2022-10-25
明確的概念。訓(xùn)練一個分類器系統(tǒng),自動向智能服務(wù)機器人提出一些有用的概念,排除那些“非常規(guī)”的做法和案例。
溫和系統(tǒng)。所謂“適度的制度”,就是那種不會過分追求目標的制度,也就是達到目標后就停止行動,而不是投入過多的資源去達到完美的目標。
摒棄工具性激勵。如果工具性獎勵太多,智能機器人就會產(chǎn)生欺騙程序員的想法。比如我們用分數(shù)作為衡量目標的工具性標準,不好的結(jié)果會是機器人只認分數(shù),任何影響分數(shù)的衡量標準都會被它拒絕。之后分數(shù)很高,但沒有達到預(yù)期目標。
隨著智能服務(wù)機器人越來越接近現(xiàn)實,我們應(yīng)該關(guān)注這些漏洞。因此,我們可以考慮為學習系統(tǒng)設(shè)計一個更完善的目標函數(shù),使這些學習系統(tǒng)能夠代表程序員的真實意愿。陶:如果你想設(shè)計一個具有預(yù)期目標的智能服務(wù)機器人,你需要定義目標函數(shù),并做一些測試,以設(shè)計一個能夠避免偏離目標并產(chǎn)生負面影響的AI系統(tǒng)。即使程序員設(shè)計的目標函數(shù)暫時不能與預(yù)期目標一致,你也要盡量保持“容錯”較低。那么,要做出符合預(yù)期目標的智能服務(wù)機器人,需要遵循哪些具體步驟呢?
未來,智能服務(wù)機器人能夠以一種連程序員都無法想出的“智慧”方法來達成目標,它們更喜歡利用較快捷的途徑實現(xiàn)操作者的直接目標,而不是滿足其預(yù)期的目標。但是,這一特點是把雙刃劍,直接目標也永遠代替不了預(yù)期目標。