7月7日,以“智聯世界·生成未來”為主題的世界人工智能大會(WAIC 2023)進入第二日。主會場大咖云集、亮點紛呈,分會場同樣也精彩不斷。當天,以“具身通用人工智能(Embodied AGI)”為主題的論壇在徐匯分會場召開,探討如何定義并實現能深入人類生活、真正通用的人工智能。
活動現場 圖片來源:每經記者 程雅 攝
近期,以ChatGPT為代表的通用人工智能(AGI)實現了巨大的突破,其強大的語言理解與對話能力令人震驚,未來AGI還應該有靈活的四肢和身體、有敏銳而靈活的感官,這才能具備更深層交互的能力。為實現以上目標,不僅需要語言預訓練模型,還需要為其賦予身體,賦予感知與行動的能力。
(相關資料圖)
“機器人(300024)需要準確理解人類意圖并與人類協同工作,要與人類價值觀相互吻合,并且在具身智能完全成功之后,人類存在的意義又將會有怎樣的定義?這是一個值得思考的哲學問題。”上海期智研究院青年科學家許華哲稱。
具身智能尚面臨諸多挑戰
什么是通用具身智能?它能給人們帶來什么?據許華哲介紹,通用具身智能是指將智能算法賦能于機器人等物理實體的領域,凡是與物理世界進行交互學習的智能體都可以看成是具身智能。從更廣義的角度,有時也會涵蓋數字人、游戲智能體等虛擬具身單位。
“具身智能可以看作是強人工智能或通用人工智能的終極追求,十分接近在阿西莫夫等科幻作家筆下的機器人,它應該可以在大量的不同場景中完成成百上千種任務。具身智能的實現,可以讓人們擁有一個機器人朋友并服務于人,例如可以在家居場景中為人端茶倒水、洗衣做飯,完成一系列的服務性工作。”許華哲稱,其中的難點在于,不同個體的住宅都具備差異性,不同功能的空間也具備差異性,對于人本身而言這種差異可以自動調整、忽略不計,但對于具身智能來說卻是巨大的挑戰。
而在工業場景下,具身智能可以完成通用的物體分揀、裝配、整理等任務。但與數控機床或者現有的工廠流水線不同,他們不需要人類為特定任務編寫特定程序,而是通用地解決很多任務。
但從技術角度出發,具身智能的實現還面臨著諸多挑戰。
許華哲介紹,AI方面,數據獲取是一大難點,需要豐富的多模態數據,其獲取難度遠高于文本。此外,訓練方法同樣需要重視,行為必須符合物理世界的規律,純文本預訓練模式不再適用。而機器人方面,Embodied AGI的硬件載體需要人形機器人這樣的通用型機器人,其研發與制造難度都顯著高于普通機器人。并且,通用型機器人需要融合行走、導航、操作等所有機器人所需要的技能,還需要在未知環境下工作。
大模型也需匹配個體價值差異
隨著人工智能的發展,安全性、價值標準就成為一個無法忽視的話題。
許華哲表示,由于機器人可能與人產生直接接觸,其安全性需要得到嚴格保障。另一方面,要保障算法不作惡,如果算法本身充滿了偏見和惡意,那將對整個人類社會帶來不可彌補的創傷。
在訓練大模型的過程中,如何讓其匹配人類的價值觀是一個有趣的問題。許華哲認為,應該讓人類是否“開心”這一標準高于其他所有目標。大模型可以是一個超級優化器,可以解決世界上的各種問題,但將人類的價值觀、善惡觀放進系統優化的目標中,就成了底線。
不過,就當下而言,不同的人具有不同的價值觀,善與惡的界定也并不是非黑即白,大模型又如何界定?
許哲華告訴《每日經濟新聞》記者,善與惡的界定,不僅需要匹配人類整體的價值觀,還需要匹配每個個體,形成差異性的優化。
上海期智研究院青年科學家弋力則告訴記者,針對具身智能領域,更重要的是如何與用戶相結合,研究出的技術如何實現智能體和人類之間的價值對齊,并且在對齊的過程中,如何保證其他智能體的利益不受侵害。不過,這需要計算機科學技術的從業者與社會學、倫理學等多領域的專家,包括政策的制定者一起推進與研究。
另外,弋力介紹,ChatGPT的出現對具身智能的影響非常大,主要是通過大模型來賦能傳統機器人的學習能力和行為能力。機器人需要控制、感知、決策進行融合,大模型在機器人的感知、決策上會給到很多幫助。
封面圖片來源:每經記者 程雅 攝
關鍵詞: