近日,北京大學(xué)人工智能研究院朱松純教授、朱毅鑫助理教授聯(lián)合北京通用人工智能研究院認(rèn)知計(jì)算與常識(shí)推理實(shí)驗(yàn)室范麗鳳等研究員,在CAAI?Artificial Intelligence Research期刊上發(fā)表綜述論文“Artificial Social Intelligence: A Comparative and Holistic View”,呼吁對(duì)人工社會(huì)智能(Artificial Social Intelligence,簡稱ASI)領(lǐng)域的關(guān)注。
ASI介紹圖
(相關(guān)資料圖)
近期,通用人工智能受到了廣泛關(guān)注,很多人認(rèn)為通用人工智能的實(shí)現(xiàn)似乎近在眼前,然而這其中還有很多問題沒有得到解決,其中的一個(gè)關(guān)鍵挑戰(zhàn)就是人工社會(huì)智能(ASI)——除了對(duì)世界的物理理解,人類還擁有高度的社會(huì)智能,一種感知社會(huì)事件、推斷他人目標(biāo)和意圖并促進(jìn)社交互動(dòng)的智能。這種社會(huì)智能是人類與最接近的靈長類親戚區(qū)分開來的關(guān)鍵特質(zhì)。然而,將這種獨(dú)特智能應(yīng)用于人工智能領(lǐng)域是一項(xiàng)極具挑戰(zhàn)性的任務(wù)。
本綜述論文呼吁對(duì)人工社會(huì)智能領(lǐng)域的關(guān)注。綜述深入研究社會(huì)智能的認(rèn)知機(jī)制,并探索如何將這些機(jī)制應(yīng)用于人工智能領(lǐng)域,以創(chuàng)造更加智能、人性化的機(jī)器,邁向通用人工智能。
綜述截圖
本文工作圍繞著社會(huì)智能展開,探索人類獨(dú)特的社會(huì)認(rèn)知能力,并將其應(yīng)用于人工智能領(lǐng)域。具體地,本綜述從認(rèn)知科學(xué)和計(jì)算建模兩個(gè)大的方面介紹了人工社會(huì)智能,包括社會(huì)感知、心智理論(ToM)和社會(huì)交互等子領(lǐng)域,并討論了研究人工社會(huì)智能的重要難點(diǎn)問題是什么、領(lǐng)域內(nèi)現(xiàn)有資源有哪些,以及未來發(fā)展趨勢(shì)是什么等關(guān)鍵問題。
社會(huì)智能是指人類在適應(yīng)更為復(fù)雜的社會(huì)情境中所展現(xiàn)的社會(huì)認(rèn)知能力。從進(jìn)化的角度來看,社會(huì)智能的發(fā)展對(duì)于人類的適應(yīng)至關(guān)重要。研究人類社會(huì)智能有助于我們?cè)O(shè)計(jì)具有人類特征的交互智能體。
社會(huì)智能具有密不可分的三方面——社會(huì)感知、心智理論和社會(huì)交互。
社會(huì)感知是指人類從輸入刺激中感知到其社會(huì)屬性(例如生命力、能動(dòng)性等)的能力。影響社會(huì)感知的一個(gè)基本的因素是動(dòng)力學(xué)結(jié)構(gòu),人類可以從簡單幾何形狀的運(yùn)動(dòng)中感知出復(fù)雜的社會(huì)信息。社會(huì)感知能力可能處于人類感知和認(rèn)知處理的交界,通過社會(huì)感知,基本的信號(hào)刺激被轉(zhuǎn)換成因果的、有生命的、甚至是有意圖的實(shí)體,從而有助于更高階更復(fù)雜的認(rèn)知推理過程。
心智理論(Theory of Mind, ToM)是指能夠理解自己以及他人的心理狀態(tài)(包括情緒、信念、意圖、愿望等),并認(rèn)識(shí)到不同個(gè)體的視角和心理認(rèn)知可能不同的能力。它最早在心理學(xué)和認(rèn)知科學(xué)中被研究,現(xiàn)在已輻射到人工智能領(lǐng)域。心智理論在多智能體和人機(jī)交互環(huán)境中尤為重要,因?yàn)槊總€(gè)智能體都要理解其他智能體的認(rèn)知狀態(tài)才能更好地進(jìn)行反應(yīng)、完成交互和合作任務(wù)。
Sally-Anne測(cè)試是心智理論中的一個(gè)經(jīng)典實(shí)驗(yàn),通過研究兒童在認(rèn)知發(fā)展早期是如何理解他人的信念和錯(cuò)誤信念,來測(cè)試兒童的心智認(rèn)知發(fā)展水平。在發(fā)展心理學(xué)研究中,心智理論的形成是早期童年最重要的發(fā)展里程碑之一。在嬰兒的第一年中,他們開始表現(xiàn)出注視追蹤行為,能夠?qū)⒆约汉退俗R(shí)別為能執(zhí)行有意識(shí)行動(dòng)的智能體,并能夠通過主觀體驗(yàn)環(huán)境來感知世界。在約14個(gè)月時(shí),嬰兒開始通過移動(dòng)獲取視覺信息,并能通過眼神來回檢查去確認(rèn)其他智能體和自己看到了一樣的現(xiàn)實(shí)環(huán)境。大約14—18個(gè)月時(shí),嬰兒開始通過眼神方向理解諸如愿望、意圖、情緒等認(rèn)知狀態(tài)。到3—4歲,兒童開始理解自己與他人在信念和知識(shí)上的不同,因此開始理解虛假信念。但是,這種能力直到5—6歲才能完全穩(wěn)定下來。在發(fā)展后期,嬰兒才建立了第二階心智理論,即預(yù)測(cè)一個(gè)人對(duì)另一個(gè)人的思想或感受的想法,這涉及到更復(fù)雜的認(rèn)知過程。
盡管有很多用來研究心智理論的方法,比如行為分析、神經(jīng)影像學(xué)和神經(jīng)信號(hào)分析等,但是我們亟需一個(gè)關(guān)于心智理論是什么、人類如何運(yùn)用它,以及神經(jīng)系統(tǒng)對(duì)其功能有何貢獻(xiàn)的全景圖像。
社會(huì)交互是人類社會(huì)智能中的一個(gè)關(guān)鍵概念。在研究社會(huì)交互時(shí),我們需要關(guān)注社交提示、現(xiàn)象、規(guī)則和機(jī)制等方面,這些方面可以為人工社會(huì)智能帶來更加復(fù)雜、類人化的交流和協(xié)作能力。社會(huì)提示是社會(huì)交互中一個(gè)非常重要的方面。一些重要的社會(huì)交互包括眼神交流(Gaze communication,通過眼神交流來傳達(dá)信息)、共同注意(Joint attention,兩個(gè)或多個(gè)人共同注意同一個(gè)物體或事件)、指涉(Pointing,用手或其他身體部位指向某個(gè)目標(biāo)或位置)、合作(Cooperation,兩個(gè)或多個(gè)智能體協(xié)作以實(shí)現(xiàn)共同的目標(biāo)或任務(wù))。
2022年7月,北京大學(xué)人工智能研究院一項(xiàng)關(guān)于社會(huì)智能的研究成果《實(shí)時(shí)雙向人機(jī)價(jià)值對(duì)齊》“Bidirectional human-robot value alignment”發(fā)表在國際頂級(jí)學(xué)術(shù)期刊Science Robotics上,并被Science頭條報(bào)道。(詳細(xì)報(bào)道見:朱松純、朱毅鑫團(tuán)隊(duì)研究成果登上Science頭條:AI賦能機(jī)器人、“讀懂”人類價(jià)值觀)
研究介紹
這項(xiàng)研究提出了一個(gè)基于即時(shí)雙向價(jià)值對(duì)齊模型的可解釋人工智能系統(tǒng)。在該系統(tǒng)中,一組機(jī)器人通過與人類的即時(shí)交互并通過人類的反饋來推斷人類用戶的價(jià)值目標(biāo),同時(shí)通過“解釋”將其決策過程傳達(dá)給用戶,讓用戶了解機(jī)器人做出判斷的價(jià)值依據(jù)。此外,該系統(tǒng)通過推測(cè)用戶的內(nèi)在價(jià)值偏好,并預(yù)測(cè)最佳的解釋方式,生成人類更容易理解的解釋。結(jié)果表明,該學(xué)習(xí)模型基于心智理論,可以在復(fù)雜協(xié)作任務(wù)中提高人機(jī)協(xié)作的效率,進(jìn)而提升人機(jī)信賴關(guān)系,實(shí)現(xiàn)真正的自主智能。
綜述認(rèn)為,人工社會(huì)智能(ASI) 相比于物理智能更具有挑戰(zhàn)性,其中一個(gè)很大的挑戰(zhàn)就是,它高度依賴于情境(context)。這里的情境可以是大到人群的文化背景和一般常識(shí),也可以是小到兩個(gè)人的共同經(jīng)歷。這里舉一個(gè)例子:有兩個(gè)朋友A和B在圖書館外面看到一輛自行車,其中一個(gè)女生A指向自行車,而另一個(gè)女生B對(duì)于這個(gè)指涉動(dòng)作背后意圖的理解取決于她們各自認(rèn)知信念和共同信念的情境;如果兩個(gè)人都知道這個(gè)自行車是B的男朋友C的,那么A的意圖可能是說進(jìn)圖書館去找C,而如果兩個(gè)人都知道B和C剛剛分手了,那A的意圖可能是說別去圖書館了。
論文舉例
現(xiàn)實(shí)環(huán)境是復(fù)雜的、充滿歧義的、隨機(jī)動(dòng)態(tài)多變的,涉及到多智能體交互,且環(huán)境只是部分可觀察。這一挑戰(zhàn)使得一般的標(biāo)準(zhǔn)算法在解決人工社會(huì)智能問題時(shí)可能會(huì)遇到極大的問題。因此,實(shí)現(xiàn)人工社會(huì)智能(ASI)需要更為全面的方法,針對(duì)特定局部模塊進(jìn)行改進(jìn),往往不能如愿提升ASI的整體性能。
多學(xué)科研究為人工社會(huì)智能(ASI)的實(shí)現(xiàn)提供了輔助和靈感,研究人類社會(huì)智能有助于我們深入了解開發(fā)具有類人特征的人工社會(huì)智能(ASI)所需的基本原理、綱要、參照系統(tǒng)以及測(cè)試基準(zhǔn)。
綜述還提出,研究發(fā)展人工社會(huì)智能(ASI)最好的方法是全面、整體、系統(tǒng)地模仿人類與他人以及周圍環(huán)境的互動(dòng)模式,讓模型像人類一樣進(jìn)行多種方式的學(xué)習(xí)(如終身學(xué)習(xí)、多任務(wù)學(xué)習(xí)、單樣本/小樣本學(xué)習(xí)、元學(xué)習(xí)等),需要一個(gè)開放交互式環(huán)境,以及思考如何更好地將類人偏差引入到ASI模型中。
綜述表示,盡管人工智能研究取得了重大進(jìn)展,但我們距離人類水平的智能還有很長的路要走。人工社會(huì)智能是實(shí)現(xiàn)通用人工智能的關(guān)鍵挑戰(zhàn)。我們需要將人工社會(huì)智能作為一個(gè)獨(dú)立的研究領(lǐng)域,鼓勵(lì)A(yù)I領(lǐng)域?qū)W者討論和研究這個(gè)大課題下的挑戰(zhàn)性問題,定義新的問題,創(chuàng)建新的環(huán)境和數(shù)據(jù)集,建立新的評(píng)價(jià)方式,并建立新的計(jì)算模型,做出更多理論和計(jì)算方面的開創(chuàng)性工作。最終目標(biāo)是讓人工智能擁有高水平的社會(huì)智能,并借助人工社會(huì)智能提升人類福祉。
本文第一作者為范麗鳳,通訊作者為朱松純、朱毅鑫,其他合作者還包括徐滿杰(北京通用人工智能研究院、北京理工大學(xué))、曹智昊(北京通用人工智能研究院、清華大學(xué))。
(原標(biāo)題:人工智能研究院朱松純教授、朱毅鑫助理教授在人工社會(huì)智能方向研究取得進(jìn)展)
標(biāo)簽: