無(wú)所不能的機(jī)器、數(shù)字化的記憶、得以永生的人類(lèi),科幻小說(shuō)中的幻想似乎正逐步成為現(xiàn)實(shí)……
機(jī)器公民索菲亞
一個(gè)名叫索菲婭的機(jī)器人最近獲得了沙特阿拉伯的公民身份,迅速引起熱議;就在不久前,最新版本的AlphaGo Zero僅用三天時(shí)間學(xué)圍棋,并擊敗了圍棋界冠軍李世石的AlphaGo;計(jì)算機(jī)科學(xué)家雷蒙德•庫(kù)茲韋爾相信,信息“奇點(diǎn)時(shí)代”即將到來(lái),那時(shí),人工智能將超越人腦。當(dāng)物理環(huán)境變成智能產(chǎn)品的天下時(shí),站在人工智能的過(guò)去與未來(lái)兩岸的我們,又該如何自處?
郝景芳的最新作品《人之彼岸》告訴我們,人工智能正是人類(lèi)自我認(rèn)知的試金石。——我們很多時(shí)候都需要有對(duì)照,才能理解我們自己。人在此岸,AI在彼岸,對(duì)彼岸的遙望讓我們觀照此岸。本文即摘自《人之彼岸》,原題為《與人工智能相比,人類(lèi)的可貴之處》,感謝中信出版社授權(quán)發(fā)布。
《人之彼岸》
文/郝景芳
如果機(jī)器學(xué)習(xí)這么厲害,人工智能什么都能學(xué)會(huì),是不是很快就要取代人類(lèi)了?
可以肯定的是,目前的人工智能還不是什么都能做,我們離萬(wàn)能超級(jí)人工智能還有很遠(yuǎn)的距離。
那是運(yùn)算速度的問(wèn)題嗎?如果芯片算力按照摩爾定律、指數(shù)增長(zhǎng)一直持續(xù),我們會(huì)不會(huì)很快達(dá)到智能的奇點(diǎn)?
我個(gè)人的觀點(diǎn)是,不完全是運(yùn)算速度的問(wèn)題,即便運(yùn)算速度持續(xù)翻番,也還有一些階梯的困難需要一個(gè)一個(gè)地跨越。這些困難也許并不是永遠(yuǎn)不可能跨越,但至少不是目前的算法能簡(jiǎn)單跨越的,而必須有新的算法或者理論突破。
很多事物的發(fā)展是階梯狀的。我們往往容易從一件事的成功,推測(cè)未來(lái)所有事的成功,然而遇到了下一個(gè)挑戰(zhàn),仍然需要新的等待和突破。
關(guān)于人工智能這件事,人們的議論往往太過(guò)于“nowor never”,要么認(rèn)為目前已經(jīng)條件成熟,只要算力增加,就能奇點(diǎn)來(lái)臨;要么認(rèn)為這都是癡人說(shuō)夢(mèng),機(jī)器永遠(yuǎn)學(xué)不會(huì)人類(lèi)的心智。但實(shí)際上更有可能的是,很遠(yuǎn)的未來(lái)有可能做到,但需要翻越一個(gè)又一個(gè)理論臺(tái)階。
“阿爾法狗”的強(qiáng)大是所有人工智能的強(qiáng)大,它面臨的困難,也是人工智能問(wèn)題的縮影。“阿爾法狗”對(duì)一些人類(lèi)認(rèn)為很困難的問(wèn)題卻覺(jué)得很簡(jiǎn)單,對(duì)人類(lèi)認(rèn)為簡(jiǎn)單的問(wèn)題卻覺(jué)得困難。舉一個(gè)很小的例子。這樣一個(gè)問(wèn)題:如果一個(gè)人從超市的貨架上拿了一瓶酒就跑出門(mén),店員會(huì)做什么?為什么?它就會(huì)覺(jué)得困難,難以回答。
如果是一個(gè)人,會(huì)如何回答這個(gè)問(wèn)題呢?人會(huì)覺(jué)得這個(gè)問(wèn)題太簡(jiǎn)單了啊,店員有可能會(huì)直接去追,因?yàn)橐训昀锏纳唐纷坊貋?lái);也有可能會(huì)打電話(huà)報(bào)警,因?yàn)樽约翰幌朊半U(xiǎn);或者告訴老板;或者喊路人幫忙。諸如此類(lèi)。
但是目前的人工智能會(huì)覺(jué)得這個(gè)問(wèn)題很難,無(wú)法回答。原因主要在于以下幾個(gè)方面:
第一,是綜合認(rèn)知的能力。
第二,是理解他人的能力。
第三,是自我表征的能力。
第一個(gè)難點(diǎn),綜合認(rèn)知的能力。
這個(gè)問(wèn)題對(duì)于我們每個(gè)人而言都是非常簡(jiǎn)單的,頭腦中甚至一下子就能想到那種畫(huà)面感。但對(duì)人工智能來(lái)說(shuō)就是很難理解的。最主要的差別在于常識(shí)。
當(dāng)我們理解這段話(huà),我們頭腦中實(shí)際上是反映出很多背景信息,包括:(1)他想喝酒;(2)他沒(méi)有付錢(qián);(3)酒擺在超市是一種商品;(4)從超市拿東西需要付錢(qián);(5)他沒(méi)有付錢(qián)就出門(mén)是違規(guī)的;(6)他是想逃跑;(7)超市店員有義務(wù)保護(hù)超市商品,不能允許這種事情發(fā)生。在所有這些背景信息支持下,我們可以一眼辨認(rèn)出這個(gè)動(dòng)作畫(huà)面的情境。除了我們自然腦補(bǔ)的這些背景信息,也還是有一些小概率背景信息,有可能影響對(duì)情境的解讀。也許這個(gè)人是店主,有急事出門(mén),如果是店主,自然不用付錢(qián),店員也不會(huì)見(jiàn)怪, 但這種可能性不大。任何一個(gè)情境的解讀都需要大量常識(shí)作為背景信息。
常識(shí)包含我們習(xí)以為常的知識(shí)總和,包含我們對(duì)整個(gè)環(huán)境和經(jīng)濟(jì)系統(tǒng)的理解。這些理解都太平常,我們就稱(chēng)之為常識(shí)。人工智能目前還沒(méi)有這些常識(shí),它并不知道一瓶酒擺在超市里和公園里有什么差別,也不知道超市買(mǎi)東西的慣例流程。從語(yǔ)法上說(shuō),從超市拿酒和從公園拿酒都是符合語(yǔ)法的表達(dá),但我們知道,其中一個(gè)合理,另一個(gè)不合理。
你也許會(huì)說(shuō),這是因?yàn)闄C(jī)器缺少生活經(jīng)驗(yàn),輸入經(jīng)驗(yàn)就可以了。我們這一次當(dāng)然可以給機(jī)器輸入酒的含義、超市的含義、超市的購(gòu)買(mǎi)規(guī)則、小偷的含義、店員的職責(zé),但好不容易輸入了所有這些信息,會(huì)發(fā)現(xiàn)下一句話(huà)涉及大量有關(guān)街頭和交通的常識(shí),依然要手動(dòng)輸入。到了最后,整個(gè)世界的無(wú)數(shù)知識(shí)碎片我們都需要輸入,如何調(diào)用又成了問(wèn)題。
“常識(shí)”經(jīng)常被認(rèn)為是區(qū)別AI和人的重要分野。“常識(shí)”是把各個(gè)門(mén)類(lèi)信息匯集到一起、形成廣泛知識(shí)背景網(wǎng)的能力。這種能力我們?nèi)巳硕加,因而并不覺(jué)得稀奇,然而機(jī)器沒(méi)有,我們才知道其可貴。
為什么機(jī)器難以具有常識(shí)?有多重原因,目前人們?nèi)栽趪L試去理解。首先的直接原因是,機(jī)器缺少物理世界的生活經(jīng)驗(yàn),所處理的是人類(lèi)的二手信息,對(duì)于周?chē)奈锢硎澜鐩](méi)有真實(shí)接觸,不知道什么是可能的,什么是不可能的。例如,“石頭放在雞蛋上”還是“雞蛋放在石頭上”只是詞語(yǔ)游戲,對(duì)于AI沒(méi)有真實(shí)意義。AI也不知道人繞房子一周會(huì)回到原點(diǎn)。
除了缺乏直接的物理世界的經(jīng)歷,還有可能是更核心的原因,那就是人工智能目前還缺少建立“世界模型”的綜合能力。
人類(lèi)擁有“完形”認(rèn)知的心理能力,能讓我們把碎片信息編制完整。這是一種高度統(tǒng)合的能力,我們能把軀體五感統(tǒng)合起來(lái),共同構(gòu)成對(duì)世界的感覺(jué)。同樣,人從各個(gè)方面得到的碎片知識(shí)也有一種統(tǒng)合的能力,大腦會(huì)把碎片粘貼起來(lái), 把碎片之間的部分補(bǔ)齊,以期構(gòu)成一個(gè)完整的知識(shí)世界。
事實(shí)上,人的“完形”并不僅是“拼湊”碎片信息,而是建立一個(gè)模型,然后用模型來(lái)理解碎片信息。“完形”是把信息連接成可以理解的圖景。中間有大片空白我們要“腦補(bǔ)”。我們能從驗(yàn)證碼的碎點(diǎn)圖片中看出連貫的字母,而計(jì)算機(jī)程序做不到。我們能把沒(méi)有關(guān)系的人連接在同一個(gè)故事里, 只需要想象一兩重關(guān)系,就能組成復(fù)雜的陰謀論。
第二個(gè)難點(diǎn),理解他人的能力。
即便人工智能未來(lái)能夠把各個(gè)學(xué)科的相關(guān)知識(shí)都學(xué)習(xí)到, 建構(gòu)起“世界知識(shí)體系”,但在理解情境相關(guān)的問(wèn)題時(shí),仍面臨如何調(diào)用正確信息的問(wèn)題。當(dāng)一個(gè)人對(duì)另一個(gè)人生氣,應(yīng)該從他們環(huán)境和背景的海量信息中調(diào)用哪些知識(shí),來(lái)理解他生氣的理由?
對(duì)人而言,這不成問(wèn)題,我們能非常容易猜測(cè)到,對(duì)生氣的兩個(gè)人而言,什么是重要的因素,什么是有可能導(dǎo)致他們憤怒的導(dǎo)火索。這主要是源于我們對(duì)人的理解,對(duì)我們自己和周?chē)说睦斫,我們知道什么樣的信息?huì)引人興奮,什么樣的信息會(huì)讓人沮喪。讀心的能力讓我們輕易做出推斷。
至少目前人工智能還不具備這樣的能力。且不說(shuō)理解復(fù)雜的場(chǎng)景,僅僅就“樹(shù)上蹲著五只鳥(niǎo),開(kāi)槍打下來(lái)一只,還剩幾只”這樣的問(wèn)題,它們也還回答不上來(lái)。它們無(wú)法推斷,鳥(niǎo)兒因?yàn)楹ε,就?huì)逃走。
正如著名心理學(xué)家、語(yǔ)言學(xué)家史蒂芬·平克所說(shuō):“如果不是建立在一個(gè)龐大的關(guān)于外部世界以及他人意圖的內(nèi)隱知識(shí)結(jié)構(gòu)的基礎(chǔ)之上,語(yǔ)言本身并不起作用。”缺乏對(duì)于他人心理的常識(shí)系統(tǒng),使得人工智能仍然難以“理解”人類(lèi)日常的語(yǔ)言。
未來(lái)人工智能有可能學(xué)會(huì)讀懂人類(lèi)的情感和意圖嗎?
很多人都提到,目前人工智能已經(jīng)可以精細(xì)識(shí)別人類(lèi)的表情,能夠讀懂人的情緒。是的,人類(lèi)的情緒屬于一種外顯圖像,是比較容易識(shí)別的,這和識(shí)別東北虎、識(shí)別癌細(xì)胞類(lèi)似,是圖像識(shí)別的一個(gè)范疇。但這和理解人的情感完全是兩回事。即便它們未來(lái)能從圖像上識(shí)別出一個(gè)人此時(shí)的情緒,想要“解釋”此人的情緒,也需要遠(yuǎn)為復(fù)雜的對(duì)人心的理解。
也有很多人提到,人工智能可以通過(guò)與人對(duì)話(huà)理解人的情感。但這實(shí)際上也離得很遠(yuǎn)。目前它們能做的只是智能對(duì)應(yīng),當(dāng)聽(tīng)到人類(lèi)說(shuō)出句子A,在語(yǔ)料庫(kù)中尋求識(shí)別匹配最合適的行為或回應(yīng)。當(dāng)你說(shuō)“我不開(kāi)心”,它們可以匹配說(shuō)“多喝點(diǎn)熱水”,但不理解什么是開(kāi)心。如果想讓它們分析不開(kāi)心的理由,推測(cè)不開(kāi)心之后的做法,就遠(yuǎn)遠(yuǎn)不夠了。其中的差別可以形容為:人工智能使用語(yǔ)言,是匹配句子和句子。而人類(lèi)使用語(yǔ)言,是匹配句子和真實(shí)內(nèi)心的感覺(jué)。
人工智能識(shí)別人類(lèi)情感和意圖,還有可能有更本質(zhì)的困難,那就是人工智能無(wú)法以自己映照他人。
人類(lèi)識(shí)別他人的情感和意圖,并不是因?yàn)榇髷?shù)據(jù)學(xué)習(xí)。實(shí)際上人一生能遇見(jiàn)的人、交談和交往的經(jīng)歷都是很有限的。人能夠從少數(shù)經(jīng)歷中學(xué)到有關(guān)他人的很多情感和行為知識(shí), 能直覺(jué)感知他人的心境,不是因?yàn)槿祟?lèi)頭腦處理能力更快, 而是因?yàn)槿祟?lèi)能夠以自己映照他人,將心比心。
最直接的映照,是鏡面反射。人腦中有一些細(xì)胞,能夠直接反射他人的行為意圖,叫作鏡像神經(jīng)元。這種神經(jīng)元不僅人類(lèi)擁有,在較高級(jí)的靈長(zhǎng)類(lèi)動(dòng)物頭腦中也有。當(dāng)一個(gè)人看見(jiàn)另一個(gè)人拿起錘子,自己即使手里沒(méi)有錘子,與“動(dòng)手砸”相關(guān)的神經(jīng)元也會(huì)“亮”起來(lái)。
這種“讀懂他人”屬于生理性質(zhì)的,大腦對(duì)他人的意圖直接有反映,反映出來(lái)的意圖,可以被觀看者直接感受到, 因此叫“鏡像神經(jīng)元”。人工智能可能生成這種直接的反映嗎?缺乏生理共同點(diǎn),應(yīng)該不太可能。
另一方面,人們可以用自我觀察映照出他人的情感和意圖。面對(duì)一個(gè)情境的分析,人們可以把自己代入同樣的情境, 假想自己會(huì)有什么樣的感情。能夠讓人悲歡離合的影視文學(xué),就是因?yàn)槿擞写敫,才?huì)讓人喜愛(ài)。這一方面來(lái)源于人類(lèi)的情感相似性,都有人之常情,另一方面人可以通過(guò)讀取自己的心思過(guò)程,以己度人。
也就是說(shuō),人類(lèi)對(duì)他人的理解,除了可以“外部觀察”和“語(yǔ)言交流”,還能有“內(nèi)部觀察”。事實(shí)上,“內(nèi)部觀察”是如此強(qiáng)大,我們對(duì)于很多從來(lái)沒(méi)見(jiàn)過(guò)的事情,只要代入自己想想,就能對(duì)其中的前因后果猜出個(gè)大概。現(xiàn)在的問(wèn)題是,如果機(jī)器完全沒(méi)有類(lèi)人的情感,僅靠“外部觀察”和“語(yǔ)言交流”,能達(dá)到同樣的理解他人的效果嗎?我不知道。
第三個(gè)難點(diǎn),自我表征的能力。
在上面,我們已經(jīng)提到了自我觀察問(wèn)題,但還僅限于理解情感方面。那如果不涉及情感方面呢?機(jī)器學(xué)習(xí)純理性知識(shí)總是無(wú)比強(qiáng)大的吧? 我們會(huì)看到,即便是在純理性知識(shí)方面,目前的機(jī)器學(xué)習(xí)也不是完美無(wú)缺的,其中之一就是“元認(rèn)知”問(wèn)題。
目前,即便是“阿爾法狗”下棋天下無(wú)敵,也有明顯的局限: 第一,它說(shuō)不出自己在做什么。“阿爾法狗”沒(méi)有對(duì)自我的觀察。它不知道自己正在“下圍棋”,而只是根據(jù)輸入數(shù)據(jù)計(jì)算勝利的路徑,至于是什么游戲的勝利,它并不清楚也不關(guān)心,勝利了也不會(huì)高興。第二,它說(shuō)不出自己為什么這么做。“阿爾法狗”的“深度學(xué)習(xí)”,目前是一種“黑箱”學(xué)習(xí)。人們給它數(shù)據(jù)輸入,看到輸出,可是它不知道中間發(fā)生了什么。人們覺(jué)得它奇著百出,不知道為什么,非常神秘。而它自己也說(shuō)不出自己是如何思考的。
從某種程度上說(shuō),人工智能目前就像電影《雨人》中的那類(lèi)自閉的孩子:一眼就數(shù)得清地上的牙簽、能心算極大數(shù)字的乘法、背得下來(lái)全世界的地圖,卻答不出有關(guān)自己的問(wèn)題。它只懂研究每秒300盤(pán)的棋路,卻不知道“我正在下棋”這件事。
缺少元認(rèn)知,首先是因?yàn)槿鄙?ldquo;我”的概念。不知道有“我”存在,因此不能以“我”為主體表達(dá)事情。也因?yàn)闆](méi)有“我”的意識(shí),因此從來(lái)不會(huì)違抗程序員的命令,只會(huì)服從。同樣也不能以“我”為中心思考高一層次的決策。
未來(lái)人工智能有可能形成“我”的概念嗎?自我意識(shí)問(wèn)題目前幾乎接近于哲學(xué)探討,還沒(méi)有好的科學(xué)研究結(jié)論。姑且不論自我意識(shí)問(wèn)題,現(xiàn)在只討論,缺少元認(rèn)知,對(duì)于變成超級(jí)智能有什么阻礙嗎?為什么一定要元認(rèn)知呢?“阿爾法狗”不用知道自己為什么贏,贏了不就行了?
最大的問(wèn)題在于,缺乏元認(rèn)知,有可能是抽象理解程度不夠的緣故。
“自我表征能力”既涉及自我,也涉及表征,表征就是抽象表達(dá)信息的能力。舉個(gè)簡(jiǎn)單的例子,對(duì)于同一件事的說(shuō)法,最具象的表達(dá)是“10101010101010……”,稍微抽象一層的表達(dá)是“用某色棋子爭(zhēng)奪地盤(pán)”,再抽象一層的表達(dá)是“下圍棋”。最后一個(gè)層次不僅是對(duì)步驟的表達(dá),更是對(duì)整個(gè)行為——我正在從事這個(gè)游戲——的表達(dá),需要跳出游戲。每一層次抽象都需要一種更高層次的審視。
人類(lèi)的認(rèn)知特征中,有不少仍是謎題,其中一種就是強(qiáng)大的特征提取和模式識(shí)別機(jī)制。它如何產(chǎn)生,仍然有很多不解的地方。我們可以知道的是,大腦有多層調(diào)節(jié)機(jī)制,其最高層次調(diào)節(jié)具有很強(qiáng)的抽象能力?赡苷沁@種抽象能力讓兒童可以非?焖俚刈R(shí)別物體。小孩子可以快速學(xué)習(xí),進(jìn)行小數(shù)據(jù)學(xué)習(xí),而且可以得到“類(lèi)”的概念。小孩子輕易分得清“鴨子”這個(gè)概念,和每一只具體不同的鴨子,有什么不同。前者是抽象的“類(lèi)”,后者是具體的東西。小孩子不需要看多少?gòu)堷喿拥恼掌湍艿玫?ldquo;鴨子”這個(gè)抽象“類(lèi)”的概念。人類(lèi)非常善于制造各種層次的概念,有一些概念幾乎所有人都懂,但實(shí)際上很難找到明確的定義、邊界或現(xiàn)實(shí)對(duì)應(yīng)物,例如“蔬菜” “健康”“魅力”“愛(ài)”,甚至是“智能”。壞處是易形成偏見(jiàn),但好處是經(jīng)常能夠敏銳地把握大類(lèi)的特征差異,用極為簡(jiǎn)化的概念把握信息。
可以說(shuō),人工智能和人類(lèi)智能最大的差異或許是:真實(shí)世界與抽象符號(hào)之間的關(guān)聯(lián)性。人工智能處理的是符號(hào)與符號(hào)之間的關(guān)系,而人類(lèi)頭腦處理的是真實(shí)世界到符號(hào)的投影。