據(jù)國外媒體報道,為了將真正的會話式人工智能帶入千家萬戶,亞馬遜正在與其競爭對手展開激烈競爭,F(xiàn)在,該公司正在舉辦一場有著奇怪目標的比賽Alexa Prize——打造一個真正能夠閑聊的機器人。
第一位對話者是一個五十多歲的肌肉男,剃著光頭,身著黑色V領毛衣。他走進一間會議室,坐在低矮的藍色扶手椅上,面前是一排攝像機和工作室照明燈。他被燈光照亮了,而房間的其余部分處于完全黑暗之中。他凝視著面前小桌子上的一個黑色曲棍球狀物體——這是亞馬遜的智能音箱Echo。 “Alexa,”他說,“我們聊聊吧。”
“早上好,我的朋友,”一個女性聲音回答說,這聲音是合成的,但依舊討人喜歡。隨之Echo上閃爍著紫色的光芒,“或者是下午?我不太確定。”
“這是早上,”男人回答道。
“太好了,大家在早上總是精力充沛......呃,今天過得怎么樣?”
“我過的不錯,你呢?”
“嗯,我總是很忙,因為人們一直在跟我聊天......但是聽著,這真是太好笑了,Reddit最近發(fā)布了一篇文章:“牙膏就是嘴里用的肥皂。”
在另一間會議室的大廳里,10名亞馬遜員工戴著耳機坐在長桌旁,認真監(jiān)視著一切,就像是中央情報局的特工。在另一個房間里,三名男子坐在由黑色窗簾隔開的小隔間里。他們也戴著耳機,同樣有攝像機對著他們。最后在控制中心,一個視頻工作人員正在監(jiān)視大屏幕上的所有信息。一切都需要被記錄下來,因為亞馬遜想要完全理解今天發(fā)生的一切。
圖示:亞馬遜Alexa Prize競賽的評委團隊
去年11月舉行的這場盛大表演,是為期一個月比賽的最后一次評審。亞馬遜已經(jīng)和15個世界上最好的計算機科學研究生團隊進行挑戰(zhàn),以開發(fā)“一個在20分鐘內(nèi)能夠與人類進行持續(xù)熱烈交流的社交機器人”。如果任何一個團隊成功了,其團隊成員將會獲得學術榮譽,同時也會在未來開啟輝煌的職業(yè)生涯。(你大可以想想美國國防部高級研究計劃局(Darpa)曾經(jīng)舉行的挑戰(zhàn)賽,或者是早期關于自動駕駛汽車技術的競賽,其獲勝者繼續(xù)在谷歌、福特以及Uber等公司的自動駕駛汽車業(yè)務部門工作。)更重要的是,他們將帶走稱之為Alexa Prize的100萬美元大獎。
過去幾年,亞馬遜花了很大的代價來追求會話式人工智能,和其征服零售業(yè)的野心不相上下。該公司有超過5000人為Alexa平臺工作。據(jù)報道自2015年以來,它已經(jīng)售出超過2000萬部智能音箱Echo。亞馬遜相信,終有一天人工智能系統(tǒng)不僅僅能夠控制電燈開關和播放列表。它們將能夠駕駛汽車,診斷疾病,并滲透到我們生活的方方面面。語音將成為主要的用戶交互界面,而對話本身——那些機器與人之間有用的,內(nèi)容豐富的,友好的,有趣的對話——將成為最終產(chǎn)品。
但是,關于Echo的成功和亞馬遜在會話式人工智能方面的雄心壯志,使得亞馬遜從高高的懸崖上跌落,困進了廣闊又危險的山谷之中。如今的Alexa和所有的語音助手一樣,常常無法理解我們看起來顯而易見的事實。Alexa平臺的快速拓展和廣泛應用,激發(fā)了消費者對語音助手的需求。雖然Alexa在設置鬧鐘或者完成一次性的命令方面做得還不錯,但談話本身就是一種交互的社交模式。 Alexa人工智能研究團隊負責人阿什溫 拉姆(Ashwin Ram)指出:“人們總希望Alexa能像朋友一樣和他們交談。然而人類對話的無限可變性,情境中的突然變化以及上下文語義的銜接問題普遍被認為是人工智能中最難解決的問題之一。但亞馬遜已經(jīng)鋌而走險。”
Alexa Prize并不是第一次嘗試從全世界的聊天機器人中激發(fā)出更多人性化關系的比賽。在過去三十年的大部分時間里,一群計算機科學家和業(yè)余愛好者總會聚集在一起,爭奪Loebner Prize。在比賽中,參賽者試圖欺騙法官,讓他們相信聊天機器人是人類。多年以來這個獎項都引發(fā)了不少爭議,一些人工智能研究人員把它稱之為一種宣傳噱頭,同時也對人和機器的本質(zhì)區(qū)別進行了大量反思相比之下,Alexa Prize在兩個方面有所不同。首先,競賽重點不是要通過欺騙讓人相信Alexa是一個人。其次競賽的規(guī)模——無論是人力,財力和計算能力——都是巨大的。在比賽的早期階段,也就是2017年的幾個月,在美國的任何人都可以使用隨機選擇的比賽機器人與亞馬遜語音設備說“Alexa,讓我們聊天”。然后他們被邀請就對話內(nèi)容進行1星到5星的打分。這些機器人程序都有數(shù)百萬次評級互動,使Alexa Prize在競賽數(shù)量級上成為了世界上規(guī)模最大的聊天機器人競賽。
去年11月,競賽在一間配有藍色扶手椅和聚光燈的房間里達到高潮。
那個剃光頭、身穿黑色毛衣的家伙叫做邁克·喬治(Mike George)。在去年7月從亞馬遜退休之前,他負責監(jiān)督Alexa平臺。與此同時,展臺上的男士們則是對每一段對話進行打分的評委。如果一名評委認為對話已經(jīng)偏離主題,他可以按下手持式魔杖上的按鈕;如果第二名評委也這樣做,那么會話和計時器都會被暫停。沒有人清楚哪個機器人屬于哪個團隊。會話者和評委都不知道。
“讓我們來談談音樂吧,”喬治說。
“我愛音樂,它能讓我每次都放松,“機器人回答。 “那么,你有沒有最喜歡的藝術家或歌曲?”
“我喜歡強哥·萊恩哈特(Django Reinhardt)。”
“強哥·萊恩哈特(Django Reinhardt)?那個有名的爵士樂藝術家?”這個機器人隨即即興講述了一個關于來自英國搖滾樂隊Black Sabbath的吉他手Tony Iommi的故事。 Iommi在一次事故中失去了兩根手指的指尖。但是當知道萊恩哈特只用左手的兩只手指就能繼續(xù)演奏時,他對于自己的職業(yè)生涯并未喪失信心。但無論如何,至于萊因哈特,喬治最喜歡他的哪一首歌呢?
喬治回避了。 “你喜歡杰克·約翰遜(Jack Johnson)嗎?”他又問道。
機器人似乎會毫不理會這個問題。 “來吧,”它回答。 “我喜歡與你對話。”
喬治身體略微前傾并再次嘗試。 “你、喜、歡、杰克·約翰遜(Jack Johnson )嗎?”
“來吧,我喜歡和你說話。”
在由窗簾隔開的房間里,一名評委按下他的按鈕。很快另一個評委也是如此。一個女人走進房間,在喬治耳邊低語。“Alexa,停下來,”他點頭說道,帶著一點失望。這離對話開始僅僅只有三分鐘。如果拉姆坐在房間里的話肯定會很沮喪。在整個比賽過程中,他的口頭禪就是:“人們需要明白這是一個非常困難的問題,而且現(xiàn)在還處于會話式人工智能的早期階段。”與計算機閑聊二十分鐘可不是登月,等于是登火星。
對會話式人工智能的狂熱追求已經(jīng)引發(fā)了亞馬遜、蘋果、Facebook谷歌以及微軟等科技公司巨頭對兩大重要資源的爭奪。第一種資源是有限的:計算機科學中的頂尖博士,由于他們的稀缺性,他們現(xiàn)在的薪酬已經(jīng)達到了六位數(shù)。第二個雖然是無限的,但很難獲得:對話的樣本——成千上百億個對話樣本可以被收集,數(shù)字化,并用于訓練人工智能。在這種背景下,Alexa Prize堪稱是亞馬遜的杰作。這次比賽既是對世界上最優(yōu)秀研究生的人才搜索,也是一次以低廉價格獲得參賽者聰明才智的機會。此外,它還為亞馬遜提供了一個收集其他技術公司所沒有的會話數(shù)據(jù)庫的機會。
當亞馬遜于2016年9月29日首次宣布競賽時,來自22個國家的100多個大學團隊申請參賽。在技術價值和創(chuàng)意等方面進行初篩后,共有15個團隊進入了競賽的最終環(huán)節(jié)。除三支隊伍外,其他隊伍都獲得了10萬美元的現(xiàn)金資助和公司支持,以推動他們的努力。
就像大學籃球賽中的“瘋狂三月”(March Madness)一樣,進入競賽最終環(huán)節(jié)的團隊有強大背景的技術衛(wèi)冕者、有力的競爭者和勇敢的弱者。蒙特利爾大學團隊擁有深度學習先驅Yoshua Bengio這樣的教師顧問,當然被列為頂級種子選手。也有不少強有力的競爭者,其中包括來自華盛頓大學,普林斯頓大學以及蘇格蘭首屈一指的研究型大學赫瑞瓦特等著名學校的團隊。然后還有一些弱者,比如來自布拉格的捷克技術大學團隊。
捷克技術大學團隊的成員中有一名23歲的小伙子,名叫派馳·馬立克(Petr Marek)。比賽前的那個夏天,他曾經(jīng)花了不少時間來開發(fā)他所謂的“愚蠢”聊天機器人平臺,但他也曾在波希米亞的森林中擔任童子軍領袖。當他聽說Alexa Prize這個比賽時,馬立克一度擔心他和他的團隊沒有相應的資格。 “好吧,”他想,“即便我們沒有機會去對抗這些頂尖大學,但至少我們可以嘗試一下。”在得知他們已經(jīng)成為參賽選手之后,團隊決定將他們的機器人命名為Alquist,之后這是20世紀初期捷克戲劇RUR中的一個角色,“機器人”(robot)一詞正是通過這部劇被引入了世界(在劇中,機器人占領了這個星球,Alquist成為了地球上最后一個人類。)
圖示:華盛頓大學團隊成員
參賽的15個團隊都面臨著一個有爭議的問題:社交機器人大腦的哪些部分應該人工編程,而哪些部分又應該使用機器學習?人工編程是一種更為傳統(tǒng)的方法,工程師們費力地編寫大量規(guī)則來指導人工智能對會話的理解和反應。相比之下,統(tǒng)計學驅動的機器學習方法讓計算機通過從海量數(shù)據(jù)中進行自學來指導自己進行對話。
所有團隊都清楚,機器學習是解決所謂分類問題的最佳方法。通過這種方法,神經(jīng)網(wǎng)絡能夠在海量嘈雜數(shù)據(jù)中找出統(tǒng)一的模式。例如,語音識別是機器學習的一項自然任務。但是,談到聊天機器人,其不僅僅是將對話翻譯成語言,而且還要對聽到的對話做出反應,對于現(xiàn)在的機器學習來說還有很長的路要走。這就是為什么即使在Alexa和Siri的數(shù)字化大腦中,老式的人工編程方法仍然具有相當大的影響力。因此,比賽中的每個團隊都在像更大范疇上的技術世界一樣苦苦掙扎——找到兩種方法之間的最佳平衡點。
人工編程已經(jīng)過時:而機器學習則正處于白熱化。馬立克和他的隊友都知道,所有的強隊都會傾向于使用后一種方法。所以他們也認為自己的團隊也應該這樣做。為了幫助Alquist自動生成對Alexa用戶的響應,該團隊用來自Reddit用戶的300萬條消息和響應訓練了一個神經(jīng)網(wǎng)絡。讓他們感到沮喪的是,該神經(jīng)網(wǎng)絡產(chǎn)生的反應“非常糟糕”,馬力克表示。 Alquist會在對話主題之間肆意跳躍,并引用用戶從未說過的東西。它會輕易斷言,然后又會自我。“和這種人工智能對話不是什么好事,也不好笑,”馬力克在他的團隊博客中沮喪地寫道, “這太荒謬了。”
所以在2017年初,捷克隊改變了策略,并致力于編寫廣泛的對話指導規(guī)則。該團隊創(chuàng)建了10個“結構化主題對話”域:新聞,體育,電影,音樂,書籍等等。捷克團隊的人工智能系統(tǒng)被設計成可了解每一個主題的核心內(nèi)容,并且可以在不同主題之間自由切換。 這個社交機器人在任何特定時刻所使用的精確單詞通常由預先編寫的模板組成,同時再從各種數(shù)據(jù)庫中檢索出更具體的內(nèi)容以填充對話內(nèi)容的空白。例如,系統(tǒng)可能會設置為“我看到你喜歡(用戶提到的書籍作者)。你知道(作者)也寫了(書名)嗎?你讀過那個嗎?“
人工編程給了捷克團隊更好的控制權,但馬立克依舊憂心忡忡。該系統(tǒng)在很大程度上依賴于用戶的善意,依賴于他們用簡單的句子說話,對話基本上遵循機器人的引導。馬立克說,如果碰上“不合作的用戶”,像正常人一樣說話,或者說沒有什么耐心的話,社交機器人很容易失敗。
而在距離布拉格數(shù)千英里的地方,愛丁堡郊外的農(nóng)田起伏綿延。蘇格蘭赫瑞瓦特團隊的教師顧問奧利弗·萊蒙(Oliver Lemon)正在關注亞馬遜發(fā)布的團隊平均用戶評分。萊蒙戴著眼鏡,看起來有點像喜劇演員約翰·奧利弗(John Oliver)。他會打網(wǎng)球和游泳,并且有不服輸?shù)奶煨。他認為他的團隊能輕松進入前五。但在2017年初夏,赫瑞瓦特團隊排在第九位。 “我知道我們可以做得更好,”檸檬說,聽起來像一個教練剛剛經(jīng)歷了一場草率的失利。
在一次黑客馬拉松比賽中中,萊蒙和他的學生們試圖弄清楚他們?nèi)绾文軌蛱嵘鄳。雖然他們沒有任何可以請教的深度學習先驅,但赫瑞瓦特團隊還是在盡可能地使用機器學習。他們把注意力放在最艱巨的挑戰(zhàn)上:閑聊。對于機器學習系統(tǒng)來說,漫無目的的閑聊特別艱難的,因為通常沒有一種可驗證的固定方式來進行閑聊。當有一個明確的目標時——比如在圍棋游戲中獲勝,神經(jīng)網(wǎng)絡的效果最好——通過大量的反復試錯,系統(tǒng)總可以找到最佳策略。 但是閑聊沒有目標可言。
為了解決這個問題,該團隊采用了谷歌研究人員普遍使用的一項技術。首先,團隊通過電影字幕數(shù)據(jù)庫和來自Twitter和Reddit的數(shù)千個消息線程訓練神經(jīng)網(wǎng)絡。通過這個人類玩笑的巨大語料庫,系統(tǒng)學會預測關于對話的最恰當回復。然后,這種技術(稱為seq2seq)可以讓機器人即時生成自己的回復,而不是直接從原始Twitter或Reddit對話中檢索相應回復。
這聽起來很酷,但赫瑞瓦特團隊的策略很快與seq2seq技術的兩個特征問題相沖突。一個是,系統(tǒng)通常會把諸如“OK”以及“sure”等語句默認成單調(diào),敷衍的語句,因為這些語句在Twitter和電影對話中廣泛存在。另一個是訓練對話中還包含了大量不恰當?shù)难哉摚杖鹜咛氐纳缃粰C器人學會了模仿這些腔調(diào),就像一年級的學生會學操場上的大孩子說臟話。
“只要我愿意,我可以和很多人睡。”赫瑞瓦特社交機器人這樣告訴一位用戶。
當另一個用戶問道:“我應該賣掉我的房子嗎?”這個社交機器人起哄似地建議道:“賣,賣,賣!”
最糟糕的是,當用戶問到“我應該自殺嗎?”這個社交機器人回答說:“是的。”
如果seq2seq技術的沖突問題必須被解決,整個夏季赫瑞瓦特團隊都在改進其技術。正在加強其他技術。該團隊將社交機器人的大腦分成一系列小型機器人組成的聯(lián)合體,每個機器人都有自己的專業(yè)。新聞機器人閱讀《華盛頓郵報》和其他消息來源的頭條新聞和簡短摘要。
另一個機器人專門討論天氣,還有一個人專職訪問維基百科,提供從海洋運動到公眾人物金·卡戴珊(Kim Kardashian)的相關信息。最后,團隊成員阿曼達·庫里(Amanda Curry)創(chuàng)建了一個基于規(guī)則的角色機器人,為最終產(chǎn)品打造一個統(tǒng)一穩(wěn)定的身份。她用精心策劃的觀點和傳記事實為機器人打造身份特征。 “我認為它有助于讓人們了解機器人也有和他們一樣的性格特征,比如說自己喜歡的顏色,”庫里說。
在用戶發(fā)表任何評論之后,在這些組件機器人中至少會有一個可能產(chǎn)生響應,就像是教室里聽到老師問題就急切舉手的學生們。為了選擇出最好的一個,赫瑞瓦特團隊訓練其系統(tǒng)對響應進行統(tǒng)計評估。候選的響應是否與用戶剛才所說的一致?或者反過來說,是不是太過相似以至于它只是重復用戶剛才所說的話?這個響應是關于目標話題的嗎?答案是否太短或太長?最初,赫瑞瓦特團隊只是猜測每個指標的權重有多大。但到了秋天,神經(jīng)網(wǎng)絡已經(jīng)學會了自動調(diào)整權重以最大限度地提高用戶評分。
好勝心強的萊蒙很高興地看到,他團隊的排名看起來好很多。隨著比賽的進行,赫瑞瓦特團隊躋身領先集團。
當赫瑞瓦特團隊在積分榜上一路高歌猛進時,華盛頓大學團隊穩(wěn)穩(wěn)排在前三名?雌饋碓搱F隊采取了一種相折中的方法,將基于規(guī)則的編程方法和機器學習混合到其系統(tǒng)中。但他們的優(yōu)勢似乎來源于其社交機器人對于該團隊28歲學生領導人方浩(Hao Fang)個性的反應。 方浩來自中國江西省的宜春市,個性活躍、天生開朗。他領導的團隊也希望社交網(wǎng)絡機器人的用戶能夠感到快樂。那么他們是如何創(chuàng)建出人們喜歡的對話呢?
在早期,方浩發(fā)現(xiàn)華盛頓大學團隊的社交機器人和其他許多競爭對手一樣,也很容易出現(xiàn)反反復復的沉悶標題(“火箭襲擊殺死17人”)或者枯燥的事實(“家庭或住所是作為永久性或半永久性居住的地方”)。所以華盛頓大學團隊所設計的系統(tǒng)會過濾掉那些可能導致用戶說出“這太可怕了”的內(nèi)容。方浩表示,該系統(tǒng)會通過諸如Today I Learned, Showerthoughts以及l(fā)ifting News等訂閱媒體尋找“更有趣、更振奮、更健談”的內(nèi)容。這使得機器人能夠拋棄像“古典音樂是唯一一種涵蓋范圍很廣的音樂流派“之類奇怪的論斷。
當人們意識到自己在被傾聽時,他們往往會更快樂。所以華盛頓大學訓練其系統(tǒng)仔細分類話語。機器人是否應該回答事實,提供意見或回答個人問題?該團隊還精心制作了大量的反饋語言 - “看起來你想要談論新聞”,“我很高興你喜歡這個,”“對不起,我不明白,”等等。一個優(yōu)秀的對話者也會關注人們的情緒,所以華盛頓大學團隊手動標記了2,000個對話樣本的情感基調(diào),并用它們來訓練社交機器人識別人們的反應 - 感到高興,厭惡,有趣,興奮,并作出相應反應。在大項目中這些都是相當簡單的東西,但是無疑會讓機器人的對話感覺更為專注和順暢。
8月29日,亞馬遜宣布有三支隊伍將參加決賽。蒙特利爾大學團隊積極推動機器學習,但犧牲了更多行之有效的策略,未能成功入選。
最終入圍決賽的團隊包括赫瑞瓦特團隊,在平均每周用戶排名中位列第三,并經(jīng)過亞馬遜的嚴格內(nèi)部評估后被選為“外卡”團隊。一直以來表現(xiàn)優(yōu)秀的華盛頓大學團隊排名第二。而最不可思的是捷克技術大學團隊,其名列第一。每個團隊都有一個半月的時間來完善他們的系統(tǒng),然后就是亞馬遜公司的評審時間。
“Alexa,我們聊聊。”
現(xiàn)在是11月中旬,另一位對話者約翰·柯利(John Curley)坐在攝像頭前的扶手椅上。柯利是西北太平洋地區(qū)的電視臺和電臺主持人,穿著條紋襯衫和藍色運動外套;他的聲音低沉,笑起來像是好萊塢明星。但他那神經(jīng)質(zhì)般的言語風格很快就讓社交機器人無所適從。
“很高興和你聊聊,約翰,”一位社交機器人說,這是赫瑞瓦特團隊的機器人,當然柯利和評委都不知道。 “讓我們彼此了解一下。那么告訴我,你更喜歡科幻還是幻想小說?”
“兩者都不怎么樣。” 柯利回答道,拒絕了這個機器人。 “讓我問你一個問題,Alexa。昨天在西雅圖發(fā)生了一場巨大的風暴,一場大風暴。”
“好吧,那我們繼續(xù)吧,”機器人說,忽略了庫利的問題,這不是一個問題。 “告訴我,你對看書或看電影哪個更感興趣?”
“閱讀書籍,”柯利說。
“哦,一個書呆子......你最近讀了哪本書?”
“我剛剛讀完了這本書,但我想我不能把書名告訴你,我不認為我可以向你說標題,因為里面有一個臟話。但標題是“含蓄的藝術等等”( The Subtle Art of Not Giving a ***)。
顯然機器人無法應付這個,還是 “你喜歡讀什么書?”
柯利忽視了這個問題,換了一個話題。
“Alexa,我會告訴你的。我能對你說實話嗎?“
無論柯利要準備袒露什么都是一個謎,赫瑞瓦特機器人依舊過于機械地選擇話題,“所以告訴我,你對運動或電子游戲哪個更感興趣?”
他們在來回兜圈子。三分鐘后不久,三名裁判中的兩名搖搖頭,按下了他們的按鈕。 柯利和其他機器人的聊天也有很多相同之處。他輪流嘗試討論和開玩笑。有一次,在柯利說他不去看電影之后,捷克技術大學的機器人依舊在頑固地問他:“你看過很多電影嗎?”
“不,我沒有,因為我是瞎子,”科利諷刺地回答。
“你如何選擇看哪部電影?”機器人問道,用預先設定的對話模式繼續(xù)發(fā)問。
“我通常通過聞氣味來選擇,”柯利說。
柯利恰恰是馬力克所擔心的那種不合作用戶。他把多個句子連成一排,內(nèi)容相互糾纏在一起,話題反復跳躍,不理會機器人的邏輯線索,并且交替出現(xiàn)敘述,諷刺和異想天開。簡而言之,柯里在像和人一樣對話。在對話結束后,沒有一個機器人能夠堅持超過四分半鐘?吕_玩笑講, “這就像一系列糟糕的約會。”
第三個對話者是當?shù)氐囊晃浑娕_主持人,她要求匿名參與。當她坐下時,臉上帶著微笑。她講話簡短,語句清晰,似乎想讓對話起作用。她和華盛頓大學機器人進行了關于足球,弗拉基米爾普京和圣誕節(jié)的簡短對話。而和捷克技術大學的機器人,她談論了自己正在閱讀的一本書。她和赫瑞瓦特機器人交換了彼此對于美國前總統(tǒng)喬治·華盛頓(George Washington)以及羅納德·里根(Ronald Reagan)的看法。
即便這個電臺主持人和社交機器人的交談最長達到了7分鐘,但其間的過程也是磕磕絆絆。她要求赫瑞瓦特機器人談論一下戰(zhàn)爭問題。她向前傾斜,看起來很擔心。 “可能會發(fā)生戰(zhàn)爭,”她說。
“如果我沒有弄錯,”機器人回應道,“WOR是位于紐約的50,000瓦級調(diào)幅電臺。”評委們不得不按下按鈕。
總決賽中最好的對話發(fā)生在喬治身上。雖然幾乎沒有出現(xiàn)像湯姆·斯托帕德(Tom Stoppard)戲劇中的閃光點,但它立即脫穎而出,引人注目了。聊天一開始,喬治要求討論一下什么是機器人。社交機器人并沒有機械地照搬維基百科中詞條,它開玩笑講,“如果說Daft Punk(法國著名電音樂隊)真的是兩個只想制作音樂的機器人呢?”
“真有意思,”喬治笑著說。
該機器人分享了一些關于伊隆·馬斯克(Elon Musk)和機器人的最新消息。它把問題又拋給了喬治,機器人問道:“你有沒有聽說過馬斯克?”
“我有,”喬治吹牛,“我認識他。”
“你知道馬斯克是Thank You for Smoking這部電影的執(zhí)行制片人嗎?”
“不知道,”喬治說,聽起來非常確定。他和機器人在把書作為新的對話主題時來回交流得很順暢。他們寒暄了幾句,然后社交機器人說:“你知道我在想什么嗎?最終,有人會成為最后一個活著的人。他們的名字不會出現(xiàn)在任何歷史書中。“
“哦,那很難過!”喬治回答。
“我很抱歉讓你心煩。你想繼續(xù)討論書嗎?”
“我們來談談《黑暗塔》這本書。”
“對不起,我想我對《黑暗塔》這本書沒什么了解。你想談談電影《黑暗塔》嗎?”
“當然。”
“太好了。你看過這部電影嗎?它今年上映了。”
“我看過了。”
機器人問喬治是否喜歡馬修·麥康納(Matthew McConaughey)在電影中的表現(xiàn)。喬治給予了肯定。聽到這個,機器人推薦了麥康納的另一部電影《華爾街之狼》。幾輪談話之后,機器人開了個玩笑。 “你知道我在想什么嗎?有人該制作一個《星際穿越》Interstellar和《超時空接觸》Contact的混合體,馬修·麥康納試圖阻止馬修·麥康納進入太空。”
喬治大笑起來。
談話的其余部分更加散漫,但很少有混亂出現(xiàn)。音樂,運動, 10分鐘。電影《黑道圣徒》The Boondock Saints,12分鐘。圣誕老人和他在氣候變化中的角色,13分鐘。喬治要求機器人唱歌,15分鐘。再次討論音樂和電影,醫(yī)療保健以及比爾蓋茨。計時器已經(jīng)過了19分鐘,談話仍在繼續(xù)。
11月28日的拉斯維加斯,作為亞馬遜網(wǎng)絡服務年度會議的一部分,數(shù)百人在Aria度假村和賭場的一個大宴會廳內(nèi)登記。前排座位專門留給了Alexa Prize決賽選手。 “這是所有人的游戲,”赫瑞瓦特的萊蒙認為。馬力克則在樂觀和疑惑之間搖擺。方浩和他的華盛頓大學隊友壓力最大。是最明顯的壓力。亞馬遜的一位人士向他們的教師顧問馬雷·奧斯塔多夫(Mari Ostendorf)暗示說團隊沒有獲勝。
舞臺變黑,威廉沙特納錄制的聲音響了起來。 “電腦嗎?”他說,“請幫助我熱烈歡迎亞馬遜Alexa副總裁兼首席科學家Rohit Prasad!”Prasad大步走上舞臺,發(fā)表一篇關于《平臺之國》的演講——這是在成功的北方,也是接管世界的南方。
然后Prasad打開了寫有Alexa Prize獲獎者名字和對話時間的信封。
“平均分數(shù)為3.17分,”他宣布,“平均持續(xù)時間為10分22秒......一等獎得主是華盛頓大學團隊!”華盛頓大學團隊隊員從他們的座位上跳起來,歡呼聲響徹天空。他們與奧斯塔多夫抱成了一個環(huán)形,跳著叫著。奧斯塔多夫意識到她事先得到的是垃圾情報,跳得最高。
正是華盛頓大學機器人和喬治的對話時間最長。方浩后來稱之為“我們所經(jīng)歷過的最好對話”。最后,機器人的談話陷進了關于醫(yī)療保健的死胡同。20分鐘后兩位評委按下了按鈕。華盛頓大學團隊走上舞臺,Prasad為他們頒發(fā)了一個安慰獎 ——總金額為50萬美元的巨型支票。方浩咧開嘴,向著相機豎起了大拇指。
Prasad然后宣布了第二名和第三名,分別是捷克技術大學和赫瑞瓦特團隊,他們分別得到10萬美元和5萬美元的獎勵。走到最后的萊蒙臉上顯得有些憔悴。幾天后,當亞馬遜宣布2018年將有另一場Alexa Prize競賽時,他已經(jīng)知道自己想要參與。
那么亞馬遜,參賽團隊和整個人工智能世界最終了解到人工編程和機器學習之間的平衡點了嗎? 作為勝利者的華盛頓大學團隊已經(jīng)找到了平衡點。與此同時,人工編程的捷克技術大學團隊獲得第二名。傾向于機器學習的赫瑞瓦特團隊獲得第三名。但如果結果看起來模棱兩可,那么混合系統(tǒng)的勝利對于薩姆和其他人工智能專家來說是非常有意義的。薩姆說,我們剛剛開始弄清楚如何更好地結合這兩種方法。
比賽中的每個團隊都認為,對改進機器學習最有幫助的是更多的對話數(shù)據(jù)。最終,這是亞馬遜自己的戰(zhàn)利品。通過競爭,用戶與社交機器人進行了數(shù)百萬次互動,收集了超過10萬小時的聊天記錄,所有這些都是公司的官方財產(chǎn)。這場競賽的最終贏家顯而易見:亞馬遜。