為了讓電腦更好地理解人類的語言,Facebook周一成立了一個研究項目,希望開發更加強大的語音識別軟件。蘋果Siri、亞馬遜Alexa和谷歌Assistant都使用了這樣的技術。值得一提的是,該公司甚至還在尋求外部人士的幫助。
Facebook的目標是讓電腦最終能夠與人類展開有意義的對話。如果能成功,就將較現有的初級技術向前邁進一大步。
人們現在可以通過語音讓亞馬遜Echo音箱播放歌曲或撥打電話。但這些技術還無法理解或響應更加復雜的對話內容,例如與人爭論哪一張才是披頭士樂隊最好的專輯,或者針對有線電視費用展開分析。
“如果沒有劇本,就表演不好。”Facebook人工智能研究總監Yann LeCun說。深度學習等人工智能的進步已經可以教會電腦識別圖片中的貓,但理解語言卻是一項更為復雜的任務。
例如,LeCun表示,電腦往往會把下面兩個句子搞混:“獎杯放不進手提箱,因為它太大了。”以及“獎杯放不進手提箱,因為它太小了。”
要理解這兩個句子,需要分析“它”所指的具體對象。根據“大”和“小”兩個線索,可以判斷“它”究竟指的是“獎杯”還是“手提箱”。人類通常可以明白:第一句話是說獎杯太大,放不進行李箱;第二句話是說手提箱太小,獎杯放不進去。
廣告
但電腦缺乏對物體尺寸的基本了解,因會搞錯兩個句子的意思。要充分理解語言,電腦就必須知道物理世界的一些基本事實,避免搞混簡單的句子。
要為電腦提供幫助,方法之一就是為其提供各種對話和網絡語言實例,將此作為教學工具。例如,研究人員曾經使用Reddit的上關于電影的討論數據來訓練電腦,使之學會人類討論自己喜歡的電影時使用的聊天方式。在另外一個案例中,研究人員還使用維基百科的數據來訓練電腦回答與具體電影有關的問題。
Facebook希望讓世界各地的研究人員可以分享他們通過具體的實驗得出的結論,并共享他們使用的數據。該公司相信,這種合作可以加快這項技術的發展,并最終讓電腦完全理解人類語言。
Facebook的人工智能研究團隊開發了免費的軟件工具,供其他人免費下載,并為他們的實驗提供幫助,使之可以匯總數據,并查看其他項目參與者的研究成果。這些軟件都開放了源代碼,所以其他人也可以貢獻自己的研究成果,從而改進底層技術。
目前還不清楚其他大公司的人工智能研究人員是否會加入Facebook的項目,并為這項技術做出貢獻。但Facebook高管表示,微軟等公司的研究人員已經表達了興趣。
Facebook認為,盡管很多從事語音軟件開發的公司彼此之間存在競爭,但也可以通過相互合作獲益。但由于這類研究所對應的產品可能關系到價值數十億美元的產品,加之Facebook、谷歌、蘋果、亞馬遜和微軟都存在激烈的競爭關系,因此他們之間的合作希望似乎比較渺茫。
不過,LeCun表示,該項目的最終目標是創造能夠完全理解對話的強大電腦,這還要等待多年才有可能實現。他表示,短期目標是讓數字助手能夠根據用戶自主提供的興趣數據推薦有用的信息和新聞。
LeCun說,這種數字朋友將成為“個性化的虛擬助手,讓人不會對他們產生厭煩。”因為他們多數情況下都會理解你的意思,而不會茫然無措。但要真正開發他夢想中的“通用智能”仍然有很長距離,這種智能就像電影《Her》里面描述的一樣,你甚至有可能與她墜入愛河。








