【文匯網訊】在「人工智能之父」阿蘭·圖靈(Alan Turing)逝世60週年之際,英國科學家昨天(8日)宣佈,一台超級計算機首次通過了「圖靈測試」,成功讓人類相信它是一個13歲的男孩。也就是說,這台計算機成為有史以來第一個具有人類思考能力的人工智能設備。
機器人成功偽裝13歲男孩
據觀察者網報道,6月8日,英國雷丁大學在著名的倫敦皇家學會(The Royal Society of London)舉辦了一場「圖靈測試」,一個俄羅斯團隊開發的一款名為「尤金·古特曼(Eugene Goostman)」的計算機軟件通過了測試。
在測試中,尤金•古特曼模仿一名來自烏克蘭的13歲男孩,而它成功地讓33%的測試人相信了這一點。
計算機和人工智能的先驅阿蘭·圖靈1950年提出了著名的「圖靈測試」。在這一年的十月,他發表了另一篇題為《機器能思考嗎?》的論文,第一次提出「機器思維」的概念。他從行為主義的角度對「智能」概念給出了定義,並提出假想:一個人在不接觸對方的情況下,通過一種特殊的方式,和對方進行一系列的問答,如果在相當長時間內,他無法根據這些問題判斷對方是人還是計算機,那麼,就可以認為這個計算機具有同人相當的智力,即這台計算機是能思維的。
圖靈還進一步預測稱,到2000年,人類應該可以用10GB的計算機設備,製造出可以在5分鐘的問答中騙過30%成年人的人工智能。
本次測試就是以圖靈的這一預測為標準,要求計算機在一次時間為五分鐘的文字交流中,能夠讓30%的測試人相信它是人類。
共有5台計算機參加了本次測試,但只有尤金•古特曼最後通過。
該軟件的開發者之一弗拉基米爾·維西羅夫(Vladimir Veselov)表示:「我們的主要設計理念是,它可以聲稱它什麼都知道,但由於受年齡限制,實際上它並不是什麼都知道,這是完全合理的。我們花了很多時間開發這樣一個具有人性的角色。」
在2012年的一次測試中,尤金•古特曼也曾成功騙過29.2%的評委,距離通過測試僅一步之遙。
英國雷丁大學客座教授凱文·沃維克(Kevin Warwick)指出,尤金•古特曼可以被認為是首台通過「圖靈測試」的計算機。雖然此前也有一些人聲稱其開發的軟件成功通過了「圖靈測試」,但它們的測試預先設定了討論的話題或提出的問題。
沃維克指出,這是人工智能發展的一個里程碑事件,而且由於當天是圖靈去世60週年紀念日,這一成就具有了特別的意義。
但沃維克也提醒說,這項技術可用於網絡犯罪。他說:「在人工智能領域,沒有什麼比圖靈測試更具標誌性和爭議性的了——讓一台計算機說服足夠數量的測試人員,認為它不是一台機器而是一個人。如果一台計算機可以欺騙一個人,讓他誤以為它是某個人或其它什麼東西,甚至是我們可以信賴的人,這不能不讓人們警惕可能因此產生網絡犯罪。」
通過圖靈測試,就真的是「人」嗎?
在現代社會,無論是GPS導航系統與Google搜索引擎,還是自動櫃員機與蘋果Siri,更遑論象棋大師深藍(Deep Blue)和滿腹經綸的沃森(Watson),人工智能無處不在。但它們都不被認為是真正的人工智能,因為在人們看來,它們都不具有人類的感情。
而圖靈測試,就被認為是檢驗機器是否具有人類感情的一個標準。一個典型的例子是,如果測試者反覆提出相同的問題,一台機器只會從知識庫裡重複提取簡單的答案,而真正的人工智能需要表現出「不耐煩」等感情活動來騙過測試者。
不過,很多人對圖靈測試提出了理論上的批評。
其中最著名的是「中文房間」理論。美國哲學家約翰·希爾勒提出了這樣一個實驗:一個只懂英語的人手中拿著一本中文對照手冊,身處圖靈實驗中所提及的房子中。而另一人則在房間外向此房間發送中文問題。房間內的人只需按照對照手冊,返回手冊上的中文答案,房間外的人就會以為房間內的人是個會思維的中文專家。然而實際上房子內的人可能對像形文字一竅不通,更談不上什麼智能思維。
也就是說,只要知識庫足夠大,一台機器仍然可以通過簡單提取答案的方式,讓人們誤以為它擁有感情。
大數據技術的發展對這一質疑提供了支持。如果能夠把一個人所說過的、聽到的、寫下的、或者是讀到的每一個字,每一句話,以及每一個看到的場景,每一段經歷的聲音片段,一併同其他成百上千、甚至成千上萬的人們的相關數據,都被錄製下來並可隨時調用,人們最終可以製造出一個能夠通過圖靈測試的機器人。然而,這個機器人真的擁有了人類的感情和好奇心嗎?
親歷圖靈測試
尤金到底說了什麼,可以讓人們把它當做一個真正的小男孩?雷丁大學方面尚未公佈本次測試的具體問答,但在2012年的那次測試中,科普作家丹·法爾克(Dan Falk)曾經現場參加,並記錄下了當時的對話。以下為法爾克撰寫的介紹文章:
——「你最喜歡的科幻片有哪些?」
——「我喜歡《星球大戰》和《駭客帝國》」
屏幕上顯示出這樣的對話。
現在的我正在努力分辨這個和我聊天的到底是一個機器人還是真正的人類。我又說:
——「如果我說《星戰大戰前傳》很難看,你贊成嗎?」
——「雙手贊成!喬治-盧卡斯應該被拉去槍斃!」
這下瞬間就瞭然了——只有一個有血有肉的電影愛好者才能被《星戰前傳:威脅潛伏》給激怒。在上周於英國布萊切利公園舉行的「圖靈測試馬拉松」中,作為18號裁判,上述的對話就是我的一個比較容易判定對方是人還是機器的方法之一。測試的目標就是讓裁判們僅僅通過對話的形式判定對方是機器還是人。這個測試,就是艾倫-圖靈在60多年前所設計出來的。60多年前,在同一個地方,圖靈所設計的 Enigma 密碼破譯機正在為二戰中的盟軍效力。
上週六的圖靈測試馬拉松中和世界各地其它的圖靈測試比賽一樣,是為了紀念艾倫-圖靈誕辰一百週年。而在布萊切利公園舉辦的這場,規模最大的一次圖靈測試馬拉松,正是在重現圖靈上世紀50年代在論文中所提出的那些可能性和方法論。
那麼,在圖靈測試中當裁判到底是什麼感覺呢?早在這個活動開始幾個月前,我就報了名。實際上這個和「審間諜」的感覺差不多:你需要問足夠多的問題,直到最後打消疑慮,或者是判定對方是機器。眾所周知,裁判是不可能在當時知道和自己進行文字交談的到底是真人還是機器,所以說,如果這個機器夠「聰明」,能夠給出類似於人思考後得出的答案,且在5分鐘的交談時間內,裁判都沒有識破對方,那麼這台機器就算是通過了圖靈測試。
圖靈測試並不是要機器人最大限度山去愚弄人類裁判,不過按照圖靈的設想,在2000年以前,裁判們在圖靈測試中的準確率就會下降到70%及更低。12年之後的今天,我們就拿出今天這場馬拉松測試的結果來和圖靈本人的預測來比較比較吧。
總之,現在坐在我對面,而我卻看不見的「人」——這個《星球大戰》粉絲——或者是披頭士的鐵粉——「有史以來最好的樂隊」,當被問到在 the Rolling Stones 和 The Who 之間選一個的時候,回答是「必須是滾石」,而當我(在腦海中)不贊同他的觀點時,對方又說「在80年代早期,The Who 確實在解散之前寫過一些好歌」。好吧,這些回答真是太「人性化」了,應該不可能是個機器。
但是另一次談話就有些說不清了。當我告訴對方我來自加拿大時,對方回答說他們「聽說加拿大是個很好的地方」,除了「魁北克地區都說法語」之外。這看起來好像是一個能夠識別語音的機器在 Google 和維基百科上迅速查找了關於我家鄉的資料,然後告訴我的內容。要麼這個人就是對中學時的地理老師說的話到現在都還記憶猶新,或者,這個人骨子裡就比較反感法語區,或者法國人?
在圖靈設計這個測試的時候,就承認,一般人們認為智力和對語言的掌握程度是相關的。確實,語言能力並不僅僅是把詞語以正確的順序組成句子這麼簡單,它還包含了邏輯等各種認知能力——表達自己思想,認識所處環境,和別的人類交流的能力——或許還包括猜測對方在想什麼的能力。孩童在成長過程中會慢慢收穫這些能力和經驗。如果將這些能力都灌輸給一台機器的話,可以說是個不小的挑戰。當然在上次的馬拉松中,那些聊天機器人所使用的軟件也確實值得我們讚賞,它們的表現令人驚訝。其中,Eugeen Goostman (著名的人工智能),這個有著13歲小男孩人格的聊天軟件,險些就通過了測試。
這屆的圖靈測試結果說明,我們現在的人工智能還沒有達到圖靈預計的那個階段,機器目前想和人類真正地談話還是比較困難的。
|