【文匯網訊】據大公報援引彭博社、BBC及CNN報道:全球數千萬用戶都在使用人工智能助手完成日常任務,如打電話、查看電郵或開關智能家電,但科技公司亞馬遜的人工智能助手Alexa11日被踢爆記錄用戶私人對話,亞馬遜還專門僱了數千名員工識別與分析這些錄音,美其名曰優化系統,讓Alexa更好地理解「人類的語言」。
亞馬遜旗下子公司Alexa Internet於2014年開發了一款智能喇叭,取名為Echo,Alexa是該設備上搭載的語音識別系統,用戶只需喊一聲「Alexa」,Echo就會被喚醒,並應用戶命令,幫助他們完成通話、查找資料、點外賣、叫車等生活瑣事,像是一個永不嫌累的私人管家。
不過,這個管家的「嘴巴」可能不太牢靠。七名曾經參與過Alexa語音識別系統改進項目的員工透露,Echo會自動錄製用戶的部分對話,並在用戶不知情的情況下發送到亞馬遜設立在海外的多個工作站。員工會對系統無法自動識別的模糊語音進行人工識別,對存在歧義的指令進行解析並標記,以提升系統對用戶語音的識別度,更好完成用戶命令。
亞馬遜曾描述Alexa「生活在雲端,不斷變得更加智能」,但從未披露過Alexa語音技術中存在人為干擾的事實。
對犯罪錄音置之不理
Alexa的危險之處還在於,為了能有效識別喚醒指令,Echo的七個喇叭可能隨時都在捕捉對話內容。彭博社引述消息人士的話表示,員工在監聽錄音的過程中,曾聽到女人在洗澡時放聲高歌,有的聽到孩子尖叫尋求幫助,甚至還有性侵案現場的錄音。員工聽到這些讓人困擾的錄音常不知所措,報告情況後公司卻指「事不關己」,所以員工只能在聊天群中傾訴解壓。
亞馬遜發言人解釋稱,可能用戶的對話中有的詞聽起來像「Alexa」,Echo因此被喚醒。Echo官方常見問題解答中提到,系統只會在檢測到喚醒詞的情況下進行錄音或發送至雲端。但消息人士透露,他們所監聽到的錄音中,很多音頻文件以噪音開始,並未出現有效的喚醒詞。
據報亞馬遜在全球僱用了數千人進行Alexa語音識別系統改進項目,團隊中既有合同工也有正式員工,工作地點位於波士頓、哥斯達黎加、印度和羅馬尼亞等。員工在入職時都會簽署一份保密協議禁止公開討論該項目。他們每天工作9小時,每班解析1000多條音頻。
員工須簽署保密協議
儘管這些員工彼此可以互相交流所監聽到的內容,但好在亞馬遜所收集到的音頻相關信息中並不包括用戶的真實姓名及地址,僅有Echo設備序列號等基本信息。
亞馬遜也承認員工的監聽行為,但堅稱會全力保護用戶私隱。彭博社引述亞馬遜發言人的話稱,只有極小部分的錄音樣本會被拿去標記,目的也是為了優化用戶體驗。該發言人強調,所有的信息都是高度機密的,公司使用身份驗證來限制別人的訪問、採用服務加密以及審計公司的控制環境來保護所有人的私隱。
蘋果Siri同樣上傳錄音
不僅是Alexa,蘋果的Siri、谷歌的智能助手,以及中國的許多智能喇叭產品,都不僅通過海量數據進行機器學習,背後還需人工幫助填補算法空白。根據蘋果安全白皮書,員工負責評估Siri對用戶命令的解讀是否符合真實情況。根據蘋果安全白皮書,Siri的錄音會被加密,並且不含個人帳號信息,存儲半年後會被移除,但也有部分被存儲更久。
責任編輯:之袁