【為什麼我們要挑選這篇文章】2017 年看到科技公司卯起來開發語音、表情辨識的 AI 技術,以前 AI 只是讓「辨識」的能力優化,現在 AI 技術開始拓展到「理解」層次,甚至 AI 在某些領域的閱讀理解比人類更進步,人類社會本來的分工階層會怎樣被顛覆呢?(責任編輯:鄒昀倢)
提起閱讀理解這四個字,你會想到什麼?
被四六級、雅思、托福支配的恐懼?英語試卷上連原作者都搞不懂的選擇題?
我們以前都以為,只有人類擁有「閱讀理解」詮釋的能力
不管哪種答案,肯定都逃不出一個規律:進行閱讀理解這項「有益身心運動」的主體,必然是跟你我一樣的人類。
畢竟嘛,這東西需要閱讀一大段文字,然後理解了意義之後再做題目,堪稱一場英語考試中最複雜最費腦筋,也最考驗綜合能力的一個環節。所以你的英語老師一定說過這樣一句話:得閱讀理解者得天下。
AI 連閱讀能力都比人類好,我們還拿啥混口飯吃?
但是,我如果告訴你今天得這個天下的,已經不再是人類而是 AI 了,你會怎麼想?也許此前我們想像過 AI 可以完成單詞聽寫、句子翻譯甚至寫作,但可能很多人可能都沒有想到,AI 做閱讀理解現在也能甩人類幾條街。
可事實就是這樣,1 月 11 日,斯坦福大學著名的機器閱讀理解賽事 SQuAD 刷新了全球排名,阿里巴巴憑藉 82.440 的精准率打破了世界紀錄,超越了人類 82.304 的平均得分。
當然了,AI 是不會去跟你比托福刷分的,這件事的背後,腦洞有點大哦……
什麼是機器閱讀理解?
機器閱讀理解,雖然看起來只是讓 AI 上陣來一場考試。 但是卻是自然語言處理技術中,繼語音判斷、語義理解之後最大的挑戰: 讓智能體理解全文語境。
而斯坦福大學發起的 SQuAD 挑戰賽,則是業內公認的機器閱讀理解最高水平賽事。
SQuAD 挑戰賽的基本規則,是通過眾包的方式構建一個包含 10 萬個問題左右的大規模數據集,並給出來源於維基百科長度大約在幾百個單詞左右的文章。參賽者提交的 AI 模型在閱讀完數據集中的一篇短文之後,回答若干個基於文章內容的問題,答案與標準答案進行比對,最終得出成績。
由於閱讀理解這項「智能」調整,需要運用到大量邏輯、細節和結構分析能力,並且直接作用於現實中的文本資料,所以實際價值很大。
比如說,我們首先要面對的問題就是,假如 AI 已經比人類平均水平更擅長於對文本中的精准信息進行理解和回答,會帶給我們什麼呢?
當 AI 的「閱讀理解」得分超越人類,意味著?
舉個例子或許可以很簡單地理解這個問題:英語考試上,當 AI 可以翻譯單詞的時候,我們一點都不驚奇;但 AI 可以聽寫整句話的時候,我們會感嘆技術進步了;當 AI 自己做閱讀理解的時候,我們大概會想,還要我考這個試幹什麼?
這裡面的差別,在於處理閱讀理解相關問題時,AI 不只是要運算和記錄,而是要主動去分析和理解。所以 閱讀理解問題一直被人當成是 NLP 的標誌性臨界點。但這個點被 AI 破解,直接意味著原本很多必須由人類才能完成的工作,已經能夠被 AI 接管。
因為閱讀理解問題,不只是要處理語音和簡單的語義,而是要理解和關注詞彙、語句、篇章結構、思維邏輯、輔助語句和關鍵句等等元素構成的複雜組織網絡。
機器閱讀理解達標,最直接的產業影響是大多數今天還必須由人工完成的規則、對話、服務信息類的相關工作,都可以被 AI 所取代。比如說客服、訊息管理和推薦類的工作,都可以考慮用不眠不休、高運算速度的機器來取代。
AI 閱讀技術提升,第一個會被影響的是「客服」行業
或許我們都注意到了這樣一個問題:今天的互聯網世界,文本內容變得越來越多,各種各樣的信息爆炸而來。太多你知道的、你不知道的、你以為自己知道的卻實際不知道的事情呼嘯而過。甚至你雙 11 想要剁個手,都有各種各樣的遊戲規則等著你。自己讀吧,太累太痛苦還沒時間,問客服吧,很可能出錯還很慢,簡直是薛定諤式問題。
這裡或許就可以用 AI 閱讀理解來解決了。比如客戶對某個電商促銷規則有疑問,就可以直接向 AI 提問,而 AI 就可以把這個問題當做閱讀理解來進行解決方案回饋。
AI 的閱讀理解能力,將在如何向客戶提供非模板式的智慧客服服務中發揮作用。而當 AI 在這些能力上超越人工,那麼 AI 客服的利用價值將可能快速提升。換句話說,AI 客服終於可以不那麼機械化了。
由此不難看出, 這種關鍵能力的突破,對大量強調與普通消費者交互的產業線益處最多。
推而廣之,AI 閱讀能力也是文娛領域進行內容尋找和推薦的有效方式,比如閱讀用戶提出的複雜需求,進行精準推薦;與 IoT 產品相結合,給出對用戶大段語言的回饋,乃至對話互動,都必須以機器理解能力為依托。
AI 理解力的提升,象徵未來技術的進步幅度可能加廣、加大
除了知道 AI 可以充當更好的客服之外,究竟我們為什麼應該關注 AI 閱讀理解這件事?或許關鍵,是我們應該知道理解力在目前 AI 世界中的重要程度和期待指數。
AI 作為一種從計算機科學下的分支,一個智能體先天具備的是運算能力,而希望進行仿人類智慧的智能模擬,第二步就是模仿人類的感知。今天我們看到的機器視覺、語音識別、語義理解,都是在做這件事。而第三步,就是讓 AI 產生理解力。
顯然,識別有著龐大應用場景,並會在接下來很長一段時間內佔據主流。但是 AI 的理解能力是大多數識別能力的進化,假如單純識別出卻無法產生輸出,那麼 AI 無非只是更靈活的傳感器而已。
從這個邏輯上看,閱讀理解對於 AI 來說絕不僅僅是個測試,或者商業應用的技術加持,更重要的是開啟 AI 紀元理解力的加速器。
更廣闊的意義在於,當我們不再考慮 AI 是否能理解人類文本和語言,那麼 DeepNLP 將可能達成,人機交互的範圍將級擴大。AI 可以開始捕捉人類的邏輯。
可能那還很遠,也可能很近,但機器理解力讓我們在未來面前不再是個孩子,這應該是毫無疑問的。
(本文經合作夥伴虎嗅網授權轉載,並同意 TechOrange 編寫導讀與修訂標題,原文標題為 〈親愛的,你連閱讀理解都做不過 AI 了 〉,圖片來源:charlywkarl, CC licensed)
延伸閱讀
深度學習專家 Yann LeCun:全球首位機械公民 Sophia 是場騙局,根本 BullShxt!
總結 2017 年 Google Brain 成果:機器學習的各種應用、開源都在這
如果你平常關注人工智慧、fintech、區塊鏈、創新創業、數位行銷、技術開源、資安、物聯網、經營管理、科技小物等,加入《TO》跟我們一起關注社會、產業創新!
TechOrange 社群編輯、實習生持續徵才中
意者請提供履歷自傳以及文字作品,寄至 jobs@fusionmedium.com
來信主旨:【應徵】TechOrange _填上應徵職稱_:您的大名