AI「閱讀理解」能力超越人類平均水準，書都給機器讀就好啦！

【為什麼我們要挑選這篇文章】2017 年看到科技公司卯起來開發語音、表情辨識的 AI 技術，以前 AI 只是讓「辨識」的能力優化，現在 AI 技術開始拓展到「理解」層次，甚至 AI 在某些領域的閱讀理解比人類更進步，人類社會本來的分工階層會怎樣被顛覆呢？（責任編輯：鄒昀倢）

提起閱讀理解這四個字，你會想到什麼？

被四六級、雅思、托福支配的恐懼？英語試卷上連原作者都搞不懂的選擇題？

我們以前都以為，只有人類擁有「閱讀理解」詮釋的能力

不管哪種答案，肯定都逃不出一個規律：進行閱讀理解這項「有益身心運動」的主體，必然是跟你我一樣的人類。

畢竟嘛，這東西需要閱讀一大段文字，然後理解了意義之後再做題目，堪稱一場英語考試中最複雜最費腦筋，也最考驗綜合能力的一個環節。所以你的英語老師一定說過這樣一句話：得閱讀理解者得天下。

AI 連閱讀能力都比人類好，我們還拿啥混口飯吃？

但是，我如果告訴你今天得這個天下的，已經不再是人類而是 AI 了，你會怎麼想？也許此前我們想像過 AI 可以完成單詞聽寫、句子翻譯甚至寫作，但可能很多人可能都沒有想到，AI 做閱讀理解現在也能甩人類幾條街。

可事實就是這樣，1 月 11 日，斯坦福大學著名的機器閱讀理解賽事 SQuAD 刷新了全球排名，阿里巴巴憑藉 82.440 的精准率打破了世界紀錄，超越了人類 82.304 的平均得分。

當然了，AI 是不會去跟你比托福刷分的，這件事的背後，腦洞有點大哦……

什麼是機器閱讀理解？

機器閱讀理解，雖然看起來只是讓 AI 上陣來一場考試。 但是卻是自然語言處理技術中，繼語音判斷、語義理解之後最大的挑戰： 讓智能體理解全文語境。

而斯坦福大學發起的 SQuAD 挑戰賽，則是業內公認的機器閱讀理解最高水平賽事。

SQuAD 挑戰賽的基本規則，是通過眾包的方式構建一個包含 10 萬個問題左右的大規模數據集，並給出來源於維基百科長度大約在幾百個單詞左右的文章。參賽者提交的 AI 模型在閱讀完數據集中的一篇短文之後，回答若干個基於文章內容的問題，答案與標準答案進行比對，最終得出成績。

由於閱讀理解這項「智能」調整，需要運用到大量邏輯、細節和結構分析能力，並且直接作用於現實中的文本資料，所以實際價值很大。

比如說，我們首先要面對的問題就是，假如 AI 已經比人類平均水平更擅長於對文本中的精准信息進行理解和回答，會帶給我們什麼呢？

當 AI 的「閱讀理解」得分超越人類，意味著？

舉個例子或許可以很簡單地理解這個問題：英語考試上，當 AI 可以翻譯單詞的時候，我們一點都不驚奇；但 AI 可以聽寫整句話的時候，我們會感嘆技術進步了；當 AI 自己做閱讀理解的時候，我們大概會想，還要我考這個試幹什麼?

這裡面的差別，在於處理閱讀理解相關問題時，AI 不只是要運算和記錄，而是要主動去分析和理解。所以 閱讀理解問題一直被人當成是 NLP 的標誌性臨界點。但這個點被 AI 破解，直接意味著原本很多必須由人類才能完成的工作，已經能夠被 AI 接管。

因為閱讀理解問題，不只是要處理語音和簡單的語義，而是要理解和關注詞彙、語句、篇章結構、思維邏輯、輔助語句和關鍵句等等元素構成的複雜組織網絡。

機器閱讀理解達標，最直接的產業影響是大多數今天還必須由人工完成的規則、對話、服務信息類的相關工作，都可以被 AI 所取代。比如說客服、訊息管理和推薦類的工作，都可以考慮用不眠不休、高運算速度的機器來取代。

AI 閱讀技術提升，第一個會被影響的是「客服」行業

或許我們都注意到了這樣一個問題：今天的互聯網世界，文本內容變得越來越多，各種各樣的信息爆炸而來。太多你知道的、你不知道的、你以為自己知道的卻實際不知道的事情呼嘯而過。甚至你雙 11 想要剁個手，都有各種各樣的遊戲規則等著你。自己讀吧，太累太痛苦還沒時間，問客服吧，很可能出錯還很慢，簡直是薛定諤式問題。

這裡或許就可以用 AI 閱讀理解來解決了。比如客戶對某個電商促銷規則有疑問，就可以直接向 AI 提問，而 AI 就可以把這個問題當做閱讀理解來進行解決方案回饋。

AI 的閱讀理解能力，將在如何向客戶提供非模板式的智慧客服服務中發揮作用。而當 AI 在這些能力上超越人工，那麼 AI 客服的利用價值將可能快速提升。換句話說，AI 客服終於可以不那麼機械化了。

由此不難看出， 這種關鍵能力的突破，對大量強調與普通消費者交互的產業線益處最多。

推而廣之，AI 閱讀能力也是文娛領域進行內容尋找和推薦的有效方式，比如閱讀用戶提出的複雜需求，進行精準推薦；與 IoT 產品相結合，給出對用戶大段語言的回饋，乃至對話互動，都必須以機器理解能力為依托。

AI 理解力的提升，象徵未來技術的進步幅度可能加廣、加大

除了知道 AI 可以充當更好的客服之外，究竟我們為什麼應該關注 AI 閱讀理解這件事？或許關鍵，是我們應該知道理解力在目前 AI 世界中的重要程度和期待指數。

AI 作為一種從計算機科學下的分支，一個智能體先天具備的是運算能力，而希望進行仿人類智慧的智能模擬，第二步就是模仿人類的感知。今天我們看到的機器視覺、語音識別、語義理解，都是在做這件事。而第三步，就是讓 AI 產生理解力。

顯然，識別有著龐大應用場景，並會在接下來很長一段時間內佔據主流。但是 AI 的理解能力是大多數識別能力的進化，假如單純識別出卻無法產生輸出，那麼 AI 無非只是更靈活的傳感器而已。

從這個邏輯上看，閱讀理解對於 AI 來說絕不僅僅是個測試，或者商業應用的技術加持，更重要的是開啟 AI 紀元理解力的加速器。

更廣闊的意義在於，當我們不再考慮 AI 是否能理解人類文本和語言，那麼 DeepNLP 將可能達成，人機交互的範圍將級擴大。AI 可以開始捕捉人類的邏輯。

可能那還很遠，也可能很近，但機器理解力讓我們在未來面前不再是個孩子，這應該是毫無疑問的。

（本文經合作夥伴虎嗅網授權轉載，並同意 TechOrange 編寫導讀與修訂標題，原文標題為〈親愛的，你連閱讀理解都做不過 AI 了〉，圖片來源：charlywkarl, CC licensed）

延伸閱讀

深度學習專家 Yann LeCun：全球首位機械公民 Sophia 是場騙局，根本 BullShxt！
總結 2017 年 Google Brain 成果：機器學習的各種應用、開源都在這
科技部長陳良基：台灣教授只活在國際會議中，沒人創業技術再強也沒用

【2018 年 TechOrange 招募新血，引領台灣正向改變】
如果你平常關注人工智慧、fintech、區塊鏈、創新創業、數位行銷、技術開源、資安、物聯網、經營管理、科技小物等，加入《TO》跟我們一起關注社會、產業創新！

TechOrange 社群編輯、實習生持續徵才中
意者請提供履歷自傳以及文字作品，寄至 jobs@fusionmedium.com
來信主旨：【應徵】TechOrange ＿填上應徵職稱＿：您的大名

AI「閱讀理解」能力超越人類平均水準，書都給機器讀就好啦！

我們以前都以為，只有人類擁有「閱讀理解」詮釋的能力

AI 連閱讀能力都比人類好，我們還拿啥混口飯吃？

什麼是機器閱讀理解？

當 AI 的「閱讀理解」得分超越人類，意味著？

AI 閱讀技術提升，第一個會被影響的是「客服」行業

AI 理解力的提升，象徵未來技術的進步幅度可能加廣、加大

延伸閱讀

Trending Articles

《沈冰自述——我和周永康的故事》全本

Moog - Subsequent 25

出售: 林憶蓮•回來愛的身邊 (東芝1A1頭版)

筆記 - 使用 PowerShell 清除停用 AD 帳號與 OU

df-dferh-01 中国区 Android 安装 Google Play Store 后报错的解决办法

「一棒接一棒、棒棒強棒」108學年度家長會長交接典禮

吸烟与MBTI类型判断捷径 (豆瓣 INFJ的奇幻之旅小组)

acermark龍璿國際展出多款包裝設備

枋寮北勢寮隆山宮睽違12年再辦迎王祭典

日本女优有村千佳COS集锦：狂三&黑白岩&亚丝娜&绫波丽

有遇到过这个问题么。/jsb-videoplayer.js not found, possible missing file.

MAS v2.8 magicgenius 汉化版 - 11.11更新

出售: Monster Cable Interlink Reference 2

福建佛教人士望云和尚(林斌)的九仙禅寺被强行收走，望云妈妈被赶出寺庙

R 语言中的OpenBLAS*和英特尔® 数学核心函数库的性能比较

[转载]煞貢、直星、人專吉日\金神七煞歌

HAKERS哈克士戶外 12月8~14日廠拍

OBS Studio 23.2.1 免安裝中文版 - 免費網路實況廣播軟體實況主必備軟體取代Fraps

<請教>行駛中安卓機會重新開機

Udp2raw-tunnel 及其一键安装脚本