AI戰勝了圍棋,但卻輸給了高考

兩臺高考機器人,AI-MATHS和Aidam,6名歷年的高考狀元,挑戰了2017年的高考數學題。儘管柯潔敗給阿爾法狗,但在高考這件事情上,高考狀元仍是不可戰勝的。

AI戰勝了圍棋,但卻輸給了高考

AI財經社(ID:Economic-Weekly)

文 | 林木木

6月7日下午5時,全國高考數學科目的結束鈴聲響起。另一邊,兩個特殊的高考生正準備“展開”試卷。

成都的一個會議室裡,準星雲學研發的高考機器人AI-MATHS在媒體見證下,2小時內解答多套2017高考數學題;數千裡外的北京,學霸君研發的另一個機器人Aidam將與四位高考狀元同臺對戰。

2017年的高考,是兩家科技公司要征服的目標。在高考的考場上,這場AI與人的角逐6年前就開始了。最終,高考狀元取得了勝利。

下面是高考機器人的編年史。

2011—2012

2012年6月的某一天,在投資公司工作的張凱磊坐在辦公室裡,收到一封在Google任職的同學發來的群郵件,郵件內容是一篇尚未發表的論文,揭示了這一輪人工智能學習的大浪潮。

這篇論文將在發表後引起巨大反響,很快,全世界都將知道Google在秘密實驗室Xlab做出了關於“貓臉識別”的驚人研究。

“教學會因此迎來徹底變革。”張凱磊說,他受到強烈的震撼。張凱磊是南開大學數學系出身,曾在大二輟學創辦過一家教育培訓機構,因此這成了第一個跳入他腦中的想法。

10月,張凱磊果斷辭掉投資公司的工作,邀請陳銳峰博士加入,開始籌備創業。一年後,主打“拍照搜題”的學霸君面世,它將為日後的高考機器人Aidam提供大量的題庫儲備。

這個時期的中國高考機器人,正在襁褓中孕育著能量。

高考機器人開端於2011年。來自日本國立情報學研究所(NII)的新井紀子教授領頭髮起了“東大機器人計劃”(Todai Robot Project)。她召集了超過100名人工智能領域的專家組成專項團隊,目標是讓機器人Torobo能在2021年前通過東京大學的入學考試。

這一年,另一箇中國人林輝,在無數次碰壁後,找到了清華大學蘇研院。那時人工智能的概念尚未在國內甦醒,這個領域的創業公司寥寥,很多投資人不理解這個概念,“聊項目之前得先給他們科普”。

清華大學蘇研院大數據中心的成立,加速了研發進程。林輝擔任數據中心主任,到2014年,大數據中心旗下的智慧教育事業部將被分出來成立為準星雲學科技有限公司,林輝任CEO,並在不久後承擔起開發高考機器人AI-MATHS的責任。

2015.7

四年後,2015年7月21日。合肥一間會議室裡,數十位專家領導圍坐在一張棕色的圓桌旁,圓桌中間擺著一大簇鮮花,每個人身邊都放著一個白色茶杯,頭頂上拉著一條紅底黃字的大橫幅。在這個極其傳統的會議場景中,正討論著十分前沿的主題。

AI戰勝了圍棋,但卻輸給了高考

國家“十二五”863計劃信息技術領域“基於大數據的類人智能關鍵技術與系統”項目啟動會暨研討會。

會議探討並啟動了國家863類人智能項目,這個項目的主要任務,就是在3-5年時間內研製出能夠參加高考並考取大學的智能機器人。

這個節點標誌著中國第一個高考機器人的誕生。

項目由科大訊飛牽頭,聯合了包括清華大學在內的30家院校和單位。當天,首創了高考機器人的日本教授新井紀子也出現在會議席上。

時間回溯到5月的某一天,正在NII工作的新井紀子收到一封來自中國的郵件,這封郵件由科大訊飛發出,意欲與NII共同開發考試機器人。郵件提到,中國將推出一個國家級項目來開發考試機器人,前三年的預算大概是30億日元,“中國為此付出了巨大的努力”,新井紀子在收到郵件後很感慨,他們在“東大機器人計劃”上的花費大概為每年數百萬日元。

AI戰勝了圍棋,但卻輸給了高考

日本國立情報學研究所(NII)教授新井紀子。

她很快同意了這項合作,並在7月到訪中國。

林輝的公司在人工智能領域的長期研究這時候起了作用。立項後,準星公司一舉中標了高考機器人的數學應考項目,成為數學組別的組長單位。當時,人工智能識別、大數據處理等難關已經被準星攻破。

除了數學,這款機器人還包括另外兩個獨立的人工智能程序,分別應考語文和文綜。研發團隊立下目標,要在兩年後,2017年的6月,讓它在封閉環境中、斷網情況下與全國文科高考生一起考試,目標是考上一本。

這並不是一個容易實現的目標。當時,已經研究了四年的Torobo還無法達到日本入學考試分數線。上線兩年的學霸君的技術能力只能使系統在數學考試中得到30分。消息一出,有網友評論下四個字:“坐等打臉。”

2015.11

“參加大學入學考試對人工智能來說是一個很好的目標。”新井紀子說。

高考機器人在這一年的11月迎來突破性進展。

從2013年開始,Torobo每年都會參加日本大學入選考試,2015年的11月,它在考試中取得了511分的成績,總分950分,平均分數416分。這意味著,它可以進入全日本441傢俬立大學和33所全國性大學就讀,排名在全國前20%,其中數學排名前1%。

這是Torobo迄今為止取得的最佳成績。但它仍然未能考入東京大學。並最終放棄了這一目標。

當月,中國代表團到日本進行交流訪問,見證了這一關鍵時刻。

與隨後出現的中國機器人的虛擬系統不同,Torobo擁有一個真實的身體。它是白色的,有兩條可以靈巧活動的機械臂,左手捏著固定爪,右手握著圓珠筆。它在真正的試卷上進行答題。

AI戰勝了圍棋,但卻輸給了高考

Torobo 在真正的試卷上進行答題。

確切說,高考是比圍棋更難的實驗。阿法狗可以戰勝九段世界級高手,雖然計算量巨大,但圍棋的規則相對簡單,而高考對機器人來說,其泛化知識庫裡的規則,遠比圍棋的黑白、點位置和吃子規則複雜得多,它要求機器有感知分析、認知聯想和推理驗證的能力。

2016.3

“請拍板。”陳銳鋒博士在電話裡對張凱磊說。

2016年3月20號,張凱磊正在美國出差,晚上11點,夜色已經籠罩住整座城市,張凱磊回到酒店準備休息。這時,他接到了首席科學家陳銳鋒打來的電話,對方告訴他說,最近兩個禮拜,機器學習突然取得實質性突破,智能機器人項目可以開始做了。

很長一段時間,他們在機器學習上的進展極其緩慢。從2012年10月創業以來,學霸君的工程師做過許多努力,三年時間只把分數從0分提高到40分左右,其中從0分到30分大概用了6個月,之後兩年多的時間基本在原地踏步,無法取得突破,很多做這個項目的人最終都選擇了離開。

但這一次,陳銳鋒告訴張凱磊,新一批龐大的數據喂進去之後,突然發現增速變快,兩週內分數增加了2到3分,這在之前是從未發生過的。在排除了誤差之後,工程師們認定,新的方法被證實有效,雖然風險仍舊存在,但這個項目有了可預見的實現可能性。

那一夜,張凱磊激動到失眠,他一直清醒地思考到凌晨五點:“一定要做,這是核心突破口。”他隨後撥通了打往公司的電話。

這個電話持續了四個多小時,他在美國的這一頭拿著電話,讓那一頭的陳銳鋒召集來所有研發人員,近十個研發人員擠在一個辦公室裡,對著一部電話,挨個回答張凱磊提出的問題。全部問完以後,他命令下面的工程師出去,只留下核心工程師金霄然和陳銳鋒,接著給幾個副總裁打了電話,最後,他說:“定了,招人吧。”

掛了電話,美國清晨的陽光已經照進窗戶,北京已經進入黑夜,張凱磊站起身,走出了房間。

2017.2

Aidam的加入,是個歷史性的時刻。他們擁有了緊隨國家“超腦計劃”之後的全國第二部高考機器人,並間接地向AI-MATHS,林輝團隊的作品提出挑戰。

談到和林輝的關係,張凱磊對AI財經社說:“我們是朋友,經常交流。”但他不願意對對方的產品下論斷。

2月23日,是林輝的數學高考機器人AI-MATHS的成果展示時間。這是一次測試。

這一天,林輝帶著他的系統來到成都石室天府中學,將於高三文科班的43名學生進行一場“人機大戰”。這是AI-MATHS首次與學生對決。

AI戰勝了圍棋,但卻輸給了高考

機器人AI-MATHS敗給成都石室天府中學高三學生,僅得93分。

氣氛很緊張。高三數學老師拿著一個黃色密封袋,嚴肅地走進高三5班和6班的教室,密封袋裡裝著即將測試的數學試卷,老師站在講臺上,舉起密封袋,展示其完好無損,接著解開密封袋的繩索,抽出一疊試卷。學生們端坐在下面,望著他,激動中帶著忐忑。

旁邊的辦公室裡,一個隔間的工位上放著兩臺未聯網的臺式電腦,穿黑色外套的技術人員將一個磁盤插入主機,隨後坐在電腦面前,開始快速地點擊鼠標,電腦屏幕上出現一行行密密麻麻的數字。

試卷被一張張依次發到學生桌上,同時被一道題一道題輸入電腦,答題開始了,接下來兩個小時是緊張的等待。

林輝不知道結果會如何,他感慨了一句:“想給系統燒上幾炷香。”高三學生佘雨佳覺得自己肯定要輸給人工智能了,她略顯悲壯地說:“感覺我們是為人類的榮譽而戰”。

答題結束,電腦連上打印機,打印出紙質版的試卷答案,老師收上學生試卷,當場批改了這44份試卷。

事實證明,這一戰,人類贏了。高考機器人的試卷審批完畢,老師在分數欄寫下了數字“93”,而43名學生的平均成績在計算器上的顯示結果是“106”。

AI戰勝了圍棋,但卻輸給了高考

高考機器人 AI-MATHS的服務器。

結果在林輝的預料之中。當時的AI-MATHS每天要吃10套題,運算量可達2的800次方。截止這次測試,機器僅有100套試題的訓練量。“它不是題庫,而是理解答題的邏輯。”這是林輝對數學機器人的解釋。


他給AI-MATHS定下目標:6月7號上重本分數線。

2017.3

另一邊,張凱磊的電腦突然跳出一個測試結果。公司的幾十臺服務器承載著機器人的系統,每天自動訓練著40-50萬道的題目,不間斷地輸出測試結果。這一天,測試分數突然比往常多了幾十分之多。

他立馬撥通研究人員的電話,對方告訴他,幾何難題終於攻破了,Aidam又迎來一次質的飛躍。

張凱磊曾一度覺得,自己研發的機器人Aidam無法參加高考了。

3月之前,他們一直無法攻克這個難題——如何將幾何語言轉換為機器能理解的語言。

他在上海組建了一個專攻幾何的團隊,8個人,包括老師和技術人員,每天坐在辦公室裡思考、運算,就這樣過了一整年,一無所獲。

幾何問題解決不了,挑戰高考試題就是無稽之談,張凱磊焦慮地在辦公室走來走去,突然靈機一動,想到一個無策之策。他召集幾何團隊的人員,命令說,從今年往後,老師來學寫代碼,工程師學備課。

前期並無效果,經過幾個月的積累,3月的某一天,就像突然開竅了一樣,這個難題就這麼消失了,張凱磊把這歸功於工程師與老師長期融合的結果。

以“拍照搜題”起家的學霸君,4年來累積了超過7000萬道數學題目的題庫系統,加上學生大量手寫和上傳的題目,以及教輔書籍中的題目,共同構成Aidam的訓練數據庫。

AI戰勝了圍棋,但卻輸給了高考

AI-MATHS的讀題設備。

階段性成果取得,張凱磊也定下目標——6月7日Aidam將在媒體見證下挑戰高考數學題,與數名高考狀元同臺對戰。

但與AI-MATHS不同,Aidam是需要聯網的。這意味著兩者有不同的邏輯。

2017.6.7

6月7日,高考日,決戰的日子到來了。下午5點過後,兩場比拼分別在成都和北京的高考機器人間上演。

“105分。”主持人說出AI-MATHS的數學高考成績。

AI-MATHS機器人的“身體”並非模仿人類的樣子,而是10餘臺服務器組成的像冰箱一樣的櫃子。它被放在會議室旁邊的休息室裡,孤零零地站在房間中央,被一條白線與外界隔開。

這張高考試卷,花費了AI-MATHS 22分鐘。

與此同時,另一個高考機器人Aidam也在北京的一間會議室裡快速地運算著,它這次的任務是與6名來自不同省份的高考狀元對決。

一個小時後,數學老師拿來了Aidam的成績,舞臺大屏幕顯示出Aidam的答題卡,老師一個題一個題地報了機器人的得分。每一次唸到滿分的題目,下面的觀眾都爆發出熱烈的掌聲。

“機器人得分134分。”主持人最終報出數字,接著補充道:“6位高考狀元平均分,135分。”

1分之差,曾經輸給阿法狗的人類,這次在高考面前,打敗了AI。

AI戰勝了圍棋,但卻輸給了高考

Aidam與高考狀元成績對比,人類平均分以一分之差勝出。

這是一次階段性的勝利,這似乎能夠表明,儘管機器能夠實現大量的運算,但面對“理解”這個難題,至少在很長一段時間裡,它是隻屬於人類的專利。


除了人類與AI的成績差,可以看到,Aidam的成績要明顯高於AI-MATHS。

AI-MATHS的研發牽頭人林輝在演講中對此做出解釋。“聯網聯庫相當於開卷考試的環境,但我們是閉卷。”他傲慢地說。

他顯然是暗指機器人Aidam。

張凱磊對此未做解釋。AI財經社問張凱磊,怎麼看林輝的AI-MATHS。他只回答了一句:“我跟林輝是朋友,經常交流。”

結尾

中國高考已經進行到第四十年,每年誕生數百萬考生,很多人事後回憶起來,覺得當年沒日沒夜做題的自己與機器人無異,多年過後,高考也會在命運的不可掌控中消逝它的意義。

那麼,為什麼我們還要耗費如此多的人力物力財力,造出一個機器人來,迎合我們所謂的“應試教育”?

學霸君CEO張凱磊的回答是,如果機器人能夠挑戰高考,有理由相信機器人可以輔道學生,在自動解題、自動批改與個性化作業上幫助學生,這對中國教育來說具有革命性意義。

AI-MATHS的負責人林輝覺得,技術要應用在教育評測上,保證教師、學生、家長的“三減負一增效”。

新井紀子教授則沒有那麼樂觀了。高考機器人的研究讓她重新審視已有的教育方式。“如果AI在那方面能夠做得更好,那說明,我們需要新型的教育。”她憂心忡忡地說。


分享到:


相關文章: