人工智能背後的人工

“嗒嗒嗒”的鼠標敲擊聲在偌大的辦公室裡交匯著,一個眼圈發紅的女孩眼睛牢牢地盯住電腦屏幕,她所需要做的是把圖片中放置在冰箱的飲料名稱和類別一一對應起來。

面對不太常見的飲料,她在右下角的菜單欄裡不停地翻閱著“碳酸飲料、乳製品、涼茶”等類別。一輪過後,還是沒能找到這瓶飲料的名稱。她開始有點焦急,抬起頭來看了看周圍的人,然後又埋頭在茫茫大海中“捕撈”著。

不久後,她分類標註出來的這些數據將用於智能冰箱的物體識別。

近幾年,隨著AlphaGo擊敗人類頂尖圍棋選手李世石、柯潔等一系列事件,人工智能開始逐漸走紅。而人工智能需要大量的數據來供機器深度學習,這些數據正是出自這群隱形者手中,他們是“人工智能背後的人工“。

人工智能背後的人工

貧困山區裡的大數據“硅谷”

在過去數年,大數據、人工智能逐步走進社會成為公眾話題。而位於西南貧困山區的貴陽,從2014年開始扛起了大數據戰略的大旗,致力成為中國大數據的“硅谷”。

從貴陽市區沿著剛修好的公路駕車50多公里,就到了百鳥河數字小鎮上,道路兩邊的松樹站得齊刷刷的,一列又一列。小鎮四面環山,人跡罕至,去年因舉辦了人工智能服務論壇逐漸被外人所知。

在這裡,有著一個能容納400多人的數據工場,電腦前坐滿了來自附近一家扶貧高職的學生,他們流程化地框圖或處理語音,這些大量標註好的數據將用於“人臉識別、無人駕駛、語音識別”等高科技項目。

在1000多平方的標註服務部裡,學生們被劃分成不同的小組:有的負責把道路上的汽車、行人、紅綠燈等框起來,用於自動駕駛的訓練;有的負責把每一段語音記錄下來,用於語音識別;有的負責把視頻抽出幾幀,用於機器對運動物體的識別。

人工智能背後的人工

“數據標得再好,還是沒有前途”

小純是扶貧高職的一名學生,這個寒假,她並沒有像以往一樣早早回家。臨近期末的一節宣講課上,小純第一次聽到了“人工智能”這個詞便被吸引住了,她毫不猶豫地報名參加了數據工場的實習。

小純每天從學校來到辦公室的第一件事便是打開電腦,登錄眾包平臺,那裡有著2000多個圖片拉框任務等著她完成。

數據標註作為一個勞動密集型行業,門檻並不高。經過幾天的培訓,小純很快就上手了。框圖要求十分精細,每一個物體邊緣都需要放大對準,小純每天從早上九點框到晚上八點,這時常讓她的眼睛感到疲勞。

小純的桌上擺著一盆萬年青,旁邊的蘋果已經開始腐爛。小純坐在電腦旁,翹著腿,時不時抖動一下,目光沒離開過屏幕。鄰座的胖子對她說話的時候,她還是一動不動地保持姿勢回答,不想讓說話影響了自己的進度。

小純電腦屏幕上的道路指示牌上寫著“北六環”,這顯然是一條北京郊區的高速公路。她右手拖動鼠標,為道路圖片中的車輛和行人打上邊框,並標註行進方向和是否有遮擋,連續框了十幾張完全一樣的道路圖片後,她看起來有些無聊。

時常待在山區裡,小純對被自己框住的汽車一概不瞭解。一邊是一線大城市的自動駕駛研發,一邊是貧困山區中坐在電腦前框圖的高職學生,小純和同學們源源不斷地為北上廣深的人工智能公司提供數據,但他們之間存在著被忽視的數據摺疊。

“SUV到底長什麼樣?無人駕駛是不是真的安全?以後還要不要考駕照?”小純好奇地問著。她經常會把答案寄託於我這個外來者身上,時不時回過頭來對我使著眼色。

小純每天上班七八個小時,一個月能掙兩千元,她很珍惜這個相對體面的掙錢機會。二十天的工期裡,還不太熟手的她拿到了800元。臘月二十七,小純第一時間給奶奶買了她最喜歡的獼猴桃,轉了兩趟車,回到了位於偏遠山區的家鄉。

然而這個春節對小純來說是殘酷的,糟糕的事一樁接著一樁:臘月二十九,身體一直不錯的奶奶因為一場突如其來的大病,臥床不起,幾天不吃不喝;父母倆人常年分居兩地打工,年前辦理了離婚手續;哥哥不滿父親帶後媽回家過年的舉動,和父親大吵一架後,離家出走;而她,只能一個人扛起了全家的擔子。

從家裡回到公司,小純的狀態一直很壓抑,不僅煩惱沒人能傾訴,連數據標註的質量也出現了下降。周邊不斷有朋友問她:“為什麼還留在數據工場?每天就坐那裡框啊框的,學不到任何東西,眼還容易花掉。”漸漸地,她對自己的未來前途也開始感到迷茫。

小純承認,“即使數據標得再好,還是沒有前途。”小純一直夢想著,有朝一日能夠通過自己的努力,走出這座大山。

人工智能背後的人工

未來的機器人會不會取代我們

與小純渴望走出去的夢想不同,標註組長小廣希望畢業後能繼續留在這裡打拼。

小廣是數據工場的元老級員工,見證了工場從幾十人增至幾百人的歷程。2015年10月,他先是加入了扶貧高職的電子商務俱樂部,做跨境電商的產品分類。面對密密麻麻的字母,英文基礎不好的他做得很吃力,常常藉助翻譯工具理解。三個月後,大數據工場成立,他隨著實踐團隊移到數據標註部。

在做了一段時間的標註員後,經理欣賞小廣踏實和勤奮的工作態度,並舉薦他和另一個同學去競爭標註組長的崗位。然而爺爺突然因病去世的消息在午後的一個電話傳到他這裡,很長一段時間,小廣都待在家裡沒回去上班。

調整好自己後,小廣決定回到公司,原以為當標註組長的機會沒了,但經理還是相信他的能力,讓他試著帶十來個同學做項目。在數據工場的一年零一個月,他從標註員升到了標註組長。

“加入數據標註公司最大的改變是性格。”自懂事以來,小廣的父母就外出打工,把自己一個人放在外婆家生活。每當遇到煩惱,小廣就躲在房裡,也不知道怎麼和外婆訴說,慢慢地變得有點自閉。來到這裡,小廣開始和同學、老師有了更多的交流,開始談了第一次戀愛。

現在,小廣手下管著十幾個同學,他的主要工作是檢查、指導組員的標註質量,並向主管彙報標註進度。如今,小廣處理起來已經得心應手。

然而,數據標註的市場才剛打開,公司的運營也遭遇了寒冬。在前一兩個月,數據工場處於過渡期,大多時間用於培訓和鍛鍊學生,僅有少數項目產量化為盈利,學生的工資也往後拖延。“那時候項目不穩定,收入也時多時少,以補貼的形式,一般我能拿到五六百。” 小廣說。

此後,每天都有同學抗議。在新調來的經理在與小廣、其他同學持續的長談之後,這場危機總算是化解,工場也漸漸步入正軌。現在項目產量多的時候,小廣一個月能賺五千多塊。最近,他給遠在浙江打工的媽媽買了一部價值1300元的手機。

隨著人工智能深入更多垂直行業,需要的數據數量也持續增加。數據工場現有的400多人已經不能夠滿足甲方的要求。在緊鄰工場的地方,他們又租下了一幢三層高的大樓,待裝修好繼續擴招標註員工。

在那裡,小廣看到了公司的招牌被換成了數據工廠,他以為公司搞錯了:“怎麼變成了工廠呢,不應該是操場的‘場’嗎?”同學繼續低頭看著手機,用著很堅定的語氣回答小廣:“這本來就是工廠啊,四百多人,大量生產的工廠。”

現在距離畢業的時間僅有三個月,小廣希望自己能留下來。“用通俗一點的話說,就是賺多點錢,養活自己和家人。”小廣笑笑說。同時,小廣和他的同學也在擔心著,他們教會了機器人學習工作,而未來的機器人會不會取代他們的工作。


分享到:


相關文章: