講觀點:算法是否能夠做到客觀中立

講觀點:算法是否能夠做到客觀中立

------本期內容導讀------

既然用到了算法,那麼對於結果的產生,已經完全交給了冷冰冰的標準化公式、程式以及程序去運算並得出,這樣的結果就會給人以一種算法更加客觀、更加理性、甚至是更加獨立與公正的印象

------以下正文詳情------

前兩天剛剛和大家講過關於算法的話題,這麼一個技術化的專業術語,實際上不過是在傳統人類認知與經驗積累上的一種創新式發展。而依賴於計算機、互聯網發展之下的算法,也越來越成為人工智能時代的重要依賴。許多人都深信,越來越多的算法應用,可以幫助人類解決現代社會中所需要的技術中立問題。

從表面來看,既然用到了算法,那麼對於結果的產生,已經完全交給了冷冰冰的標準化公式、程式以及程序去運算並得出,這樣的結果就會給人以一種算法更加客觀、更加理性、甚至是更加獨立與公正的印象。所以,在商業市場上,我們也會看到許多品牌、服務,都打出“科學化的算法”、“更優秀的算法”的招牌,來為自己服務品質的“客觀公正”性而打出招牌。

可是,算法真的能夠保證這種中立嗎?大打問號!

1,問號之一,算法自身是人寫出來的,如果寫算法的人不客觀公正,結果又如何保證中立?

現實中,普通的桿秤,極難控制準星與秤砣的標準化生產,後來使用了電子秤來解決。但是一旦有人誠心在程序里加入了控制後門,就可以隨心所欲地讓這電子秤想準就準、想不準就不準,比普通桿秤作手腳的危害還要大100倍。而各種貌似客觀公正的算法,都會在最終加入各種加權規則,這些規則中,有些可以看成為合理修正,而有些則帶有編寫者強烈的個人主觀傾向。

舉一個例子,為了做到優秀人才選拔的公平公正,在簡歷審核中應用了標準的篩選算法,而編寫者從個人經驗與偏見中認為:某一省的人相對不夠誠信,於是自行加入降低這一省籍人士的通過權重,這樣的結果便可想而知了。

2,問號之二,算法是一個過程,如果算法使用的原始數據被影響汙染,那麼在這些數據基礎上得出的結果將如何保證中立?

有位朋友一直在抱怨,在他手機上的某個新聞閱讀APP的智能推薦系統簡單垃圾得要命,他從來不去關注任何有關手遊與二次元的東西。可是在這個APP上卻總是孜孜不倦地頻繁推薦這樣的內容。後來在剛剛的提醒下才發現,他的兒子一直在使用他的關聯手機帳號在關注收閱這樣的內容。

現實應用中,原始數據被汙染,或者不夠準確的因素太多。有些是採集場景不夠科學專業,有些是客觀實際過於複雜,還有些是利益團體的刻意介入。比如我們對於各種投票評選活動的最終分析算法,無論再先進,都必須要面臨著大量投票數據中,早就已經摻雜了太多的刷票機構的無效數據、汙染數據。其結果根本就沒有任何可參考價值。

3,問號之三,更多的算法只是提供出各種可能的結果,而從這些結果中選擇採用的標準又如何保證中立?

這種算法的應用環境主要體現在當前在信息閱讀、電商購買以及廣告接受等領域的各種智能推薦引擎。這些引擎的工作原理實際上是分為兩步來實現,第一步是根據前端的得到的各種數據來進行相關用戶畫像,確定一個標本體系,第二步才是按照這個標本結果去對應選擇推薦對象。而恰恰就在這個選擇的地步,就存在著取捨的情況下。

想想看,當年在搜索引擎的算法機制上,百度曾經對谷歌追得相當接近,但是最終市場口碑上卻相差甚遠,其主要原因就是,雖然算法算出來了應該推薦結果A,但是百度卻會因為種種利益原因,最終選擇推薦結果B,哪怕結果B是假的、錯的、有害的。

4,問號之四,推動算法技術不斷髮展的最大動力來自於各種商業化集團,而在商言商的特性下又如何能保證中立?

對於算法進行監督的呼聲已經不斷被提起。網上流傳一段視頻,某互聯網公司年會上,眾多程序員對於其中的抽獎程序的算法提出質疑,而編寫該抽獎應用的程序員為了力證清白,在一千多名研發同事的注視下當眾一句一句地review程序代碼,場面相當壯觀。

而現實中,能夠有這種當眾review自己代碼的程度員不多,更有可能是涉及其中的商業機構會因為或這或那的原因,根本就不可能主動接受各種監督與檢查。所以,在眾多的所謂創新型應用中,算法可能會是好算法,但會不會公平的算法、中立的算法,這也就不得而知了。


分享到:


相關文章: