寒武紀的戰爭-中國半導體工業發展歷程

上世紀50年代,成就了“20世紀最偉大發明”的“晶體管之父”的肖克利博士,有著名的八大門徒。這八位青年科學家後來離肖克利而去,集體成立了仙童半導體公司,肖克利怒不可遏地罵他們是“八叛徒”(The Traitorous Eight)。

在仙童期間,以諾伊斯為首的“八叛徒”在晶體管的基礎上設計出了基於硅的IC(集成電路),他本人與德州儀器的基爾比並稱“集成電路之父”。

後來由於仙童公司的經營問題,“八叛徒”分道揚鑣,這八位均在未來成為了赫赫有名的硅谷大佬,其中有兩位諾伊斯和摩爾於1968年創辦了在今天大名鼎鼎的IT巨頭——英特爾。

寒武紀的戰爭-中國半導體工業發展歷程

喬布斯(左)與諾伊斯(右)

1978年英特爾發佈了新款16位微處理器8086,也同時開創了一個新時代:X86架構誕生了。X86指的是微處理器執行的計算機語言指令集,定義了芯片的基本使用規則。而真正將X86架構發揚光大的是英特爾另外兩位合作伙伴——IBM和微軟。

1981年IBM生產出了世界上第一臺PC,它的處理器和操作系統分別選擇了當時並非一流的英特爾和微軟。出人意料的是,各個並非一流的組件組合成強大的產品,風頭蓋過產業先驅蘋果公司。

寒武紀的戰爭-中國半導體工業發展歷程

世界上第一臺PC

在蓋茨的建議下,IBM開放架構允許其他計算機制造商仿製和改進,使得IBMPC成為世界標準,這就是IBM兼容機的由來。讓IBM始料不及的是,PC廠商百花齊放,而操作系統和CPU卻是微軟和英特爾一枝獨秀。

藉著IBM PC的影響力,英特爾與微軟開始坐大,成為IBM兼容機廠商的供貨商,並逐漸在眉來眼去中形成了事實上的Wintel聯盟。

90年代英特爾推出了具有劃時代意義的奔騰芯片系列,而微軟則“珠聯璧合”地推出了Windows95。從那時起,大部分PC都採用了英特爾的X86處理器,而微軟的Windows是主流的操作系統。

曾有PC廠商老總無奈地說,“賣一臺PC能賺100元,其中英特爾拿去了70元,微軟拿去了40元。”而這種無奈,正是世紀之初國家下定決心要造中國人自己的CPU的直接動力。

潰敗

1999年,在專家加強對國內芯片企業支持力度的提議下,當時的國家經貿委政策司與信息產業部組成聯合小組,並起草了相關芯片企業優惠政策條款,這些條款最終在2000年6月形成了《鼓勵軟件產業和集成電路產業發展的若干政策》(18號文)。

受到使命感召,大批有海外留學經驗、在頂級芯片公司工作多年的半導體人才,在這一時期回到中國。90年代末,先後任職於摩托羅拉、日立(美國)的李德磊,回國成立一家百拓立克(BBT)公司,主要靠李德磊介紹外包業務。

1997年,離開摩托羅拉的李德磊加入日立,擔任微處理器設計總監,BBT承接的外包業務也從摩托羅拉轉向後者,主要做基於日立芯片的相關業務。

1999年,李德磊通過內部消息得知,日立美國要停止外包給BBT的一切項目。此時李德磊想到了一個人——聯想集團前總工程師倪光南,並詢問後者的建議。李德磊在80年代進入中科院計算所讀研時,倪李二人便已相熟。

寒武紀的戰爭-中國半導體工業發展歷程

聯想集團前總工程師倪光南

倪光南提出了自己的看法,“雖然當時日立的項目沒做完,但我發現通過這個項目,BBT在編譯器設計、芯片設計以及操作系統設計方面的人才積累已經很完善,基本具備自主研發CPU的技術能力。”而擁有一支做CPU的完整技術隊伍,是倪光南夢寐以求的。

李德磊同意了倪光南的建議。2000年3月8日,北京中芯微系統技術有限公司(“方舟科技”前身)在京註冊成立。倪光南幫助李德磊找錢、找政府、找資源,用自己的信譽和國產芯片巨大的前景,打動了一位熱心的深圳民營企業家,後者立即拍板投資2000多萬元。

那時,倪光南又找回了在聯想時的研發熱情。作為倪光南助手的梁寧在日後回憶道:“倪光南院士給我講方舟CPU+Linux操作系統,做成瘦客戶機NC,‘雲+端’解決方案,替代Wintel架構的時候,我當時興奮得緊緊攥住拳頭……”

有了CPU和SOC(系統級芯片)的技術,政府給的錢也到位了,2001年4月,第一片中國人自己設計的嵌入式芯片“方舟1號”問世。

國家幾個部委召開了盛大新聞發佈會,主辦單位陣容豪華,多個部委代表出席。這在中國工程院歷史是破天荒的第一次。

寒武紀的戰爭-中國半導體工業發展歷程

李德磊手持方舟芯片

貨真價實的芯片造出來了,然而真正的考驗才剛剛開始……

梁寧在《一段關於國產芯片和操作系統的往事》中談及,做CPU最難的不是開發,而是要在Wintel之外建立一個全新的遊戲規則。方舟不是寫不出英特爾那樣的設計,而是他們打不起官司。

自英特爾成立那天起,專利保護就是其核心競爭力之一,當2000年中國決定自主研發CPU時,英特爾幾乎把X86體系相關的專利全註冊了。對方舟團隊來說,不是X86體系的技術難度高,而是在這條路上的每一步,都會遇到英特爾的專利。

所以,倪光南做的技術路線選擇是,走RISC結構,做嵌入式,繞開X86體系。

CPU是做出來了,但是根本沒有一家下游企業可以使用。當時生產主板的中國廠商拿著方舟的CPU做不了產品原型開發,一直都是基於英特爾或它的設計工廠(design house)的公板進行再開發。也就是說,方舟芯片沒有它的目標客戶。

顯然,我們與英特爾的差距不是一塊CPU,而是一個基於CPU的開發生態系統。

無奈之下,方舟在做完CPU後,又建立硬件團隊,自己做出了公板,做出了NC的產品原型,終於可以交付市場……當時為了支持NC,北京市政府直接訂購了幾萬臺NC機。北京市副市長劉志華專門把各個行業的頭召集起來,“逼著”他們支持推廣NC。

NC主要靠政府推,李德磊認為只要做好政府就行了,不需要什麼市場推廣。在連續拒絕了前兩家客戶後,2002年經政府牽線搭橋,脫胎於聯想集團的神州數碼成為方舟真正意義上的第一家客戶。

2002年11月4月,雙方召開了盛大的新聞發佈會,神州數碼於當天宣佈正式推出基於方舟1號的網絡計算機。有媒體以“迎接PC時代後的NC風潮”為標題報道了這場發佈會。

寒武紀的戰爭-中國半導體工業發展歷程

2002年《e點天下》雜誌

2002年12月,方舟2號系統級芯片高調上市。聯想、京東方、泰豐、長城等知名廠商紛紛跟進。到2003年,在政府採購中勝出的網絡計算機均採用了方舟系列芯片。

但是NC的缺點顯然易見,Linux系統的操作複雜性姑且不論,更關鍵是沒有任何配套軟件可用。Windows早期依託IBM PC成為最普遍的操作系統,所有的配套軟件都圍繞Windows進行開發,而這些軟件均不能被Linux兼容。

為了解決這一問題,當時北京市先後發起了“揚帆計劃”“啟航計劃”,針對Linux桌面的13大類50多個問題,在全國進行招標,包括瀏覽器、OFFICE、播放器等,召集中國的所有Office高手一起破解微軟的文檔格式,以期能讀能存。

但是效果不好,用戶體驗極差,紛紛要求換回Wintel。比如當時重點推廣NC的學校,一有領導來視察,這些校長就嚷嚷“NC不能用啊,讓我們換PC吧”。啟航計劃的破產,也宣告了內嵌方舟芯片的NC徹底失敗。

隨著NC被逐步證明並不適用,從2003年底開始,NC從政府採購中淡出。方舟CPU的銷售也開始受到影響,財務狀況持續惡化。2004年被曝出挪用1538萬科研基金,方舟科技接受調查,CPU停止開發。

兩年後漢芯騙局敗露,國產芯片事業跌入谷底。

時至今日,在PC端,Windows+X86 CPU的格局依然無法打破。目前商業化做的最好的海光、兆芯,其主打產品還是X86 CPU,而且性能遠不如英特爾和AMD的產品。而與方舟走同一條路的龍芯,研發歷程長達18年,至今仍未實現商業化。

希望

2002年,年僅19歲的陳雲霽從中科大少年班畢業,意氣風發。

就在一年前,中國自主研發的第一塊CPU方舟1號面世,中科院計算所的龍芯課題組也正式成立,同樣畢業於中科大的胡偉武博士是該項目的首席科學家。而成為胡偉武的學生,是陳雲霽當時最大的志向。

這年夏天,陳雲霽終於如願以償,憑藉優異的成績,來到中科院計算所碩博連讀,他的導師正是胡偉武博士。

當時由於龍芯研發人手短缺,胡偉武將19歲的陳雲霽安排進了龍芯研發團隊,成為團隊中最年輕的成員。而陳雲霽也如福星一般,就在他加入團隊的這個夏天,我國首款通用CPU龍芯1號代號X1A50流片成功。

寒武紀的戰爭-中國半導體工業發展歷程

“龍芯之父”胡偉武

與方舟不同的是,龍芯團隊並沒有做CPU方面的經驗,沒有海外留學經歷,胡偉武更將自己戲稱為“土鱉派”。此外,胡偉武啟用了大量學生,處於一種邊學習邊開發的狀態,陳雲霽碩博連讀期間的最大收穫就是全程參與了龍芯的研發工作。

因為技術不成熟、學生比例較大的緣故,龍芯項目的進程相對緩慢,從龍芯1號到3號歷時7年時間,直到2010年龍芯中科公司成立,才開始產業探索。項目進程緩慢,對於陳雲霽有一個好處就是在芯片開發領域打下堅實的基礎。

就這樣,陳雲霽在龍芯團隊一待就是12年,24歲取得中科院計算所博士學位,29歲晉升為研究員。目前國內最新的計算機體系結構教材,就是胡偉武和陳雲霽在2011年合作編寫的。

這位14歲就進入中科大的天才科學家,還有一位比他小兩歲的弟弟——陳天石,自認為不輸於哥哥的陳天石,2001年16歲的他追隨哥哥的腳步來到中科大少年班。後來,正是這位少年改變了中國芯受制於人的窘境。

寒武紀的戰爭-中國半導體工業發展歷程

陳雲霽(左)與陳天石(右)

實際上,陳天石在中科大最早的專業並不是計算機。本在數學專業的他,卻因成績太差擔心以後“沒飯吃”,只能考慮換專業。百般糾結之後,陳天石通過抓鬮的方式在物理和計算機專業中選擇了計算機。

由於之前學的是數學專業,因此陳天石沒有寫代碼的經驗,但慶幸的是,當時計算機系的導師對學生十分寬容,並沒有嫌棄他成績差。本科畢業後,頗具天賦的陳天石順利進入中科大計算機系讀研究生,並一直讀到博士畢業。

在那期間,陳天石的導師是現在擔任南科大系主任的姚新老師。姚新老師不僅發現了陳天石的“慧根”,還順利地“忽悠”他學習人工智能(AI),此後更是成為他的主攻方向。

因為愛人在北京的關係,陳天石讀博的最後一年,經常跟導師找藉口說去北京計算所做基礎研究。一來二去,陳天石漸漸熟知了哥哥所負責的龍芯項目,並且得到了胡偉武的賞識。

在陳天石博士畢業之時,導師告訴他可以考慮留校工作,同時胡偉武也邀請陳天石加入龍芯工作。雖然他在此前完全沒有處理器架構相關的基礎知識,但是盛情難卻,陳天石最終還是答應了。

實際上這是一個非常需要勇氣的決定,當時的AI遠沒有現在火熱,甚至有很多人因找不到工作選擇轉行,而計算所大都選擇做芯片,陳天石在計算所感覺無用武之地。

終於,厭倦了畫版圖的陳天石,產生了一個非常“不靠譜”的想法:既然自己從事人工智能的研究,而且計算所又有芯片研發的基礎,是不是可以將AI和芯片結合在一起呢?

興奮不已的陳天石將這個“不靠譜”的想法告訴了哥哥陳雲霽,沒想到二人一拍即合。就這樣,陳天石、陳雲霽決定聯手做人工智能和芯片設計的交叉研究。儘管芯片設計落後發達國家幾十年,人工智能同樣落後幾十年,但是AI+芯片,陳氏兄弟稱得上是先驅者。

雖然做AI芯片的想法看似非常“不靠譜”,但是陳氏兄弟也認真地尋找可以支持自己想法的理論依據。當時,陳氏兄弟甚至以自動駕駛作為例子去說服計算所的領導。2010年得到計算所李院士支持的陳氏兄弟決定繼續AI芯片的研發工作。

2012年,陳雲霽、陳天石帶著幾個計算所的師弟,包括後來在寒武紀任高管的劉少禮、郭崎、劉道福、杜子東等,以及首次提出“AI加速器”概念的Olivier Temam教授,啟動了神經網絡處理器(AI芯片)項目,這也是寒武紀的技術來源。

項目命名非常直白,就是漢語拼音DianNao(電腦),據說是在Olivier教授的建議下定的這個名字,與其取一個平淡的英文名字,還不如反其道而行用中文的拼音來命名,這樣對外國人來說是“外語”,他們反而會覺得十分“洋氣”。

2014年3月,陳氏兄弟團隊公開提出國際首個深度學習處理器學術架構DianNao,該學術論文獲處理器架構領域頂級國際學術會議ASPLOS最佳論文獎,這是亞洲學術研究成果首獲處理器架構領域頂尖會議最佳論文。

同年12月,團隊在DianNao的基礎上公開提出國際首個多核深度學習處理器學術架構DaDianNao,該學術論文獲處理器架構領域頂級國際學術會議MICRO最佳論文獎。這也是MICRO自1963年創辦以來,第一次由美國以外的研究者摘得該獎項。

後來,團隊又相繼開發出了PuDianNao(普電腦,通用機器學習處理器)、ShiDianNao(視電腦,圖像識別處理器)等。2016年發佈國際首個智能處理器指令集Cambricon ISA,最初命名為DianNaoYu(電腦語)。

寒武紀的戰爭-中國半導體工業發展歷程

首個智能處理器指令集Cambricon ISA

2015年,陳雲霽入選年度《麻省理工科技評論》35歲以下的全球最佳35名創新人士,又在第二年榮獲中國青年科技獎和中科院青年科學家獎。

截至目前,陳氏兄弟團隊在計算機體系結構方面的系列技術成果已經獲得國際四大頂級會議的認可,包括ASPLOS上有兩篇,ISCA上有兩篇,MICRO與HPCA上各有一篇。

破局

在論文獲得國際學術界的認可之後,陳氏兄弟團隊的研究工作開始得到更多關注。2015年,團隊獲得了中科院先導專項數千萬元的資助,在這筆資金的支持下,僅20人的研發團隊研發出世界首款深度學習專用處理器原型芯片。

但是實驗室的成就不是陳氏兄弟的終極目標,他們要讓科研成果走出實驗室,給人們的生活帶來改變。但是,要成立公司就必須拉到投資,這對長期從事科研的陳氏兄弟是個不小的挑戰。雖然對項目感興趣的投資人較多,但真正看得懂也願意投資的人很少。

2015年12月,陳雲霽以“深度學習處理器芯片”為名申報的項目入圍蘇州工業園區第九屆科技領軍,獲領軍人才稱號。緣於蘇州工業園區的推薦,陳雲霽得以結識元禾原點的投資人樂金鑫,並給後者留下了深刻印象。

寒武紀的戰爭-中國半導體工業發展歷程

元禾原點合夥人 樂金鑫(左)

兩個時間安排很緊湊的人約到一塊兒談事情,從上午10點開始聊,聊到午飯來不及吃,聊到最終各自都取消了另外的行程安排。雙方聊得情投意合,投資寒武紀的決策也就進行得很迅速。

終於在2016年3月,北京中科寒武紀科技有限公司在中關村註冊成立,行事謹慎的陳天石擔任公司CEO,而陳雲霽選擇繼續在計算所搞科研,為寒武紀的首席科學家。

之所以將公司命名為“寒武紀”,根據陳天石介紹,“‘寒武紀’這個地質紀年是生物多樣性大爆發的時代,這項科研成果之所以取這個名字,就是希望人工智能也能像生命一樣出現大爆發。

而“寒武紀”也的確名副其實,公司在成立當年就發佈了世界首款終端人工智能專用處理器(寒武紀1A),面向智能手機、安防監控、可穿戴設備、無人機和智能駕駛等各類終端設備,併入選世界互聯網大會評選的十五項“世界互聯網領先科技成果”。

寒武紀1A處理器支持視覺、語音、自然語言處理等多種智能任務,一經推出便被華為看中,集成到華為海思的麒麟970芯片中。麒麟970被公認為全球首款內置獨立NPU(神經網絡單元)的智能手機AI計算平臺,而NPU指的就是寒武紀1A處理器。

寒武紀的戰爭-中國半導體工業發展歷程

華為麒麟970芯片發佈會

“寒武紀1A就是在計算機裡用虛擬的神經元和虛擬的突觸把他們聯結在一起,構成多層次的人工神經元網絡。在語音識別和視頻識別領域裡,它的識別精度已經超越了人類。”陳天石介紹,“每秒可以處理160億個神經元和超過2萬億個突觸,功耗卻只有原來的1/10。”

2017年10月,首款採用麒麟970的華為手機Mate 10正式發佈,這是全球手機行業首次引入人工智能概念。後來的事實證明,搭載寒武紀1A的華為麒麟970以每分鐘識別2005張照片擊敗了蘋果A11芯片每分鐘的889張照片。

用陳天石的話來說,“這一成功合作已成為全球手機和智能芯片發展史中的標誌性事件,吹響了手機進入智慧時代的號角,為中國高科技公司的商業合作樹立了典範。”

麒麟970名聲大噪,寒武紀也因此一炮而紅,拿到了上億元的訂單。同時,寒武紀獲得了國投創業、阿里巴巴、聯想創投、國科投資等共計1億美元的A輪融資,成立僅一年時間,寒武紀估值已達10億美元,

成為全球智能芯片領域誕生的第一個獨角獸公司。

2017年11月6日,寒武紀迎來自己的榮耀時刻,公司成立以來的首場發佈會在北京泰富酒店隆重召開。對於寒武紀短短一年就成為一家獨角獸公司,站在臺上的陳天石毫不掩飾自己內心的喜悅,哥哥陳雲霽則在臺下注視著口若懸河的陳天石。

寒武紀的戰爭-中國半導體工業發展歷程

發佈會臺上的陳天石

在發佈會上,寒武紀發佈了第二代終端處理器:寒武紀1H16和寒武紀1H8,以及面向開發者的人工智能軟件平臺Cambricon NeuWare。與上一代1A相比,寒武紀1H16具備更高性能、更低能耗,能效比達到了1A的2.3倍,而寒武紀1H8對比1H16又有更低的功耗和成本。

2018年5月,寒武紀再接再厲,發佈了第三代終端處理器寒武紀1M,在臺積電7nm工藝下8位運算的效能比達每瓦5萬億次運算,是1A性能的10倍,可廣泛應用於智能手機、智能音箱、智能攝像頭、智能駕駛等不同領域當中。

而更加引人注目的是,寒武紀還發布了第一代雲端AI芯片MLU100(MLU即機器學習處理器),以及搭載MLU100的雲端智能處理卡。

寒武紀MLU100芯片可獨立完成各種複雜的雲端智能任務,理論峰值速度達每秒128萬億次定點運算,達到世界先進水平。更可以與寒武紀1A/1H/1M系列終端處理器完美適配。

之所以要做雲端芯片,陳天石的解釋是,“過去大部分芯片廠商都是主攻端(如ARM)或者主攻雲(如Intel)。兩者兼顧的很少,因為端雲的任務生態都區別比較大。但是智能時代,我們認為這個局面會被全面打破,因為端和雲的AI任務是一體的,編程和使用的生態也是一致的。”

“MLU100芯片是寒武紀發展歷程上全新的里程碑,標誌著寒武紀已成為中國第一家(也是世界上少數幾家)同時擁有終端和雲端智能處理器產品的商業公司。”

寒武紀的戰爭-中國半導體工業發展歷程

陳天石手持MLU100芯片,身旁是他的導師陳國良院士

而據陳天石透露,寒武紀MLU100芯片已進入大規模量產階段,中國最大的三家服務器提供商——

浪潮、聯想、曙光都將對外發售搭載寒武紀MLU100芯片的AI服務器產品,多家頂尖互聯網公司都在緊鑼密鼓地進行產品導入。

到2020年底,力爭佔據中國高性能智能芯片市場的30%份額,力爭將寒武紀終端智能處理器集成進入超過10億臺設備。如果這兩個目標都能實現,寒武紀將初步支撐起中國主導的智能產業生態。

就在雲端芯片發佈後的一個月,寒武紀完成了數億美元的B輪融資,領投的機構為清一色的國家隊,投後公司整體估值達25億美元,領跑全球人工智能芯片的創業公司。

寒武紀的戰爭-中國半導體工業發展歷程

A輪、B輪均由“國家隊”領投

2018年10月11日,華為宣佈全面採用自研架構,外界一度解讀為華為已經放棄與寒武紀在芯片 IP 層面的合作。

但是10月底搭載麒麟980的華為Mate 20系列手機發布後,寒武紀官方發文《寒武紀1H加持華為麒麟980 帶來更強端側AI算力》,文中表示,繼寒武紀1A智能終端處理器助力麒麟970成為全球首款人工智能手機芯片後,寒武紀1H雙核處理器繼續為麒麟980帶來更強大、更卓越、更穩定的移動端AI計算力。用實際行動打消了外界的疑慮。

根據華為官方公佈,2018年發佈的兩款手機,mate20系列的出貨量超過了750萬臺,較早發佈的P20系列更是超過1700萬臺,其中寒武紀1A/1H系列芯片功不可沒。

未來

從方舟1號到寒武紀,我之所以要用“破局”這樣的字眼,因為相比於第一代“芯片人”的切膚之痛,寒武紀確實打開了芯片事業的新領域,在芯片和人工智能都不佔先的情況下,創造性地將二者結合,並在短時間內掌握世界領先的技術,

就憑這一點,寒武紀也配得上“破局”二字。

回顧那段歲月,第一代“芯片人”梁寧用到了激情、失落、懷疑、愧疚等一系列極端的字眼來表達當時複雜的情緒。NC機的潰敗讓後來者不敢踏入這一領域,漢芯騙局讓幾乎所有的國產芯片背上“詐騙”的罵名,就連中科院的龍芯也沒少被口誅筆伐。

之所以會有這段芯酸往事,應當歸結於生態的缺失,早期的芯片開發只能在Wintel制定的遊戲規則下進行,要用Windows,就必須X86。而想繞過X86就意味著要重新構建一個生態,這對於已經落後美國幾十年的中國PC產業來說談何容易。

直到今天,應用於PC的芯片依然沒有可以替代X86的,即使在國內處於領先地位的龍芯,也找不到任何一臺投放到市場的電腦嵌入了它的芯片,在PC領域已經鮮有突破口。

以在移動時代崛起的ARM為例,這家在90年代平平無奇的英國公司,21世紀乘著手機行業的東風攻城略地,目前全世界超過95%的智能手機和平板電腦都採用ARM架構,這就是時代的力量。

後來我們又迎來了智能時代,用戶已經不滿足於拍照片、看視頻和玩遊戲,產生了更多智能化的需求,比如圖像識別、語音識別、機器翻譯等。雖然CPU、GPU也能實現這些功能,但是功耗卻是難以克服的問題。

以2016年風靡全球的AlphaGo為例,使用了一千多塊CPU及一百多塊GPU,每盤棋局耗電成本3000美元。如果集成一塊專門用於處理智能化問題的NPU,就能大大減少CPU的運算任務,而寒武紀要做的正是這件事。

這一次,我們終於不再苦苦追趕美國人的腳步。直到今天,陳天石都十分感激自己在十年前做的那個“不靠譜”的決定。

陳雲霽曾說,“寒武紀的長期奮鬥目標是,讓人工智能芯片計算效率提高一萬倍,功耗降低一萬倍。”這意味著我們可以把AlphaGo放到手機裡,讓手機幫我們做各種各樣的事情,甚至通過長期觀察和深度學習後,最終可能出現人類想象不到的智能。


分享到:


相關文章: