從大數據到機器學習，帶你入門史上最強跨界學科

2019-05-13 20:56:00 華章科技

導讀：在傳統的科學研究中，學科與學科之間的融合與交流並不多，而有一門學科則做到了融合計算機科學、統計學、數學、工程學這些學科，甚至將其應用範圍擴展至經濟、生物、醫藥、物理、化學等領域中，這就是機器學習。

在過去的十年中，機器學習的這種多學科魅力逐漸被人們所理解並推崇。

作者：史蒂芬·馬斯蘭（Stephen Marsland）

假設你經營著一家網站，出售自己編寫的軟件。現在想讓網站為用戶提供更加個性化的服務，所以你開始收集訪問者的數據，比如他們的電腦型號、操作系統、瀏覽器、居住的國家，以及在一天中訪問該網站的時間。

這些數據可以從任何訪問者那裡得到，並且對於那些真正想要購買的用戶來說，你能夠了解到他們購買的東西，以及付款的方式（如PayPal、信用卡）。

因此，對於每一個在網站消費的用戶，你可以得到像電腦型號，瀏覽器，國家，時間，購買的軟件，付款方式這樣的數據清單。比如，你收集到的前三條數據可能是這樣的：

Macintosh OS X, Safari, UK, morning, SuperGame1, credit card
Windows XP, Internet Explorer, USA, afternoon, SuperGame1, PayPal
Windows Vista, Firefox, NZ, evening, SuperGame2, PayPal

以這些數據為基礎，你希望在網站裡添加一個“你可能感興趣的商品”的欄目，從而展示出可能與每一個訪問者的需求有關的軟件，這基於的是網頁載入時你可以訪問的數據，即電腦型號、操作系統、國家以及時間。

你希望隨著更多的人訪問網站而收集更多的數據，從而發現一些趨勢。比如來自於新西蘭的Mac用戶青睞第一款遊戲，或者那些對電腦更加精通的Firefox用戶需要自動下載應用程序等。

當收集了大量這樣的數據之後，你開始觀察它們，思考能夠用這些數據做些什麼。你面對的是一種預測（prediction）問題：根據所擁有的數據，預測下一個用戶將要購買什麼商品。並且你認為這種預測能夠奏效的原因在於，看上去相似的人，他們的行為常常也具有相似性。

那麼應該怎樣著手解決這個問題呢？這也是所謂的監督學習（supervised learning）的一個例子，因為我們知道了對應於一些樣本的正確結果（實際購買的軟件），所以可以把這些已知正確結果的樣本提供給學習器。

01 如果數據有質量，地球將成為黑洞

在世界的各個角落，計算機每天都在採集和存儲著數以TB級的數據。即使不考慮你收藏的MP3和節假日的照片，還有屬於商店、銀行、醫院、科學實驗室以及其他更多地方的正在不停存儲數據的計算機。

舉例來說，銀行建立關於人們如何花錢的記錄，醫院記錄下對不同疾病的患者所採取的醫療措施，汽車中的引擎監控系統會記錄下引擎的狀況以便檢測出何時會發生故障。這裡的挑戰在於如何對數據進行有用的處理：

如果銀行的計算機能夠學習到消費的模式，它們能否快速檢測出信用卡欺詐？
如果醫院之間共享數據，那麼那些效果沒有達到預期的治療措施能否快速被發現？
一輛智能汽車能否在早期就給出引擎隱患的警報，以至於你不會在最糟糕的地方拋錨？

這些都是能夠用機器學習的方法解決的問題。

科學研究中也同樣使用計算機來存儲大量的數據。首先是在生物學中，測量DNA微陣列中的基因表達將產生大量的數據集，同時還有蛋白質轉錄數據以及可用來描述各物種之間進化關係的系統進化樹。

其他學科也緊隨其後，天文學現在使用數碼望遠鏡，每天晚上世界各地的天文臺會存儲有關夜空的難以置信的高分辨率圖像，大約每晚有1TB。歐洲核子研究中心的大型強子對撞機每年產生大約25PB的數據。

同樣，在醫學裡，大到核磁共振成像，小到血液測試，這些醫療測試的結果也都被存儲起來。

數據爆炸已經廣為人知，如何應用這些數據去做一些有用的事情對我們來說不失為一個挑戰。

▲圖1-1 一組數據點作為表格數值和圖表上的點。相比於表格數據，我們更容易觀察可視化數據。但如果數據有三個以上的維度，我們就無法一次查看所有數據

這些數據集的大小和複雜度意味著人類無法從中獲取有用的信息。甚至連數據的存儲方式也對我們不利。面對一個滿是數字的文件，我們通常都不願意長時間閱讀。然而，若取出相同數據中的一部分，並且在圖中標記出來，我們就能有所作為。

比較一下圖1-1中的表格和圖像：顯然圖像更容易觀察和處理。不幸的是，我們生活的三維世界不容許我們對更高維度的數據進行處理。就連我們已經收集的簡簡單單的網頁數據也包含了四個不同的特徵，因此如果每一個特徵用一個維度表示的話，我們將需要四個維度！

面對這種情況，有兩種處理方法：降低維度（直到我們“簡單”的大腦能夠處理這個問題），或是使用計算機（它並不覺得高維的問題困難，並且不會對查看大量由數字組成的數據文件感到厭煩）。

▲圖1-2 相同的兩個風力渦輪機（位於新西蘭阿什赫斯特的Te Apiti風力發電場），相差約30°拍攝的兩幅視圖。三維物體的二維投影會隱藏信息

圖1-2中的兩幅圖表明瞭降低維度（更嚴格地說，映射到更低的維度）帶來的一個問題，即這樣做會掩蓋某些有用的信息，並且使圖像看上去很奇怪。上面討論的問題正是機器學習變得如此流行的原因之——有了電腦的幫助，很多超出人類極限的問題都能夠得到解決。

此外，如果維度不是遠大於三的話，可以使用其他的符號（glyph）表示，如數據點的大小或是顏色來描述其他維度的信息，但是如果數據集有100個維度的話，這種方法也無能為力了。

事實上，很有可能在某個時候你已經接觸到了機器學習的算法。它們在我們使用的很多軟件程序中都有所應用，例如微軟Office中臭名昭著的paperclip工具（也許不是什麼正面的例子）、垃圾郵件過濾器、聲音識別軟件以及大量的電腦遊戲。

它們也是加油站安全監控攝像頭以及收費公路上使用的自動車牌識別系統的一部分，並且在防滑剎車以及車輛穩定性系統中也有應用，甚至還是銀行決定是否給你提供貸款的一套算法中的一部分。

這一節的這個吸引人的標題只有在數據量非常巨大的時候才是正確的。我們很難計算出世界上所有的計算機中一共有多少數據，但是據某報告估計，2006年有大約160EB（160×10¹⁸字節）的數據被製造和存儲，2012年增長到2.8ZB（2.8×10²¹字節），到2020年，這個數字將會增長到40ZB。

然而，要製造一個地球大小的黑洞，其質量需要達到約40×10³⁵克。這意味著，數據如此沉重，你甚至連鋼筆大小的數據都提不動，更不必說一臺計算機了。

然而對於機器學習，事情變得更加有趣，預測2012年數據量將達到2.8ZB的同一份報告（Big Data，Bigger Digital Shadows，and Biggest Growth in the Far East by John Gantz and David Reinsel，EMC Corporation）中還指出，這些數據僅有25％具有有效信息，只有大約3％的數據被標記，而實際用於分析的數據不到0.5％！

02 學習

在我們深入研究這個話題之前，不妨先後退一步，思考一下究竟什麼是學習。對於機器來說，我們需要考慮的關鍵性概念是從數據中學習，因為數據正是我們所擁有的，某些情況甚至是數以TB級的。

不過，把它用人類行為的術語來翻譯也不是很難，那就是從經驗中學習。我們都認同人類以及其他的動物通過從經驗中學習，能夠展現出我們稱之為智能的行為。學習給我們提供了生活中的靈活性。事實上，無論我們的年齡有多大，都能夠調整和適應新的環境，學習新的技藝。

動物學習的關鍵部分是記憶（remembering）、適應（adapting）和泛化（generalizing）：識別出上一次遇到的這種情況（看到這個數據），我們試驗了某個特定的動作（給出了這個輸出），並且起到了作用（是正確的），因此我們將再一次嘗試這個動作，或者若沒有起作用，我們將嘗試一些不同的東西。

最後一個詞——泛化，它的含義是識別出不同情況之間的相似之處，使得應用在一個地方的東西在別處也能有所應用。這使學習變得有用，因為我們可以把知識應用在不同的地方。

當然，對於智能來說，還有很多其他的內容，比如推理（reasoning）和邏輯演繹（logical deduction），但這裡我們不會過多地關注那些。我們感興趣的是智能最基礎的部分——學習和適應，以及如何在計算機中來模擬。

在應用計算機推理和演繹方面人們也有過很多的興趣。這是最早期的人工智能（Artificial Intelligence）的基礎，並且常常被稱為符號處理（symbolic processing），因為這種情況下計算機操作的是能反映環境的符號。與此相反，機器學習的方法有時被稱為是亞符號（subsymbolic）的，因為它不包含符號或是符號的操作。

03 機器學習

機器學習，其含義是使計算機改進（modify）或是適應（adapt）它們的行為（不管這些行為是做出預測還是控制機器人），從而使這些行為變得更加準確，這裡的準確性是通過測量這些行為在多大程度上反映了正確的行為而得到的。

想象一下，你正在和一臺計算機玩Scrabble遊戲（或是某些其他的遊戲）。也許在開始的時候，你每次都能打敗它，但是在許多局過後，它開始打敗你，直到最後你再也不能獲勝。

這可能部分歸因於你的水平在變差，另一部分是因為計算機在學習如何在Scrabble遊戲中獲勝。當學會如何打敗你之後，它可以繼續在其他的玩家身上使用同樣的策略，這樣就不用在與每一個新玩家進行遊戲的時候都從零開始學習。這就是泛化的一種形式。

直到大概十年前，機器學習內在的多學科性才得到了認可。它融合了神經科學、生物學、統計學、數學以及物理學的觀點，使得計算機能夠學習。

關於學習的可行性有一個極好的證據，那就是在你的兩隻耳朵之間的由水和電（以及一些微量化學元素）組成的袋狀物。我們將簡要地研究一下它的內部構造，並且看看有沒有什麼東西能夠借鑑到機器學習算法中來。

結果當然是有的，並且神經網絡（neural network）正是從此發展而來，儘管現在連它們的發明者都不再予以承認，但經過發展，神經網絡已經被重新解釋為統計性的學習器。

另一個驅動機器學習研究方向改變的是數據挖掘（data mining），它研究的是從大規模的數據集中提取出有用的信息（這裡的挖掘是由使用計算機的人，而不是拿著鎬戴著安全帽的人來進行的），它需要的是高效的算法，這又把更多的重心放回到了計算機科學上。

機器學習方法的計算複雜度（computational complexity）將同樣是我們感興趣的，因為我們製造出來的是算法（algorithm）。這非常重要，因為我們可能想把某些方法應用在很大的數據集上，那些與數據集的大小成高階多項式時間複雜度（甚至更糟）的算法將會是一個問題。

這裡所說的複雜度通常分為兩個部分：訓練的複雜度，以及應用訓練好的算法的複雜度。訓練並不是經常發生，所以通常對時間的要求不是很苛刻，時間長一些也可以接受。

然而，我們在測試一個數據點時，通常需要能夠快速給出結論，而且當一個算法投入使用之後，這樣的測試點可能會有很多，因此較低的計算成本是必不可少的。

04 機器學習的類別

在本文開始的網站例子中，我們的目標是根據收集的信息，對網站的訪客可能購買哪種軟件做出預測。這裡有幾件有趣的事情。首先是數據，知道訪客之前購買過的軟件以及訪客的年齡可能會有用。

然而，這些信息不可能從他們的瀏覽器中得到（即使是cookie，也不能告訴你某個人的年齡），因此無法使用這些信息。挑選你想要使用的變量（專業術語稱為特徵（feature））對於找到問題合適的解來說，是很重要的一部分。

同樣，選擇如何處理數據也是很重要的。這在例子中時間的獲取上有所體現。你的計算機可以記錄精確到毫秒的時間，但這樣做毫無意義，因為你想要做的是發現用戶之間相似的模式。

基於這個原因，在前面的這個例子中，我選擇把時間量化為四個範圍——上午、下午、晚上、夜間，顯然我需要確保這些時間對於其所在時區來講是正確的。

我們把學習不精確地定義為

通過訓練從而在某項工作上做得更好。這導致了幾個很重要的問題：計算機如何知道它是否表現得更好，抑或是更差，以及它如何知道怎樣才能有所提高？對於這些問題，有幾個不同的但都是合理的答案，而且基於此產生了不同類型的機器學習。

我們可以把某個問題的正確答案提供給算法，這樣下一次算法遇到同樣問題的時候就可以得到正確的結果（這就是在網站例子中發生的，因為我們知道這位用戶已經購買了什麼軟件）。

但是，我們希望只提供給算法部分正確的答案，然後它能夠自動地發現問題所有的正確答案（泛化）。或者，我們所能做的是告知算法某一個答案是否正確，但並不告知如何去尋找正確的答案，這樣它必須對正確的答案進行搜索（search）。

這裡的一個變化是我們根據某個答案的正確程度給它一個得分，而不是隻響應一個“正確或是錯誤”。最後一種情況，我們可能根本沒有正確的答案，只能設法讓算法去尋找具有相似性的輸入。

上面針對這個問題的不同回答，給我們將要討論的機器學習類別提供了一個好的分類方法：

監督學習（supervised learning）：提供了一個由包含正確回答（目標（target））的樣本組成的訓練集（training set），並且以這個訓練集為基礎，算法進行泛化，直到對所有可能的輸入都給出正確的回答。這也稱為從範例（exemplar）中學習。
無監督學習（unsupervised learning）：沒有提供正確的回答，取而代之的是算法試圖鑑別出輸入之間的相似之處，從而使有著共同點的輸入被歸類為（categorized）同一類。非監督學習的統計學方法稱為密度估計（density estimation）。
強化學習（reinforcement learning）：強化學習介於監督學習和非監督學習之間。當答案不正確時，算法會被告知，但如何去改正則不得而知。它需要去探索，試驗不同的可能情況，直到得到正確的答案。強化學習有時被稱為伴隨
評論家（critic）的學習，因為它只對答案評分，而不提出改進的建議。
進化學習（evolutionary learning）：可以將生物學的進化看成一個學習的過程，即生物有機體改變自身，以提高在所處環境下的存活率和擁有後代的概率。我們將研究如何在計算機中對這一過程建模。在此使用適應度（fitness）的概念，相當於是對當前解答方案好壞程度的評分。

05 機器學習過程

以下簡要闡釋機器學習算法選擇、應用、評估問題的過程。

1. 數據收集和準備

在少數情況下，面對新的問題，我們需要從頭開始收集數據，或者至少需要重組和準備數據。事實上，如果問題是全新的，那麼可以選擇適當的數據，這個過程應該與下一步特徵選擇合併，這樣可以僅收集需要的數據。

這通常可以通過組合一個相當小的數據集來完成，該數據集需要包含你認為可能有用的所有特徵，並在選擇最佳特徵、收集和分析完整數據集之前進行試驗。

通常，困難在於存在大量可能相關的數據，但很難收集這些數據，因為需要進行多次測量，或者因為它們處於各種位置幷包含各種格式，不僅如此，我們很難恰當地融合它們，而且還要確保它們是乾淨的（clean），也就是說，沒有重大錯誤或缺少數據等問題。

對於監督學習，還需要目標數據，這可能需要相關領域的專家參與和大量時間投入。

最後，需要考慮數據量。機器學習算法需要大量數據，最好沒有太多噪聲。但是隨著數據集規模的增加，計算成本也在增加。對於大量數據，沒有額外計算的“最優平衡點”通常很難預測。

2. 特徵選擇

它通過實驗鑑別了對於問題最有用的特徵。這就要求對於問題和數據的先驗知識，對於上面的硬幣示例，常識可幫助我們識別一些可能有用的特徵並排除其他特徵。

除了識別對學習器有用的特徵之外，還必須要求數據收集不必花費大量費用或時間，並且對收集過程中可能出現的噪聲和其他數據損壞具有魯棒性（robust）。

3. 算法選擇

本書為你準備了對於給定數據集的算法（或算法群）選擇方法，為此還包括了每個算法的基本原理知識及其使用示例。

4. 參數和模型選擇

對於許多算法，必須手動設置參數，或者需要實驗來識別適當的值。本書也會在合適的章節討論這個問題。

5. 訓練

給定數據集、算法和參數，訓練應當只是使用計算資源來構建數據模型，以便預測關於新數據的輸出。

6. 評估

在系統投入應用之前，需要對其進行測試並評估其在未經訓練數據上的準確性。這通常包括與該領域的人類專家進行比較，以及為此選擇適當的度量指標。

關於作者：史蒂芬·馬斯蘭（Stephen Marsland），新西蘭惠靈頓維多利亞大學數學與統計學院教授，兼任新西蘭複雜系統卓越研究中心項目主管，負責複雜性、風險與不確定性等相關主題的研究工作。研究興趣是幾何和複雜系統的應用，主要涉及形狀空間、機器學習和算法。

本文摘編自《機器學習：算法視角》（原書第2版），經出版方授權發佈。

延伸閱讀《機器學習：算法視角》

推薦語：CRCPress機器學習領域暢銷教材，知名媒體推薦的十大機器學習入門教材之一。

分享到:

閱讀更多 華章科技 的文章

關鍵字: 電腦大數據銀行

「大數據」民主黨派微信熱文展播（2020年4月30日）

「大數據」民主黨派微信熱文展播（2020年4月28日）

「大數據」民主黨派微信熱文展播（2020年4月27日）

大數據 -- 重構產業園區服務時代！！

「大數據」民主黨派微信熱文展播（2020年4月8日）

「大數據」民主黨派微信熱文展播（2020年4月7日）

未來數據神話從“區塊鏈+大數據”開始

拿出“大數據”乾貨

萬用表+互聯網+大數據，儀器智能化才是硬道理。

大數據•響應數據中心戰略給力“新基建”

「大數據」民主黨派微信熱文展播（2020年3月3日）

大數據？別逗了，你連像樣的數據都沒有……

大數據，別為了耍帥買錯口罩了！

圖解｜兩江新區市場監管抗疫“大數據”

個人貸款有史以來關於大數據和網貸最形象生動的解釋

大數據！出大事！雙11火了這個姑娘的抖音號：846133997

大數據，是個沒有感情的殺手？一文解析大數據時代的利和弊

12月福利：Python+JAVA+大數據+編程語言整理大合集放送出去！

大健康、大數據，這些你都懂嗎？

大數據：國慶有2000萬人宅在家一天步數不足100步

精彩回顧：一圖秒懂「激情九月」大數據外媒競相報導齊點讚

生物醫學技術將加入華爲雲AI、大數據「佐料」，又會是什麼味道？

大數據+場景應用，婚騙4年騙走1.8億港元

「大數據」結婚的少了離婚的多了，是我們不敢愛了還是愛不起了？

「大數據」寧波幾百個小區最新二手房價格出爐，當前最吃香的是小戶型！

分享經濟學+倍增學原理+大數據+移動網際網路+的思維在奔跑了

大數據：基於百度慧眼數據的寧波市區職住空間分析

大藥房，大數據：爲什麼製藥商想要你的健康記錄

店鋪運營大連結，大數據，教你玩爆款，打造精品店鋪

大數據+商業商業分析就業前景

大數據：看上去很美的大概念？加入實戰營你也可以

大數據，小細節：元數據如何帶來安全風險

「融媒體”雙創“大賽｜人物」玩轉動車“大數據”的“金花”分析組

徐建輝：扯上“大數據”的相親，能有幾分“真”？

大數據：北京100個人中就有44個不工作，但是收入卻比你高

05.31 大數據：北京100個人中就有44個不工作，收入卻很高

新零售+大數據>2：新零售時代下的商業模式

大數據：數據大合集，快來集齊七龍珠召喚神龍吧！

基層這樣搞「大數據」，你確定不是在逗逼？

04.27 大數據“殺熟”，磨刀霍霍向“珠”羊！

大數據、雲計算促進消防行業「五化」發展

與我們息息相關的城市「大數據」你了解多少？

大數據：北京人口首次負增長！竟有這麼多人口流入環京！

大數據！商務部聯合今日頭條為“中美貿易戰”量體溫！

重磅！無錫最新“大數據”出爐，慶幸你沒有離開！

大數據“殺熟”咋治理多數受訪者表示被坑過

沈巍先生雜談（358）說好的快手不倒，陪伴到老呢？個個都是戲精

轉念一想，這種看似不正常的狀態才是正常的，隨著時間的推移，很多過去迷迷糊糊的人慢慢就看清了，是進是退跟著內心走就好，別管什麼善始善終，不要被這種論調道德綁架，過段時間，你覺得可以，再回來就行，開關在你自己手裡，一秒鐘就能完成進退。

出海奮鬥是有膽識後浪的更優選項

東南亞11國，除去東帝汶，其他10國組成東盟。東南亞有多熱，從很多國際資本的快速湧入都有目共睹。養老產業：泰國、越南、菲律賓、馬來西亞、印尼都是大受歐美日韓退休人士歡迎的亞洲養老目的地。

甲有5套房，不上班，收房租；乙有1套房，上班賺工資；丙租房子.

每逢佳節被相親，單身青年看這裡！

“非常戰疫

為珠峰“量身高”，為啥要人上去？

6日，2020珠峰高程測量行動測量登山隊舉行出發儀式，30多名計劃登頂的測量登山隊員當日從海拔5200米的珠峰登山大本營向更高海拔出發，計劃抓住近日的天氣窗口，擇日登頂測量。如果成功，這將成為我國專業測繪人員首次登頂珠峰測高。

我省獲國家局通報表揚

湖南名字最尷尬的城市，90%的人都會想歪，當地人：思想有問題！

湖南省作為中國中南地區的一個省份，經濟強勁，地位獨特，有著十足的發展後勁。湖南經濟總量在全國排名第九。湖南也是華夏文明的發祥地，境內的炎帝陵，成為華夏兒女尋根祭祖的重要場所。南嶽衡山就在湖南衡陽。湖南張家界景區成為馳名中外的旅遊景點。湖南湘西鳳凰古鎮成為中國馳名十大古鎮之一。

超六成前浪點贊《後浪》，全球白手起家90後富豪人均財富190億

再不來一場精緻野餐，我就要被開除中產籍了

《新週刊》創刊於1996年8月18日，由南方出版傳媒股份有限公司主管、主辦，以“中國最新銳的生活方式週刊”為定位，推出過一系列極具影響力的專題報道，是中國期刊市場最具代表性和影響力的雜誌之一，享有“話題策源地”的美譽。

工程師我只服中國，曾經放生到三峽的1萬條魚，如今怎麼樣了？

每一個大項目其實都會面臨一個問題，那就是生態環境，因為所涉及的範圍實在太廣了，所以需要考慮的問題都是多方面的，三峽就是我國早期的一個超大體量的工程，而三峽所涉及的問題也很多。三峽其實一直都是我國的驕傲，但是關於三峽的質疑聲，其實也一點都不少，特別是關於三峽環境方面的質疑聲。

後疫情時代的五個營銷啟示

現象級白酒——李渡高粱酒，作為沉浸式/場景化營銷的開創者，早在幾年前就使用互聯網工具助力，疫情爆發後一系列的操作自然遊刃有餘了，銷量同比增加170%，線上銷量更是增加400%。

丘北縣雙龍營鎮人民政府普者黑村委會、矣則村委會太陽能路燈採購安裝項目競爭性談判公告

為什麼重量相同的金子，銀行賣得比金店還便宜？看完漲知識了

為什麼重量相同的金子，銀行賣得比金店還便宜？看完漲知識了金子一直是我們中國人比較喜歡投資的一個東西，黃金飾品也是中國女性非常喜歡購買的東西，大家都知道，金子具有保值的功能，所以很多人既喜歡在銀行購買金條用於投資，又喜歡去一些金店購買黃金飾品。

打雷的時候，到底要不要拔掉插頭，關閉電路呢？看完漲知識了

打雷的時候，到底要不要拔掉插頭，關閉電路呢？看完漲知識了大家都會知道，每到夏天，我們的沿海地區都是一個多風多雨的季節，這時候我們出門也是需要隨時帶上雨具，避免突然有暴風雨這些天氣的出現。

乘坐火車時，把車票弄丟了怎麼處理？看完可算知道了

乘坐火車時，把車票弄丟了怎麼處理？看完可算知道了每次一到假期，就非常害怕到達火車站，可以說是基本上都是人山人海的感覺。很多人會為了方便去選擇去乘坐動車和高鐵。現在我們無論是出差還是去旅遊也都是會選擇去坐動車，又快又方便，主要還會很舒服。

肖戰視頻專訪：眼裡帶著故事，請不要聽說他，這一次，請他說

這是肖戰春節後，經歷過這麼多事後首次參加採訪。視頻中他依然是面帶微笑，依舊是少年的樣子。但是眼裡到這故事，說話也變得小心謹慎，談吐措辭也是越來越嚴謹了。

秦山核電應急行動水平優化項目招標公告

從中國電力集採招標網（www.dljczb.

巴基斯坦SK水電站消防及火災報警系統設備採購招標招標公告

從中國電力集採招標網（www.dljczb.

中煤能源新疆鴻新煤業葦子溝煤礦瓦斯抽採機械設備採購招標公告

從中國電力集採招標網（www.dljczb.

縣域社區團購，在平臺發展上有哪些優勢？

社區團購的迅速發展，已經不再侷限於各大城市中的小區。漸漸的擴大範圍，發展到一些城市邊緣的縣城鄉鎮。像是興盛優選、十薈團、食享會、考拉精選、美家買菜等月流水上億的社區團購頭部企業，都很重視下沉市場的佈局和開拓。

和王為念離婚，與“假奶奶”常香玉對簿公堂，55歲小香玉生活如詩

戲曲是以古代故事以及現代經典故事為題材的藝術表演，也是歷史悠久的綜合舞臺藝術樣式，表演戲曲難度很高，但戲曲人才依舊人才輩出，說起在戲曲圈中的佼佼者，陳百玲必是其一。

眼力測試：由4字組成的白菜，1秒看出4個字的智商都很高

這是一幅白菜圖，由4字組成的，1秒看出4個字的智商都很高！你看出來了嗎？

看圖猜字：這個不簡單，你能猜對幾個？全猜對眼力非凡

這福圖上的圖你能猜對幾個？全猜對眼力非凡，猜對3個眼力160，猜對3個是近視眼！你能猜對幾個字？

眼力測試：火焰中藏了4個字，看出3個算達標，全看出眼力200

熊熊火焰中藏了4個字，看出3個算達標，全看出眼力200！你能全部看出來嗎？

小米硬剛德國雙立人，400年非洲灌木做家用砧板，不發黴砍不壞

民以食為天。

眼力測試：美女圖中藏了5個漢字，全部看出來的眼力超群

這幅美女圖中藏了5個漢字，你能不能看出來是哪幾個漢字呢？全部看出來的眼力超群！

最萌Hodler，剛出生就收到比特幣大學教育基金的寶寶

作為比特幣愛好者，Izabella的父母在她出生當日於《泰晤士報》刊登了一則附帶比特幣地址的小廣告，希望廣大讀者能夠捐出小部分比特幣給他們女兒作為大學教育基金。

《瞭望大灣區》：全國中高風險區域今日“清零”

《晨會解讀》：中山證券投資顧問楊立華：連續上漲過後注意把握好操作節奏

孫鬆峰：幸福生活唱出來

河南市場安全網訊（www.hnscjgw.com）

衡水：守護一湖碧水打造生態之城

長城網衡水訊（記者張梅勝

英國小夥第一次體驗中國網吧，就被電腦屏幕嚇到直言：這是個啥

網吧其實不管是對於哪個國家的人來說，都是極具吸引力的，而在中國對於八九四年的年輕人和學生來說，網吧簡直就是快樂源泉，但是也是老師家長中的眼中釘，肉中刺。相信很多人小時候可能都有過被家長從網吧裡揪出來的不甚美好的回憶。

微商到底多能吹牛！哈哈哈哈哈千萬別屏蔽，每天都是快樂源泉

雖然有的時候在朋友圈裡有很多微商不停的發朋友圈，讓大家覺得有些困擾和煩悶，有一種私生活被侵擾的感覺。但是不要忙著屏蔽他們，有的時候這些總是吹得天花亂墜的微商也能給人們帶來快樂的源泉。

2020珠峰高程複測出發儀式今日舉行小米10全程助力丈量世界新高度

5月6日，2020珠峰高程測量登山隊伍出發儀式正式舉行，30多名隊員當日從海拔5200米的登山大本營向更高海拔出發，開啟珠峰衝頂測量。隊員們力爭抓住近日的天氣窗口，擇日登頂測量。如果成功，這將是我國專業測繪人員首次登頂珠峰測高。

“十大沂蒙工匠”齊玉祥：鋼花璀璨照亮青春之路

一支焊槍、一面防護罩，鋼花白晝繁星，在刺耳的噪聲中點亮四壁，焊工齊玉祥用13年的青春，打磨出了人生最璀璨的鋼花。2007年，齊玉祥畢業後進入山東華源鍋爐有限公司工作。剛進公司沒多久，由於工作需要，他被分配到了焊接崗位。

日本的丈母孃，賣萌發嗲也是蠻有技術的

國內這點估計是比不過了

消費水平最高的5座城市，北上廣深均在列，另一座你知道是哪嗎？

我們都知道在地大物博的中國，擁有很多城市，而它們之間的等級劃分也都是不同的，等級越高，往往消費就會越高，那麼說起國內消費水平最高的幾座城市，夥伴們都知道是哪裡嗎？接下來就讓小編帶大家去了解一下吧，看看有沒有你心中的那個。

德國愛他美怎麼樣？"斷貨王"愛他美值得買嗎？

哈哈。每次都會用iGepir 姐姐推薦來的，小寶從6個月混養喝起，現在快1歲半了，一直喝愛他美，不上火，購入量大，也算全心全意支持國際媽咪了

廣東有望合併的3座城市：合併成功後，將誕生一座千萬人口的城市

相信大家都知道，目前廣東是中國經濟實力最強的城市，哪怕是國內富有的浙江和江蘇，在經濟上也被廣東牢牢按住。你要知道廣東可是中國唯一有一線城市的省份，而且還是兩座。光靠這一點就能讓全國所有的省份羨慕，但比較遺憾的是，廣東的經濟發展似乎並不平衡。

國外奶粉怎麼樣？去哪買靠譜？線下實體店一定比網店安全嗎？

之前買的一直是國際媽咪的海外倉，但是疫情的緣故怕被吧斷糧所以在海外倉直郵了一箱又在自貿倉補了一箱，反正奶粉是消耗品，不擔心吃不完hhh。自貿倉物流速遞還是很快的，重慶保稅區發貨，4天到達。

四川潛力大的城市：還是重要的恐龍化石產地，被譽為“恐龍之鄉”

對此有的網友說:很多人可能不知道，其實我們自貢還有飛機制造，汽車製造，新能源汽車，及新能源電池研發與製造產業，雖然剛起步，但未來可期!

00後，吾輩當自強

當記者採訪她時，她說了一句讓人永生難忘的話:“其實我們並不是什麼逆行者，只不過是一些普通人在堅守自己的使命。

“我來！”

十天，我應該可以讀完一本《百年孤獨》，應該可以學會用吉他彈一首歌，還應該可以追完一部電視劇《慶餘年》。

東北唯一新一線城市：被譽為“東方魯爾”，經濟卻不如省內地級市

眾所周知這幾年東北的經濟，確實沒有以前增長得那麼快了。原因相信大家也很清楚，簡單點說就是南方更適合發展經濟。因此中國的經濟重心向南移動，所以在未來的幾年甚至幾十年裡面，中國南方的經濟都會比北方強。特別是廣東省跟浙江省的經濟水平，目前已經超越世界上大部分國家了。

人生有尺，做人有度

“救命錢”變“唐僧肉” 扶貧最後一公里處“蠅貪”頻現！

家境殷實的90後海歸女為何“沉迷”偷快遞？

青春洋溢，不加過分修飾，真實的少女感，你喜歡嗎？

4名網友預謀綁架一董事長，匯合後劇情突變……

江蘇的第二個“蘇州”，並非南京和無錫，而是這座低調的城市

說起蘇州的大名，相信是無人不知，無人不曉的，作為我國名副其實的最強地級市，蘇州近些年屬實為人們帶來了很大驚喜，甚至在經濟發展上也已經遠超省會南京，而今天小編要為大家帶來的則是江蘇境內的“第二個蘇州”，發展潛力巨大，並非南京和無錫，而是這座十分低調的城市。

從大數據到機器學習，帶你入門史上最強跨界學科

01 如果數據有質量，地球將成為黑洞

02 學習

03 機器學習

04 機器學習的類別

05 機器學習過程

相關文章:

「大數據」民主黨派微信熱文展播（2020年4月30日）

「大數據」民主黨派微信熱文展播（2020年4月28日）

「大數據」民主黨派微信熱文展播（2020年4月27日）

大數據 -- 重構產業園區服務時代！！

「大數據」民主黨派微信熱文展播（2020年4月8日）

「大數據」民主黨派微信熱文展播（2020年4月7日）

未來數據神話從“區塊鏈+大數據”開始

拿出“大數據”乾貨

萬用表+互聯網+大數據，儀器智能化才是硬道理。

大數據•響應數據中心戰略給力“新基建”

「大數據」民主黨派微信熱文展播（2020年3月3日）

大數據？別逗了，你連像樣的數據都沒有……

大數據， 別為了耍帥買錯口罩了！

圖解｜兩江新區市場監管抗疫“大數據”

個人貸款有史以來關於 大數據 和 網貸 最 形象生動 的解釋

大數據！出大事！雙11火了這個姑娘的抖音號：846133997

大數據，是個沒有感情的殺手？一文解析大數據時代的利和弊

12月福利：Python+JAVA+大數據+編程語言整理大合集放送出去！

大健康、大數據，這些你都懂嗎？

大數據：國慶有2000萬人宅在家 一天步數不足100步

精彩回顧：一圖秒懂「激情九月」大數據 外媒競相報導齊點讚

生物醫學技術將加入華爲雲AI、大數據「佐料」，又會是什麼味道？

大數據+場景應用，婚騙4年騙走1.8億港元

「大數據」結婚的少了離婚的多了，是我們不敢愛了還是愛不起了？

「大數據」寧波幾百個小區最新二手房價格出爐，當前最吃香的是小戶型！

分享經濟學+倍增學原理+大數據+移動網際網路+的思維在奔跑了

大數據：基於百度慧眼數據的寧波市區職住空間分析

大藥房，大數據：爲什麼製藥商想要你的健康記錄

店鋪運營大連結，大數據，教你玩爆款，打造精品店鋪

大數據+商業 商業分析就業前景

大數據：看上去很美的大概念？加入實戰營你也可以

大數據，小細節：元數據如何帶來安全風險

「融媒體”雙創“大賽｜人物」玩轉動車“大數據”的“金花”分析組

徐建輝：扯上“大數據”的相親，能有幾分“真”？

大數據：北京100個人中就有44個不工作，但是收入卻比你高

05.31 大數據：北京100個人中就有44個不工作，收入卻很高

新零售+大數據>2：新零售時代下的商業模式

大數據：數據大合集，快來集齊七龍珠召喚神龍吧！

基層這樣搞「大數據」，你確定不是在逗逼？

04.27 大數據“殺熟”，磨刀霍霍向“珠”羊！

大數據、雲計算促進消防行業「五化」發展

與我們息息相關的城市「大數據」 你了解多少？

大數據：北京人口首次負增長！竟有這麼多人口流入環京！

大數據！商務部聯合今日頭條為“中美貿易戰”量體溫！

重磅！無錫最新“大數據”出爐，慶幸你沒有離開！

大數據“殺熟”咋治理 多數受訪者表示被坑過

沈巍先生雜談（358）說好的快手不倒，陪伴到老呢？個個都是戲精

出海奮鬥是有膽識後浪的更優選項

甲有5套房，不上班，收房租；乙有1套房，上班賺工資；丙租房子.

每逢佳節被相親，單身青年看這裡！

為珠峰“量身高”，為啥要人上去？

我省獲國家局通報表揚

湖南名字最尷尬的城市，90%的人都會想歪，當地人：思想有問題！

超六成前浪點贊《後浪》，全球白手起家90後富豪人均財富190億

再不來一場精緻野餐，我就要被開除中產籍了

工程師我只服中國，曾經放生到三峽的1萬條魚，如今怎麼樣了？

後疫情時代的五個營銷啟示

丘北縣雙龍營鎮人民政府普者黑村委會、矣則村委會太陽能路燈採購安裝項目競爭性談判公告

為什麼重量相同的金子，銀行賣得比金店還便宜？看完漲知識了

打雷的時候，到底要不要拔掉插頭，關閉電路呢？看完漲知識了

乘坐火車時，把車票弄丟了怎麼處理？看完可算知道了

肖戰視頻專訪：眼裡帶著故事，請不要聽說他，這一次，請他說

秦山核電應急行動水平優化項目招標公告

巴基斯坦SK水電站消防及火災報警系統設備採購招標招標公告

中煤能源新疆鴻新煤業葦子溝煤礦瓦斯抽採機械設備採購招標公告

縣域社區團購，在平臺發展上有哪些優勢？

和王為念離婚，與“假奶奶”常香玉對簿公堂，55歲小香玉生活如詩

眼力測試：由4字組成的白菜，1秒看出4個字的智商都很高

看圖猜字：這個不簡單，你能猜對幾個？全猜對眼力非凡

眼力測試：火焰中藏了4個字，看出3個算達標，全看出眼力200

小米硬剛德國雙立人，400年非洲灌木做家用砧板，不發黴砍不壞

眼力測試：美女圖中藏了5個漢字，全部看出來的眼力超群

最萌Hodler，剛出生就收到比特幣大學教育基金的寶寶

大數據，別為了耍帥買錯口罩了！

個人貸款有史以來關於大數據和網貸最形象生動的解釋

大數據：國慶有2000萬人宅在家一天步數不足100步

精彩回顧：一圖秒懂「激情九月」大數據外媒競相報導齊點讚

大數據+商業商業分析就業前景

與我們息息相關的城市「大數據」你了解多少？

大數據“殺熟”咋治理多數受訪者表示被坑過

衡水：守護一湖碧水打造生態之城

2020珠峰高程複測出發儀式今日舉行小米10全程助力丈量世界新高度