語音識別技術簡史

2019-08-23 14:46:43 哈文說科技

語音識別，通常稱為自動語音識別，英文是Automatic Speech Recognition，縮寫為 ASR，主要是將人類語音中的詞彙內容轉換為計算機可讀的輸入，一般都是可以理解的文本內容，也有可能是二進制編碼或者字符序列。但是，我們一般理解的語音識別其實都是狹義的語音轉文字的過程，簡稱語音轉文本識別（ Speech To Text, STT ）更合適，這樣就能與語音合成(Text To Speech, TTS )對應起來。

語音識別是一項融合多學科知識的前沿技術，覆蓋了數學與統計學、聲學與語言學、計算機與人工智能等基礎學科和前沿學科，是人機自然交互技術中的關鍵環節。但是，語音識別自誕生以來的半個多世紀，一直沒有在實際應用過程得到普遍認可，一方面這與語音識別的技術缺陷有關，其識別精度和速度都達不到實際應用的要求；另一方面，與業界對語音識別的期望過高有關，實際上語音識別與鍵盤、鼠標或觸摸屏等應是融合關係，而非替代關係。

深度學習技術自 2009 年興起之後，已經取得了長足進步。語音識別的精度和速度取決於實際應用環境，但在安靜環境、標準口音、常見詞彙場景下的語音識別率已經超過 95%，意味著具備了與人類相仿的語言識別能力，而這也是語音識別技術當前發展比較火熱的原因。

隨著技術的發展，現在口音、方言、噪聲等場景下的語音識別也達到了可用狀態，特別是遠場語音識別已經隨著智能音箱的興起成為全球消費電子領域應用最為成功的技術之一。由於語音交互提供了更自然、更便利、更高效的溝通形式，語音必定將成為未來最主要的人機互動接口之一。

當然，當前技術還存在很多不足，如對於強噪聲、超遠場、強幹擾、多語種、大詞彙等場景下的語音識別還需要很大的提升；另外，多人語音識別和離線語音識別也是當前需要重點解決的問題。雖然語音識別還無法做到無限制領域、無限制人群的應用，但是至少從應用實踐中我們看到了一些希望。

本篇文章將從技術和產業兩個角度來回顧一下語音識別發展的歷程和現狀，並分析一些未來趨勢，希望能幫助更多年輕技術人員瞭解語音行業，並能產生興趣投身於這個行業。

語音識別的技術歷程

現代語音識別可以追溯到 1952 年，Davis 等人研製了世界上第一個能識別 10 個英文數字發音的實驗系統，從此正式開啟了語音識別的進程。語音識別發展到今天已經有 70 多年，但從技術方向上可以大體分為三個階段。

下圖是從 1993 年到 2017 年在 Switchboard 上語音識別率的進展情況，從圖中也可以看出 1993 年到 2009 年，語音識別一直處於 GMM-HMM 時代，語音識別率提升緩慢，尤其是 2000 年到 2009 年語音識別率基本處於停滯狀態；2009 年隨著深度學習技術，特別是 DNN 的興起，語音識別框架變為 DNN-HMM，語音識別進入了 DNN 時代，語音識別精準率得到了顯著提升；2015 年以後，由於“端到端”技術興起，語音識別進入了百花齊放時代，語音界都在訓練更深、更復雜的網絡，同時利用端到端技術進一步大幅提升了語音識別的性能，直到 2017 年微軟在 Swichboard 上達到詞錯誤率 5.1%，從而讓語音識別的準確性首次超越了人類，當然這是在一定限定條件下的實驗結果，還不具有普遍代表性。

GMM-HMM時代

70 年代，語音識別主要集中在小詞彙量、孤立詞識別方面，使用的方法也主要是簡單的模板匹配方法，即首先提取語音信號的特徵構建參數模板，然後將測試語音與參考模板參數進行一一比較和匹配，取距離最近的樣本所對應的詞標註為該語音信號的發音。該方法對解決孤立詞識別是有效的，但對於大詞彙量、非特定人連續語音識別就無能為力。因此，進入 80 年代後，研究思路發生了重大變化，從傳統的基於模板匹配的技術思路開始轉向基於統計模型（HMM）的技術思路。

HMM 的理論基礎在 1970 年前後就已經由 Baum 等人建立起來，隨後由 CMU 的 Baker 和 IBM 的 Jelinek 等人將其應用到語音識別當中。HMM 模型假定一個音素含有 3 到 5 個狀態，同一狀態的發音相對穩定，不同狀態間是可以按照一定概率進行跳轉；某一狀態的特徵分佈可以用概率模型來描述，使用最廣泛的模型是 GMM。因此 GMM-HMM 框架中，HMM 描述的是語音的短時平穩的動態性，GMM 用來描述 HMM 每一狀態內部的發音特徵。

基於 GMM-HMM 框架，研究者提出各種改進方法，如結合上下文信息的動態貝葉斯方法、區分性訓練方法、自適應訓練方法、HMM/NN 混合模型方法等。這些方法都對語音識別研究產生了深遠影響，併為下一代語音識別技術的產生做好了準備。自上世紀 90 年代語音識別聲學模型的區分性訓練準則和模型自適應方法被提出以後，在很長一段內語音識別的發展比較緩慢，語音識別錯誤率那條線一直沒有明顯下降。

DNN-HMM時代

2006年，Hinton 提出深度置信網絡（DBN），促使了深度神經網絡（DNN）研究的復甦。2009 年，Hinton 將 DNN 應用於語音的聲學建模，在 TIMIT 上獲得了當時最好的結果。2011 年底，微軟研究院的俞棟、鄧力又把 DNN 技術應用在了大詞彙量連續語音識別任務上，大大降低了語音識別錯誤率。從此語音識別進入 DNN-HMM 時代。

DNN-HMM主要是用 DNN 模型代替原來的 GMM 模型，對每一個狀態進行建模，DNN 帶來的好處是不再需要對語音數據分佈進行假設，將相鄰的語音幀拼接又包含了語音的時序結構信息，使得對於狀態的分類概率有了明顯提升，同時DNN還具有強大環境學習能力，可以提升對噪聲和口音的魯棒性。

簡單來說，DNN 就是給出輸入的一串特徵所對應的狀態概率。由於語音信號是連續的，不僅各個音素、音節以及詞之間沒有明顯的邊界，各個發音單位還會受到上下文的影響。雖然拼幀可以增加上下文信息，但對於語音來說還是不夠。而遞歸神經網絡（RNN）的出現可以記住更多歷史信息，更有利於對語音信號的上下文信息進行建模。

由於簡單的 RNN 存在梯度爆炸和梯度消散問題，難以訓練，無法直接應用於語音信號建模上，因此學者進一步探索，開發出了很多適合語音建模的 RNN 結構，其中最有名的就是 LSTM 。LSTM 通過輸入門、輸出門和遺忘門可以更好的控制信息的流動和傳遞，具有長短時記憶能力。雖然 LSTM 的計算複雜度會比 DNN 增加，但其整體性能比 DNN 有相對 20% 左右穩定提升。

BLSTM 是在 LSTM 基礎上做的進一步改進，不僅考慮語音信號的歷史信息對當前幀的影響，還要考慮未來信息對當前幀的影響，因此其網絡中沿時間軸存在正向和反向兩個信息傳遞過程，這樣該模型可以更充分考慮上下文對於當前語音幀的影響，能夠極大提高語音狀態分類的準確率。BLSTM 考慮未來信息的代價是需要進行句子級更新，模型訓練的收斂速度比較慢，同時也會帶來解碼的延遲，對於這些問題，業屆都進行了工程優化與改進，即使現在仍然有很多大公司使用的都是該模型結構。

圖像識別中主流的模型就是 CNN，而語音信號的時頻圖也可以看作是一幅圖像，因此 CNN 也被引入到語音識別中。要想提高語音識別率，就需要克服語音信號所面臨的多樣性，包括說話人自身、說話人所處的環境、採集設備等，這些多樣性都可以等價為各種濾波器與語音信號的卷積。而 CNN 相當於設計了一系列具有局部關注特性的濾波器，並通過訓練學習得到濾波器的參數，從而從多樣性的語音信號中抽取出不變的部分，CNN 本質上也可以看作是從語音信號中不斷抽取特徵的一個過程。CNN 相比於傳統的 DNN 模型，在相同性能情況下，前者的參數量更少。

綜上所述，對於建模能力來說，DNN 適合特徵映射到獨立空間，LSTM 具有長短時記憶能力，CNN 擅長減少語音信號的多樣性，因此一個好的語音識別系統是這些網絡的組合。

端到端時代

語音識別的端到端方法主要是代價函數發生了變化，但神經網絡的模型結構並沒有太大變化。總體來說，端到端技術解決了輸入序列的長度遠大於輸出序列長度的問題。端到端技術主要分成兩類：一類是 CTC 方法，另一類是 Sequence-to-Sequence 方法。傳統語音識別 DNN-HMM 架構裡的聲學模型，每一幀輸入都對應一個標籤類別，標籤需要反覆的迭代來確保對齊更準確。

採用 CTC 作為損失函數的聲學模型序列，不需要預先對數據對齊，只需要一個輸入序列和一個輸出序列就可以進行訓練。CTC 關心的是預測輸出的序列是否和真實的序列相近，而不關心預測輸出序列中每個結果在時間點上是否和輸入的序列正好對齊。CTC 建模單元是音素或者字，因此它引入了 Blank。對於一段語音，CTC 最後輸出的是尖峰的序列，尖峰的位置對應建模單元的 Label，其他位置都是 Blank。

Sequence-to-Sequence 方法原來主要應用於機器翻譯領域。2017 年，Google 將其應用於語音識別領域，取得了非常好的效果，將詞錯誤率降低至5.6%。如下圖所示，Google 提出新系統的框架由三個部分組成：Encoder 編碼器組件，它和標準的聲學模型相似，輸入的是語音信號的時頻特徵；經過一系列神經網絡，映射成高級特徵 henc，然後傳遞給 Attention 組件，其使用 henc 特徵學習輸入 x 和預測子單元之間的對齊方式，子單元可以是一個音素或一個字。最後，attention 模塊的輸出傳遞給 Decoder，生成一系列假設詞的概率分佈，類似於傳統的語言模型。

端到端技術的突破，不再需要 HMM 來描述音素內部狀態的變化，而是將語音識別的所有模塊統一成神經網絡模型，使語音識別朝著更簡單、更高效、更準確的方向發展。

語音識別的技術現狀

目前，主流語音識別框架還是由 3 個部分組成：聲學模型、語言模型和解碼器，有些框架也包括前端處理和後處理。隨著各種深度神經網絡以及端到端技術的興起，聲學模型是近幾年非常熱門的方向，業界都紛紛發佈自己新的聲學模型結構，刷新各個數據庫的識別記錄。由於中文語音識別的複雜性，國內在聲學模型的研究進展相對更快一些，主流方向是更深更復雜的神經網絡技術融合端到端技術。

2018年，科大訊飛提出深度全序列卷積神經網絡（DFCNN），DFCNN 使用大量的卷積直接對整句語音信號進行建模，主要借鑑了圖像識別的網絡配置，每個卷積層使用小卷積核，並在多個卷積層之後再加上池化層，通過累積非常多卷積池化層對，從而可以看到更多的歷史信息。

2018年，阿里提出 LFR-DFSMN（Lower Frame Rate-Deep Feedforward Sequential Memory Networks）。該模型將低幀率算法和 DFSMN 算法進行融合，語音識別錯誤率相比上一代技術降低 20%，解碼速度提升 3 倍。FSMN 通過在 FNN 的隱層添加一些可學習的記憶模塊，從而可以有效的對語音的長時相關性進行建模。而 DFSMN 是通過跳轉避免深層網絡的梯度消失問題，可以訓練出更深層的網絡結構。

2019 年，百度提出了流式多級的截斷注意力模型 SMLTA，該模型是在 LSTM 和 CTC 的基礎上引入了注意力機制來獲取更大範圍和更有層次的上下文信息。其中流式表示可以直接對語音進行一個小片段一個小片段的增量解碼；多級表示堆疊多層注意力模型；截斷則表示利用 CTC 模型的尖峰信息，把語音切割成一個一個小片段，注意力模型和解碼可以在這些小片段上展開。在線語音識別率上，該模型比百度上一代 Deep Peak2 模型提升相對 15% 的性能。

開源語音識別 Kaldi 是業界語音識別框架的基石。Kaldi 的作者 Daniel Povey 一直推崇的是 Chain 模型。該模型是一種類似於 CTC 的技術，建模單元相比於傳統的狀態要更粗顆粒一些，只有兩個狀態，一個狀態是 CD Phone，另一個是 CD Phone 的空白，訓練方法採用的是 Lattice-Free MMI 訓練。該模型結構可以採用低幀率的方式進行解碼，解碼幀率為傳統神經網絡聲學模型的三分之一，而準確率相比於傳統模型有非常顯著的提升。

遠場語音識別技術主要解決真實場景下舒適距離內人機任務對話和服務的問題，是 2015 年以後開始興起的技術。由於遠場語音識別解決了複雜環境下的識別問題，在智能家居、智能汽車、智能會議、智能安防等實際場景中獲得了廣泛應用。目前國內遠場語音識別的技術框架以前端信號處理和後端語音識別為主，前端利用麥克風陣列做去混響、波束形成等信號處理，以讓語音更清晰，然後送入後端的語音識別引擎進行識別。

語音識別另外兩個技術部分：語言模型和解碼器，目前來看並沒有太大的技術變化。語言模型主流還是基於傳統的 N-Gram 方法，雖然目前也有神經網絡的語言模型的研究，但在實用中主要還是更多用於後處理糾錯。解碼器的核心指標是速度，業界大部分都是按照靜態解碼的方式進行，即將聲學模型和語言模型構造成 WFST 網絡，該網絡包含了所有可能路徑，解碼就是在該空間進行搜索的過程。由於該理論相對成熟，更多的是工程優化的問題，所以不論是學術還是產業目前關注的較少。

語音識別的技術趨勢

語音識別主要趨於遠場化和融合化的方向發展，但在遠場可靠性還有很多難點沒有突破，比如多輪交互、多人噪雜等場景還有待突破，還有需求較為迫切的人聲分離等技術。新的技術應該徹底解決這些問題，讓機器聽覺遠超人類的感知能力。這不能僅僅只是算法的進步，需要整個產業鏈的共同技術升級，包括更為先進的傳感器和算力更強的芯片。

單從遠場語音識別技術來看，仍然存在很多挑戰，包括：

（1）回聲消除技術。由於喇叭非線性失真的存在，單純依靠信號處理手段很難將回聲消除乾淨，這也阻礙了語音交互系統的推廣，現有的基於深度學習的回聲消除技術都沒有考慮相位信息，直接求取的是各個頻帶上的增益，能否利用深度學習將非線性失真進行擬合，同時結合信號處理手段可能是一個好的方向。

（2）噪聲下的語音識別仍有待突破。信號處理擅長處理線性問題，深度學習擅長處理非線性問題，而實際問題一定是線性和非線性的疊加，因此一定是兩者融合才有可能更好地解決噪聲下的語音識別問題。

（3）上述兩個問題的共性是目前的深度學習僅用到了語音信號各個頻帶的能量信息，而忽略了語音信號的相位信息，尤其是對於多通道而言，如何讓深度學習更好的利用相位信息可能是未來的一個方向。

（4）另外，在較少數據量的情況下，如何通過遷移學習得到一個好的聲學模型也是研究的熱點方向。例如方言識別，若有一個比較好的普通話聲學模型，如何利用少量的方言數據得到一個好的方言聲學模型，如果做到這點將極大擴展語音識別的應用範疇。這方面已經取得了一些進展，但更多的是一些訓練技巧，距離終極目標還有一定差距。

（5）語音識別的目的是讓機器可以理解人類，因此轉換成文字並不是最終的目的。如何將語音識別和語義理解結合起來可能是未來更為重要的一個方向。語音識別裡的 LSTM 已經考慮了語音的歷史時刻信息，但語義理解需要更多的歷史信息才能有幫助，因此如何將更多上下文會話信息傳遞給語音識別引擎是一個難題。

（6）讓機器聽懂人類語言，僅靠聲音信息還不夠，“聲光電熱力磁”這些物理傳感手段，下一步必然都要融合在一起，只有這樣機器才能感知世界的真實信息，這是機器能夠學習人類知識的前提條件。而且，機器必然要超越人類的五官，能夠看到人類看不到的世界，聽到人類聽不到的世界。

語音識別的產業歷程

語音識別這半個多世紀的產業歷程中，其中共有三個關鍵節點，兩個和技術有關，一個和應用有關。第一個關鍵節點是 1988 年的一篇博士論文，開發了第一個基於隱馬爾科夫模型（HMM）的語音識別系統—— Sphinx，當時實現這一系統的正是現在的著名投資人李開復。

從 1986 年到 2010 年，雖然混合高斯模型效果得到持續改善，而被應用到語音識別中，並且確實提升了語音識別的效果，但實際上語音識別已經遭遇了技術天花板，識別的準確率很難超過 90%。很多人可能還記得，在 1998 年前後 IBM、微軟都曾經推出和語音識別相關的軟件，但最終並未取得成功。

第二個關鍵節點是 2009 年深度學習被系統應用到語音識別領域中。這導致識別的精度再次大幅提升，最終突破 90%，並且在標準環境下逼近 98%。有意思的是，儘管技術取得了突破，也湧現出了一些與此相關的產品，比如 Siri、Google Assistant 等，但與其引起的關注度相比，這些產品實際取得的成績則要遜色得多。Siri 剛一面世的時候，時任 Google CEO 的施密特就高呼，這會對 Google 的搜索業務產生根本性威脅，但事實上直到 Amazon Echo 的面世，這種根本性威脅才真的有了具體的載體。

第三個關鍵點正是 Amazon Echo 的出現，純粹從語音識別和自然語言理解的技術乃至功能的視角看這款產品，相對於 Siri 等並未有什麼本質性改變，核心變化只是把近場語音交互變成了遠場語音交互。Echo 正式面世於2015年6月，到 2017 年銷量已經超過千萬，同時在 Echo 上扮演類似 Siri 角色的 Alexa 漸成生態，其後臺的第三方技能已經突破 10000 項。藉助落地時從近場到遠場的突破，亞馬遜一舉從這個賽道的落後者變為行業領導者。

但自從遠場語音技術規模落地以後，語音識別領域的產業競爭已經開始從研發轉為應用。研發比的是標準環境下純粹的算法誰更有優勢，而應用比較的是在真實場景下誰的技術更能產生優異的用戶體驗，而一旦比拼真實場景下的體驗，語音識別便失去獨立存在的價值，更多作為產品體驗的一個環節而存在。

所以到 2019 年，語音識別似乎進入了一個相對平靜期，全球產業界的主要參與者們，包括亞馬遜、谷歌、微軟、蘋果、百度、科大訊飛、阿里、騰訊、雲知聲、思必馳、聲智等公司，在一路狂奔過後紛紛開始反思自己的定位和下一步的打法。

語音賽道里的標誌產品——智能音箱，以一種大躍進的姿態出現在大眾面前。2016 年以前，智能音箱玩家們對這款產品的認識還都停留在：亞馬遜出了一款叫 Echo 的產品，功能和 Siri 類似。先行者科大訊飛叮咚音箱的出師不利，更是加重了其它人的觀望心態。真正讓眾多玩家從觀望轉為積極參與的轉折點是逐步曝光的 Echo 銷量，2016 年底，Echo 近千萬的美國銷量讓整個世界震驚。這是智能設備從未達到過的高點，在 Echo 以前除了 Apple Watch 與手環，像恆溫器、攝像頭這樣的產品突破百萬銷量已是驚人表現。這種銷量以及智能音箱的 AI 屬性促使 2016 年下半年，國內各大巨頭幾乎是同時轉變態度，積極打造自己的智能音箱。

未來，回看整個發展歷程，2019 年是一個明確的分界點。在此之前，全行業是突飛猛進，但 2019 年之後則開始進入對細節領域滲透和打磨的階段，人們關注的焦點也不再是單純的技術指標，而是迴歸到體驗，迴歸到一種“新的交互方式到底能給我們帶來什麼價值”這樣更為一般的、純粹的商業視角。技術到產品再到是否需要與具體的形象進行交互結合，比如人物形象；流程自動化是否要與語音結合；酒店場景應該如何使用這種技術來提升體驗，諸如此類最終都會一一呈現在從業者面前。而此時行業的主角也會從原來的產品方過渡到平臺提供方，AIoT 縱深過大，沒有任何一個公司可以全線打造所有的產品。

語音識別的產業趨勢

當語音產業需求四處開花的同時，行業的發展速度反過來會受限於平臺服務商的供給能力。跳出具體案例來看，行業下一步發展的本質邏輯是：在具體每個點的投入產出是否達到一個普遍接受的界限。

離這個界限越近，行業就越會接近滾雪球式發展的臨界點，否則整體增速就會相對平緩。不管是家居、酒店、金融、教育或者其他場景，如果解決問題都是非常高投入並且長週期的事情，那對此承擔成本的一方就會猶豫，這相當於試錯成本過高。如果投入後，沒有可感知的新體驗或者銷量促進，那對此承擔成本的一方也會猶豫，顯然這會影響值不值得上的判斷。而這兩個事情，歸根結底都必須由平臺方解決，產品方或者解決方案方對此無能為力，這是由智能語音交互的基礎技術特徵所決定。

從核心技術來看，整個語音交互鏈條有五項單點技術：喚醒、麥克風陣列、語音識別、自然語言處理、語音合成，其它技術點比如聲紋識別、哭聲檢測等數十項技術通用性略弱，但分別出現在不同的場景下，並會在特定場景下成為關鍵。看起來關聯的技術已經相對龐雜，但切換到商業視角我們就會發現，找到這些技術距離打造一款體驗上佳的產品仍然有絕大距離。

所有語音交互產品都是端到端打通的產品，如果每家廠商都從這些基礎技術來打造產品，那就每家都要建立自己雲服務穩定，確保響應速度，適配自己所選擇的硬件平臺，逐項整合具體的內容（比如音樂、有聲讀物）。這從產品方或者解決方案商的視角來看是不可接受的。這時候就會催生相應的平臺服務商，它要同時解決技術、內容接入和工程細節等問題，最終達成試錯成本低、體驗卻足夠好的目標。

平臺服務並不需要閉門造車，平臺服務的前提是要有能屏蔽產品差異的操作系統，這是 AI+IOT 的特徵，也是有所參照的，亞馬遜過去近 10 年裡是同步著手做兩件事：一個是持續推出面向終端用戶的產品，比如 Echo，Echo Show等；一個是把所有產品所內置的系統 Alexa 進行平臺化，面向設備端和技能端同步開放SDK和調試發佈平臺。雖然 Google Assistant 號稱單點技術更為領先，但從各方面的結果來看 Alexa 是當之無愧的最為領先的系統平臺，可惜的是 Alexa 並不支持中文以及相應的後臺服務。

國內則缺乏亞馬遜這種統治力的系統平臺提供商，當前的平臺提供商分為兩個陣營：一類是以百度、阿里、訊飛、小米、騰訊為代表的傳統互聯網或者上市公司；一類是以聲智等為代表的新興人工智能公司。新興的人工智能公司相比傳統公司產品和服務上的歷史包袱更輕，因此在平臺服務上反倒是可以主推一些更為面向未來、有特色的基礎服務，比如兼容性方面新興公司做的會更加徹底，這種兼容性對於一套產品同時覆蓋國內國外市場是相當有利的。

類比過去的 Android，語音交互的平臺提供商們其實面臨更大的挑戰，發展過程可能會更加的曲折。過去經常被提到的操作系統的概念在智能語音交互背景下事實上正被賦予新的內涵，它日益被分成兩個不同但必須緊密結合的部分。

過去的 Linux 以及各種變種承擔的是功能型操作系統的角色，而以 Alexa 為代表的新型系統則承擔的則是智能型系統的角色。前者完成完整的硬件和資源的抽象和管理，後者則讓這些硬件以及資源得到具體的應用，兩者相結合才能輸出最終用戶可感知的體驗。功能型操作系統和智能型操作系統註定是一種一對多的關係，不同的 AIoT 硬件產品在傳感器（深度攝像頭、雷達等）、顯示器上（有屏、無屏、小屏、大屏等）具有巨大差異，這會導致功能型系統的持續分化（可以和 Linux 的分化相對應）。這反過來也就意味著一套智能型系統，必須同時解決與功能型系統的適配以及對不同後端內容以及場景進行支撐的雙重責任。

這兩邊在操作上，屬性具有巨大差異。解決前者需要參與到傳統的產品生產製造鏈條中去，而解決後者則更像應用商店的開發者。這裡面蘊含著巨大的挑戰和機遇。在過去功能型操作系統的打造過程中，國內的程序員們更多的是使用者的角色，但智能型操作系統雖然也可以參照其他，但這次必須自己來從頭打造完整的系統。（國外巨頭不管在中文相關的技術上還是內容整合上事實上都非常薄弱，不存在侵略國內市場的可能性）

隨著平臺服務商兩邊的問題解決的越來越好，基礎的計算模式則會逐漸發生改變，人們的數據消費模式會與今天不同。個人的計算設備（當前主要是手機、筆記本、Pad）會根據不同場景進一步分化。比如在車上、家裡、酒店、工作場景、路上、業務辦理等會根據地點和業務進行分化。但分化的同時背後的服務則是統一的，每個人可以自由的根據場景做設備的遷移，背後的服務雖然會針對不同的場景進行優化，但在個人偏好這樣的點上則是統一的。

人與數字世界的接口，在現在越來越統一於具體的產品形態（比如手機），但隨著智能型系統的出現，這種統一則會越來越統一於系統本身。作為結果這會帶來數據化程度的持續加深，我們越來越接近一個百分百數據化的世界。

總結

從技術進展和產業發展來看，語音識別雖然還不能解決無限制場景、無限制人群的通用識別問題，但是已經能夠在各個真實場景中普遍應用並且得到規模驗證。更進一步的是，技術和產業之間形成了比較好的正向迭代效應，落地場景越多，得到的真實數據越多，挖掘的用戶需求也更準確，這幫助了語音識別技術快速進步，也基本滿足了產業需求，解決了很多實際問題，這也是語音識別相對其他 AI 技術最為明顯的優勢。

不過，我們也要看到，語音識別的內涵必須不斷擴展，狹義語音識別必須走向廣義語音識別，致力於讓機器聽懂人類語言，這才能將語音識別研究帶到更高維度。我們相信，多技術、多學科、多傳感的融合化將是未來人工智能發展的主流趨勢。在這種趨勢下，我們還有很多未來的問題需要探討，比如鍵盤、鼠標、觸摸屏和語音交互的關係怎麼變化？搜索、電商、社交是否再次重構？硬件是否逆襲變得比軟件更加重要？產業鏈中的傳感、芯片、操作系統、產品和內容廠商之間的關係又該如何變化？

本文得到眾多語音識別領域專家的指導，並引用了一些參考資料的配圖，在此表示感謝，本文中的不足之處還請批評指正。

分享到:

閱讀更多 哈文說科技 的文章

關鍵字: 語音識別技術 IBM 簡史

剛剛工作的畢業生，一個月只有2000多，是不是太少了？

剛剛:剛剛工作的畢業生，一個月只有2000多，是不是太少了？根據你城市消費水平來看啊，還有你從事的工作，假如你在二三線城市做一份事業單位或者是編制類的工作，薪資水平是隨著你工作年限逐年增長的，而且在年終也有很多福利補貼待遇等等，算下來收入也是可觀的，再舉一個例:-畢業生 2000

為什麼只有edg賺錢？

電競行業作為一個新興產業，這幾年發展勢頭越來越好，IG戰隊，FPX戰隊先後奪得了s8-s9世界賽的冠軍，據俱樂部知情人士透露，除了國內的幾家豪門俱樂部之外，其他俱樂部基本都是虧錢在做的，當然EDG也是:-edg 賺錢:為什麼只有edg賺錢？

網上羅馬仕充電寶20000毫安的，參數怎麼很多樣？哪個是真的？

20000:網上羅馬仕充電寶20000毫安的，參數怎麼很多樣？哪個是真的？天貓旗艦店，或者淘寶旗艦店，或者京東旗艦店肯定包真，質量好，再說可以官方驗證啊，不能圖那十塊五塊的便宜，畢竟一個充電寶要用好久呢，一兩年沒問題的。:-羅馬仕馬仕毫安

我們買的新商品房還沒有拿到房產證，怎麼轉賣最好？

沒有取得房抄產證的房子可以轉讓。但如果確定無法取得房產證的，房產轉讓不受法律保襲護。一般情況下，只有取得房產證的房屋才能確定房屋產權人，才具有轉讓的條件。但如果房屋是合法取得的，以百後可以依法辦理度房:-轉賣房產證商品房拿到:我們買的新商品房還沒有拿到房產證，怎麼轉賣最好？

為什麼突厥人可以成功復國？是大唐的刀不鋒利了麼？

鋒利突厥人你這樣說只能說明你對歷史非常不瞭解，我先用一句話概括突厥被大唐雄兵打的有多慘：三次滅國，背井離鄉，遠赴西亞，打不過，俺躲著你還不行嗎？突厥的意思是中間慫起的頭盔。其來歷已經不可靠，可能有著匈奴、鮮卑或:-復國大唐:為什麼突厥人可以成功復國？是大唐的刀不鋒利了麼？

小高層16層高樓間距60米哪一層比較好？

小高層 60:小高層16層高樓間距60米哪一層比較好？首先需要明白，選擇層數居住與樓間距毫無關係，住在哪一層，肉眼看對面樓的距離，是相差不大的。設定樓間距60米，純粹是混淆視聽。其實，一幢樓的樓層總數確定的情況下，到底哪一層最佳？很簡單，取總層數乘以黃金:-樓間距層高

金銀花盆栽好養嗎？怎麼養？

金銀花可以盆栽，很好養的！金銀花，是忍冬科的常綠纏繞灌木，枝條柔韌修長，多攀爬或匍匐生長。金銀花生性強健，在我國的很多南方省份野外很多地區都能看到它的身影，葉子常年翠綠，到夏季開花，飄香四溢。所以，有:-金銀花盆栽:金銀花盆栽好養嗎？怎麼養？

長城對於抵禦古代匈奴和蒙古人起到了多大作用？

長城真的無用嗎？在今天許多人認為長城無用，古代國家舉國之力建造的長城不過只是文物，就連康熙都曾作詩諷刺，原文如下：萬里經營到海涯，紛紛調發逐浮誇。當時用盡生民力，天下何曾屬爾家。-康熙但真的如此嗎？小:-匈奴抵禦長城:長城對於抵禦古代匈奴和蒙古人起到了多大作用？蒙古人

什麼樹可以嫁接臘梅？

臘梅只能嫁接在不同品種的臘梅上，其他的樹種不行！臘梅的繁殖可以用播種，壓條，嫁接，分株等繁殖方法。播種法因不易保持花卉的原有優良特性，且播種的優點是在於大量繁殖，而臘梅大都只需培植少量幾株，故一般都不:-臘梅嫁接:什麼樹可以嫁接臘梅？

行情堪憂，還有多少教育機構的老師們五一假期有課上的？課時量多不多？

堪憂五一假期:行情堪憂，還有多少教育機構的老師們五一假期有課上的？課時量多不多？事實上，因為教育培訓都是預收費用的模式。但凡有一點點規模的培訓機構老師。在上半年，帶課量是可以得到保證。:-課時量

在農村“立夏節”都有哪些民間習俗？

民間習俗農村:在農村“立夏節”都有哪些民間習俗？在農村“立夏節”都有哪些民間習俗一、農村立夏常見的習俗風俗活動：1、吃雞蛋“立夏吃蛋”習俗由來已久，俗話說“立夏吃了蛋，夏天不疰夏”。據說立夏開始天氣越來越熱，村裡小孩兒會有身體疲勞四肢無力的感覺，吃:-立夏節

男朋友失望分手，但對我還有感覺，答應我兩個月之後可以在一起，我應該怎麼做，才能改變之前他對我的看法？

失望分手看法:男朋友失望分手，但對我還有感覺，答應我兩個月之後可以在一起，我應該怎麼做，才能改變之前他對我的看法？你的這個問題特別的有趣，我覺得你先不要看你要怎麼做才讓他才能讓他對你的印象有所改變，你要去看為什麼是兩個月之後可以在一起，這兩個月他會用來做什麼，為什麼會有這兩個月？例如他的身體碰到了什麼樣的問題嗎？:-答應我

工程分包乙方人員傷殘誰承擔？

承擔:工程分包乙方人員傷殘誰承擔？分包乙方分包致人傷殘責任誰承擔？嚴格來說，需要了解更多傷殘原因才能區分的，作為非專業人士，自己發表一點淺見供題主參考：1、如果甲方是央企的話，他們合同中的責任、義務等條款內已經將自己的責任全部撇開了，更會:-乙方傷殘

有哪些看起來毫不相關的兩個歷史人物實際上有過聯繫？

實際上:有哪些看起來毫不相關的兩個歷史人物實際上有過聯繫？歷史人物聯繫這個詞貌似太寬泛了，就好像有一個調皮的答案說的，胡亥和溥儀相隔2000多年，牽強的找，也有聯繫：都是亡國之君不是。我想題主的意思是兩個看起來應該風馬牛不相及的人物，在歷史上居然是熟悉或是一個時代的:-毫不相關

13年雪鐵龍世嘉自動擋7萬多公里，沒有水泡事故，多少錢能買？

法系車不保值，如果準備常開可以入手，性價比高，價格應該在二至三萬之間，二手車一車一況，一況一價，居體價格看車況。:-錢能水泡:13年雪鐵龍世嘉自動擋7萬多公里，沒有水泡事故，多少錢能買？世嘉自動擋

22+吃土少女17年就有駕駛證了，今年才開始開車，想買個二手昂克賽拉，或者有什麼好建議嗎？

17年駕駛證二手:22+吃土少女17年就有駕駛證了，今年才開始開車，想買個二手昂克賽拉，或者有什麼好建議嗎？建議買日系二手車，開順了賣了，買新車，昂克賽拉無法再次出手時獲得好價格，而且也不省油，開完日系車直接換德系:-昂克賽拉

如何騎車去臺灣騎行？

騎車在臺灣沒有迴歸內地前，最好不要去臺灣，一是國內政策不允許你去臺灣，因為已停止了臺灣個人遊。二是你偷著去臺灣旅遊，安全沒有保障，偷渡客在哪裡也沒有安全保障的。以後內地政策允許個人去臺灣旅遊了，建議那時再:-騎行臺灣:如何騎車去臺灣騎行？

本人預算5萬左右，想買一輛二手法系車！求推薦？

預算:本人預算5萬左右，想買一輛二手法系車！求推薦？ 5萬預算5萬元左右，想買一輛二手法系車？推薦東風標緻老款308車型。1 5萬元可以買標緻308車況好的，沒大事故呢，年限15年左右，公里數3萬左右，手動檔車型。2 標緻308車型，底盤調教紮實，跑高速穩定:-法系二手

14年進口馬自達5PK進口10年道奇酷威買哪個划算？

道奇你好，好高興回答你的問題！14年進口馬自達5和10年月道奇酷威個人感覺馬自達5比較划算。新車價馬5報價29.99萬，酷威19.38萬兩款車都是原裝進口，馬5屬於日系，酷威屬於美系。兩款車不屬於同類車型:-酷威馬自達 14年:14年進口馬自達5PK進口10年道奇酷威買哪個划算？

2020年，河南教育行業國務院特殊津貼推薦，河南大學並列第三，大家怎麼看？

特殊津貼高校人才就要重視，河南省高校人才更要重視，這個人才不是評出了的，而是推薦出來的，沒有推薦，連參評的資格都沒有。國務院特殊津貼人員推薦，不推薦是百分百沒希望，推薦了希望就非常，那麼是什麼是國務院特殊津貼:-河南大學並列 2020年:2020年，河南教育行業國務院特殊津貼推薦，河南大學並列第三，大家怎麼看？

本田CRV2019款1.5T舒適版油耗高嗎？

李老貓說車為你非專業解答各種選車用車問題本田crv定位於一款緊湊級suv產品，主要對飈豐田榮放，日產奇駿，這款車整體市場表現非常突出，2019年全年累計銷量為18.44萬臺，平均月銷1.5萬以上，其深:-舒適版本田油耗:本田CRV2019款1.5T舒適版油耗高嗎？

國外疫情如果沒有得到有效控制，世界會發生什麼事情？頭腦風暴？

1.世界經濟遭到重創疫情影響之下，各行各業基本屬於停工停產的狀態，在世界經濟趨於一體化的今天，停工停產勢必會造成一系列的連鎖反應，最後導致的結果可能會引發金融危機。2.世界格局可能發生改變美國仍是世界:-頭腦風暴控制:國外疫情如果沒有得到有效控制，世界會發生什麼事情？頭腦風暴？疫情國外

本田XRV這款車的整體表現怎麼樣？我想買1.5T自動豪華版，全款多少錢？

如果有15萬元的預算，讓你選擇一臺空間和動力都很不錯的小型SUV，我覺得很多的讀者都會想到本田XRV這款車型。因為本田XRV確實太出色了，和同級別的其他盒子SUV車型相比，這款車在空間和動力上都有優勢:-xrv 自動:本田XRV這款車的整體表現怎麼樣？我想買1.5T自動豪華版，全款多少錢？本田豪華版

現在存款有14萬，借了5萬還沒收回來，該做什麼好？

何去何從:現在存款有14萬，借了5萬還沒收回來，該做什麼好？續租存款利息率較低，可以投資較高收益的項目，比如投資基金，一般情況下可獲得6%一10%的回報。如果行情好可達到50%以上收益，去年不少基金超過這目標。目前受疫情影響，股市在低位震盪，也是基金投資的機會。一:-存款 2300

2070super和5700xt買哪個比較好？

如果是玩遊戲毫無疑問選擇n卡，也就是2070 suep。如果追求性價比可以選擇a卡，也就是5700xt. 為什麼遊戲選n卡呢？首先遊戲廠商針對n卡優化比較多，然後就是功耗小，然後N卡架構執行效率極高，:-:2070super和5700xt買哪個比較好？

生完二胎後，感覺自己有點抑鬱，總是想發火，特別煩躁，怎麼辦？

二胎我是兩個孩子的媽媽，曾經的我和你一樣，生完寶寶我也抑鬱了，我知道抑鬱症真的很痛苦，產後的那段日子我整天都不開心，做什麼事也沒積極性，誰也不想搭理，別人給我說話我就覺得很煩。忍不住衝家人發脾氣。每當一個:-生完抑鬱:生完二胎後，感覺自己有點抑鬱，總是想發火，特別煩躁，怎麼辦？發火

人這一生遇到的人和事為什麼感覺都像是必然的經歷？

感覺:人這一生遇到的人和事為什麼感覺都像是必然的經歷？正所謂有因必有果，所以你今天的因，就會產生明天的果。所以這一切你就會覺得是必然的。生活中大部分是普通人大家的生活規律，生活方式，大致相同。當你看到別人家庭的果，自己家也產生同樣的果，你就會覺得這一切是:-人和經歷

現在校內校外到底教的是美式英語還是英式英語還是混搭英語？

校內:現在校內校外到底教的是美式英語還是英式英語還是混搭英語？校外英式答案肯定是不唯一的！美式英語現在是主流，少量英式發音也個別存在！但對於孩子來說，肯定是混搭英語，因為孩子肯定不是一直一位老師教下去，肯定會換老師！而老師的發音肯定是既有英式的，也有美式的！就連一些英語:-美式英語

上有老下有小，我們真的跳不出這個人生循環了嗎？

上有老魔咒:上有老下有小，我們真的跳不出這個人生循環了嗎？的確如此，儘管現在不結婚，晚婚的人很多，但是從人類繁洐生息的歷史和大多數人來看，成家立業，生兒育女，家庭仍是主流，一個人的生理，心理和生存需求決定了生存狀態，生兒育女，瞻養父母即是義務責任，也是生活動:-下有小

如果外面正在下小雨，你會突然想起了誰？

想起:如果外面正在下小雨，你會突然想起了誰？我最不忘，還是秋日的雨夜，天又涼了幾分，已經需要披上一件薄薄的外套了。臨窗而望，眼見窗臺上的幾株小植物，葉片上沾了幾滴小雨珠，我總喜歡，用小手電去照它們，這樣的小水滴看起來晶瑩晶瑩的，有一種清清涼涼的:-小雨

初中同學許久未見大學期間突然聯繫請吃飯，態度還良好，我給推了，會不會讓人很煩？

初中同學:初中同學許久未見大學期間突然聯繫請吃飯，態度還良好，我給推了，會不會讓人很煩？吃飯許久未見，意思就是交情不怎麼樣，無功不受祿，人家憑什麼那麼熱情，難道真的是多年一來忘不了咱們之間的同學情誼，倍感想念了嗎，不是請幫忙、做業務、就是借錢，十有八九十借錢。我建議還是不要去的好，大家都很忙:-許久未見

現在我覺得認真對某個人說我喜歡你什麼的這種話好惡心，我愛你更說不出口，好惡心，是什麼心理？

出口心理:現在我覺得認真對某個人說我喜歡你什麼的這種話好惡心，我愛你更說不出口，好惡心，是什麼心理？愛你更多的是心裡問題，可能對方還沒有優秀到你滿意的程度，更沒有到那種離不開的地步！愛情最終還是要回歸生活，而生活離不開兩個人的相處，父母終究會老，孩子終究會飛，所以選擇自己的伴侶尤為重要，你現在覺得噁心更:-喜歡你

劇版的《何以笙簫默》和《再見王瀝川》哪一個更好看呢？

再見王瀝川好看:劇版的《何以笙簫默》和《再見王瀝川》哪一個更好看呢？《遇見王瀝川》吧，高以翔的王瀝川太招人稀罕了。長相，身材，家世，人品，才能樣樣好，簡直完美，挑不出任何毛病，實在要說一個缺點的話，那就是太tm完美，天妒英才、才讓他飽受病魔折磨。偶像劇、深情帥氣的男主:-何以笙簫默

計算機專業本科能夠進入字節跳動、華為這些公司做開發嗎？是否還需要繼續讀研？

學歷是求職必備條件。有了工作不能停止對知識的探索。更高的學歷，可以讓你有更專業的技術能力和學習能力，可以讓你拓展自己的交際圈，可以讓你更知名。總之，活到老，學到老，學習對人總是有好處的，技多不壓身嘛！:-字節跳動:計算機專業本科能夠進入字節跳動、華為這些公司做開發嗎？是否還需要繼續讀研？讀研計算機專業

生完二胎的你們，現在有什麼感想？

二胎家庭日常是什麼樣的？是不是覺得家裡多了一個小人兒，溫馨多了？不存在的！生二胎根本是媽媽們的渡劫磨礪！以前週末睡到自然醒，現在全年無休，時刻警醒著，能睡一次懶覺跟過年似的，黑眼圈不說，頭髮呼啦啦地掉:-生完二胎感想:生完二胎的你們，現在有什麼感想？

華北適合種植蠶豆嗎？

華北適合種植蠶豆，種蠶豆的面積大，在西北，華北，都在種植蠶豆，蠶豆莖稈根部有根瘤菌是種植其它農作物的好茬地，特別是土壤培養和防病蟲害起到作用。:-蠶豆種植適合:華北適合種植蠶豆嗎？華北

華為手機更新EMUI10.1系統後效果咋樣？

大家知道現在智能手機的性能不僅僅跟智能手機的硬件有關，還跟智能手機的系統軟件息息相關，在國產智能手機操作系統裡，小米的MIUI系統跟華為的EMUI系統都是比較優秀的操作系統。最近小米推出了小米MIUI:-咋樣華為華為手機更新:華為手機更新EMUI10.1系統後效果咋樣？

大熱天蜜蜂老是爬到箱外結群正常嗎？

蜜蜂爬到:大熱天蜜蜂老是爬到箱外結群正常嗎？盜蜂現在正是夏季，很多地方蜜源稀少，蜂群中可能缺蜜，也是胡蜂猖獗的時間，所以蜂群中是非常容易發生盜蜂的。在蜂群中發生盜蜂的時候，蜂群守衛蜂會增多，但是這種情況引發的蜜蜂在蜂箱外一般不會結團，只是蜜蜂來:-大熱天

辣椒正是生長最佳期，偏偏有的辣椒苗蔫，不是病蟲害是咋回事？

最佳期霧都山客來回答您的問題。最近山客家鄉的村民正在進行辣椒移栽，確實有像題主提到的情形，辣椒苗移栽前長勢蔥蔥，嫩綠喜人，但是移栽後幾天內就出現萎蔫現象，細心觀察也不是被病蟲害危害。那究竟是什麼原因導致辣椒:-苗蔫辣椒咋回事:辣椒正是生長最佳期，偏偏有的辣椒苗蔫，不是病蟲害是咋回事？

手機相機發展的最終形態會是怎樣的？

最近這幾年手機在電子產品行業裡可謂是發展速度非常快，蘋果和華為兩大公司可以說也是，明爭暗鬥，產品一次比一次有賣點，前一段時間華為和蘋果還都推出了手機新品，兩家都在大力宣傳強調著拍照功能，像iPhone:-形態相機手機最終:手機相機發展的最終形態會是怎樣的？

華為為什麼不出一款5寸全面屏手機呢？我想應該會有很多人支持吧？

5寸手機支持:華為為什麼不出一款5寸全面屏手機呢？我想應該會有很多人支持吧？很高興回答你的問題，刷頭條刷出來的問題，看到很多人回答，感覺還有一些觀點沒有寫出，所以我來回答一下。首先，華為為什麼不出小尺寸全面屏手機？其實並不只有華為一家沒有出小屏手機，放眼近期各大手機廠商發佈的:-華為

生吃山芋，生吃胡蘿蔔，還有哪些蔬菜可以生吃呢？

胡蘿蔔蔬菜:生吃山芋，生吃胡蘿蔔，還有哪些蔬菜可以生吃呢？第一種，黃瓜。這個瓜，可不是菜市場中堆放滿滿的青瓜。各位可要睜大眼睛看清楚了，這個黃瓜，青中帶黃，品種屬以前鄉下農戶少量種植的，形態上面來看這種瓜矮、短、圓，表面覆蓋有比較淡的細毛，經水輕輕沖洗之後整:-山芋

為什麼馬鈴薯不宜過早過遲播種？

不宜:為什麼馬鈴薯不宜過早過遲播種？播種過早為什麼馬鈴薯不宜過早過遲播種？馬鈴薯的種植主要是由於氣候條件的限制，過早出苗後容易遇到低溫被凍死，種植晚了容易遇到乾旱和高溫，影響產量。馬鈴薯種植時間的早晚必須根據種植地方的氣候條件來確定。馬鈴薯生長:-馬鈴薯

疫情愈發嚴重，原油為何反而大漲？

原油愈發:疫情愈發嚴重，原油為何反而大漲？疫情愈發嚴重和原油大漲沒有必然關係。但是資金總是從高處流向低處，原油價格跌的越多，投資價值越明顯，相對於其他產業更有投資價值。舉個例子：深圳南山房價均價大約6萬左右，寶安均價5萬左右，如果南山房價漲到:-疫情

生菜球很好吃，怎麼種植才能高產呢？

種植:生菜球很好吃，怎麼種植才能高產呢？高產對環境條件的要求、1.溫度生菜球為喜冷涼、忌高溫作物，種子在4度以上可發芽、以15～20度為發芽適溫。幼苗能耐較低溫度，日平均溫度12度時生長壯健，葉球生長最適溫度為13～16度。不過目前有些結球生菜:-生菜

裝修高手來幫忙看下144平，套內122平，怎麼三房改四房？？

看下這個戶型三房改四房，改一個小房間，應該沒有問題。△原戶型圖這個戶型改四房，能改的方案比較多，但是修改以後是否好用，是一件值得考慮的事情。一、主臥室變為兩個臥室可以將主臥室改為兩個臥室，但是這樣的改動佔:-房改 122:裝修高手來幫忙看下144平，套內122平，怎麼三房改四房？？ 144

大家幫忙看看這個房子如果要砸牆的話，怎麼改比較好？

房子:大家幫忙看看這個房子如果要砸牆的話，怎麼改比較好？這個戶型砸牆，當然可以砸牆，但是在砸牆之前，要搞清楚為什麼要砸牆，砸牆以後有什麼優劣。△原戶型原戶型圖上的白色牆體部分不是承重牆，理論上說否可以砸掉。但是外牆和與旁邊戶型或者是公共區域的共用牆體和圖上:-幫忙

意蜂夏季喝什麼水降溫？

降溫意蜂夏季喝什麼水降溫？氣溫高，蜂巢溫度高的情況下，蜜蜂是通過採水的辦法掛在蜂箱的四壁來蒸發帶走熱量，降低蜂巢溫度同時也能幫助蜂群維持正常的溼度。在平常的情況下，蜜蜂是在室外採自然水的。夏季消耗的水量:-意蜂夏季:意蜂夏季喝什麼水降溫？

黃瓜種子催芽後種植需要打底水嗎？

黃瓜種子:黃瓜種子催芽後種植需要打底水嗎？你好很高興回答這個問題。答案：不用。1-2天可出芽。黃瓜種子催芽：選用飽滿的種子，用30℃水浸泡4小時後催芽。也可用100倍福爾馬林溶液浸泡種子10-20分鐘，洗淨後清水浸種3-4小時，然後於25-3:-催芽黃瓜打底

書友們展示一下自我感覺發揮較好的作品，一起學習？

自我較好這幅作品是參賽的，色彩的搭配，紙張的拼接都是自己設計完成的，一如既往的清新淡雅感覺。書體用的魏碑中楷書，增加了書寫的趣味性。:-書友展示:書友們展示一下自我感覺發揮較好的作品，一起學習？