實例解析:Python jieba庫用法(具有不錯的參考價值)

今天為大家帶來的內容是:
實例解析:Python jieba庫用法(具有不錯的參考價值)

文章內容主要介紹了Python jieba庫用法及實例解析,文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,喜歡的記得點贊轉發關注收藏不迷路哦!!!

1、jieba庫基本介紹

(1)jieba庫概述

jieba是優秀的中文分詞第三方庫

  • - 中文文本需要通過分詞獲得單個的詞語
  • - jieba是優秀的中文分詞第三方庫,需要額外安裝
  • - jieba庫提供三種分詞模式,最簡單隻需掌握一個函數

(2)、jieba分詞的原理

Jieba分詞依靠中文詞庫

- 利用一箇中文詞庫,確定漢字之間的關聯概率

- 漢字間概率大的組成詞組,形成分詞結果

- 除了分詞,用戶還可以添加自定義的詞組

jieba庫使用說明

(1)jieba分詞的三種模式

精確模式、全模式、搜索引擎模式

  • - 精確模式:把文本精確的切分開,不存在冗餘單詞
  • - 全模式:把文本中所有可能的詞語都掃描出來,有冗餘
  • - 搜索引擎模式:在精確模式基礎上,對長詞再次切分

(2)、jieba庫常用函數

實例解析:Python jieba庫用法(具有不錯的參考價值)

2.jieba應用實例

實例解析:Python jieba庫用法(具有不錯的參考價值)

實例解析:Python jieba庫用法(具有不錯的參考價值)

實例解析:Python jieba庫用法(具有不錯的參考價值)

3.利用jieba庫統計三國演義中任務的出場次數

實例解析:Python jieba庫用法(具有不錯的參考價值)

實例解析:Python jieba庫用法(具有不錯的參考價值)

統計了次數對多前十五個名詞,曹操不愧是一代梟雄,第一名當之無愧,但是我們會發現得到的數據還是需要進一步處理,比如一些無用的詞語,一些重複意思的詞語。

以上就是本文的全部內容,希望對大家的學習有所幫助!!!

最後多說一句,小編是一名python開發工程師,這裡有我自己整理了一套最新的python系統學習教程,包括從基礎的python腳本到web開發、爬蟲、數據分析、數據可視化、機器學習等。想要這些資料的可以關注小編,並在後臺私信小編:“07”即可領取。


分享到:


相關文章: