自然语言处理—词云图制作

自然语言处理(NLP)是计算机科学,人工智能,语言学关注计算机和人类(自然)语言之间的相互作用的领域。因此,自然语言处理是与人机交互的领域有关的。

在自然语言处理面临很多挑战,包括自然语言理解,因此,自然语言处理涉及人机交互的面积。在NLP诸多挑战涉及自然语言理解,即计算机源于人为或自然语言输入的意思,和其他涉及到自然语言生成。

本文作为自然语言处理的一部分,做出好看的词云图一共有七步,下面随我一起边欣赏、边实践。

一、导入标准库

conda install jieba

conda install wordcloud

conda install PIL #安装生成词云的依赖包和运行环境

<code>import matplotlib.pyplot as plt     #数学绘图库

import jieba      #jieba分词库

from wordcloud import WordCloud,ImageColorGenerator    #词云库

from PIL import Image     #图像处理标准库

import numpy as np    #数据科学计算的核心库/<code>
自然语言处理—词云图制作

二、读取文本数据

<code>text = open(r'C:\\Users\\Administrator\\Desktop\\词云图\\词云.txt',"r",encoding="utf-8").read()   #读入txt文本数据

print(text)/<code>
自然语言处理—词云图制作

三、使用jieba分词,将汉语按照语言结构分开

<code>lyrics = jieba.cut(text)  #使用jieba分词
txt = "/".join(lyrics)

print(txt)/<code>
自然语言处理—词云图制作

四、自定义背景图

<code>image = Image.open(r'C:\\\\Users\\\\27342\\\\Desktop\\\\图片.jpg')  #初始化自定义背景图 


graph = np.array(image)      #图像数据化/<code>
自然语言处理—词云图制作

五、产生词云图

<code>wc = WordCloud(font_path = r"C:\\\\Users\\\\27342\\\\Desktop\\\\微软雅黑.ttf",background_color='white',max_font_size=80,mask=graph)
wc.generate(txt) #导入字体/<code>
自然语言处理—词云图制作

六、设置文字颜色、背景图颜色

<code>import matplotlib.pyplot as plt     #数学绘图库

import jieba      #jieba分词库

from wordcloud import WordCloud,ImageColorGenerator    #词云库

from PIL import Image      #图像处理标准库

import numpy as np   #数据科学计算的核心库/<code>
自然语言处理—词云图制作

七、显示图片

<code>text = open(r'C:\\Users\\Administrator\\Desktop\\词云图\\词云.txt',"r",encoding="utf-8").read()  #读入txt文本数据

print(text)/<code>
自然语言处理—词云图制作

更多实用的数据分析知识,请持续关注!


分享到:


相關文章: