基于 Python 的网易民谣歌词数据分析

(1)目标确定和分析 网易歌曲链接地址为:https://music.163.com/discover/

playlist/?cat=%E6%B0%91%E8%B0%A3&order=hot,在此链 接地址 Response 中可以看到源代码以及页面的具体信息,通 过在Headers里可以看到request URL,从而利用URL的地址 链接进行接下来的信息采集。

(2)编写python爬虫代码 首先在下载网页内容前,需要进行 download 代码封装,

进而对下载的信息有了安全性和隐蔽性的保障,限制了一定 的访问者,必要地要通过接口才可进行访问。

(3)执行爬虫

整个爬虫爬取信息的重点即是通过 get_music()方法获 取 top10 的歌手以及歌词内容并保存到 TXT 文件中 。

基于 Python 的网易民谣歌词数据分析

歌手情绪数据分析

本节运用 Python 类库(SnowNLP)对民谣 top10 歌手的 歌词文本进行情绪分析, 运用 SnowNLP 后对 top10 民谣歌手的歌词进行情感分析。

运用词云统计歌词词频与可视化 为了让数据分析出来更加直观清晰,首先运用 jieba 库

行分词和词频统计分析,得到歌词中词频统计信息 。

基于 Python 的网易民谣歌词数据分析


分享到:


相關文章: