怎麼實現用大數據幫你進一步認識蘇軾?

Fny丶樂兮

看到這個提問,剛好想到之前網上說的小學生對蘇軾的詩詞進行分析的事,在這裡就把看到的分享給大家。

蘇軾是一位高產的詩詞家

把蘇軾所有的3458首詩詞全部整理出來,總共約有25W的字。而唐宋詩詞由8552位作者共創作了276545首詩詞,平均算的話每位作者完成的數量28-29首詩詞的創作,而蘇軾一個人就相當於120個人的創作量,佔整個唐寧詩詞量的1.25%。

蘇軾詩詞的常用詞分析

對蘇軾的3458首詩詞進行分詞研究,可以幫助我們找到一些高頻詞,如下列舉的是前50的高頻詞:

由於詩詞的簡練性,對單個詞也需要關注一下,

在此,基礎上,高頻詞的出現會讓人產生疑問,為什麼就是這些詞高頻出現呢,比如”歸來“出現了157次,是蘇軾詩詞裡用得最多的一個詞。

深入調查資料後,發現蘇軾有三次被謫的經歷,第一次因為”烏臺詩案“遭到新黨誣陷,被謫黃州。第二次因為不同意司馬光盡廢新法,被謫杭州。第三次因為與章惱政見不合,被謫惠州。

通過數據發現,蘇軾每次被謫之後,蘇軾詩中的”歸來“出現的次數都會有所增加,蘇軾這些”歸來“詩,也他跌宕起伏的一生似乎存在著聯繫,他一直滿懷憂國之情,總能將這些歸去歸來的經歷,化作美好的詩詞。


Bean蠶豆

好啊,蘇軾可是歷史上最大的文豪,但一般都是淺認識,如果有大數據分析,善莫大焉!


分享到:


相關文章: