現在是不是有一種“我為刀俎,它為魚肉”的感覺了。經過簡單的數據處理,我們得到了每個人物的名字在小說中出現的頻次,由於蕭峰和喬峰是同一個人,為了方便統計將兩個名字的出場次合併。
然後取出場率排名前30位的角色數據,用圖表的形式展示出來。
其實《天龍八部》的中心思想就是“求不得”:
段譽不想學武功卻練成了絕世神通一心追求王語嫣最終美人對慕容復不離不棄蕭峰立志保衛大宋沒想到自己居然是契丹人決定與阿朱塞外牧馬,然而造化弄人,心愛的人卻死在自己手上這裡我們僅提取詞長度不小於4的成語、俗語和短語進行分析。同時,考慮到某些人名(例如:上官婉兒、澹臺滅明)等專有名詞會對分析結果造成干擾,在分詞取詞的時候可以一併過濾掉,最終得到這樣一份詞語文件:
2.雲圖
對用詞習慣的分析更傾向於定性分析,我們這裡使用詞雲圖來作展示,首先繪製《萍蹤俠影錄》的詞雲圖。
我們可以看到在這篇小說中“微微一笑”、“哈哈大笑”、“大吃一驚”、“非同小可”等詞語使用頻率非常高,再來看另一部作品《女帝奇英傳》,詞雲圖如下: