ACL 2018｜北京大學：用循環強化學習實現無平行語料的情感轉換教育頭條網

ACL 2018｜北京大學：用循環強化學習實現無平行語料的情感轉換

2018-06-11 12:57:59 讀芯術

ACL 2018

用循環強化學習實現無平行語料的情感轉換

Unparied Sentiment-to-Sentiment Translation: A Cycled Reinforcement Learning Approach

北京大學

Peking University

1 引言

本文提出了一種新的方法用於無平行語料的情感轉換問題。現有的情感轉換的模型存在的問題是，在情感轉換的同時不能保證內容不變。例如，主語從food變成movie。其原因是內容和情感在同一個隱向量中，所有信息混在一起難以解釋。因為沒有平行語料，非情感的語義信息難以不受影響。

本文提出了循環強化學習模型。包括模塊和情感化模塊。去情感模塊作用是去除情感詞，以提取非情感的語義信息。情感化模塊作用是添加情感詞，讓中性句子情感化。其核心思想是：第一步，去情感模塊先去除情感，然後情感化模塊根據原始情感和語義內容重構原句，讓情感化模塊在有監督的情況下學習增加情感。第二步，將情感詞取反，這樣就可以實現添加相反的情感詞。

2 模型

1）去情感模塊，用於去除情感詞，視為抽取問題。用LSTM來產生每個詞是中性詞或極性詞的概率。循環強化學習要求模型有初始學習能力，因此提出一個預訓練方法來讓去情感模塊學會判斷非情感詞。預訓練使用了基於自注意力機制的情感分類器，將注意力權重作為指導。這麼做的原因是，在訓練好的情感分類器模型中，注意力權重在一定程度上反映了每個詞對情感的貢獻。通常情感詞的權重大，中性詞的權重小。試驗結果表明情感分類準確率達到89%-90%，可以認為分類器充分捕捉了每個詞的情感信息。根據連續的權重提取非情感詞，將權重離散化為0和1。如果某個詞的權重小於這句話的權重的平均值，則其離散值為1，否則為0。情感詞權重為1，非情感詞為0。將這個結果可以幫助去掉情感。

2）情感化模塊

情感化模塊負責添加情感詞。使用了seq2seq模型，編碼和解碼都是LSTM。有兩個解碼器，分別用於添加正情感詞和負情感詞。

3）循環強化學習