命名實體識別是自然語言處理中的一個基礎模塊,秋招項目中有一個ner的項目。經常被面試官懟懟。寫一寫我經常被問到的題目,並提供一下我回答的思路,供大家參考。
1、介紹些命名實體怎麼做的?
根據STAR法則 - - 情境(situation)、任務(task)、行動(action)、結果(result)。說明項目的背景、解決的痛點、採取的行動、效果說明怎麼做的。
你可能會說ner是一個序列標註問題,模型用的lstm+crf,接著面試官可能問你:
2、序列標註問題還有什麼其他方法?
seq2seq、HMM、CRF、預訓練模型
這一步可能引出下面這個問題:
3、CRF和HMM的區別?
這部分從概率圖模型、三個問題角度回答
4、CRF的優化目標?
從CRF損失函數和帶標記數據怎麼更新參數角度回答
5、LSTM和CRF是怎麼連接的?
可以參考TensorFlow源碼
6、序列標註和分類有什麼區別?
7、為什麼不單獨使用LSTM 或 CRF進行序列標註?
從序列標註和分類的區別,lstm做的是一個分類,加上CRF是一個序列標註問題
8、CRF的前項後項算法
寫這篇文章的主要目的是分享面試常見問題,供大家總結,歡迎大家留言一起討論!