命名實體識別面試中常見問題,哪些你還不會?

命名實體識別是自然語言處理中的一個基礎模塊,秋招項目中有一個ner的項目。經常被面試官懟懟。寫一寫我經常被問到的題目,並提供一下我回答的思路,供大家參考。


命名實體識別面試中常見問題,哪些你還不會?


1、介紹些命名實體怎麼做的?

根據STAR法則 - - 情境(situation)、任務(task)、行動(action)、結果(result)。說明項目的背景、解決的痛點、採取的行動、效果說明怎麼做的。


你可能會說ner是一個序列標註問題,模型用的lstm+crf,接著面試官可能問你:

2、序列標註問題還有什麼其他方法?

seq2seq、HMM、CRF、預訓練模型


這一步可能引出下面這個問題:

3、CRF和HMM的區別?

這部分從概率圖模型、三個問題角度回答


4、CRF的優化目標?

從CRF損失函數和帶標記數據怎麼更新參數角度回答


5、LSTM和CRF是怎麼連接的?

可以參考TensorFlow源碼


6、序列標註和分類有什麼區別?


7、為什麼不單獨使用LSTM 或 CRF進行序列標註?

從序列標註和分類的區別,lstm做的是一個分類,加上CRF是一個序列標註問題


8、CRF的前項後項算法


寫這篇文章的主要目的是分享面試常見問題,供大家總結,歡迎大家留言一起討論!


分享到:


相關文章: