1 ChineseNLPCorpus:
https://github.com/InsaneLife/ChineseNLPCorpus
2 由滴滴人工智能實驗室所屬的自然語言處理團隊創建並維護的,該項目非常細緻的整理了中文自然語言處理相關任務、數據集及當前最佳結果,相當完備。
https://chinesenlp.xyz/#/zh/docs/co-reference_resolution
3 醫療,法律等相關公開數據集,涉及醫療相關的專業詞分詞,問答和醫療實體識別,以及法律文本分類,情感分析和評價相關的數據集
https://github.com/OYE93/Chinese-NLP-Corpus
4 文本相似度計算LCQMC數據集
https://github.com/brightmart/albert_zh
5 跨領域中文任務導向對話數據集
https://github.com/thu-coai/CrossWOZ
6 SemEval_2020數據集
http://alt.qcri.org/semeval2020/index.php?id=tasks
閱讀更多 nlp初學者 的文章