1 ChineseNLPCorpus:
https://github.com/InsaneLife/ChineseNLPCorpus
2 由滴滴人工智能实验室所属的自然语言处理团队创建并维护的,该项目非常细致的整理了中文自然语言处理相关任务、数据集及当前最佳结果,相当完备。
https://chinesenlp.xyz/#/zh/docs/co-reference_resolution
3 医疗,法律等相关公开数据集,涉及医疗相关的专业词分词,问答和医疗实体识别,以及法律文本分类,情感分析和评价相关的数据集
https://github.com/OYE93/Chinese-NLP-Corpus
4 文本相似度计算LCQMC数据集
https://github.com/brightmart/albert_zh
5 跨领域中文任务导向对话数据集
https://github.com/thu-coai/CrossWOZ
6 SemEval_2020数据集
http://alt.qcri.org/semeval2020/index.php?id=tasks
閱讀更多 nlp初學者 的文章