nlp任务公开数据集汇总

1 ChineseNLPCorpus:

https://github.com/InsaneLife/ChineseNLPCorpus

2 由滴滴人工智能实验室所属的自然语言处理团队创建并维护的,该项目非常细致的整理了中文自然语言处理相关任务、数据集及当前最佳结果,相当完备。

https://chinesenlp.xyz/#/zh/docs/co-reference_resolution

3 医疗,法律等相关公开数据集,涉及医疗相关的专业词分词,问答和医疗实体识别,以及法律文本分类,情感分析和评价相关的数据集

https://github.com/OYE93/Chinese-NLP-Corpus

4 文本相似度计算LCQMC数据集

https://github.com/brightmart/albert_zh

5 跨领域中文任务导向对话数据集

https://github.com/thu-coai/CrossWOZ

6 SemEval_2020数据集

http://alt.qcri.org/semeval2020/index.php?id=tasks


分享到:


相關文章: