数学建模社区-数学中国

标题: 文本分类语料库(复旦)测试语料 [打印本页]

作者: 习惯优你    时间: 2014-4-27 14:30
标题: 文本分类语料库(复旦)测试语料
由复旦大学李荣陆提供。answer.rar为测试语料,共9833篇文档;train.rar为训练语料,共9804篇文档,分为20个类别。训练语料和测试语料基本按照1:1的比例来划分。收集工作花费了不少人力和物力,所以请大家在使用时尽量注明来源(复旦大学计算机信息与技术系国际数据库中心自然语言处理小组)。文件较大(训练测试各50多兆),下载时请耐心等待
    下载地址:http://www.nlpir.org/download/tc-corpus-answer.rar



作者: 骑马闯青楼    时间: 2015-10-30 11:58
请问有文本转向量的工具没?包含中文分词,提取摘要的。 谢谢!





欢迎光临 数学建模社区-数学中国 (http://www.madio.net/) Powered by Discuz! X2.5