[学位论文]
  • 陈奇
  • 华南理工大学

摘要: 该文对基于支持向量机的中文文本分类做了深入的研究,并用约两万个文档的语料库进行实验.研究结果表明,利用中文分词软件并只使用名词作为文档向量的组成元素,中文分类的效果优于英文.在使用SVD变换文本向量空间之后,分类效果平均可改善21%.该文的研究... 展开

作者 陈奇   授予学位单位 华南理工大学  
导师 彭宏 学位 硕士
学科 软件工程   国籍 CN
页码/总页数 1-57 / 57 出版年 2004
中图分类号 TP311.31, TP181
关键词 文本分类   支持向量机   奇异值分解   Zipf定律   词汇分布密度  
机标主题词 支持向量机;奇异值分解;概率模型
机标分类号 TP18;O122;O211
馆藏号 Y649767
相关作者
相关关键词