您当前的位置: > 详细浏览

基于降噪自动编码器的中文新闻文本分类方法研究

请选择邀稿期刊:
摘要: 【目的】借助深度学习理论, 解决传统特征选择方法容易导致特征项不明确、分类精度下降的问题。【方法】对中文新闻文本进行分类时, 使用降噪自动编码器构建一个深层网络来学习对文本的压缩及分布式的表示,并在网络最后一层采用SVM 算法将其分类到具体的类别中去。【结果】随着样本数目的增大, 分类准确率、召回率和F 值都在上升, 且比KNN 算法、BP 算法和SVM 算法取得了更优的分类效果, 平均分类准确率达到95%以上。【局限】数据量依然较小, 且并没有完全发挥深度学习并行处理大容量数据的优势。【结论】该方法能提高特征项提取的准确性, 并能提高分类效果。

版本历史

[V1] 2017-10-11 13:20:06 ChinaXiv:201711.01201V1 下载全文
点击下载全文
预览
许可声明
metrics指标
  •  点击量1970
  •  下载量1322
评论
分享