分类: 图书馆学、情报学 >> 情报学 提交时间: 2017-12-05 合作期刊: 《数据分析与知识发现》
摘要: 【目的】从评论对象的属性特征出发解决情感极性量化问题。【方法】将在线评论文本分解构建三层评论 体系, 即评论对象–对象属性–评论描述, 从属性层级抽取属性词集和对应的评论集, 考虑评论对象属性特征的 不同影响, 引入属性因子, 并对 TFIDF 进行改进用以计算属性因子; 结合评论模式和评论语境提出基于属性特 征的评论情感量化分析算法并采用 Python 语言予以实现。【结果】相较于传统机器学习分类算法(NB、SVM)、 属性因子设置为等权重时, 本文算法在评论文本情感分类准确性方面有显著提高。【局限】评论集领域选择方面 具有局限性, 量化算法在系数设定方面存在主观性。【结论】本文算法能有效解决情感极性量化问题, 进一步提 高了情感分类准确性。
分类: 图书馆学、情报学 >> 情报学 提交时间: 2017-12-05 合作期刊: 《数据分析与知识发现》
摘要: 【目的】对在线评论进行分析, 揭示评论文本主题的内容和情感分布变化规律。【方法】使用融入先验信 息的 SSTM 模型获得评论文档的情感分布, 以文档、文档情感分布和词项为可视变量, 提出 DSTM 模型, 并估算 情感主题分布和主题词项分布。【结果】将采集的评论数据集按时间片划分进行建模, 实验得到主题的内容和情 感随时间的变化趋势。【局限】未考虑不同主题之间的关联关系, 建模结果可能存在一定误差。【结论】融合时 间外部特征的 DSTM 模型, 能够有效地对在线评论进行主题演化分析。