• 基于 BERTopic的突发事件微博舆情主题演化分析研究——以“东航Mu5735空难事件”为例

    分类: 图书馆学、情报学 >> 情报资料的处理 提交时间: 2024-04-18

    摘要: 目的/意义 :本研究旨在系统地分析突发事件微博舆情的主题演化趋势,可视化舆情发展过程中的焦点主题,为后续网络舆情的引导提供实践参考依据。 方法/过程 :采用BERTopic主题提取模型识别舆情发展不同阶段的主题,并采用余弦相似度度量主题间的相似性,可视化主题的演化路径。以新浪微博“东航Mu5735空难事件”为例,进行突发事件网络舆情的主题演化研究。 结果/结论: 实证研究结果表明,基于BERTopic主题模型对舆情事件建模得到高效且可观性较高的主题识别结果,准确把握舆情发展每个阶段中热点主题,揭示了舆情传播过程中主题演变过程。 创新/局限 :本研究提出了一种基于 BERTopic 模型对短文本突发事件微博舆情主题演化分析的总体框架,对主题提取后的结果进行主题内容演化分析并进行可视化展示。本研究的局限性在于当前选用的数据来源仅来源于微博平台,后续可提高数据来源的多样性。

  • 中文微博的立场判别研究

    分类: 图书馆学、情报学 >> 图书馆学 提交时间: 2023-10-08 合作期刊: 《知识管理论坛》

    摘要: [ 目的 / 意义 ] 提出一种以情感加权算法和朴 素贝叶斯算法为基础的组合分类模型(SWNB 模 型),旨在对中文微博话题的立场进行判别。[ 方法 / 过程 ] 该模型首先通过给定的复杂句模型对微博进 行简化,然后依据情感规则得到情感权值,提取微博中与话题相关的实体并进行优化,进而将微博分为包 含立场和未表明立场(NONE)两类;再对包含立场的微博提取特征词,利用朴素贝叶斯算法将其立场判 别为支持(FAVOR)或反对(AGAINST)。[ 结果 / 结论 ] 实验结果表明,本模型有较好的立场判别精度, 并能同时有效地处理中文复杂句式、话题相关评价对象以及上下文语境等复杂情形。

  • 基于多源数据的专业领域热点探测模型研究

    分类: 图书馆学、情报学 >> 图书馆学 提交时间: 2023-07-26 合作期刊: 《图书情报工作》

    摘要: [目的/意义]面向出版业进行专业领域出版时的选题决策问题,对互联网上公开的资讯动态进行多源整合,通过多维度的情报分析探测专业领域内的热点,实现数据驱动的出版选题决策,为出版业的数字化转型与发展奠定坚实基础。[方法/过程]设计一个情报分析模型,面向出版选题决策进行专业领域的热点探测。模型包含热点发现与热度评价两个过程。热点发现过程,通过词频统计和词增长速度算法对专业领域内的热点进行识别;热度评价过程,从内容层面和传播层面两个维度设计并计算一系列指标,对识别到的热点进行热度评价与排序。[结果/结论]以2018年1月至4月的36 550条信息、通讯和技术领域多源中文信息为样本进行热点探测实验,实验结果表明,设计的热点探测模型可以有效地探测专业领域内的热点,辅助出版业科学地进行专业领域选题决策。