基于多源数据的专业领域热点探测模型研究
Towards Professional Publishing: Research on Hotspot Detection Model Based on Multi-source Data
-
作者:
王晓光
1
王宏宇
1
黄菡
2
-
作者单位:
-
提交时间:2023-07-26 17:46:56
摘要: [目的/意义]面向出版业进行专业领域出版时的选题决策问题,对互联网上公开的资讯动态进行多源整合,通过多维度的情报分析探测专业领域内的热点,实现数据驱动的出版选题决策,为出版业的数字化转型与发展奠定坚实基础。[方法/过程]设计一个情报分析模型,面向出版选题决策进行专业领域的热点探测。模型包含热点发现与热度评价两个过程。热点发现过程,通过词频统计和词增长速度算法对专业领域内的热点进行识别;热度评价过程,从内容层面和传播层面两个维度设计并计算一系列指标,对识别到的热点进行热度评价与排序。[结果/结论]以2018年1月至4月的36 550条信息、通讯和技术领域多源中文信息为样本进行热点探测实验,实验结果表明,设计的热点探测模型可以有效地探测专业领域内的热点,辅助出版业科学地进行专业领域选题决策。
版本历史
[V1] |
2023-07-26 17:46:56 |
ChinaXiv:202307.00454V1
|
下载全文 |