分类: 图书馆学、情报学 >> 情报学 提交时间: 2024-05-06
摘要: 研究目的 提高高校网络舆情事件风险预测的准确性对于维护国家安全和社会稳定具有重要意义。 研究方法 本研究基于微博平台中高校网络舆情事件的热度和评论,提出了一种基于舆情事件热度和情感分析结果的舆情风险模型,使用灰狼算法与LSTM相结合作为预测模型,分析高校网络舆情风险演化的情况,并结合案例进行了分析验证。 研究结论 本文构建了全链条高校网络舆情分析框架,模型考虑因素更为全面,预测精度和拟合度高,能全面地反映实际舆情的风险态势及其变化,防控演化分析表明利用模型预测舆情可及时将舆情事件控制,防止持续发酵。研究表明,该模型能很好地反映并预测舆情风险的程度与变化,在验证事件中,平均绝对误差为13.8%,同时利用模型的演化分析论证了高校网络舆情预测的重要性和必要性。
分类: 图书馆学、情报学 >> 图书馆学 提交时间: 2023-08-27 合作期刊: 《图书情报工作》
摘要: [目的/意义]数据科学作为一个融合诸多领域的新兴交叉学科正在快速形成。从数据科学招聘的公告信息中,抽取出相应的实体知识不仅有助于从市场的角度了解数据科学的发展动态,而且有助于改进数据科学教学的内容。[方法/过程]基于各大招聘网站职位招聘公告,结合情报学的数据获取、标注和组织方法,构建数据科学招聘语料库并从中抽取相应的实体进行分析与研究。[结果/结论]在搜集到的11 000篇经过标注的职位招聘公告语料的基础上,基于Bi-LSTM-CRF、CRF和Bi-LSTM模型,对数据科学招聘实体的抽取任务进行性能的对比,确定最终的数据科学招聘实体自动抽取模型,设计数据科学招聘实体自动抽取平台,并构建数据科学招聘实体网络。
分类: 图书馆学、情报学 >> 图书馆学 提交时间: 2023-07-26 合作期刊: 《图书情报工作》
摘要: [目的/意义] 在新时代人民日报分词语料库的基础上构建的深度学习自动分词模型,不仅有助于为高性能分词模型的构建提供经验,也可以借助具体的自然语言处理研究任务验证深度学习相应模型的性能。[方法/过程] 在介绍双向长短时记忆模型(Bi-LSTM)和双向长短时记忆与条件随机场融合模型(Bi-LSTM-CRF)的基础上,阐明汉语分词语料预处理、评价指标和参数与硬件平台的过程、种类和情况,分别构建Bi-LSTM和Bi-LSTM-CRF汉语自动分词模型,并对模型的整体性能进行分析。[结果/结论] 从精准率、召回率和调和平均值3个指标上看,所构建的Bi-LSTM和Bi-LSTM-CRF汉语自动分词模型的整体性能相对较为合理。在具体性能上,Bi-LSTM分词模型优于Bi-LSTM-CRF分词模型,但这一差距非常细微。
分类: 图书馆学、情报学 >> 情报学 提交时间: 2017-12-05 合作期刊: 《数据分析与知识发现》
摘要: 【目的】利用 LSTM 模型和字嵌入的方法构建分类系统, 提出一种中文图书分类中多标签分类的解决方 案。【方法】引入深度学习算法, 利用字嵌入方法和 LSTM 模型构建分类系统, 对题名、主题词等字段组成的字 符串进行学习以训练模型, 并采用构建多个二元分类器的方法解决多标签分类问题, 选择 3 所高校 5 个类别的书 目数据进行实验。【结果】从整体准确率、各类别精度、召回率、F1 值多个指标进行分析, 本文提出的模型均有 良好表现, 有较强的实际应用价值。【局限】数据仅涉及中图分类法 5 个类别, 考虑的分类粒度较粗等。【结论】 基于 LSTM 模型的中文图书分类系统具有预处理简单、增量学习、可迁移性高等优点, 具备可行性和实用性。