您选择的条件: 王丽
  • 利用引文构建的主题模型研究进展

    分类: 图书馆学、情报学 >> 图书馆学 提交时间: 2023-07-26 合作期刊: 《图书情报工作》

    摘要: [目的/意义] 概率主题模型算法在不断得到改进与扩展,本文对国内外已有的利用引文构建的主题模型进行研究,分析和对比不同模型的生成过程与算法,并探讨利用引文构建的主题模型在科技文本分析中的应用与可扩展的研究方向。[方法/过程] 通过Web of Science数据库和CNKI数据库获取国内外利用引文构建主题模型的相关文献,经人工判读后筛选出具有代表性的文献,对这些文献中利用引文构建的主题模型,从建模思想、生成过程、参数估计与推断算法等方面进行对比与分析。[结果/结论] 目前国内外利用引文构建的主题模型主要包括研究主题与引文分布的主题模型、研究被引与施引主题间关系的主题模型,以及基于引用内容的引用主题模型;主题模型中引入引文信息后,能够获得更完整的主题内容和特定主题下的重要文献,并可识别施引文献和被引文献之间主题间的关系及影响;已有的模型多集中在概率潜在语义分析(Probabilistic Latent Semantic Analysis,PLSA)和潜在狄利克雷分配(Latent Dirichlet Allocation,LDA)主题模型基础上进行扩展。未来可扩展研究引入引用内容的主题模型、模型的性能优化和评价方法、模型的应用研究等。

  • 关系网络视角下新兴技术识别研究进展

    分类: 图书馆学、情报学 >> 情报学 提交时间: 2023-04-01 合作期刊: 《图书情报工作》

    摘要: [目的/意义] 新兴技术识别有助于国家、企业等把握技术前沿、发现技术机会、抢占市场先机、创造社会价值。梳理新兴技术识别的研究进展,以期为新兴技术识别研究提供参考。[方法/过程] 在明确新兴技术概念和特征的基础上,详细介绍基于关系网络的新兴技术识别方法,并从新兴技术识别的网络节点、网络关系、测度指标进行总结,对未来新兴技术识别研究提出建议。[结果/结论] 基于关系网络的新兴技术识别方法包括基于引用关系、共现关系以及相似度关系的方法,新兴技术识别的网络节点主要来自论文和专利数据,现有指标体系包括文献计量学指标和网络结构特征指标。未来,新兴技术识别研究可以从丰富数据源、网络关系融合、测度指标等方面进行改进;同时,重点加强对新兴技术识别中多源数据和多元关系的融合网络的探索。

  • 专题专利预警平台建设方案研究与实践

    分类: 图书馆学、情报学 >> 情报学 提交时间: 2017-11-08 合作期刊: 《数据分析与知识发现》

    摘要: 【目的】制定专题专利预警平台建设方案, 为长期的专题跟踪预警分析、专题数据再利用等工作提供一种解决途径。【方法】平台集成开源代码平台和工具(DSpace、OpenRefine、ECharts、VOSviewer 等), 实现对专题数据的存储、跟踪、分类、清洗、分析、管理等功能。【结果】选择极紫外光刻技术专题进行应用实践, 测试并解决实践过程中的细节问题, 验证专题专利预警平台的可行性和有效性。【局限】目前的专题专利预警平台数据处理全自动化、数据分析指标化、内容挖掘的关联实现等方面需要进一步优化。【结论】专题专利预警平台所实现的功能, 对于在技术研发生命周期内进行技术专利及时跟踪预警并分类管理有着现实的意义。