您选择的条件: 周潇
  • 融合多源数据的科研人员画像构建方法研究

    分类: 图书馆学、情报学 >> 图书馆学 提交时间: 2023-08-27 合作期刊: 《图书情报工作》

    摘要: [目的/意义]大数据时代需要将人数据化,科研人员也需要数据化。科研人员画像的建立,对于科研管理层全面了解科研人员的信息、客观评价其研究水平等有重要作用,可以作为分析科研人员研究行为或专家推荐的基础,提高科研管理效率。[方法/过程]首先提出科研人员画像的概念,认为其是描述科研人员信息的标签的集合。其次,以个人主页、知网、基金网等多个异构数据源的数据为基础,提出融合多源数据的科研人员画像构建方法,分别从科研人员的基础属性、科研偏好和科研关系三方面形式化描述了科研人员信息,并提取各个维度的标签,以可视化的方式展示其画像。最后,分别以国内外两位科研人员为例,说明了科研人员画像构建方法的可行性。[结果/结论]科研人员画像的构建适用于国内外的科研人员,能够全面描述科研人员信息并直观展示出来。

  • 基于深度学习与语义挖掘的技术创新组合识别与追踪

    分类: 图书馆学、情报学 >> 情报学 提交时间: 2023-04-01 合作期刊: 《图书情报工作》

    摘要: [目的/意义]随着战略型新兴技术产业的迅猛发展,如何识别具有潜在协同效应的技术创新组合、厘清组合中核心的创新关系,是有效规划产业发展路线、提升产业竞争优势的重要前提。[方法/过程]在技术组合进化理论的指导下,结合深度学习、SAO语义挖掘和CFDP算法,提出一种基于专利数据的技术创新组合与演化关系的识别方案。该研究方案共分为3个步骤:首先基于关键词与专利分类号构建领域检索策略,并实现对获取数据的清洗和分词。随后,通过Word2Vec构建领域技术主题的词向量语义网络,并利用CFDP算法识别出潜在创新要素及组合方式。最后,深入挖掘各组合中核心的SAO结构,通过LSTM深度学习算法对其演化关系进行分类,挖掘技术的核心创新方式,进而有效甄别领域潜在的技术机会。[结果/结论]以语音识别领域为例,通过对该领域DII专利文本数据的深入挖掘,识别并追踪5个潜在的技术创新组合及核心创新方式。研究发现,当前我国语音识别领域在智能芯片设计、语音识别算法、新场景和应用等方面有较大的创新潜力。