您选择的条件: 韩涛
  • 科研智能化趋势下科研数据服务研究

    分类: 图书馆学、情报学 >> 情报学 提交时间: 2023-06-12

    摘要: 目的 系统梳理和总结科研智能化趋势下科研数据在科研过程中的运行流程,挖掘其中潜在的科研数据需求,为新趋势下科研数据服务的转型发展提供思考。 方法 在科研数据生命周期的理论指导下,以材料和化学领域为例分析科研数据在科研智能化研究中如何转变为知识的过程,构建了包括数据管理计划、数据产生与收集、数据处理与分析、数据生成与出版、数据存储与共享、数据再利用六大阶段的科研数据生命周期运行流程,挖掘科研数据的作用和潜在需求。 结果 科研智能化研究表现出对多源异构数据集成、细粒度数据结构化、人机互动语言表示的探索、数据关联化挖掘和科研数据类型丰富化的需求特征。 结论 建议未来科研数据服务发展加强高质量全面化领域数据网络建设、深化嵌入科研式数据服务、提升图书馆员领域知识和人工智能素养、重视文本型数据中实验信息的挖掘、关注人机互动语言的探索。

  • 基于二模复杂网络的隐性知识发现方法研究——以潜在药物靶点挖掘为例

    分类: 图书馆学、情报学 >> 情报学 提交时间: 2023-04-01 合作期刊: 《图书情报工作》

    摘要: [目的/意义] 通过构建二模复杂网络模型,揭示隐藏在海量文献中的隐性知识。[方法/过程] 通过NetworkX复杂网络工具包,依据任意两个节点的共现关系构建二模复杂网络模型;对网络模型中节点的共现关系进行加权,计算网络的拓扑信息并进行AP聚类,提取节点间的直接关系;采用AUC方法对AA、JC、加权改进的wAA和wJC等4种链路预测算法进行评价,遴选出最合适的预测算法,并对复杂网络的隐性关系进行预测分析。[结果/结论] 以潜在药物靶点挖掘为例进行的实证研究结果表明,wAA链路预测算法为最优的链路预测算法;二模复杂网络模型、指标和方法体系在美国化学文摘社数据库中的药物靶点挖掘中具有一定的有效性。下一步计划在其他数据库中或其他研究领域中进行尝试,以进一步验证该模型的通用性和有效性。

  • 融合文献知识聚类和复杂网络的关键技术识别方法研究

    分类: 图书馆学、情报学 >> 情报学 提交时间: 2023-04-01 合作期刊: 《图书情报工作》

    摘要: [目的/意义] 立足情报研究视角,提出一套科学有效且可复用推广的关键技术识别方法,以期为国家、地区、企业和创新机构发现、部署、推动关键技术研发前瞻性布局提供情报支撑。[方法/过程] 在关键技术类型及概念界定的基础上,利用文献知识聚类识别热点技术,以各项热点技术为节点构建复杂网络,通过节点二次聚类和可视化方法展现技术结构网络,采用结构洞理论分析网络和节点特性,以此遴选共性技术;利用链路预测方法,预测技术结构网络中的缺失边产生连接的可能性,分析热点技术交叉融合促进创新技术形成的现象,以此识别潜在新兴技术。[结果/结论] 以智能制造领域为例开展关键技术识别的实证研究,通过国家权威规划文件对比和文献资料调研,初步验证方法的可操作性和有效性。

  • 基于深度学习的中文专利自动分类方法研究

    分类: 图书馆学、情报学 >> 情报学 提交时间: 2023-04-01 合作期刊: 《图书情报工作》

    摘要: [目的/意义] 面向当前国内专利审查和专利情报分析工作中对于海量专利分类的客观需求,设计了7种基于深度学习的专利自动分类方法,对比各种方法的分类效果,从而助力专利分类效率和效果的提升。[方法/过程] 针对传统机器学习方法存在的缺陷,基于Word2Vec、CNN、RNN、Attention机制等深度学习技术,考虑专利文本语序特征、上下文特征以及分类关键特征,设计Word2Vec+TextCNN、Word2Vec+GRU、Word2Vec+BiGRU、Word2Vec+BiGRU+TextCNN等7种深度学习模型,以中国专利为例,选取IPC主分类号的部作为分类依据,对比这7种模型与3种传统分类模型在中文专利分类任务中的效果。[结果/结论] 实证研究效果显示,采用考虑语序特征、上下文特征及强化关键特征的深度学习方法进行中文专利分类具有更优的分类效果。

  • 结合链路预测和ET机器学习的科研合作推荐方法研究

    分类: 图书馆学、情报学 >> 情报学 提交时间: 2017-11-08 合作期刊: 《数据分析与知识发现》

    摘要: 【目的】结合链路预测与机器学习, 提出推荐未来科研合作的新方法, 以提高单独基于链路预测方法的推荐精确度。【方法】构建加权作者合作网, 以不同的链路预测指标作为特征输入, 运用极端随机树(Extremely Randomized Trees, ET)机器学习算法训练分类, 并利用遍历算法求取分类结果的最优权重组合, 选取TOP 准确度的预测作为合作推荐结果。【结果】选取纳米科技领域2008 年–2010 年SCI 论文数据进行实证。在城市合作推荐中, 改进的ET 方法优于已有方法, 有良好的推荐成功率; 预测方法受网络结构等因素影响较小, 适用范围更广泛。【局限】科研合作受合作动机、地域、语言等诸多因素影响, 加权作者合作网没有反映在一篇论文中同城市、同机构的多个作者, 也没有反映上述因素。【结论】改进算法能够比单个预测指标产生更准确的合作推荐建议, 也为推广到大学等机构、个人等更微观的应用层面提供参考。

  • 文献–作者二分网络中基于路径组合的合著关系预测研究

    分类: 图书馆学、情报学 >> 情报学 提交时间: 2017-11-08 合作期刊: 《数据分析与知识发现》

    摘要: 【目的】降低文献–作者二分网络在投影为合著网络过程中的信息丢失影响, 形成适应特定二分网络的合著关系预测指标和方法, 提高预测准确率和结果可解释性。【方法】首先构建文献–作者二分网络及其投影合著网络; 接着抽取二分网络中的二阶路径和三阶路径表示作者间的关联关系; 最后利用逻辑回归方法学习不同路径对于合著关系预测的贡献, 由此形成文献–作者二分网络中基于路径组合的合著关系预测指标。【结果】在图书情报领域的实验证实, 文献–作者二分网络在投影为合著网络过程中存在较大的信息丢失, 并以合著关系预测准确率变化进行定量计算; 逻辑回归方法适合学习不同路径对于合著关系预测的贡献, 由此形成的路径组合指标准确率远远高出其他指标, 并且预测结果更易解释。【局限】其他的多阶路径尚未引入到该模型中, 方法通用性还需在其他领域进行验证。【结论】合著关系预测应直接在文献–作者二分网络上进行, 以降低投影过程中的信息丢失影响; 文献–作者二分网络上的路径组合指标是合著关系预测的最优指标; 该方法可扩展应用到其他类型的二分网络中, 如专利–发明人二分网络。