您选择的条件: 陈亮
  • 基于Doc2Vec的专利文件相似度检测方法的对比研究

    分类: 图书馆学、情报学 >> 图书馆学 提交时间: 2023-08-27 合作期刊: 《图书情报工作》

    摘要: [目的/意义]专利相似度检测(Similarity Measurement)可从宏观上辅助制定国家创新战略规划,发现国内外的热点及应对其他国家的专利流氓,从微观上为专利发明人、专利审查员、专利权人提供辅助支撑。[方法/过程]提出基于深度学习的Doc2Vec专利相似度分析方法,基于未进行清洗的专利语料库,采用深度学习的Doc2Vec模型,随机挑选了专利,研究了专利相似度检测问题,并和传统的相似度检测模型进行对比研究。[结果/结论]实验结果表明,基于深度学习的Doc2Vec模型和TF-IDF模型对于处理不做数据清洗的专利语料的结果有相近性,该方法对分析人员的专利领域知识要求较低,不需要对专利数据进行基于专利领域知识的数据清洗,同时可为专利侵权、专利查新提供新的智能工具支撑,降低研究门槛和工作量,提升研究效率。

  • 专利引用关系形成的解释框架:一个指数随机图模型视角

    分类: 图书馆学、情报学 >> 图书馆学 提交时间: 2023-07-26 合作期刊: 《图书情报工作》

    摘要: [目的/意义]近年来,围绕着专利引文网络结构特征的研究出现大量的研究成果,这些成果都从某种程度上折射出专利引文关系的形成受到来自属性特征之外关系特征的影响,而现有的以回归方法为基础的统计推断方法难以将这些因素纳入到分析框架中,因此,急需探索新的方法。[方法/过程]从关系形成视角,专利引用关系形成可表示三种广义的关系形成过程:自组织影响过程、自身属性影响过程、网络协变量影响过程,并建立关系形成过程与网络配置间的映射关系,最终,形成一整套可用于理解复杂专利引用关系形成问题的解释框架。[结果/结论]提出一整套可用于理解复杂专利引用关系形成问题的解释框架,该框架是未来进一步构建网络统计模型的理论基础,另外,解释框架包含丰富的网络配置项,预示着未来指数随机图模型在文献计量、科学网络分析上广阔的应用前景。

  • 专利无效对比文件判定方法研究

    分类: 图书馆学、情报学 >> 情报学 提交时间: 2023-04-01 合作期刊: 《图书情报工作》

    摘要: [目的/意义] 对比文件是用以判断专利能否授权或无效的重要文件,针对传统信息检索方法的不足且鲜有利用机器学习方法研究对比文件检索的问题,在引入对比文件信息的基础上,构建专利相关性判定模型。[方法/过程] 以专利无效判决书中的目标专利与对比文件为数据集进行实验,提取文本相似度、共现词汇和共词数量特征信息,利用GBDT模型将对比文件的检索问题转化为判断其是否相关的分类问题。[结果/结论] 研究结果表明,不同字段数据对分类效果的贡献不同,其中说明书字段的准确率、召回率和F1值分别为79%、48%和59%,并且多特征集成后的分类效果显著优于单一文本相似度的结果,最后对实验错分情况进行分析,指出本研究下一步的研究方向。