ChinaXiv.org 中国科学院科技论文预发布平台

注册登录

EN | 中文

按提交时间

2023
1

按主题分类

情报学
1

按作者

按机构

当前资源共 1条

隐藏摘要

点击量

时间

您选择的条件: 崔靖华

1. ChinaXiv:202304.00622
下载全文

多示例多标签学习在中文专利自动分类中的应用研究

分类：图书馆学、情报学 >> 情报学提交时间： 2023-04-01 合作期刊: 《图书情报工作》

包翔刘桂锋崔靖华

摘要： [目的/意义] 旨在对大量的中文专利实现快速分类，满足专利审查以及情报分析等工作的要求。[方法/过程] 结合专利文本的固有格式以及存在多个IPC分类号的实际情况，将多示例多标签学习应用于专利自动分类中，在介绍几种经典的多示例多标签模型的基本原理之后，将这些模型运用于中文专利IPC分类号的确定。[结果/结论] 实验证明，多示例多标签模型适合运用在专利的自动分类中，并且从Average precision、Hamming Loss、Ranking Loss、One Error、Coverage、Training time等指标分析可以发现，MIMLRBF模型能快速、准确地运用在中文专利IPC分类号的确定中，为大规模专利的自动分类提供借鉴。

点击量 172 下载量 111 评论 0

友情链接: ChinaXiv PubScholar 哲学社会科学预印本

运营单位: 中国科学院文献情报中心
制作维护：中国科学院文献情报中心知识系统部
邮箱: eprint@mail.las.ac.cn
地址：北京中关村北四环西路33号

招募预印本评审专家许可声明法律声明

京ICP备05002861号-25 | 京公网安备110402500046号
版权所有© 2016 中国科学院文献情报中心