分类: 图书馆学、情报学 >> 图书馆学 提交时间: 2023-10-08 合作期刊: 《知识管理论坛》
摘要: [ 目的 / 意义 ] 面向主流新闻媒体人民日报语料展开研究,旨在为文本自动摘要研究 提供思路和实践支撑,进而应用到新闻等相关文本信息处理中,为知识聚合服务和信息获取 途径研究做出贡献。[ 方法 / 过程 ] 以新时代人民日报语料 NEPD 中的 2015 年 1 月、2015 年 6 月和 2016 年 1 月的人民日报分词语料作为实验语料,基于 TF-IDF、Textrank 等抽取式自 动摘要算法,以及基于指针生成网络的生成式自动摘要模型展开研究,并对摘要结果进行分 析评价。[ 结果 / 结论 ] 实验设计面向人民日报语料的新闻抽取式自动摘要算法,构建面向人 民日报语料的新闻生成式自动摘要指针生成网络模型,并通过 Rouge 指标(包括 Rouge-1、 Rouge-2和 Rouge-L 3种指标)对实验结果进行评测,为人民日报分词语料的应用提供具体思路, 并对新闻自动摘要系统研究提供语料支持和实践支撑。
分类: 图书馆学、情报学 >> 情报学 提交时间: 2023-04-01 合作期刊: 《图书情报工作》
摘要: [目的/意义]在数字化的前提下对《春秋经传引得》的错漏进行识别和校订,以量化数据为依据整体考察和分析其编纂质量,并得以管窥手工时代中国古代典籍索引扛鼎之作《汉学引得丛刊》的编纂质量,重新发现印本形态的古籍全文索引在数字时代的价值。[方法/过程]对《春秋经传引得》的经文、传文以及全部索引款目全面数字化,并逐项比对,找出并校订其中的错漏,记录并统计错漏的类型、数量,分析整体编纂质量。[结果/结论]《春秋经传引得》确有极少的错漏,款目差错率仅为万分之一左右,编纂质量堪称手工时代的巅峰,当得起学界的高度赞誉,可作为数字化语料的高质量基础语料。
分类: 图书馆学、情报学 >> 情报学 提交时间: 2023-04-01 合作期刊: 《图书情报工作》
摘要: [目的/意义] 学术图书是呈现科学研究活动成果的重要工具,也是人类社会信息活动中的重要信息资源,对学术图书进行影响力评价有利于学术图书得到充分的利用。[方法/过程] 在吸取前人研究成果的基础上设计一套完整、全面的中文人文社会科学学术图书影响力评价体系,从图书的学术影响力和社会影响力两方面出发,设置多级评价指标,并选取CBKCI中图书馆情报与文献学领域的103本学术图书作为研究样本,收集相应的指标数据,采用CRITIC赋权法、TOPSIS法对103个样本图书进行影响力评价实证。[结果/结论] 研究结果表明,本文提出的中文人文社会科学学术图书影响力评价指标和方法,考虑了科研学者、读者、图书本身等因素,较全面地反映出学术图书影响力的各个方面,具有一定的易用性和可行性。
分类: 图书馆学、情报学 >> 情报学 提交时间: 2023-04-01 合作期刊: 《图书情报工作》
摘要: [目的/意义] 事件自动识别抽取是当前典籍主题挖掘研究中一个新的重要课题,其中事件触发词的识别是一项基础的工作,本研究旨在探索古代典籍中事件触发词自动识别和分类的通用方法。[方法/过程] 首先运用LDA模型对动词进行主题聚类,归纳典籍事件触发动词的分类体系;并依据聚类结果与分类体系,初步构建触发动词的种子词集。在此基础上,通过语义相似度计算,对种子词集进行扩展,构建典籍事件触发词语义数据集。在实验阶段,以先秦时期的重要典籍《左传》为例,对分类体系构建和种子词集扩展的方法进行验证。[结果/结论] 结果表明,本文所提出的典籍事件触发词识别方法可行有效,据此构建的事件触发词集具有较高可信度,未来可进一步扩大实验的样本数量及范围。