Subjects: Library Science,Information Science >> Information Science submitted time 2024-04-24
Abstract: Abstract: Objective This paper reviews the relevant progress of semantic novelty research at home and abroad, and summarizes the relevant technologies to provide reference for the subsequent research. Coverage Using retrieval methods such as Novelty of the literature , semantic novelty , literature novelty , semantic novelty and literature evaluation , after reading and sorting, this paper traced the source of representative relevant theoretical researches, and finally selected 70 literatures for review. Methods This paper summarizes the relevant researches on semantic novelty at home and abroad, and analyzes the development status and future trend of semantic novelty evaluation in scientific and technological literature by focusing on the definition of novelty, evaluation indexes of novelty and different evaluation methods. Results Semantic novelty evaluation has gradually attracted widespread attention from the academic community. There have been related studies on semantic content mining and evaluation, but no unified measurement index has yet been formed. Limitations The existing literature novelty is mostly evaluated from external features, while the number of literatures directly focusing on semantic novelty is small, which has limitations in supporting the review. Conclusions The evaluation of semantic novelty of scientific and technological literature is based on the novelty of content. Quantitative research has become the mainstream research method, but the calculation method of evaluation index needs to be clarified, and the development direction of novelty evaluation should be combined with qualitative and quantitative methods to achieve a scientific and reasonable comprehensive evaluation.
Subjects: Library Science,Information Science >> Information Science submitted time 2023-04-01 Cooperative journals: 《图书情报工作》
Abstract: [Purpose/significance] The paper explores the construction of literature intelligence big data knowledge resource system, which supports multi-domain intelligent knowledge service.[Method/process] Based on the AI application requirements, drawing on the industry experience, combing the problems of existing resource system, the paper expanded the resource system from multi-level and multi-dimensional, built a reliable data processing process and computing platform to support efficient data collection and processing, and developed intelligent data governance tools to achieve effective governance of knowledge resources and ensure the provision of high-quality data resources.[Result/conclusion] It has initially formed a knowledge resource system covering multiple types and disciplines of sci-tech literature, constructed and completed a highly automated data collection and governance process, implemented multiple data quality control, and accumulated hundreds of millions of high-quality data. At present, it has provided data support for multiple knowledge services.
Subjects: Library Science,Information Science >> Information Science submitted time 2017-11-08 Cooperative journals: 《数据分析与知识发现》
Abstract:【目的】通过采用语义识别、知识关系计算等方法提升科技文献检索系统的服务功能和效果, 使之能够呈现更加丰富的知识化语义信息, 将更多的知识点和知识关系展现给用户。【方法】应用数据挖掘和关系计算工具,深度识别和抽取科技文献中的语义知识, 分析、计算、构建语义关系, 并将得到的语义知识和语义关系建立多维语义索引树, 设计新的数据组织呈现模型。【结果】研发语义丰富化检索示范系统, 在科技文献检索应用过程中充分揭示语义信息, 丰富检索体验。【局限】选取的试验数据集合不够充足, 缺少其他领域应用对比。【结论】本文模型设计给用户带来更多的知识层面的关联、揭示和导航, 提升了检索系统体验。同时分析了设计模型的不足之处, 探索改进方法。
Subjects: Library Science,Information Science >> Information Science submitted time 2017-11-08 Cooperative journals: 《数据分析与知识发现》
Abstract:【目的】分析数字文献资源长期保存的可持续性挑战, 推进长期保存服务的可持续建设。【方法】系统分析国内外相关文献, 梳理长期保存可持续性框架, 分析可信赖认证和经济支持等问题体系, 分析整理可信赖性认证实施机制和长期保存经济投入实施机制。【结果】提出数字文献资源长期保存的可持续支撑机制建设具体建议。【局限】对数字文献资源长期保存经济支持模式和相关研究只做了简要概述, 有待更深入展开论述。【结论】数字文献资源长期保存的可持续性包括格式可持续性、系统可持续性和服务可持续性, 服务可持续性涉及管理、经济和政治可持续性要求, 并提出加强长期保存可持续性建设的具体建议。
Subjects: Library Science,Information Science >> Information Science submitted time 2017-10-11 Cooperative journals: 《数据分析与知识发现》
Abstract:【目的】开发网络信息存档WARC 文件的解析与索引系统, 充分挖掘科技网站存档资源价值。【应用背景】在网络资源采集存档领域, WARC 文件格式获得了广泛的应用。随着网络信息的多样化, 已有的WARC 文件索引工具越来越难以满足用户多样性的查询需求。【方法】采用模块化方案解析WARC 文件。分析比较常用的索引工具, 选择Solr 平台开发全文索引系统。【结果】实现对WARC 文件基于内容的检索访问服务, 并在WARC的索引中增加了学科分类、资源类型和存档时间等分面检索内容, 从多维度对WARC 文件内容进行揭示。【结论】向用户提供了丰富的科技网站存档数据信息, 提高了用户检索访问效率。
Subjects: Library Science,Information Science >> Philology submitted time 2017-08-21
Abstract:[目的/意义]本文期望通过采用数据挖掘、语义识别、知识关系计算等技术方法来提升科技文献检索系统的服务功能和效果,使之能够呈现更加丰富的知识化语义信息,将更多的知识点和知识关系展现给用户。[方法/过程] 本文应用semrap和clausIE数据挖掘和关系计算工具,识别和抽取科技文献中的语义对象,分析、计算、构建语义关系,并将得到的语义对象和语义关系设计建立多维语义索引树,设计了新的数据组织呈现模型。[结果/结论] 研发语义丰富化检索示范系统,在科技文献检索系统中充分揭示语义信息,给用户带来更多的知识内容层面的导航、关联、发掘和揭示,同时分析了设计模型的优势与不足。
Peer Review Status:Awaiting Review
Subjects: Library Science,Information Science >> Library Science submitted time 2016-05-05
Abstract:[目的]对典型科技文献语义检索系统进行调研和总结。[文献范围]利用Web of Knowledge和Google Scholar检索semantic search相关文献以及语义检索系统的参考文献和研究报告。[方法]根据文本语义处理程度,将这些系统归纳为语义查询扩展的检索系统、以概念或实体为中心的检索系统、以关系为中心的检索系统和面向知识发现的检索系统。[结果]提出科技文献语义检索系统的基本框架,总结科技文献语义检索系统功能特点。[局限]缺少对语义检索系统的性能评测。[结论]为构建面向科技文献的语义检索系统提供良好借鉴。
Peer Review Status:Awaiting Review
Subjects: Library Science,Information Science >> Collection and Storage of Information submitted time 2016-04-20
Abstract: 目的/意义 研究建立长期保存系统起源管理框架,通过有效管理起源信息,确保长期保存系统所存档数据的真实可靠可用。 方法/过程 基于数字对象保存周期进行起源事件定义,基于 OAIS 保存流程进行起源管理框架设计,以事件为核心进行起源管理功能模型和起源信息模型设计。 结果/结论 初步完成基于事件的保存系统起源管理框架的设计,既遵循了保存领域的相关标准,同时兼顾了实践需求,对长期保存系统具有很好的普适性和可行性,但其在有效性和实用性方面还有待进一步验证。
Peer Review Status:Awaiting Review
Subjects: Library Science,Information Science >> Library Science submitted time 2016-04-14
Abstract:摘要: 【目的】在数字资源长期保存系统(DPS)中应用开源格式识别工具获取复杂对象的格式信息。【应用背景】摘要: 【目的】在数字资源长期保存系统(DPS)中应用开源格式识别工具获取复杂对象的格式信息。【应用背景】在现有开源工具的基础上, 为满足 DPS 的实际需求、保障效率和执行效果, 需选择合适的工具进行二次开发和集成应用。【方法】分析比较现有两种常用工具, 选取 DROID作为 DPS的格式识别工具, 同时针对 DPS效率要求, 提出选用 DROID 批量格式识别的处理思路, 并对其进行有效封装。【结果】将 DROID 封装为“DPS 的批量格式处理模块”并在 DPS格式识别及技术元数据抽取中得到实际应用。【结论】 DROID是一个优秀的开源工具, 其自动批处理特性基本满足 DPS格式处理需求。
Peer Review Status:Awaiting Review
Subjects: Library Science,Information Science >> Library Science submitted time 2016-03-10
Abstract:文章对图书馆领域的主流资源发现平台(Elsevier,Springer,中国知网 CNKI)和商业资源发现系统(Primo,Summon,EDS)的页面构造和页面布局等方面进行了多层次多角度的分析,并对多个平台(如Willy,英国国家图书馆,荷兰国家图书馆,美国国会图书馆,美国 NSDL,OCLC,PubMed等)的特色资源和功能进行调研分析,最终借助上述平台的优秀功能,改进我中心自行建设的资源集成发现服务系统,并着重提升用户使用体验。
Peer Review Status:Awaiting Review
Subjects: Library Science,Information Science >> Collection and Storage of Information submitted time 2016-02-22
Abstract:[目的/意义]结合数据起源的内容和长期保存特点,全面研究和分析数据起源在长期保存中的应用,为长期保存系统组织管理起源提供参考。 [方法/过程]分析长期保存领域中相关标准如OAIS、PREMIS和TRAC对起源的解释和要求,对比起源在已有的长期保存系统中的应用情况。[结果/结论]提出以事件为核心的长期保存起源管理框架,总结起源的详细内容、捕获方法、组织方案、存储封装策略和技术方案等。
Peer Review Status:Awaiting Review
Subjects: Library Science,Information Science >> Library Science submitted time 2016-02-02
Abstract:【目的】构建国际重要科研机构 Web 存档系统。【方法】基于 IIPC 开源软件拓展采集存档框架, 在采集端采用三层扩展策略, 在采集客户端增加自动上传及报告等管理功能, 开发WARC文件内容解析模块, 利用Solr进行索引。【结果】在采集端实现三层扩展, 通过增加采集客户端功能提高存档流程自动化程度, 通过增加的WARC文件内容解析功能抽取更多信息, 实现索引及检索服务的扩展。【局限】没有使用大规模采集存档进行检验。【结论】扩展后的采集存档框架初步具备分布式、可扩展、全自动化的特点。
Peer Review Status:Awaiting Review
Subjects: Library Science,Information Science >> Library Science submitted time 2016-01-25
Abstract:通过调研国际主要机构的战略规划,归纳出Data Curation 在管理、资源建设、技术基础设施方面存在的主要挑战。针对这些挑战,从战略规划、数据评估与遴选政策、关键技术、审计和认证四方面全面回顾了国际Data Curation 研究、实践的发展情况。分析图书馆在大数据科研环境下可能参与科研数据保管的领域,为图书馆在Data Curation活动中谋求发展机会。
Peer Review Status:Awaiting Review