分类: 图书馆学、情报学 >> 情报学 提交时间: 2024-05-08
摘要: 目的/意义 本文以人文社科领域为出发点,从人文社科领域基础知识与人文社科学术文本两个方面入手进行人文社科领域模型性能比对。旨在为人文社科领域提供一份体系化的大模型评测基准,供人文社科相关领域研究人员参考。 方法/过程 设计了7个人文社科领域相关的评测任务并选取对应指标,在此基础上,选取了当前开源且性能较优的通用领域中文大模型,通过调用本地模型以问答形式完成领域化任务,并选取相关指标对其在人文社科领域的性能进行了量化评测。 结果/结论 评测结果表明,在本文选取的开源模型中,无论是基座模型还是对话模型,Qwen性能最优,Baichuan2紧随其后,InternLM次之,Atom表现最差,此外,大多数情况下,相较于基座模型,对话模型表现出了更加优越的性能。
分类: 图书馆学、情报学 >> 图书馆学 提交时间: 2024-05-04
摘要: 出版伦理是科技期刊发展的基础与前提。在我国大力推动世界一流科技期刊建设的背景下,出版伦理规范化建设尤为迫切。作为科研诚信的重要组成部分,科技期刊出版伦理规范化建设应符合国家政策需求。本文全面搜集我国出版伦理相关政策,通过政策文献计量分析和扎根理论分析,明确了科技期刊出版伦理政策的演变、出版伦理规范化建设的理论模型、出版伦理政策的内容变迁。通过对研究结果的分析可得如下结论: 我国日益重视科技期刊诚信与伦理治理; 科技期刊出版伦理规范化建设的基本框架包括总体要求、出版伦理内容以及落实出版伦理的保障举措,后两者是关键要素。
分类: 图书馆学、情报学 >> 图书馆学 提交时间: 2023-04-13
摘要: 目的/意义 对先秦典籍中植物进行知识挖掘,构建先秦典籍植物知识图谱,对认识我国古代人民社会和生活状态等具有重要意义。 方法/过程 对先秦典籍中植物词进行详尽标注与计量分析。基于CRF和多种深度学习模型构建古汉语植物命名实体识别模型,比较分析各模型性能以确定最优模型;设计了面向知识图谱的古汉语植物知识组织模式。 结果/结论 基于领域预训练语言模型SikuRoBERTa构建的古汉语植物命名实体识别模型性能最优,调和平均值达85.44%,为基于实体的植物知识挖掘提供了有效方法;构建了先秦典籍植物知识图谱,实现了对先秦典籍中植物实体及其关联知识的聚合与可视化呈现。
分类: 图书馆学、情报学 >> 图书馆学 提交时间: 2022-01-06
摘要: [目的/意义]对图情档及相关学科而言,国务院学位委员会办公室2021年新版学科专业目录(征求意见稿)的发布,不仅事关一级学科的更名,更是我们学科内涵与学科体系的重大变革。为此,需要解析和思考这种更名的重要意义及未来学科建设策略。[方法/过程]通过文献调研与历史分析,梳理“信息资源管理”的发展演变,加强对一级学科更名的理性认识,提出新的一级学科建设策略。[结果/结论]需要学界业界加大对作为一级学科的“信息资源管理”概念与内涵、意义与价值、范畴与边界、方法与技术、学科与理论、应用与成效、规划与未来的认知与研究,推动一级学科从名称(名)到内容(实)的根本性转变。