分类: 图书馆学、情报学 >> 图书馆学 提交时间: 2023-08-26 合作期刊: 《图书情报工作》
摘要: [目的/意义]从科技论文中自动识别与抽取研究设计指纹,能够为科研人员项目设计、研究方法的有效性评估、研究过程问题诊断、研究结果鉴别与评价提供重要的方法论和研究操作支撑。[方法/过程]基于科技论文研究设计指纹的概念模型,提出基于多规则模式混合机器学习方法,设计并实现指纹识别算法,并以数据挖掘领域的期刊文献数据为例,对识别算法的可行性与有效性进行分析验证。[结果/结论]除研究数据与研究趋势外,其他研究设计指纹识别准确率的认可度都基本达到80%以上,覆盖率的认可度,除研究工具与研究数据外,基本达到80%以上。
分类: 图书馆学、情报学 >> 情报资料的处理 提交时间: 2023-08-14
摘要: 企业数字化转型需要对数据进行全生命周期管理,数据鉴定归档是破解大数据技术难以直接处理传统非结构化文档问题的重要手段。在企业数据治理基础上,将主数据管理引入到数据归档中,将企业数据分为主数据、事务数据、分析数据三类。运用宏观鉴定法对这三类数据进行鉴定,确定数据归档范围,将ER图、数据字典、数据血缘关系图谱等作为元数据纳入元数据归档范围,以归档数据子湖融入到企业数据湖建设作为数据归档保存最佳路径。档案部门可以采取实行电子文件与数据归档双套制、大型国企先行试点数据归档、提升档案工作团队的数据素养主动参与数据治理等方式加快融入到国家大数据战略。
分类: 图书馆学、情报学 >> 文献学 提交时间: 2016-03-10
摘要: 提出用于描述科技文献核心知识的“研究设计指纹”概念,综合研究分析了相关的科技文献规范描述框架,创建“基于科技文献的研究设计指纹描述框架”,以增强科技文献的机器计算可执行性、知识粒度性、知识关联性、结构的扩展性以及研究设计思路的可视性,为科研人员快速发现研究设计方法、研究设计工具等指纹提供了新的思路与方法。