您选择的条件: 付家炜
  • 敦煌壁画叙词表关联数据实体语义相似度计算方法与实验

    分类: 图书馆学、情报学 >> 情报学 提交时间: 2023-04-01 合作期刊: 《图书情报工作》

    摘要: [目的/意义] 随着文化遗产数字化和人文计算研究范式的兴起,人文领域学者在参与数字人文研究过程中对于文化遗产数据资源的利用需求日益突显。多源、异构文化遗产信息资源的语义融合与互操作成为当前数字人文数据基础设施建设中的关键问题,而行之有效的实体语义相似度计算方法则成为实现这一目标的重要手段。[方法/过程] 以敦煌壁画叙词表关联数据为例,在分析该数据集本体模型与数据框架的基础上,针对其内容分布与结构特征提出一种多粒度匹配与加权运算相结合的实体语义相似度计算方法,并选取敦煌壁画叙词表关联数据中"飞天"相关实体为实验对象,引入属性特征、编辑距离等多种现有实体语义相似度计算方法进行对比实验。[结果/结论] 实验结果表明,本文提出的基于多粒度匹配的实体语义相似度计算方法,能够更好地适应敦煌壁画叙词表关联数据的内容与结构特征,在计算结果准确性方面比同类方法具有更好的表现,是推动数字人文背景下异构人文信息资源的数据互联与知识共享的又一可行思路。