ChinaXiv.org 中国科学院科技论文预发布平台

按提交时间

2017
3

按主题分类

情报学
3

按作者

按机构

当前资源共 3条

隐藏摘要

点击量

时间

下载量

您选择的条件: 刘健

1. ChinaXiv:201711.02009
下载全文

基于语义相似度的文本聚类研究

分类：图书馆学、情报学 >> 情报学提交时间： 2017-11-08 合作期刊: 《数据分析与知识发现》

毕强刘健鲍玉来

摘要：【目的】为解决传统的文本聚类无法充分挖掘文本资源语义信息以及相似度矩阵高维性、稀疏性等问题,并进一步改善文本聚类质量, 提出基于语义相似度的文本聚类方法。【方法】通过《同义词词林扩展版》计算词语的语义相似度并得到文本语义相似度矩阵, 根据文本语义相似度矩阵进行谱聚类, 将文本聚集为文本簇。【结果】利用复旦大学文本语料库与搜狗文本语料库中的文本资源作为数据来源分别对传统聚类算法与本文提出的算法进行实验, 结果表明, 当聚类个数为10 时, 本文算法的准确率最高, 并且Purity 值高于传统聚类算法的Purity 值。【局限】《同义词词林扩展版》中包含的领域术语不完整, 部分相似度计算结果需要手工进行调整。【结论】该方法考虑了词语间语义关系, 充分挖掘文本主体潜在信息, 并且改善了聚类质量, 为文本聚类和推荐提供了一条新途径。

点击量 3437 下载量 2545 评论 0
2. ChinaXiv:201711.02039
下载全文

数字文献资源内容服务推荐研究——基于本体规则推理和语义相似度计算

分类：图书馆学、情报学 >> 情报学提交时间： 2017-11-08 合作期刊: 《数据分析与知识发现》

刘健毕强刘庆旭王福

摘要：【目的】解决传统数字文献资源内容服务推荐中无法充分挖掘资源语义信息等问题。【方法】通过设定本体推理规则对用户查询关键词进行语义扩展,提出一种新的语义相似度计算方法计算文献资源内容相似度。按照相似度大小对搜索结果进行排序,将排名较高的文献推荐给目标用户。【结果】实验结果证明,该方法能够较准确地计算语义相似度,并能够对用户需求进行有效推荐。【局限】缺少对数字资源的大规模采集,实验案例较少。【结论】该方法充分挖掘数字文献资源的语义信息并进行有效推荐,为数字资源内容服务推荐提供一种新思路。

点击量 2176 下载量 1382 评论 0
3. ChinaXiv:201711.01212
下载全文

数字图书馆微服务评价指标体系构建及实证研究

分类：图书馆学、情报学 >> 情报学提交时间： 2017-10-11 合作期刊: 《数据分析与知识发现》

刘健毕强马卓

摘要：【目的】基于人-信息-技术互动的视角构建数字图书馆微服务评价指标体系, 旨在为数字图书馆微服务建设提供理论依据和评判标准。【方法】提出基于聚类方法的群组AHP 方法, 利用其构造判断矩阵, 对数字图书馆微服务指标体系进行测评, 并选用模糊数学中隶属度函数作为标度系统对国内外10个具有代表性的数字图书馆进行实证研究。【结果】实证结果表明, 指标体系具有实际应用价值和较强的可操作性, 能更好地指导数字图书馆进行微服务建设。【局限】评价指标、评价标准、指标权重等还需根据各数字图书馆微服务的具体情况、具体问题进一步深入分析。实证研究的样本量较少, 结论具有局限性, 指标的确定和分值的给定(采用少数专家打分方式)带有主观性。【结论】在理论层面, 基于人-信息-技术互动视角构建的评价指标体系, 为数字图书馆微服务建设提供新的研究视角; 在实践应用层面, 通过对微服务的评价提升数字图书馆微服务质量和效率, 从而达到满足用户需求和期望的目标。

点击量 2231 下载量 1429 评论 0

基于语义相似度的文本聚类研究

数字文献资源内容服务推荐研究——基于本体规则推理和语义相似度计算

数字图书馆微服务评价指标体系构建及实证研究