• 基于矩阵加权关联模式的印尼中跨语言信息检索模型

    分类: 图书馆学、情报学 >> 情报学 提交时间: 2017-11-08 合作期刊: 《数据分析与知识发现》

    摘要: 【目的】针对跨语言信息检索存在的查询漂移问题, 提出一种融合用户点击下载行为与矩阵加权关联模式挖掘的印尼中跨语言信息检索模型。【方法】将矩阵加权关联模式挖掘、查询扩展以及用户点击下载行为集成应用到印尼中跨语言信息检索模型, 给出模型实现的关键技术, 即面向跨语言信息检索的矩阵加权关联模式挖掘算法、跨语言查询扩展模型以及印尼中跨语言信息检索算法。【结果】在 NTCIR-5 CLIR 数据集上的实验结果表明, 该检索模型的R_prec、p@10 和p@20 值均达到单语言检索基准的60%以上, 比跨语言检索基准提高37%以上, 比现有基于伪相关反馈的跨语言检索算法提高28%以上。【局限】该模型实验在基于向量空间模型的跨语言检索系统中进行, 需要探讨和研究在实际搜索引擎中的具体应用。【结论】该模型能有效地减少跨语言检索中的查询漂移问题, 提高和改善印尼中跨语言检索性能, 对长查询的检索效果更好, 有较好的实际应用价值。

  • 基于矩阵加权关联模式的印尼中跨语言信息检索模型

    分类: 图书馆学、情报学 >> 情报学 提交时间: 2017-11-08 合作期刊: 《数据分析与知识发现》

    摘要: 【目的】针对跨语言信息检索存在的查询漂移问题, 提出一种融合用户点击下载行为与矩阵加权关联模式挖掘的印尼中跨语言信息检索模型。【方法】将矩阵加权关联模式挖掘、查询扩展以及用户点击下载行为集成应用到印尼中跨语言信息检索模型, 给出模型实现的关键技术, 即面向跨语言信息检索的矩阵加权关联模式挖掘算法、跨语言查询扩展模型以及印尼中跨语言信息检索算法。【结果】在 NTCIR-5 CLIR 数据集上的实验结果表明, 该检索模型的R_prec、p@10 和p@20 值均达到单语言检索基准的60%以上, 比跨语言检索基准提高37%以上, 比现有基于伪相关反馈的跨语言检索算法提高28%以上。【局限】该模型实验在基于向量空间模型的跨语言检索系统中进行, 需要探讨和研究在实际搜索引擎中的具体应用。【结论】该模型能有效地减少跨语言检索中的查询漂移问题, 提高和改善印尼中跨语言检索性能, 对长查询的检索效果更好, 有较好的实际应用价值。