分类: 图书馆学、情报学 >> 情报学 提交时间: 2017-10-11 合作期刊: 《数据分析与知识发现》
摘要: 【目的】利用互动问答社区——百度知道的知识共享、更新及时的优势, 弥补维护大规模地理隶属关系资源库开销大的不足, 并通过百度知道自动补全缺陷地理位置实体。【方法】对缺陷地理位置实体转化为所属区域问题, 并通过百度知道进行检索; 根据检索结果提取特征, 计算该地理位置实体属于各个区域的得分, 并构建缺陷地理位置实体的所属区域特征向量; 利用规则对缺陷地理位置实体进行完整化处理, 实现地理位置实体完整性表示。【结果】在完整化微博城市投诉文本中的缺陷地理位置实体时, 该方法的综合精确率达到92.51%。【局限】对零地理位置实体无法完整表示。【结论】该方法对缺陷地理位置实体完整化是有效的、可行的。