• 不同文本长度的体验型产品在线评论时间序列研究-以电影评论为例

    分类: 图书馆学、情报学 >> 图书馆学 提交时间: 2023-07-26 合作期刊: 《图书情报工作》

    摘要: [目的/意义]将体验型产品在线评论按照文本长度分为长文本在线评论和短文本在线评论,探究这两类评论的时间和内容特征,为电子商务平台掌握消费者在线评论行为规律和商品需求偏好提供情报依据。[方法/过程]利用Python爬虫语言获取电影评论网站中在线评论的相关信息,构造在线评论时间间隔序列,基于人类行为动力学相关构念,探究不同类型在线评论发布行为的时间特征规律;利用文本挖掘方法找出不同类型在线评论的文本内容特征并进行比较分析。[结果/结论]以电影评论网站在线评论为数据来源,从时间角度总结出不同类型在线评论行为的时间间隔序列符合幂率分布;从文本内容角度发现不同类型在线评论的文本内容特征既有一定的相似性,也表现出明显的差异。

  • 中国大学生的网络使用:基于大规模日志分析的模式识别新方法

    分类: 图书馆学、情报学 >> 图书馆学 提交时间: 2023-07-26 合作期刊: 《图书情报工作》

    摘要: [目的/意义]深入挖掘和准确理解中国大学生日常网络行为模式,不仅对促进用户行为和检索领域的发展具有巨大的理论意义,而且在提升面向大学生用户的企业个性化服务与信息推荐能力方面也具有潜在的社会价值和实践意义。[方法/过程]提出一种基于大规模日志分析的大学生用户行为模式识别新方法,该方法包括一种基于深度学习和文本分析技术的半监督学习算法MaxMatching以及混合两种特征熵(香农熵与真实熵)的聚类模型。[结果/结论]实证结果表明本方法不仅在算法和结果解释上具有一定的优势,而且能从网络使用能力、访问时序性和主题倾向性三方面归纳与呈现中国大学生网络行为全方位模式。该方法和结论有效地拓展了信息检索领域查询项的语义化理解方面的方法体系,也为企业提升面向大学生用户的个性化信息推荐服务提供一定的参考和可行性意见。

  • 网络分析在数字人文中的应用框架

    分类: 图书馆学、情报学 >> 图书馆学 提交时间: 2022-11-26 合作期刊: 《图书情报工作》

    摘要: 网络分析作为有效的分析手段与可视化方式,是数字人文领域应用最广泛的方向之一。对网络分析在数字人文领域的应用进行系统总结与归纳,有助于数字人文研究人员快速明确网络分析的能力与局限,以便开展更深层次的研究实践。采用内容分析法对发表在国际数字人文领域最有影响力的期刊和国际数字人文会议上近5年的文章进行梳理与总结,从研究问题、数据集、网络特性、网络分析指标4个方面进行梳理,最终提炼出网络分析方法在数字人文领域的应用框架。该应用框架包括三类数据规模(单一文本、平行文本和语料库)、五大应用场景(角色分析网络、人物关联网络、话语空间网络、文本关联网络、文化主题网络)、两种指标规模(全局指标和局部指标)以及五类指标类型(构成、密度、中心度、派系和结构)。

  • 基于日志分析的民办高校大学生网络生活 类型研究

    分类: 图书馆学、情报学 >> 情报学 提交时间: 2017-12-05 合作期刊: 《数据分析与知识发现》

    摘要: 【目的】研究基于民办高校大学生的导航页面使用情况, 揭示民办高校大学生典型的网络生活类型及特点。 【方法】通过对导航页面设置数据采集点, 获得民办高校大学生的点击行为和搜索行为数据, 进行统一建模和特 征提取后, 利用聚类算法将其细分为几个有代表性的群体。【结果】将民办高校大学生划分为 6 个典型群体, 分 别为重度视频型、昼学夜玩型、搜索追剧型、沉迷直播型、劳逸结合型、勤奋学习型; 民办高校大学生主要用 网络看视频与直播, 仅有小部分学生利用互联网进行学习。【局限】PC 端导航页面行为仅能反映大学生网络生 活的一部分, 且数据的时间跨度为两个月, 不能反映学生在期初和期末的行为差异。【结论】本研究实现了民办 高校大学生群体中典型网络生活类型的识别, 这将有助于民办高校大学生特点和行为规律的发现和总结, 为提 升高校服务管理水平提供参考建议。

  • 基于日志分析的民办高校大学生网络生活 类型研究

    分类: 图书馆学、情报学 >> 情报学 提交时间: 2017-11-30 合作期刊: 《数据分析与知识发现》

    摘要: 【目的】研究基于民办高校大学生的导航页面使用情况, 揭示民办高校大学生典型的网络生活类型及特点。 【方法】通过对导航页面设置数据采集点, 获得民办高校大学生的点击行为和搜索行为数据, 进行统一建模和特 征提取后, 利用聚类算法将其细分为几个有代表性的群体。【结果】将民办高校大学生划分为 6 个典型群体, 分 别为重度视频型、昼学夜玩型、搜索追剧型、沉迷直播型、劳逸结合型、勤奋学习型; 民办高校大学生主要用 网络看视频与直播, 仅有小部分学生利用互联网进行学习。【局限】PC 端导航页面行为仅能反映大学生网络生 活的一部分, 且数据的时间跨度为两个月, 不能反映学生在期初和期末的行为差异。【结论】本研究实现了民办 高校大学生群体中典型网络生活类型的识别, 这将有助于民办高校大学生特点和行为规律的发现和总结, 为提 升高校服务管理水平提供参考建议。

  • 商品检索中的多任务识别与分析

    分类: 图书馆学、情报学 >> 情报学 提交时间: 2017-10-11 合作期刊: 《数据分析与知识发现》

    摘要: 【目的】对商品检索中的购物任务进行识别, 并对多任务会话行为特征进行分析。【方法】利用淘宝商品分类体系以及自建的商品词表, 根据商品检索的检索式进行购物任务识别, 数据集为2 754 个用户的19 704 个检索会话。【结果】影响每个购物任务所用检索式数的因素包括商品分面、数量的多少以及描述难易程度;有主要任务和次要任务之分的多任务会话中, 任务之间的关系更为紧密。【局限】购物任务识别方法有待完善, 只以检索式作为研究对象无法全面反映用户行为特征。【结论】本研究可以帮助理解购物中的商品检索行为, 并为设计更好的商品推荐算法、预测用户购物过程、行为等提供依据。

  • 多会话商品信息搜寻行为、情境及影响因素研究

    分类: 图书馆学、情报学 >> 情报学 提交时间: 2017-10-11 合作期刊: 《数据分析与知识发现》

    摘要: 【目的】研究电商用户在多会话网购过程中的商品信息搜寻的行为特征、会话时间间隔特征以及购物网站使用特征, 并探究行为背后的情境、原因和动力。【方法】基于某电商网站4 285 个用户的1 409 160 条访问日志, 利用顺序分析和聚类分析方法挖掘用户信息搜寻行为特征, 结合访谈研究行为背后的情境、原因等影响因素。【结果】多会话网购用户信息需求并不急切, 较之搜索更倾向于查看商品详情; 平均会话时间间隔为3-4 天;继续原来购物任务的动力包括个人偏好、需求状态、支付能力、时间等方面的因素; 用户主要通过搜索、购物车、收藏夹、同店或同款商品浏览、商品个性化推荐等途径回到原来购物任务。【局限】访谈结果受样本数量限制, 不具有普适性。【结论】有助于理解用户的复杂网购行为, 指导购物网站提高服务质量, 改善用户体验。