• 人文社科领域中文通用大模型性能评测

    分类: 图书馆学、情报学 >> 情报学 提交时间: 2024-05-08

    摘要: 目的/意义 本文以人文社科领域为出发点,从人文社科领域基础知识与人文社科学术文本两个方面入手进行人文社科领域模型性能比对。旨在为人文社科领域提供一份体系化的大模型评测基准,供人文社科相关领域研究人员参考。 方法/过程 设计了7个人文社科领域相关的评测任务并选取对应指标,在此基础上,选取了当前开源且性能较优的通用领域中文大模型,通过调用本地模型以问答形式完成领域化任务,并选取相关指标对其在人文社科领域的性能进行了量化评测。 结果/结论 评测结果表明,在本文选取的开源模型中,无论是基座模型还是对话模型,Qwen性能最优,Baichuan2紧随其后,InternLM次之,Atom表现最差,此外,大多数情况下,相较于基座模型,对话模型表现出了更加优越的性能。

  • 基于信息需求表达理论的低年级小学生网络信息搜寻任务辅助策略研究

    分类: 图书馆学、情报学 >> 情报检索 提交时间: 2024-04-18

    摘要: 目的/意义 在数字化智能化时代,中小学的知识管理能力与服务水平也在逐步提升,中小学图书馆及相关学科的老师也在探索如何更有效地辅助学生利用学校知识库和互联网获取高质量信息,以便更好地完成学习及相关任务。本研究旨在探索低年级小学生在网络信息搜寻任务中的辅助策略,以提高他们的信息素养,并为中小学图书馆馆员和相关辅助老师设计教学活动提供建议。 方法/过程 研究基于信息需求表达理论,结合田野调查与实地访谈方法,分析了小学生在“点亮图书馆”活动中的使用百度进行信息搜寻过程。通过将搜寻任务阶段性分解,建立了信息搜寻任务过程模型,该模型涵盖了任务分析、查询式构建、检索结果筛选、内容解读、信息抽取和完成任务等关键步骤。 结果/结论 研究发现,低年级学生在信息提取和利用方面表现出一定的信息素养能力,但仍然需要辅助人员帮助。此外,研究还探讨了小学生对搜索引擎的使用经历和评价,发现他们使用百度等搜索引擎的经历十分丰富,对百度的搜索体验给出了较高的评价,也从小学生的视角提出了问题。本研究对于设计合理的教学活动、提升小学生的信息素养具有重要意义,并为未来相关领域的研究提供了新的视角和数据支持。

  • 中国小学生数字化习惯与数字素养的调查研究

    分类: 图书馆学、情报学 >> 情报学 提交时间: 2024-04-18

    摘要: 目的/意义 在“人工智能+”以及“数字教育”背景下,众多中小学生已经开始使用智能手机上网查找信息、休闲娱乐,但是对于目前小学生使用智能手机上网的情况以及小学生的数字素养情况,仍缺乏广泛的调研。本研究面向国内小学生群体开展数字化习惯和数字素养调查,并将处于发达和欠发达地区的样本进行比较分析,以期为小学生信息技术课程设计、小学生在新时代下的数字素养提升路径提供调研依据和决策建议。 研究设计/方法 本研究采用问卷调查法收集了中高年级小学生的数字化习惯和数字素养等方面的情况的数据,得到了有效问卷701份。在此基础上,采用描述性统计、差异检验、聚类、文本编码等数据分析方法来描述和比较小学生群体的数字化习惯和数字素养现状。 结论/发现 小学生有着较为丰富良好的数字化习惯和一定的数字素养,但在数字能力、数字意识、数字学习意向等多个方面存在可提升的空间,且欠发达地区和发达地区的小学生表现出一定的差异。 创新/价值 填补了面向小学生的数字化习惯与数字素养调查的空白,提出了培养小学生正确数字化习惯、改进数字教育政策的建议。

  • 协同搜索与独立搜索的行为与体验的比较研究

    分类: 图书馆学、情报学 >> 图书馆学 提交时间: 2023-08-27 合作期刊: 《图书情报工作》

    摘要: [目的/意义]探究在协同与独立模式下完成信息搜索任务的过程中,用户在搜索体验、交互行为方面的差异,试图通过对比研究来理解协同信息搜索行为的特点,为协同搜索系统的设计提供借鉴。[方法/过程]基于图书交互式检索平台(CLEF-Social Book Search)进行实验,共招募16名独立被试和18名协同被试到实验室完成多种类型的书目搜索任务,对搜索前后问卷记录的搜索体验以及后台服务器记录的搜索过程交互行为进行对比分析。[结果/结论]搜索体验方面,协同搜索被试比独立搜索被试对实验系统的功能评价更好,对系统的美感、耐用性、新颖度评价更高,参与实验的专注度更高,但却感到更加费力;搜索行为方面,相比独立模式下的被试,协同模式下的被试在目标型任务中进行更多次决策,尤其是删除书目的决策,意味着协同搜索被试在搜索后期会进行更多的决策讨论和整理;在探索任务中,协同被试比独立被试的平均决策时间和首次决策时间都更长,可能是由于在探索任务中协同被试的参与度更高、讨论更多。

  • 搜索前后用户知识水平的评估及其变化情况分析

    分类: 图书馆学、情报学 >> 图书馆学 提交时间: 2023-08-26 合作期刊: 《图书情报工作》

    摘要: [目的/意义]信息搜索是人们常用的信息查询方法,目前搜索系统在查找事实型信息时支持效果较好,但是对人们以学习为目的的搜索功能还缺乏研究。搜索即学习(search as learning)是近年来交互式信息检索的研究热点,这类研究中将搜索看作学习的过程,并尝试对用户搜索中的知识学习进行评估,进而提出系统支持用户学习的功能优化建议。本文着重解决如何全面评估用户搜索前后的知识水平,为此类研究提供参考。[方法/过程]采用用户实验法,对用户搜索前和搜索后撰写的知识内容进行评估,提出综合数量与质量维度的用户知识评估方法,对用户在学习型任务搜索前后知识水平进行评估。数据分析阶段采用统计方法来验证用户搜索后与搜索前的知识水平差异。[结果/结论]研究发现,用户在知识数量上的表现随着搜索的完成而变得更加全面和深入,在知识点数量、知识面数量、知识面广度和知识面深度上都有显著的提升。同时,在搜索后产生了专业度较高的知识面。对于搜索前较模糊的某些概念,在搜索后表达得更清晰明确。在质量上,搜索后绝大多数的用户都在知识的相关性、分析程度及用户观点的提出方面有所提升。

  • 面向创新生态系统的企业知识整合研究

    分类: 图书馆学、情报学 >> 图书馆学 提交时间: 2023-07-26 合作期刊: 《图书情报工作》

    摘要: [目的/意义] 基于创新生态系统情景,探究企业知识整合,为提升企业知识整合效果、提高企业创新能力提供新视角。[方法/过程] 通过对创新生态系统和知识整合进行理论回顾,围绕创新性和生态性两个本质特征探究知识整合过程与动力,并提出保障措施。[结果/结论] 在创新生态系统情境下,企业知识整合历经对外知识摄入和对内知识同化两个阶段,在企业创新源动力、产学研合作助动力以及创新环境驱动力的协同作用下实现知识的有效整合。文章从创新环境、高等院校和科研院所、企业三个层面为知识整合的有效实现提出保障措施。

  • 重大突发公共卫生事件中公众信息搜寻行为影响因素探究

    分类: 图书馆学、情报学 >> 情报学 提交时间: 2023-04-01 合作期刊: 《图书情报工作》

    摘要: [目的/意义] 在重大突发公共卫生事件中,公众对于相关信息需求旺盛,信息搜寻成为公众了解和应对风险的重要途径。面对风险信息,公众对信息搜寻的态度如何塑造其行为?哪些因素会影响公众信息搜寻态度与行为?不同人群间是否具有差异性?解答这些问题有助于为公众提供针对性的信息服务、助力提升个体应对效能、开展有效防疫工作。[方法/过程] 以在线问卷形式调查国内719名受访者,探究重大突发公共卫生事件中影响公众信息搜寻态度与行为的因素。[结果/结论] 研究表明:不同地区、年龄、学历的公众信息搜寻态度与行为具有显著差异;感知风险、情感反应、信息充分性、信息主观规范与知觉行为控制正向影响公众信息搜寻态度与行为;信息搜寻态度在各因素与信息搜寻行为间起中介作用。基于研究结果,分别从信息发布渠道、信息传播过程与信息搜索平台等角度提出意见。

  • 大学生个人学术信息组织行为与学业拖延的关联探究

    分类: 图书馆学、情报学 >> 情报学 提交时间: 2023-04-01 合作期刊: 《图书情报工作》

    摘要: [目的/意义] 针对大学生个人学术信息组织行为与学业拖延的关联展开实证研究,以发现组织个人学术信息在预防或矫正"拖延症"方面的作用。[方法/过程] 首先,使用问卷调查法收集数据,问卷包括大学生学术信息组织水平量表、GPS量表(中文修订版)、NASP量表(中文修订版)。然后,使用同质性信度检验、验证性因子分析来评估问卷质量。最后,使用描述性统计、相关性检验、差异性检验等方法对大学生个人学术信息组织行为与学业拖延的关系进行分析。[结果/结论] 个人学术信息组织行为与学业拖延存在显著关联,个人学术信息组织行为的改进或许有助于大学生预防或矫正"拖延症"。

  • 自我调节学习情境下任务类型和学习认知策略对视频类搜索行为的影响

    分类: 图书馆学、情报学 >> 情报学 提交时间: 2023-04-01 合作期刊: 《图书情报工作》

    摘要: [目的/意义] 视频平台成为互联网时代新的知识学习场景,在这种场景下,搜索交互过程可以被看作自我调节学习过程。着重研究自我调节学习情境下不同的任务类型以及学习认知策略对视频类搜索行为的影响,以补充交互式信息检索领域在学习情境下视频类搜索行为的研究。[方法/过程] 选择两种任务类型:事实型和技能型,认知策略依据自我调节学习框架分为复述、阐述、组织和批判性思维四种类型。研究采用实验法,以哔哩哔哩视频网站作为测试系统,借用已有的测量框架,基于实验数据探究不同学习认知策略的用户在执行不同类型任务时行为特征以及搜索效果的差异。[结果/结论] 发现不同任务类型和学习认知策略会对搜索行为和学习效果产生影响,在多个指标上表现出显著差异,结合任务和认知策略特征进行分析和总结,为视频类搜索平台在学习情境下的系统使用提出了改进建议,对此类搜索平台的改善、提升用户搜索体验和学习效率具有积极意义。

  • 大学生学术信息组织水平量表的开发与应用

    分类: 图书馆学、情报学 >> 情报学 提交时间: 2023-04-01 合作期刊: 《图书情报工作》

    摘要: [目的/意义] 将个人学术信息组织行为看作整体来测量其行为能力和行为结果,开发出大学生学术信息组织水平量表,并应用该量表简要分析北京大学本科生的个人学术信息组织行为的特征,以提供具有实际价值的改进建议。[方法/过程] 在开发量表时,首先在文献调研、半结构化访谈的基础上编制初始量表,然后运用项目分析、因子分析进行量表纯化,最后通过信效度检验评估量表的质量。在应用量表时,使用了描述性统计、相关分析、差异分析等方法。[结果/结论] 大学生学术信息组织水平量表包括电脑文件组织水平、纸质资料组织水平、学术信息管理素养、学术空间清洁水平、课堂笔记组织水平共五个关键维度。量表为大学生群体的个人信息组织水平的测量提供了可行工具,为个人学术信息组织行为的研究提出了新的视角,为全面理解大学生的信息行为拓展了新的思路。

  • 搜索即学习主题的相关研究综述

    分类: 图书馆学、情报学 >> 情报学 提交时间: 2023-04-01 合作期刊: 《图书情报工作》

    摘要: [目的/意义] 对"搜索即学习(SAL)"主题的相关研究进行梳理,形成较为完整的综述,为未来进一步探索该主题提供相应的指导和参考。[方法/过程] 从SAL研究中涉及的4个关键问题:搜索和学习的关系、搜索过程的影响因素、学习的评估、系统优化,对已有文献展开回顾,并构建SAL主题下情境、人群、系统与搜索学习间关系的研究框架。[结果/结论] 未来SAL主题下的研究应重点关注4方面问题:①特征化学习情境,以设计学习型搜索任务,并根据任务特征评估学习产出;②探索人群的学习特征,如认知特征、元认知特征,对搜索过程中行为交互的影响;③理解搜索作为学习的过程,探索搜索行为和学习行为之间的联系;④结合情境要素、人群要素、搜索和学习的特征,重新设计、配置和优化当前的搜索系统,实现搜索系统和学习系统的融合,有效支持学习。

  • 时间限制与时间压力下的信息行为研究综述

    分类: 图书馆学、情报学 >> 情报学 提交时间: 2023-04-01 合作期刊: 《图书情报工作》

    摘要: [目的/意义]时间是信息行为中普遍存在的情境因素,然而将时间视为稀缺资源,探讨其对信息行为影响的研究较为零散。本研究梳理信息行为领域中对时间限制和时间压力影响的相关研究,总结时间限制与时间压力对信息行为的作用和影响,以加深对时间因素的理解,呼吁信息行为领域对时间的关注。[方法/过程]在阅读与筛选近10年相关领域研究的基础上,本研究系统性归纳与总结时间限制与时间压力对信息行为的影响,着重梳理时间限制与时间压力在不同类型的信息行为过程中的角色。[结果/结论]研究发现,时间限制与时间压力会对任务完成过程中的信息行为(包括搜索、浏览与撰写行为)、无明确任务下的信息偶遇行为和信息决策行为均产生影响。未来研究者应厘清时间限制、时间压力及其相关概念边界,明确时间压力测量标准,同时关注时间压力积极作用。

  • 学习型搜索中的笔记记录行为与学习产出的关联探究

    分类: 图书馆学、情报学 >> 情报学 提交时间: 2023-04-01 合作期刊: 《图书情报工作》

    摘要: [目的/意义]信息搜索不仅是信息获取过程,还可以被视为用户的自我学习过程。在学习型搜索情境下,探究搜索过程中的笔记记录这一信息使用行为对学习产出的影响,同时关注用户的笔记记录行为特征以及搜索情境对笔记记录行为的影响。[方法/过程]使用实验法收集数据,采用编码分析、描述性统计和聚类分析对笔记记录特征进行剖析,运用差异性检验对笔记记录与搜索情境、学习产出的关联进行分析。[结果/结论]识别出三种笔记记录模式: "粗略采集-线性结构型" "精细采集-线性结构型"和"自由结构型"。其中,拥有更多先验知识的用户倾向于采取"粗略采集-线性结构型"的记录模式,但这种模式可能会导致更差的学习效率。研究结论有助于丰富"搜索即学习"相关研究中对信息使用行为的有限探索,启发各类信息搜索系统从支持用户自我学习的角度进行设计和优化。

  • 先验知识差异对协同信息搜索和学习效果的影响研究

    分类: 图书馆学、情报学 >> 情报学 提交时间: 2023-04-01 合作期刊: 《图书情报工作》

    摘要: [目的/意义]探究先验知识差异水平不同的组别在搜索交互行为、协同体验以及学习效果方面的差异,以丰富对协同信息搜索行为的认知,并为现实情境下的协同搜索学习提供建议。[方法/过程]研究采用用户实验法,设计理解型与评价型两种搜索任务,通过录屏记录交互行为,结合问卷收集协同体验数据,思维导图记录协同搜索前后知识状态及改变。采用方差分析、Kruskal Wallis检验等方法进行数据分析。[结果/结论]研究发现:在搜索交互行为方面,包含先验知识水平较高者的小组使用检索式数量多于同质低水平的小组;在协同搜索体验方面,先验知识水平相近的小组对自身任务完成度的评价更高;在知识状态改变方面,同质低水平组知识广度的增长显著多于其他两组,但在质量方面,搜索后各组别之间的差异较小。最后本研究对于搜索系统如何提高用户协同搜索体验和学习效果提出改进建议。

  • 面向任务难度感知的检索行为研究

    分类: 图书馆学、情报学 >> 情报学 提交时间: 2023-04-01 合作期刊: 《图书情报工作》

    摘要: [目的/意义] 以学习型搜索为背景,探索对于反映用户感知任务难度具有稳定、显著影响的交互行为指标。[方法/过程] 依托课堂教学开展行为实验,以《信息技术应用》课程学生为研究对象,布置5项搜索任务,运用Morae软件进行过程录制,共收集39名学生的170条有效检索行为数据。根据录屏数据和任务难度感知评价数据,对不同难度下呈现显著差异的行为指标进行分析。结合课题组在2016年、2017年开展的两项实验数据,以及已有相关研究发现进行横向比较,归纳不同任务难度下行为指标呈现显著差异的稳定性。[结果/结论] 最终获得具有26项行为指标的稳定行为指标体系,从探索式搜索过程及行为类型角度对用户在困难任务下的行为特点进行描述,并指出未来进一步研究的方向。

  • 基于多特征多分类器集成的专利自动分类 研究*

    分类: 图书馆学、情报学 >> 情报学 提交时间: 2017-12-05 合作期刊: 《数据分析与知识发现》

    摘要: 【目的】为了准确地给专利申请书分配 IPC 分类号, 本文提出一种基于多特征多分类器集成的专利自动分 类方法。【方法】使用从专利申请书中提取的全词典 TFIDF 特征、信息增益词典 TFIDF 特征、段落向量特征、 主题模型向量特征, 分别训练朴素贝叶斯、支持向量机、AdaBoost 分类器, 以此构建特征–类别矩阵, 并结合 F1 权重矩阵集成, 获得最终 IPC 预测分类号。【结果】对 2014 年–2016 年“发动机或泵”领域的 10 个小类进行分 类, 使用 Top Prediction、All Categories 和 Two Guesses 三种评估方法得到准确率分别为: 78.9%、80.1%、91.2%。 【局限】训练仅仅使用了 2014 年–2016 年共三年的专利数据, 数据规模有限。【结论】在“发动机或泵”领域, 本文 方法能够有效地提高专利文本分类的准确率。

  • 基于多特征多分类器集成的专利自动分类 研究*

    分类: 图书馆学、情报学 >> 情报学 提交时间: 2017-11-30 合作期刊: 《数据分析与知识发现》

    摘要: 【目的】为了准确地给专利申请书分配 IPC 分类号, 本文提出一种基于多特征多分类器集成的专利自动分 类方法。【方法】使用从专利申请书中提取的全词典 TFIDF 特征、信息增益词典 TFIDF 特征、段落向量特征、 主题模型向量特征, 分别训练朴素贝叶斯、支持向量机、AdaBoost 分类器, 以此构建特征–类别矩阵, 并结合 F1 权重矩阵集成, 获得最终 IPC 预测分类号。【结果】对 2014 年–2016 年“发动机或泵”领域的 10 个小类进行分 类, 使用 Top Prediction、All Categories 和 Two Guesses 三种评估方法得到准确率分别为: 78.9%、80.1%、91.2%。 【局限】训练仅仅使用了 2014 年–2016 年共三年的专利数据, 数据规模有限。【结论】在“发动机或泵”领域, 本文 方法能够有效地提高专利文本分类的准确率。

  • 用户步行导航过程中的情感变化研究

    分类: 图书馆学、情报学 >> 情报学 提交时间: 2017-11-08 合作期刊: 《数据分析与知识发现》

    摘要: 【目的】优化用户体验, 提高用户对导航系统的持续使用性。【方法】采用用户实验和基于情感词典的情感分析方法, 使用程度副词系数量、中文情感词汇本体、极性短语的强度计算公式等对情感短语进行量化, 分析影响情感的因素及其变化规律。【结果】用户在步行导航过程中的情感变化主要受到系统因素和环境因素的影响,系统更新的不及时、定位不准、环境恶劣均会对用户的情感造成影响。【局限】情感是一个复杂而且涵盖广泛的概念, 仅通过文本分析可能存在不足。【结论】通过改进系统本身和增添人性化的设置提高用户对导航系统的持续使用性, 为系统未来的升级提供有效参考。

  • 结合深度置信网络和模糊集的虚假交易识别研究

    分类: 图书馆学、情报学 >> 情报学 提交时间: 2017-10-11 合作期刊: 《数据分析与知识发现》

    摘要: 【目的】解决电子商务平台中存在的虚假交易问题。【方法】依据消费者历史购买和评论行为数据, 提出一种结合深度置信网络和模糊集的虚假交易识别方法, 通过识别虚假交易的用户(刷客)进行虚假交易的识别。【结果】识别准确率达到89%, 与浅层机器学习模型试验结果进行对比, 其综合性能有明显提升。【局限】相对于淘宝存在的海量刷客, 实验数据较少。仅以淘宝数据作为验证数据, 未涉及其他电子商务平台。【结论】本方法能够较好地识别刷客, 减少电子商务中的虚假交易问题。