| 联系我们 |
 |
合作经济与科技杂志社
地址:石家庄市建设南大街21号
邮编:050011
电话:0311-86049879 |
|
|
| 管理/制度 |
| AIGC赋能高校图书采访质量控制研究 |
| 第757期 作者:□文/赵 维 时间:2025/7/16 10:02:28 浏览:53次 |
[提要] 当前,我国高校图书馆采访工作面临采访馆员数量匮乏,认知负荷高;采访数据质量走低,时效性不强;采访平台分析利用性差,评估反馈弱等质量风险。本文基于当前生成式人工智能发展现状,以文心一言为例,探讨其在高校图书采访工作中的应用路径。
关键词:高校图书馆;质量控制;图书智能采访;AIGC
中图分类号:G253.1 文献标识码:A
收录日期:2025年1月17日
引言
2024年4月,美国研究型图书馆协会(ARL)成员代表对进化中的图书馆人工智能(AI)策略的两次调查表明,2023年4~12月期间,图书馆在探索和实施生成式人工智能(AIGC)方面呈现出动态变化态势,越来越多的图书馆从初步探索过渡到积极的实施阶段,并在采访中的出版物编目、文献目录访问等多个领域进行AI研发。可以发现,生成式人工智能在简化工作流程、提高生产效率、重新定义图书馆劳动力等方面发挥了积极作用。2023年8月,密歇根大学创建独特聊天工具的无代码平台已被广泛应用于自然语言图书推荐服务、人工智能学术顾问、采购标书生成等各种项目。2023年9月1日,我国国家图书馆与百度在智能问答领域开展战略合作,助力馆藏资源活化,让AI技术与图书馆深度融合。2023年10月17日,百度CEO发布文心大模型4.0,综合能力与CPT-4相比毫不逊色。“文心一言”面向全社会开放至今,用户规模已达到4,500万,开发者5.4万,场景4,300个,应用825个,插件超过500个。相对于ChatGPT来说,“文心一言”有中文语言优势,有国内领域相关数据积累,更适合高校内容创作和数据可视化分析。本文以文心一言为例,探究生成式人工智能赋能图书采访质量应用路径分析,以期为后续高校图书馆提升馆藏质量提供参考。
一、高校图书采访工作现状及面临的质量风险
高校图书馆图书采访是指图书馆根据其藏书计划和读者的需求,通过购买、交换、接受捐赠等方式获取图书的过程。采购图书的质量和价值是图书采访的核心问题,采访馆员的专业能力、学科水平、信息获取路径,采访数据的质量、时效性以及采访系统的易用性、智能性等均会对高校图书馆的馆藏资源质量造成影响。
(一)图书采访馆员数量匮乏,认知负荷高。在全面深化改革的大背景下,高校精简机构、减员增效的步伐正在加快,图书馆首当其冲。据教育部高等学校图书情报工作指导委员会2024年7月发布的《2022年高校图书馆发展报告》可知,高校图书馆的文献资源经费与收藏总量在持续增长,在编馆员的馆均人数呈现出持续下降趋势,如图1所示。图书馆需要聘用更多合同制员工、购置更多智能化设施来弥补人员的不足。随着高校图书馆人员的缩减,图书采访馆员的职位配比也逐步缩小,基本负责纸本图书采访的馆员就1~2名,难以全面了解和获取海量信息。(图1)
采访馆员的信息素养及信息搜集能力一定程度上影响图书采访质量。合格的图书采访馆员应当至少具备的选书能力包括情报追踪能力、主客观切换能力(以之避免采访主观性)、图书馆学情报学专业能力、对新事物和新技术的适应和应用能力、信息搜集能力等,并要求在一定程度上提升自身认知与阅读量的同时,也要学会辨别优质好书。需要具备丰富的学科知识和采访经验,积极与出版社进行沟通,了解出版行情。综合来看,高校图书采访人员需要具备全面的认知能力。
按业务流程阶段来看,具体如下:一是高校图书采访工作前需要调研的信息,包括但不限于调研本校读者需求信息,了解教师课题组的研究方向、课程设置、学校专业设置占比、统计年度选书分类占比以及学生人数等。进一步确定采访图书分类占比与本校专业设置的匹配度及教育部要求达到的生均册数。需要根据馆藏图书、教学科研、学生借阅因素以及文献购置经费进行综合判断,确立当年图书采选方案,进一步划定选书范围与选书重点。二是图书采访工作中需要关注的信息,包括但不限于著名研究学者、诺贝尔奖得主、文学奖获得者以及国际国内获奖作者;关注与学校关联学科出版社的出版动态、出版计划、规律、内容、以往出版的经典、大套出版物、专家评价高的出版物、畅销热点图书以及获奖图书的动态变化;关注开放获取的资源情况,了解当下的时事热点以及大众需求等。采访馆员还需要考虑到学科覆盖、学术水平等多方面因素,分析新书资源与现有资源的重复度、差异学科分布与学校的匹配度。三是图书采访工作后需要分析的信息,包括但不限于中标书商的年度供货率;采访内容全面性、准确性以及客观性的评估等。综上,生成式人工智能辅助采访需求提供信息决策在保证馆藏质量方面将起到一定作用。
(二)图书采访数据质量走低,时效性不强。通过对广东省政府采购网中标公告的收集,查询获取了广东省2020~2024年度43所(其中5所高校五年均无年度数据)公办本科院校的年度中标折扣,最终对38所院校进行数据统计,数据查询截止时间为2024年7月,如表1所示。根据已有年度中标折扣数据来看,有21所高校近五年来中标折扣率持续走低。除去2024年10所无数据的高校,2024年的中标折扣低于六五折的高校有19所(占比达67.9%),其中六折以下有9所。扣除中标商以及出版社的成本利润,这将会进一步导致可选书目数据质量不高。(表1)
1、馆配市场价格战突出。低价中标导致投标人恶性价格竞争,从而中标商给的采访书目中无法获取到新出版的全部书目数据,难以保证采全率及采准率。学者徐月华在2019年的研究中已然提到图书馆图书采购自主权的缺失和弱化导致最低价中标现象愈演愈烈。2024年新出版的《世上为什么要有图书馆》一书中进一步指出了图书馆成为某些书商的库存倾销处。低价中标商在无法提供高价值书目的前提下,提供重复数据的情况增加,书目更新滞后,同质化严重。现今政府采购招标向中小微企业倾斜,实力强优秀的大型馆配商不占优势,无运营资质的招标代理公司往往以“涉嫌歧视性条款”为由驳回或降低评分指标和要求,使得招标低折扣中标的概率增大。
2、优质图书可获得性缺乏便利。时移世异,图书从出版到回收的周期不断变短,书店里的书从上架到消失的时间越来越短。据中国出版传媒商报发布的2023年馆配市场分析报告数据显示,2023年度出版新书市场的采购份额负增长,由于新书折扣普遍偏高,从而导致采购新书到书率低。随着供书周期的加长,新书折扣会相应降低,2023年度高校图书采购前一年版图书成主力,这对于不具备时效性的书没什么影响,但对于时效性强的图书来说,时间越久价值越低;对研究教学型高校而言,甚至影响学科服务、研究支持服务等业务的质量。(表2)
此外,图书馆与供应商之间在信息获取和传递方面存在障碍,导致图书馆难以全面了解供应商的产品和服务质量,从而增加采购风险。在中标商提供的书目数据中,偶有夹杂印刷年度与出版年度混乱的数据,按年度排序选取数据则会给采访馆员带来新书误导的情况,靠自身难以辨别,若有一定存储量的书目数据库平台可以做数据对比则能较好地解决这一问题。因此,采访馆员自身获取采访数据、鉴别书商发布的书目数据对于提高图书采访质量来说极为重要。
(三)图书采访分析利用性差,评估反馈弱。在高校图书馆图书采访流程中,各环节相互关联影响,共同构成图书采访工作的完整体系。对图书采访工作完成后的数据分析评估和读者反馈也是重要内容。然而,当前由于各高校师生规模大小、经费拨款、人员配比、数据隐私安全等因素的影响,大部分高校仍选择使用图书馆管理系统中的嵌入图书采访模块进行采访数据的整理分类订购。为了解当前高校对智能采选平台的应用情况,本文对广东省43所公办本科院校进行网络调研,调研截止时间为2024年7月。调研结果显示:应用智能采选平台的高校有6所,其中中山大学、华南理工大学等37所高校没有采用智能荐书平台。仅从对广东省公办本科院校的调研结果来看,未使用智能采选平台的高校多过使用高校。(表3)
此外,图书管理系统中的图书采访模块缺乏数据可视化分析以及数据推荐功能。以广东海洋大学图书馆使用的图书管理系统为例,图书采访模块无法从不同维度分析相应数据,比如出版社种数统计、册数统计、出版时间、出版社码洋、中图分类码洋等。在图书采访评估工作中的适用性、完整性以及成本效益的控制上存在一定的难度。采访完成的大量馆藏数据难以根据读者的喜好程度进行推荐,因此对采选系统功能的全面性、易用性以及智能化有一定的要求。
二、AIGC在高校图书采访工作中的应用
AIGC时代已经来临,图书馆应借助新技术优势,推动高校图书馆资源建设发展跃上新台阶,提升整体服务效能。以文心一言为例,AIGC可以通过自然语言处理和机器学习技术,为高校图书馆的图书采访工作提供以下帮助:
(一)人机协同助力信息获取。文心一言的大数据模型能助力高校图书采访馆员提高自身的知识面,这对于图书采访质量的把控无疑是锦上添花。它的出现也对图书馆员的职业技能及素养提出了新要求,不仅要求馆员具备读者多元需求采集、大数据管理与分析、知识产品开发与服务管理等实践能力,还需要具备算法思维、算法理念、科技伦理等职业素养,以适应AI技术的集成。文心一言的智能问答是一种高效便捷的信息资源获取手段,可承担大量繁重而初步的工作,降低知识生产的人力消耗和时间成本,直接或间接提高知识生产的效率和能力。利用好文心一言可降低采访馆员的认知负荷。
辅助采访需求提供信息决策,协助采访馆员扩充学科背景。文心一言可以收集分析图书馆资源信息,帮助馆员了解相关主题的背景知识以及学科当下的发展热点、前沿趋势以及资源的评价和推荐信息,帮助馆员掌握资源的内容和特点,为资源采买提供参考。可以通过查看图书的评价、作者的专业背景、出版社的信誉等方式来评估图书的质量和价值。这些仅凭采访馆员自身的积累需要耗费大量的时间,且是短时间不可能完成的事情。通过官方平台的实践与文心一言的智能问答可知:“文心一言”的生成能力以及生成内容有助于我们便捷地获取到相关的资源,在馆员掌握知识不全的情况下可以互相补充,从而形成尽可能全面的视野,并且会备注参考来源,能在思路、知识以及资料来源渠道上与采访专业人员形成优势互补。目前,就易用性来说,对于问题需要提供更多的上下文信息加以引导,步骤变得繁琐,从而降低了用户获取信息的效率。受智能工具自身的“生成逻辑”制约,数学上的概率预测模型,导致其生成的文本并不总是正确的,需要采访馆员提高自身信息素养、信息检索以及问题导向能力,通过全能、智慧的文献检索策略——多轮、持续互动,不断提高检索的精准度。因此,建议积极掌握“文心一言”的检索对话策略,学习了解《生成式人工智能服务管理暂行办法》。与此同时,在与AIGC交互的过程中,需要不断培养和应用批判性思维,针对目前“文心一言”出现的信息误差以及信息不完整情况,要求专业人员对于知识问答获取到的内容进行批判性分析,从而做出更好的决策,提高自身责任意识与职业素养。
(二)AIGC辅助采访数据应用场景。文心一言除了智能问答知识获取外,在数据分析应用模块也开发了很多功能,如表4所示,官方平台百宝箱所展示的数据分析功能,如数据搜集、数据对比、数据更新、数据排序等,能在数据搜集上提供大方向的引导作用,挖掘新出版的数据,分析数据的来源信息。譬如,在数据搜集部分,运用数据指令“现在你是一个数据检索程序,你需要找到并梳理[2024年度新出版的图书书目]相关的数据,注意你需要附上数据对应的来源。此外请注意你需要在输出结果中标明部分生成的数据可能存在的偏差。”对结果进行搜集,得到的结果包含了书目数据的数据来源,如出版机构官方发布、图书销售平台、图书馆系统、专业书籍评论网站(豆瓣、知乎)以及部分极少书目数据的梳理(作者、出版日期、简介、未注明出版社)。详细的书目信息还需自身从书商以及出版社获得,或自行在文心一言提供的数据来源平台搜集。(表4)
通过与文心一言的多轮对话,在全平台的数据搜集中可获取到专业权威的报告数据以及2024年度阅读排行榜单。例如,2024年中国图书海外馆藏影响力研究报告,入藏海外图书馆对图书内容质量、学术价值、出版机构品牌等进行严格筛选,该报告已成为中国出版界衡量世界影响的一个重要指标。这些间接数据可以为采访馆员在选择出版社以及出版社数据的采集中提供参考,一定程度上避免来自书商海量书目数据的盲目性。采访馆员在数据获取中拥有主动权,便能在图书现采的过程中,通过与相应出版社以及中标商三方进行沟通交流,进一步解决书目因利润问题导致不能供货的问题,改善当今市场因低折扣造成的书目质量低的问题。
馆配商由于利润或者人员等各方面的因素,提供的书目数据有时会存在出版年份错误的情况,采访馆员在采访过程中很难对这种错误进行甄别,现有的智能采访系统知选可以通过导入数据,平台自动获取内容上的不同,对数据错误的出版年份信息进行纠正,从而进一步提高数据质量。但很多图书管理系统自带的采访模块目前还无法做到这点,文心一言虽有数据比对功能,但由于没有足够的馆藏数据与出版社数据的存储支撑,在数据比对方面还需进一步实践。
(三)AIGC赋能采访平台数据分析。文心一言可以辅助人工对馆藏数据进行分析。本文根据“文心一言”提供的数据分析方法进行了流程图的绘制,如图2所示,利用生成式AI可从用户反馈中不断学习的技术特征,可依托对用户行为数据的分析结果进行采购优化。结合图书馆传统的OPAC系统,利用神经网络、语义网、自然语言处理等技术实现资源检索到资源发现的转变,提高检索结果的准确度。利用技术优势将图书馆资源经费占比、馆藏分布以及电子资源、特色资源建设等方面的数据进行分析,为资源建设提供决策支持。(图2)
一方面,可以赋能馆藏数据自动推荐。利用自然语言处理技术,对图书馆的图书、期刊、论文等资源进行文本分析和处理,提取出关键词和主题。分析读者的借阅历史和搜索记录等数据,了解读者的兴趣和需求。随之对处理后的数据建立推荐模型,根据读者的兴趣和需求,自动推荐相关的图书、期刊、论文等资源,定期更新推荐列表,根据读者的反馈和数据的更新,对推荐模型进行优化和调整,提高推荐的准确性和有效性。通过文心一言的自动推荐功能,高校图书馆可以为读者提供更加个性化和智能化的服务,提高图书馆的资源利用效率和读者满意度。也可依托其自动生成引人入胜的视频内容功能,如先行阅读、书单介绍或主题推荐,集文字、图像、声音及视频于一身,将知识精华以多媒体形式动态呈现,有助于不同读者获取知识体验质量。
另一方面,可以支撑文献采购智能风险控制。文心一言可以通过分析历史数据和趋势,为图书馆工作人员提供采购风险预警和防范措施,减少采购风险和损失。可以利用文心一言对采访结果进行关键词提取、情感分析、文本分类等操作,以了解采访中涉及的主题、中图分类号、出版社等信息。通过这些信息的分析,可以对采访结果进行客观的评估,如采访内容的全面性、准确性和客观性等。同时,也可以根据分析结果对采访过程进行反馈,发现采访中存在的问题和不足,为后续的采访提供改进和优化的建议。因此,文心一言在图书采访结果客观评估和反馈方面具有重要的作用。
可见,文心一言可以为高校图书馆的图书采访工作提供智能化、自动化的支持,提高采购效率和质量,满足读者的需求。采访馆员可以根据文献资源采购建议,结合现有的资源建设方式,形成更为合理的资源采购清单,以满足用户快速变化的多元化需求。图书馆也可以联合多部门创建服务共同体开展合作服务,针对生成式人工智能工具带来的变革开展服务,共建人工智能服务体系,进一步盘活图书馆资源。
综上,随着AI和互联网的发展,获取知识的方式正在发生变化。基于研究工作人员对生成式人工智能工具的接触,对技术潜在益处以及局限性的更好理解与生成式人工智能将长期存在的事实认可,相信未来的图书馆资源将能更好地为师生读者服务。
(作者单位:广东海洋大学)
主要参考文献:
[1]储节旺,罗怡帆.人工智能生成内容赋能图书馆知识服务的路径研究[J].情报理论与实践,2024(08).
[2]袁传玺.百度发布文心大模型4.0文心一言用户已达4500万[N].证券日报,2023-10-18(003).
[3]符荣鑫,杨小华.AIGC语言模型分析及其高校图书馆应用场景研究[J].农业图书情报学报,2023.35(07).
[4]王诺,毕学成,许鑫.先利其器:元宇宙场景下的AIGC及其GLAM应用机遇[J].图书馆论坛,2023.43(02).
[5]刘聪,张久珍.国际图联视域下图书馆人工智能应用的战略对策研究[J].图书与情报,2023(06).
[6]徐月华.广东地区图书招标采购现状和发展态势研究——基于2011-2016年广东省政府采购网招标和中标公告数据的实证分析[J].大学图书馆学报,2019(03).
[7]杨素秋.世界上为什么要有图书馆[M].上海:上海译文出版社,2024.
[8]尹克寒,陈纪文.AGI浪潮下Sora何以赋能智慧图书馆建设[J].图书馆理论与实践,2024(03).
[9]肖峰.生成式人工智能介入知识生产的功用探析——借助ChatGPT和“文心一言”探究数字劳动的体验[J].重庆邮电大学学报(社会科学版),2023.35(04).
[10]张嘉宁,宋西贵.ChatGPT与图书馆的领域动向[J].农业图书情报学报,2023.35(08).
[11]安子栋,敬卿,郝志超,等.基于生成式AI技术的图书馆文献资源管理创新策略[J].图书馆工作与研究,2023(S1).
[12]柯平,王洁,刘倩雯.生成式AI视域下智慧图书馆建设的关键路径[J].现代情报,2024.44(01).
[13]胡安琪.AIGC赋能智慧图书馆建设:基础、特征、场景及策略[J].高校图书馆工作,2023.43(05).
[14]于曦.美国高校图书馆ChatGPT服务实践及启示[J].山东图书馆学刊,2023(06).
[15]邱瑾,黄茂汉.生成式人工智能对高校图书馆的影响及应对策略——以ChatGPT大型语言模型为例[J].图书馆工作与研究,2024(03).
|
|
|
|