本地 天下 发现自贡 文化 健康 教育 商圈
搜索

解码全国首个档案展览AI智能体:从“档案数字化”到“知识智能化”演进

2025-10-14 15:14 川观新闻

0

分享

“从抗战大后方到国家战略腹地”档案文献展上,观众与“档小江”“档小河”互动。 四川省档案馆供图

川观新闻记者 蒋京洲

10月11日,四川省档案馆主办的“从抗战大后方到国家战略腹地”档案文献展上,数智讲解员“档小江”“档小河”吸引许多观众驻足。语音交互、自主导览、智能讲解……这一档案展览AI智能体具备多样服务能力和丰富档案知识,在为观众提供线下观展新体验的同时,也能通过线上服务打破档案馆的物理围墙,提供覆盖更广、触达更易的档案服务。

这一产品形态在全国档案系统属首次应用,开档案展览AI智能体建设之先河。这一智能体是如何诞生?开发过程中克服了哪些困难?目前能够实现何种功能?带着上述问题,本文深度解码四川省档案馆档案展览AI智能体。

输入4000万字档案文化出版物

打造“档案大脑”

近年来,国内外人工智能技术发展迅速。档案工作如何“借力”人工智能?四川省档案馆经过研讨和论证,决定以聚焦档案育人职能为切入点,利用人工智能技术打造档案宣传服务品牌,探索档案育人数智化应用新场景,从而打破档案服务需要群众“到馆上门”的被动形态,转变为基于场景的主动服务,让档案知识、档案信息“一键触达”。

2024年底,四川省档案馆与四川日报报业集团达成合作意向,共同建设红色档案知识库。该知识库具备自然语言处理、知识图谱构建等中枢功能,能够将档案信息转化为结构化知识进行存储。同时,它能适配多种使用场景,以智能问答为基础进行多模态的问答互动,为了解、查阅档案知识提供服务。

2025年是中国人民抗日战争暨世界反法西斯战争胜利80周年。经过四川省档案馆和四川日报报业集团组建的联合开发团队讨论,决定知识库首期工程以抗战档案为主题。为此,四川省档案馆打破资源壁垒,向全国近30家省市档案馆征集抗战档案文化出版物,形成共计4000万余字的高质量数据集,为知识库建设打下坚实基础。

半年针对性技术攻关

破解准确性、安全性难题

2025年春节后,红色档案知识库进入正式开发阶段。针对档案文化出版物的结构和内容作品,开发团队围绕提高识别准确率、问答召回准确率、确保数据安全性等内容展开针对性攻关。

首先,利用OCR技术可将大量扫描件文献转换为可读、可检索的文本数据。进而,NLP技术能够对文本进行实体识别、关键词提取与主题分类,实现档案内容的自动标引与智能分类。更进一步,通过构建档案知识图谱,AI能够自动识别并关联档案中的人物、机构、地点与事件,将孤立的档案信息点编织成一张结构化的、富含语义的知识网络。

在数据安全层面,团队采取了严格的管理与技术措施。知识库的全部数据部署于自有服务器资源,接入的通用大模型全部完成国产化。在模型侧,开发人员根据档案工作特点进行多轮微调训练,要求严格按照语料内容进行生成,尽可能避免AI算法偏见、降低AI幻觉。在用户侧,使用自主研发的审校系统,确保源头可溯、技术可控、权限可管、安全可防。

打造档案展览AI智能体

丰富拓展应用场景

红色档案知识库目前已在全国20家参与“江河奔腾”宣传活动的省级综合档案馆实现首期成果线上共享。下一步,如何让红色档案知识库更加易用、进一步拓展服务覆盖?建设档案展览AI智能体的构想被提上日程。

为更好地服务四川省档案馆“从抗战大后方到国家战略腹地”档案文献展育人新场景,开发团队采用最新轻量级前端框架进行开发,进行了大量的适配和测试工作——在前端能力方面,持续对“档小江”“档小河”的智能问答模块进行优化,着重提升对模糊问题的应对能力、多轮对话的连贯能力、对特定档案的深度讲解能力;在驱动方案方面,定制化开发机器人的遥控功能,优化移动路径逻辑,确保机器人的巡展、导展运行安全稳定。

截至目前,该档案展览AI智能体已经在多场次面向公众开放的展览中提供服务,全国抗战档案知识互动可答,受到广泛好评。

作为全国率先探索人工智能技术在档案展陈领域应用的智能体产品,它改变了观众与档案展览的关系,将静态的观展体验转变为动态的、个性化的对话探索,这使得深奥的历史档案变得可亲、可感、可互动。同时,它为档案馆的智慧化建设提供了可复制的技术路径和应用模式。档案服务工作不再仅仅依赖于资深讲解员的个人经验,实现服务能力的标准化输出。

编辑:冯方湲

责任编辑:金艳

编审:吴山冠

相关新闻

Copyright © 2006-2024 WWW.ZGM.CN 自贡网 All Rights Reserved. 自贡日报社 主办

地址:四川省自贡市汇川路1240号自贡报业大楼 电话:0813-8220769 8220773 邮箱:webmaster@zgm.cn

互联网新闻信息服务许可证编号:51120190016 蜀ICP备11013724号 川公网安备51030002000105号

涉本网站网络内容从业人员违法违规行为举报电话:0813-8220769 网络内容从业人员违法违规行为举报

涉未成年人投诉举报电话:0813-8220770 电子邮箱:wcn@zgm.cn | 涉互联网算法推荐专项举报渠道

中国互联网举报中心举报电话: 12377 | 涉本网站违法和不良信息举报电话:0813-8220770 | 涉企举报专区

食品安全投诉举报电话:0813-2988060 电子邮箱:zgsscjgjyjk@163.com