最懂甲骨文的AI来了!全球首个甲骨文智能体“殷契行止” 上线
创始人
2025-12-12 18:48:35

你只需往电脑上传一张甲骨图片,AI(人工智能)即可完成文字识别、释义查询、文献溯源——最懂甲骨文的AI来了!近日,厦门大学与腾讯公司、安阳师范学院联合研发的全球首个甲骨文智能体“殷契行止”正式上线。

厦门大学人工智能研究院甲骨文研究团队的负责人金泰松说,这是三方三年潜心研究的一个“合集”——一直以来,甲骨文研究一直面临“识别难、比对难、共享难”的挑战,“殷契行止”就是破解这些难题的智能体——AI用定制算法练就了读懂古文的真功夫。

用大白话说,“殷契行止”使得AI首次具备了“理解古文字”的能力,最终让每一片甲骨“读得懂、找得到、用得上”。

目前,甲骨文智能体已面向专家和公众免费开放,人人都能上手体验。

不过,金泰松说:“我们不是替代甲骨文研究专家,而是把专家从重复劳动中解放出来,让他们把精力留给真正的破译与思考。”

小程序“了不起的甲骨文”,展示甲骨文“其”的不同字形。(本组图/小程序截图)   

能做什么

看图识字

上传图片就能

精准比对标准字库

只需上传一张含有甲骨文字的图片,AI就能精准比对甲骨文标准字库,看图识别出它是哪个甲骨文字,还能进一步检索系统知识库中有关该甲骨文字的相关资料,还会给出权威释义和参考文献。

识别出某个单字后,AI会自动查找这个字在哪些甲骨和拓片中出现过,快速定位相关资料。

针对某个单字,快速汇聚与之相关的学术研究成果、各家释读观点和演变历史,省下大量翻找资料的时间。 

甲骨文“马”字   

全自动甲骨校重

以图搜图

10分钟完成数年的工作

这个智能体还有拓片重见检索功能:相当于“甲骨文版以图搜图”。上传一张拓片照片,AI能快速比对海量数据库,找出同一片甲骨的不同拓片版本或有相似字形的其他甲骨,帮助研究者发现重复收录的文献或追踪甲骨流传轨迹。

甲骨拓本图像是研究甲骨文的基础。所谓“拓本”,核心是把龟甲、兽骨上的文字,用宣纸和墨“印”下来的成品,就是给甲骨上的字拍了张“黑白高清照”。从甲骨文首次发现至今,因为收藏、流转,大部分甲骨都留下了多个版本的拓本,这些拓本被称为重片,梳理重片的工作被称为校重。

可想而知,甲骨的拓本数量远远大于甲骨的数量,需要对这些重片进行系统整理,才能理清这笔“糊涂账”。因此,拓片校重是甲骨学一项重要的基础性整理工作,耗费了甲骨文研究学者大量时间。

团队开发的拓片校重和重见检索系统有效解决了一字多版难题,让AI学会“找字”,实现了全自动甲骨校重。原本需要专家耗时数年的比对工作,现在仅需10分钟即可完成。  

拓本转化为摹本

不必借助临摹

就能看清笔画细节

此外,运用AI还可以将甲骨拓本(类似碑文拓印的黑白图片),转化为甲骨文摹本(白底黑字的临摹图),方便研究者看清笔画细节。

在此之前,甲骨文摹本需要甲骨文研究者用笔一笔笔临摹,需要研究人员对甲骨文有较深的理解,并且非常费时费力。

甲骨文摹本  

甲骨拓本   

怎么用

小程序免费开放

可以跟AI直接对话

更酷的是,“殷契行止”使得甲骨文走向大众——目前,这个甲骨文智能体已面向专家和公众免费开放,人人都能上手体验。

简单来讲,无论你是深耕古文字的研究者,还是初识甲骨文的爱好者,都能借助它与3000年前的文字对话。

如果你是甲骨文研究者,可以在PC端登录“甲骨文AI协同平台”,使用AI研究工具智能识别、比对与检索甲骨文,显著提升研究效率。比如,上传图片后,你可以直接提问单字的释义,还可以问“这个字在哪里出现过?”AI会自动比对,快速找出包含该字的全部拓片和摹本。

如果你是古文字爱好者,只需打开微信小程序“了不起的甲骨文”,就能和智能体对话。

例如,你可以问它:“家”字的甲骨文长什么样?它不仅会展示字形,还会告诉你,这个字里藏着殷商时代的“居住”特点。  

甲骨文“门”字   

跟着“甲骨舞者”

学跳甲骨文体操

在“了不起的甲骨文”,人们还可以体验甲骨识读乐趣,获取古文字知识。

这个小程序还能让甲骨文翩翩起舞,金泰松介绍,安阳师范学院甲骨文信息处理教育部重点实验室牵头,联合音乐学院、体育学院等编创了一套“广播体操”,手机上轻轻一点,“甲骨舞者”就翩翩起舞,时而展示侧身而立的“人”字,时而表演张开双臂的“舞”字。

金泰松说,这位“甲骨舞者”是真人,这套甲骨文“广播体操”是为了帮助大家更好地理解和传播甲骨文。

此外,团队还打造了一系列甲骨文主题游戏,让普通人也能在有趣互动中,感受古文字的千年底蕴。  

如何研发

三方合作

引入甲骨文针对性算法

金泰松说,随着DeepSeek(深度求索,一种AI助手)等通用大模型的涌现,我们意识到,AI确实能为甲骨文研究带来实质性的效率变革。基于这一认识,团队开始研发面向甲骨文识别的专用智能体。

什么叫智能体?金泰松列举一个例子,我们问DeepSeek:到北京的机票多少?它会告诉你价格,你还得自己去找App(应用程序)完成订票等工作;智能体却可以帮助你做其他的事情——你告诉特定的智能体:我要去北京,它会去查询相关的网站,调出支付的App等。表现在甲骨文智能体上,你上传一个甲骨单字,它可以自动去找这个字出现在哪片甲骨上,给出专家研究的文献等。

金泰松强调说,甲骨文智能体不是突然出现的,三年来,团队以AI+多模态甲骨文数据集融合为基础,研发出多项关键技术,包括甲骨字形检测与分类算法、AI摹本生成与字形匹配技术、甲骨校重与结构化比对算法,以及融合图像、文字与语义的多模态推理能力。

也就是说,现在相当于引入这些针对性的算法,用智能体技术把这些成果整合在“殷契行止”。

金泰松特别介绍三方合作的起源——2022年,在厦门大学纪荣嵘教授牵线下,厦门大学多媒体可信感知与高效计算教育部重点实验室、安阳师范学院甲骨文信息处理教育重点实验室与腾讯公司联合组建了跨机构研究团队。作为实验室主任,纪荣嵘在研究方向、技术路线优化、核心技术难题的攻坚突破中发挥关键作用。

金泰松是计算机专家,甲骨文智能化的研究与他参与研发的其他类型项目的感受是不一样的,他说,有时你会觉得,我们是在进行3000年文明的一场接力。  

教AI认字

精准检测143万个字形

很多人疑惑的是,人工智能是如何认识甲骨文的?难道不是要建立在“投喂”的基础上?

金泰松解释,的确,项目的起点是最基础的字形识别。面对模糊不清的拓片,常规图像检测方法几乎失效。“拓片噪声干扰严重,笔画断裂,以‘庚’为例,同一个‘庚’字在不同时期形态各异,有的像铃铛,有的像劳动工具,有的因为刻痕太浅几乎难以辨认。”金泰松说,“这给视觉算法带来了巨大挑战。”

AI首先学会了“认字”,从模糊的拓片中提取清晰字形。就像教孩子识字一样,团队给AI展示了上千个“庚”字的拓片,告诉它:这些都是“庚”,虽然长得不太一样,但都是同一个字。经过数百次迭代,AI便学会了从模糊的拓片中精准识别出各种形态的“庚”字。

团队一步一步从底层图像处理做起,通过多尺度图像增强、去噪、去模糊等技术,处理破损的甲骨片,再不厌其烦地“教”AI“认字”,最终实现对143万个字形的精准检测,准确率超过90%。  

让流失海外的甲骨

在数字世界回归

“殷契行止”背后还有“数字甲骨共创计划”,目前,它已完成1525片甲骨的数字化采集工作,其中以数字化形式“回归”的流失海外的甲骨达950片。

也就是说,用AI让几千岁的甲骨文在数字世界里“团圆”。

这里有个背景,出土的甲骨不仅在中国,还分布在世界16个国家和地区。过去几年,“数字甲骨共创计划”的研究者分赴各地,凭借一盏灯和一台相机工作,现在,这些散落在海外的甲骨片都以数字形式回归到祖国。

据介绍,通过“数字甲骨共创计划”,研究团队已构建起全球规模最大的甲骨文多模态数据集,包含143万个甲骨文字形数据、1.5万片甲骨多模态数据、3000篇研究文献等。

2024年世界人工智能大会上,AI+多模态甲骨文数据集首次发布,供研究人员和公众免费使用。

相关内容

热门资讯

国务院国有资产监督管理委员会原... 国务院国有资产监督管理委员会原副部长级干部潘良涉嫌严重违纪违法,目前正接受中央纪委国家监委纪律审查和...
送上定制化防护指南!护肺科普活... 12月10日,中华社会救助基金会大爱清尘基金联合中共清镇市委社会工作部、共青团息烽县委等单位,在息烽...
聚焦北大荒丨青龙山农场开展冬季... 近日,北大荒集团青龙山农场针对冬季生产生活特点,采取“全覆盖、无遗漏、严要求”多角度的方式推进隐患排...
原创 崂... 鲁网12月12日讯 为切实保障公共场所安全,深入排查消除安全隐患,12月11日,中共崂山区委宣传部联...