2000年前碳化的古卷轴,如今成功被AI破译!背后三人团队还拿下70万美元大奖!AI在考古领域的重大进步,甚至登上了今天Nature的头版。
要说这件事的起源,还得追溯到公元79年一次火山爆发,直接将一座珍藏古老的纸莎草卷轴——Herculaneum Papyri的图书馆埋葬。而这些卷轴,直到18世纪才被挖出,却早已成为炭焦的木块。由于太过脆弱,根本无法轻易展开。
今天,正式获奖的作品,展示了超过15栏的数百个单词,相当于整个卷轴的5%的内容。值得一提的是,三人拔得头筹的团队中,有一位年仅21岁计算机天才少年Luke Farritor,成功用AI从图像裂缝中破译内容。当时,他还在SpaceX暑期实习,偶然发现这场挑战赛的英雄贴。这场AI破译卷轴的大赛还有3个团队获得亚军,包括一位谷歌华人工程师单独获5万美元大奖。
从破译文字转录后可以读出,古代哲学家对「如何享受生活」「快乐」的探讨与争辩,还揭示了人们对音乐和冒险的沉思。这一壮举为AI完整破译其余古卷铺平了道路,研究人员表示,这可能会对我们对古代世界的理解产生革命性的影响。
谷歌DeepMind的首席执行官:我迫不及待地想阅读这些被认为已经失传的古籍!2000年后,我们终于可以阅读卷轴了!
下图3D还原了,岩浆吞噬图书馆的情境。这些卷轴在公元79年维苏威火山的爆发中被碳化直到18世纪,这些卷轴被挖掘出来。目前,有800多卷被保存在意大利那不勒斯的一个图书馆中。
这些碳化的卷轴无法在不损害的情况下展开。当任何人尝试展开卷轴,结果就是支离破碎。那么,问题来了,我们该如何阅读这些卷轴?
2023年3月15日,Nat Friedman、Daniel Gross和Brent Seales发起了Vesuvius Challenge,就是为了解决这一世纪难题。这场挑战赛,要求参赛者在卷轴的4平方厘米区域内,至少找到10个字母。最诱人的是,挑战赛为成功破译者提供超100万美元的奖金。
来自法国科学院的卷轴在牛津附近的Diamond Light Source粒子加速器进行了成像,然后公布了这些卷轴的高分辨率CT扫描图像。
虚拟展开卷轴分三个步骤进行:
- 扫描:利用X射线断层扫描技术对卷轴或碎片进行3D扫描。
- 分割:在3D扫描图像中追踪卷曲的纸莎草层,随后将其展开或铺平。
- 墨迹检测:借助机器学习模型,识别铺平后段落中的墨迹区域。
这些卷轴是在位于英格兰牛津附近的Diamond Light Source(一种粒子加速器)扫描的。该机器可以产生的高强度平行X射线束,使得成像快速、准确且分辨率高。通过断层重建算法,X射线图片被转化为3D体素体积,形成一系列的切片图像。接下来,需要在3D空间中识别出单独的纸莎草纸张,这一步骤主要依赖于一个名为Volume Cartographer的工具。
墨迹检测一直是个挑战,直到最近挑战赛发起团队在两个方向上取得了突破:去年夏天,Casey Handmer在检查平铺后的表面体积时,发现了一种奇特的裂纹模式,这些裂纹似乎组成了文字。Casey因这一发现赢得了首个墨迹奖,并与社区共享了他的发现,随后引发了一系列的研究活动。与此同时,数百支团队在Kaggle竞赛中努力构建出最佳的机器学习模型,目标是检测那些在几百年前卷轴物理解卷过程中脱落的碎片上的墨迹。与之前不同的是,他们利用了这些碎片照片上的真实数据进行训练,而不是标记尚未发现的裂纹。虽然这些努力产生了一些优秀的模型,但它们在