加入收藏 | 设为首页 |

科技巨头用AI“抄”了20万页古书迎接海外古籍“回家”

海外新闻 时间:2021-05-19 18:34:00 浏览:
为寻觅流散海外的中国古籍并将其数字化、公共化,5月18日,汉典重光古籍平台正式上线。据介绍,该平台上首批20万页古籍已完成数字化,并沉淀为覆盖3万多字的古籍字典,利用阿里达摩院AI对古籍的识别准确率已达到97。5%,公众可通过汉典重光平台翻阅、检索古

  为寻觅流散海外的中国古籍并将其数字化、公共化,5月18日,汉典重光古籍平台正式上线。据介绍,该平台上首批20万页古籍已完成数字化,并沉淀为覆盖3万多字的古籍字典,利用阿里达摩院AI对古籍的识别准确率已达到97。5%,公众可通过汉典重光平台翻阅、检索古籍。

  文物古籍是不可再生的历史文化资源。事实上,企业利用各种形式存储、传承中华文化及修复其载体已有诸多先例。

  今年3月,腾讯联合敦煌研究院开发了AI病害识别技术用于壁画修复与保护。英特尔从2018年起就启动了利用3D建模与AI识别修复长城的项目。DeepMind联合牛津大学打造的古文修复AI将一块2500年前的残破碑文补齐。此外,科大讯飞也在利用语音识别技术保护即将消失的古方言。

  具体到中文古籍保护,避免“健康”文物因环境变化和使用“生病”是现阶段的重要目标。阿里巴巴达摩院院长张建锋认为,现阶段,古籍保护与利用存在实体藏书分散,内容查询难,联合调用难三大痛点。“阿里计划将古籍数字化技术工具同平台一并捐赠给权威公共机构,并持续投入人力物力。”

  科技的最高境界,就是用来理解文化,文物古籍无论修复还是合理使用再也经不起等待。

  据国家图书馆副主任张志清介绍,如今的古籍发布还受传统藏书楼等旧观念制约,国家图书馆在网上发布的7。2万册古籍检索还远远不够。“顺应时代,需要科技企业利用大数据、云计算和AI等技术形成结构化、标准化、可视化的平台型服务。”

  “古籍平台要完全发挥作用,应成为一个知识工具。”参与了平台搭建的四川大学历史文化学院教授陈力认为,平台已解决了查询古籍,保护原件,和古文字识别的问题。在此基础上,还应不断吸引藏书家丰富平台内容,帮助学者和普通用户开展研究和学习,做成一项包含在线词典和检索工具的公益事业。