NXワンビシアーカイブズ、大規模言語モデルを活用した古文書の現代語訳の品質評価方法を共同研究
NIPPON EXPRESSホールディングス株式会社のグループ企業であり、データ・ソリューション事業を展開する株式会社NXワンビシアーカイブズ(本社:東京都港区、代表取締役社長 高橋 豊)は、大学共同利用機関法人 人間文化研究機構 国立歴史民俗博物館の橋本雄太准教授と共同で、大規模言語モデル(以下「LLM」)を活用した古文書の現代語訳に関する品質評価方法の研究を行い、LLMによる誤訳やハルシネーションの傾向を分析しました。これらの研究成果については、2025年5月17日開催の一般社団法人情報処理学会 第138回人文科学とコンピュータ研究発表会にて報告しました。
【取り組みの概要】
日本には膨大な古文書類が現存しています。これらは「くずし字」と呼ばれる、現代では使用されない字体で書かれているうえ、私たちが日常では用いない言葉や文体で記述されています。そのため、現代社会において活用するには、現代で使用する字体への文字起こしや現代語訳が必要不可欠です。現代語訳の課題に対し、当社は国立歴史民俗博物館 橋本雄太准教授からの委託を受け、中世および近世の古文書をサンプルとして、LLMを活用した現代語訳に最適なモデルの選定や、その現代語訳の品質評価、さらに誤訳やハルシネーションの傾向分析を実施しました。本研究の成果は、情報処理学会にて橋本准教授と当社社員が共同で発表しました。今後もNXワンビシアーカイブズは、橋本准教授とプロンプトエンジニアリングを活用した翻訳精度の向上や、現代語訳の品質評価の自動化に向けた検証に継続して取り組んでまいります。
※詳細は国立歴史民俗博物館の公式ウェブサイト掲載の「「LLMを利用した歴史文献資料の現代語訳の品質に関わる調査業務」分析結果報告」 (URL:https://khirin-labs.rekihaku.ac.jp/)をご覧ください。
【古文書の文字起こしの取り組み】
古文書をはじめとする歴史資料を現代に活用するためには、まず手書き文字を現代の活字に置き換える必要があります。この作業は歴史学の専門用語で「翻刻」と呼ばれ、従来は日本史学や国文学分野で訓練を積んだ専門家が担ってきました。しかし、現存する歴史資料は膨大であり、限られた専門家だけでは翻刻作業を網羅できないという課題があります。この問題を解決するため、国立歴史民俗博物館では「みんなで翻刻」プロジェクトを展開しています。本プロジェクトは、多くの一般参加者が協力して歴史資料の翻刻作業に取り組み、その解読を加速させる取り組みです。これまでに延べ5,000人以上が参加し、累計600万文字を超える歴史資料の翻刻が実現されています。「みんなで翻刻」では、LLMを活用し翻刻された古文書を現代語に翻訳するページも試験導入されています。これにより、より多くの人々が歴史資料を活用できる環境の実現を目指しています。

▲詳細は「みんなで翻刻」(URL:https://honkoku.org/)をご覧ください。
【AIで広がる歴史資料活用】
NXワンビシアーカイブズでは、LLM等を活用し、歴史資料をより広く、より便利に利用できる仕組みづくりに取り組んでいます。国立歴史民俗博物館 橋本雄太准教授との連携による古文書の現代語訳の研究も、こうした取り組みの一環です。NXワンビシアーカイブズには、国立公文書館および日本アーカイブズ学会が認めたアーキビスト、博物館勤務経験を有する学芸員が在籍しています。彼らの経験と知見を活かし、歴史資料保存機関のニーズを的確に把握しながら、古文書に限らずその他の歴史情報についてもLLMの利活用効果を検証していく方針です。今後も、歴史資料を社会で有効に活用するための新たな可能性を模索し、博物館、アーカイブズの分野においてさまざまなイノベーション創出を目指してまいります。
【株式会社NXワンビシアーカイブズとは】
NXワンビシアーカイブズは、1966年の設立以来、一貫して『企業の情報の安全確保と管理の効率化』を追求し、堅固なセキュリティ体制のもと、重要な情報(機密文書、医薬品開発関連資料、永年保存の歴史資料、テープ等の記録メディア、デジタルデータ、細胞・検体試料・治験薬・医薬品原薬など)の発生段階から活用、保管、抹消までのライフサイクル全てをカバーした総合的サービスを提供しています。
現在では東京・名古屋・大阪・九州に営業拠点を置き、官公庁や金融機関・医療機関・製薬業をはじめとした4,600社以上のお客様にご利用いただいており、2017年には書類とデジタルの両方をカバーする新しい書類保管サービス「書庫探」、2019年には書類と電子に対応した電子契約・契約管理サービス「WAN-Sign」、2022年にはWeb申し込み後、最短5日で利用可能な書類保管サービス「WAN-CASE」、2024年には事前準備を極力排除したリーズナブルな電子化プラン「WAN-Scan」や自在にカスタマイズ可能なレコードバンキングシステム「WAN-RECORD Plus®」をリリースし、お客様の働き方の変革をサポートできるサービスを提供しています。
【本リリースに関する問い合わせ先】
株式会社NXワンビシアーカイブズ
経営企画部 広報担当:池田・神谷・里村
TEL:03-5425-5400 E-mail:koho@wanbishi.co.jp
すべての画像