モルフォAIソリューションズ、長野高専と「FROG AI-OCR」を活用した文学研究を開始
近代文学全集の自然言語処理研究を実施
モルフォAISは、2022年7月1日より大学図書館・地方図書館・自治体様からのデジタル田園都市構想を背景としたデジタルアーカイブ事業や読書バリアフリー法対応のニーズを受け、市販ソフトとして「FROG AI-OCR」を提供してきました。
本研究にかかる取り組みにおいては、「FROG AI-OCR」を活用した近代文学全集の自然言語処理研究を実施しました。昨今、デジタル技術を用いることによる近代文学研究の新たな可能性が国内外の学術機関などで論じられています。その一つには、形態素解析(文章を意味のある最小の単位に分解して、意味や品詞など判別する分析方法)が挙げられ、この分析の利点はテキストを捉える正確性や説明の客観性が向上することにあります。一方で、既存のテキスト化ソフト(OCR)において、旧字旧仮名や特殊なレイアウトを含む書籍の文字をほぼ認識できず、手動でテキスト化を行い、膨大な時間がかかっているのが課題でした。
本研究では、旧字旧仮名や特殊なレイアウトに対応可能な「FROG AI-OCR」を活用することで、近代文学の形態素解析の効率化を図り、新たな文学研究の可能性を提供することを試みています。
今後モルフォAISは、学術機関における研究において「FROG AI-OCR」をより活用いただけるサポートプログラム(科研費への申請支援等)を充実していく予定です。
長野高専 牧 千夏 様コメント
文学研究は、文献の精読を主な分析方法としてきました。コンピュータで大量のテキストを分析する自然言語処理は、文学研究に新たな展開をもたらすと考えています。しかし現状では、自然言語処理をするためのテキストの作成に苦労しています。旧字体やルビなどを含む雑誌・全集データは、一般的なOCR処理では正しく認識できないためです。「FROG AI-OCR」は、そうしたデータでもかなりの高精度で認識でき、大変重宝しています。
処理サンプル
近代文学に多いルビと本文の区別は既存のOCRでは対応が難しかった近代文学に多いルビと本文の区別において、「FROG AI-OCR」では読み違いを起こさずに処理することが可能です。
FROG AI-OCR製品ページ
https://frog-ai-ocr.morphoai.com/
FROG AI-OCR紹介ムービー
お申込み・問い合わせ窓口
https://www.morphoai.com/ai-ocr
こちらより無償トライアル頂く事が可能です
関連プレスリリース
2022年4月28日
モルフォAIソリューションズが、国立国会図書館の最新AI技術を活用したOCR処理プログラムの開発を完了
https://www.morphoinc.com/news/20220428-jpr-mais_ndl
2022年5月9日
モルフォAIソリューションズが、国立国会図書館から視覚障害者等用のOCR開発を受託
https://www.morphoinc.com/news/20220509-jpr-mais_ndl
2022年6月14日
世界初、近代書籍対応の市販AI-OCRソフト「FROG AI-OCR」新発売
https://www.morphoinc.com/news/20220614-jpr-mais_frog_aiocr
2023年12月05日
近代書籍対応AI-OCRソフト「FROG AI-OCR」の研究者向けパッケージプランを発表
https://www.morphoinc.com/news/20231205-jpr-mais_frog_aiocr
※「FROG AI-OCR」は、国立国会図書館のNDLOCR(https://github.com/ndl-lab/ndlocr_cli)をコアエンジンとして利用しています。
株式会社モルフォAIソリューションズについて
モルフォAIソリューションズは、AI(人工知能)の事業化に取り組む企業です。行政、電力、交通、製造といった社会インフラの領域で、AI-OCRをはじめとする最先端のAI技術の導入と実運用を推進しております。
所在地:東京都千代田区神田錦町 2-2-1 KANDA SQUARE 11階 WeWork内
代表者:代表取締役 神田 武
設立:2019年12月
事業内容:AIコンサルティング、システムインテグレーション、SW・HW販売など
ホームページ:https://www.morphoai.com
お問合せ先
モルフォAIソリューションズ 石崎
メール:contact@morphoai.com
このプレスリリースには、メディア関係者向けの情報があります
メディアユーザー登録を行うと、企業担当者の連絡先や、イベント・記者会見の情報など様々な特記情報を閲覧できます。※内容はプレスリリースにより異なります。
すべての画像