高精度のAI-OCR搭載
凸版印刷は2月16日、オンライン上で古文書や古典籍を解読できるくずし字解読支援システム「ふみのはゼミ」を開発したと発表した。
同社はこれまで、歴史的文献を解読する障壁となっていた「くずし字」のOCR技術を開発するため、国文学研究資料館と共同で研究・実証を重ねてきた。
今回開発されたシステムには、従来のくずし字OCRをさらに発展させた最新の高精度くずし字AI-OCRが搭載されている。また、グループワーク用の支援機能も搭載され、くずし字で書かれた歴史的資料を容易に解読できるようになったという。
AIが大量のくずし字形を学習
システムの開発には、解読済みの古文書や古典籍から採集した大量のくずし字の形をAIに学習させてAI-OCRを生成した。このAI-OCRの導入により、文字認識の精度は90%以上になったという。
同システムでは、解読したい範囲を「ふみのはゼミ」の画面上で指定するだけで、AIが文字の区切り位置も含めて解読する。また、目視による入力や校正の結果をAI-OCRに再学習させることで、AI-OCRの精度をさらに向上させることも可能という。
(画像はプレスリリースより)

凸版印刷 ニュースリリース
https://www.toppan.co.jp/