▼ ニュースのポイント
①凸版印刷が近代のくずし字を含む手書き文字に対応したAI-OCRを開発。
②同AI-OCRは同社提供のAI-OCR「ふみのは」を基に開発された。
③実証実験を経て2023年4月からサービス開始を予定。
同社提供のAI-OCR「ふみのは」を基に開発
凸版印刷は11月11日、明治期から昭和初期に至る近代のくずし字を含む手書き文字に対応したAI-OCRを日本で初めて開発したと発表した。
今回のAI-OCRは、同社が提供する江戸時代のくずし字を対象としたAI-OCR「ふみのは」を基に、近代の多様な筆跡の手書き文字まで対応させたもの。さまざまなパターンの文字をAIに学習させることで、難読文字の解読を実現したという。
同AI-OCRについて、同社では2022年11月から神戸大学経済経営研究所附属企業資料総合センターなどと実証実験を実施し、2023年4月より正式サービスを開始する予定としている。
近代の手書き文字は多様 解読は専門家にも難しい
近代に作成された手書きの資料は全国に大量に残存し、中には公文書や企業経営文書、業務日誌、書簡などの貴重な情報が記された資料も数多く含まれている。
だが、近代の手書き資料には、書き手によって異なるくずし方や、筆記用具の多様化、カタカナ語の混在、旧字旧仮名遣い表記などがあるため、解読は専門家にとっても難易度が高いとされている。また、実用レベルのOCR技術も開発されていない。
そこで同社では、学術研究や業務の効率化をはかるため、神戸大学経済経営研究所附属企業資料総合センターと三井文庫との共同研究で、近代のくずし字を解読するAI-OCR技術を独自に開発した。
(画像はプレスリリースより)
凸版印刷ニュースリリース
https://www.toppan.co.jp/▼ 会社概要
凸版印刷は「印刷テクノロジー」をベースに「情報コミュニケーション事業」、「生活・産業事業」、「エレクトロニクス事業」の幅広い事業活動を展開している。
社名:凸版印刷株式会社
代表取締役:麿秀晴
所在地:東京都文京区水道1-3-3