TOPPANは、スマートフォンで撮影したくずし字資料を高精度のAI-OCR技術によりその場で手軽に解読できるくずし字解読アプリ「古文書カメラ」を、今年6月よりiOS版、10月よりAndroid版で提供している。江戸時代を中心とした古文書などのくずし字資料の解読を支援する誰でも無料で使用できるアプリケーションサービスだ。
12月12日にアップデートを実施。AI-OCRの再学習を実施し、解読精度の向上を実現するとともに、様々な条件下で撮影した画像に対応できるように、画像編集機能を搭載した。また、解読機能の利用回数をこれまでの1日あたり10回から、30回に増加させている。
学習データの追加およびAI-OCRモデルの刷新により、とくに手書きの古文書に対して、大幅な解読精度の改善が認められた。
<解読精度向上について>
アプリで撮影した画像や、スマートフォンから取り込んだ画像を編集することで、よりAI-OCRの認識精度を高めることができる。
<本アップデートで搭載した画像編集機能>
解読機能の利用回数をこれまでの1日あたり10回から、30回に増やした。利用回数は毎日0時にリセットされる。
本アプリケーションは、今後さまざまな時代および筆跡の文字を学習させていくことにより、解読可能な文書の種類を増やし、また、他のサービスと連携することにより利用シーンの拡大を目指す。同社では、本サービスを自治体や研究機関に向け広く提供することにより、全国各地に眠る貴重な歴史的資料の研究・活用の支援に継続して取り組み、様々な史資料のアーカイブ化を通じ、社会・文化に貢献するとしている。
OCR(Optical Character Recognition)とは光学文字認識のことで、文書画像に含まれる文字を読み取り、テキストデータに変換するソフトウェアの総称。昨今ではディープラーニングと呼ばれるAI技術を用いて構築することが主流になっている。
「古文書カメラ」のバックエンドで動作するくずし字OCRは、ディープラーニング技術をベースにTOPPANデジタルの研究開発部門が独自に開発したアルゴリズムにより実現している。
<アプリダウンロード用QRコード>