top of page
Yomitokuの特長
独自に学習されたAIモジュール
弊社内で独自の文書データセットを構築し、それらのデータで4種類のAIモデルを学習しています。
・Text Detection 画像からテキスト位置を特定する
・Text Recognition 見つけ出したテキストの文字を推定
・Layout Parsing グラフ、画像、表など文書の構成要素を抽出
・Table Structure Recognition: 表画像の構造を認識
日本語に特化の文書画像解析エンジン
YomiTokuは日本語文書に特化しています。7000文字を超える種類の文字の認識をサポートし、縦書きなど複雑なレイアウトの帳票に対応します。画像のセルの位置や行番号、列番号、セル結合などを把握し、画像で与えられた表の構造を認識します。
出典: 「文部科学広報 2019 年 4 月号」:(文部科学省) を加工して作成
出典:「令和 7 年度歳出予算概算要求書(東日本大震災復興特別会計)」:(総務省) を加工して作成
豊富なエクスポート機能
YomiTokuで解析した情報は、JSON、Markdown、CSV、HTMLで出力可能です。ユーザの利用方法に応じて、出力形式を使い分けることが可能です。また、解析で得た表や図、画像などの情報を個別に出力することも可能です。
出典:「令和 6 年版情報通信白書 3 章 2 節 AI の進化に伴い発展するテクノロジー」:(総務省)
お客様のサーバーに組み込み可能
YomiTokuはPythonパッケージ製品であり、お客様でご用意したネットワーク、サーバーに組み込み可能可能です。また、1コマンドで手軽にインストール可能であり、複雑なセットアップも必要ありません。AIモデルは軽量で高スペックなGPUを用意しなくても動作可能です。また、製品版には、CPUでの実行に最適化したさらに超軽量版のAIモデルも搭載しています。
bottom of page