top of page

Yomitokuの特長

​独自に学習されたAIモジュール

弊社内で独自の文書データセットを構築し、それらのデータで4種類のAIモデルを学習しています。

・Text Detection  画像からテキスト位置を特定する

・Text Recognition 見つけ出したテキストの文字を推定

・Layout Parsing グラフ、画像、表など文書の構成要素を抽出
・Table Structure Recognition: 表画像の構造を認識

スクリーンショット 2024-12-12 11.12.00.png

​日本語に特化の文書画像解析エンジン

YomiTokuは日本語文書に特化しています。7000文字を超える種類の文字の認識をサポートし、縦書きなど複雑なレイアウトの帳票に対応します。画像のセルの位置や行番号、列番号、セル結合などを把握し、画像で与えられた表の構造を認識します。

in_gallery3_p1_ocr.jpg

出典: 「文部科学広報  2019 年 4 月号」:(文部科学省) を加工して作成

in_gallery2_p1_layout.jpg

出典:「令和 7 年度歳出予算概算要求書(東日本大震災復興特別会計)」:(総務省) を加工して作成

​豊富なエクスポート機能

YomiTokuで解析した情報は、JSON、Markdown、CSV、HTMLで出力可能です。ユーザの利用方法に応じて、出力形式を使い分けることが可能です。また、解析で得た表や図、画像などの情報を個別に出力することも可能です。

スクリーンショット 2024-12-12 11.43.31.png

出典:「令和 6 年版情報通信白書 3 章 2 節 AI の進化に伴い発展するテクノロジー」:(総務省)

​お客様のサーバーに組み込み可能

YomiTokuはPythonパッケージ製品であり、お客様でご用意したネットワーク、サーバーに組み込み可能可能です。また、1コマンドで手軽にインストール可能であり、複雑なセットアップも必要ありません。AIモデルは軽量で高スペックなGPUを用意しなくても動作可能です。また、製品版には、CPUでの実行に最適化したさらに超軽量版のAIモデルも搭載しています。

スクリーンショット 2024-12-12 11.50.55.png
bottom of page