top of page
About
About
YomiTokuは日本語文書画像解析に特化したPythonパッケージです。
独自に構築した日本語特化AIで文書画像を解析し、PDFなど文書内の文字の文字起こし、図やグラフの検出、表を認識し、これまで難しかった画像内の情報を抽出し、解析を高精度に実現します。
お客様の環境のサーバーに組み込み可能であり、機密性の高い情報をお客様の自社環境内で解析可能です。
製品の特長
01
日本語文書特化型AI
独自の日本語文書データで学習した 4 種類の AI モデルを搭載しています
搭載されているAIは日本語文書に対して高い精度で解析が可能です
02
複雑なレイアウトに対応
縦書きや段組みなど複雑な構造の文書も解析も可能です
人が読む順序を予測し、レイアウトが表す意味的な構造を崩さずに出力します
03
表の構造の解析
表の構造をAIが解析し、表の構造を維持した状態で出力可能です
セル結合や区切り罫線がない複雑な表でもAIがテーブルの構造を予測します
04
豊富なエクスポート機能
解析したデータはHTML やMarkdown、CSV、JSON のいずれかのフォーマットに変換可能です。文書内に含まれる図表、画像の抽出の出力も可能です
05
ローカルサーバーで動作
1コマンドで素早くインストール可能です
お手持ちのサーバー上で動作し、セキュアかつ効率的な解析が可能とします
ユースケース
LLMとの連携
YomiTokuで文書画像から図、表、文字の情報を抽出し、RAGを用いたLLMの精度を向上させます
作業の自動化
文書画像から情報を抽出し、システムに連携することで、これまで目視確認や手入力していた作業を自動化します。
転記作業の効率化
表などの複雑なレイアウトの情報の構造をそのまま読み取り、CSVに自動で書き起こすことで文書画像に含まれていたデータの転記作業の負荷を軽減します
Contact
bottom of page