top of page
Yomitoku

文書を「読み解く」AI​

Githubに公開されており、無償でお試し可能です。
※​製品版は一部、仕様が異なり、公開版に加え、追加のモデルや機能がご利用いただけます。

Github
About

About

YomiTokuは日本語文書画像解析に特化したPythonパッケージです。​

独自に構築した日本語特化AIで文書画像を解析し、PDFなど文書内の文字の文字起こし、図やグラフの検出、表を認識し、これまで難しかった画像内の情報を抽出し、解析を高精度に
​実現します。

お客様の環境のサーバーに組み込み可能であり、機密性の高い情報をお客様の自社環境内で解析可能です。

​製品の特長

01

​日本語文書特化型AI

独自の日本語文書データで学習した 4 種類の AI モデルを搭載しています

搭載されているAIは日本語文書に対して高い精度で解析が可能です

02

​複雑なレイアウトに対応

縦書きや段組みなど複雑な構造の文書も解析も可能です

人が読む順序を予測し、レイアウトが表す意味的な構造を崩さずに出力します

03

表の構造の解析

表の構造をAIが解析し、表の構造を維持した状態で出力可能です
セル結合や区切り罫線がない複雑な表でもAIがテーブルの構造を予測します

04

豊富なエクスポート機能

解析したデータはHTML やMarkdown、CSV、JSON のいずれかのフォーマットに変換可能です。文書内に含まれる図表、画像の抽出の出力も可能です

05

ローカルサーバーで動作

1コマンドで素早くインストール可能です
お手持ちのサーバー上で動作し、セキュアかつ効率的な解析が可能とします

​ユースケース

LLMとの連携

YomiTokuで文書画像から図、表、文字の情報を抽出し、RAGを用いたLLMの精度を向上させます

作業の自動化

​文書画像から情報を抽出し、システムに連携することで、これまで目視確認や手入力していた作業を自動化します。

​転記作業の効率化

​表などの複雑なレイアウトの情報の構造をそのまま読み取り、CSVに自動で書き起こすことで文書画像に含まれていたデータの転記作業の負荷を軽減します

Contact

YomiTokuに関するお問い合わせ

bottom of page