iformat.io ロゴ iformat.io

画像からテキストへのコンバーター (OCR)

画像や PDF からテキストを即座に抽出します。画像 OCR は完全にブラウザ内で実行されます。ファイルがデバイスの外に出ることはありません。

最大ファイルサイズは10MBです。 サインアップ さらに詳しく。

クリップボードから画像を貼り付けることもできます (Ctrl+V / Cmd+V)

3 ステップでテキストを抽出する方法

画像または PDF をアップロードすると、OCR に作業を任せて、編集可能なテキストを即座に取得できます。

ファイルをアップロードする

画像または PDF をアップロード領域にドロップします。 PNG、JPG、WebP、BMP、GIF、PDF 形式をサポートします。

OCR によるテキストの抽出

私たちのエンジンはファイルを処理し、すべてのテキストを抽出します。画像はプライバシーを保護するためにブラウザーで処理されます。

コピーまたはダウンロード

抽出されたテキストを確認し、編集を行ってから、クリップボードにコピーするか、.txt ファイルとしてダウンロードします。

画像からテキストへの変換ツールを使用する理由

100% プライベート

画像 OCR は完全にブラウザ内で実行されます。ファイルがデバイスの外に出ることはありません。

多言語 OCR

英語、中国語、日本語、韓国語、アラビア語、ヒンディー語などを含む 100 以上の言語をサポートします。

PDF のサポート

デジタル PDF とスキャンされた PDF の両方からテキストを抽出します。デジタル PDF は即座に処理されます。

サインアップは必要ありません

アカウントを作成したりソフトウェアをインストールしたりせずに、ツールをすぐに使用できます。

クリップボードの貼り付け

Ctrl+V を使用して、クリップボードからスクリーンショットを直接貼り付けます。ファイルの保存は必要ありません。

編集可能な結果

抽出されたテキストは完全に編集可能です。コピーまたはダウンロードする前に、OCR の間違いを修正してください。

サポートされている言語グループ

当社の OCR エンジンは、主要なスクリプト ファミリ全体で 100 以上の言語をサポートしています。最高の精度を得るために、処理する前に主言語を選択してください。

言語グループ スクリプト
ラテン語 英語、フランス語、スペイン語、ドイツ語、ポルトガル語 ラテン語
キリル文字 ロシア語、ウクライナ語、ブルガリア語、セルビア語 キリル文字
CJK 中国語(簡体字・繁体字)、日本語、韓国語 CJK
アラビア語 アラビア語、ウルドゥー語、ペルシア語 アラビア語
インド系 ヒンディー語、ベンガル語、タミル語、テルグ語 デヴァナーガリーなど
その他 タイ語、ギリシャ語、ヘブライ語、グルジア語 いろいろ

よくある質問

画像からテキストへのコンバーターはどのように機能しますか?

画像の場合、私たちのツールは Tesseract.js を使用します。Tesseract.js は、完全にブラウザ内で実行される強力な OCR エンジンです。画像がサーバーにアップロードされることはありません。 PDF の場合は、PyMuPDF を使用してサーバー側で埋め込みテキストを抽出し、スキャンされた PDF の場合、ページは画像としてレンダリングされ、ブラウザーで OCR で処理されます。結果は編集可能なテキスト ボックスに表示され、コピーまたはダウンロードできます。

どのようなファイル形式がサポートされていますか?

PNG、JPG、JPEG、WebP、BMP、GIF などの一般的な画像形式をすべてサポートしています。 PDF ファイルもサポートされており、選択可能なテキストを含むデジタル PDF と画像を含むスキャン PDF の両方がサポートされています。スキャンされた PDF の場合、プライバシーを最大限に高めるために、クライアント側の OCR を使用して最大 10 ページが処理されます。

私のデータはプライベートで安全ですか?

はい。画像 OCR 処理は、Tesseract.js を使用してブラウザ内で完全に行われます。画像がデバイスから離れることはありません。 PDF テキスト抽出の場合、ファイルはサーバー上で処理され、テキスト抽出後すぐに破棄されます。ファイルや抽出されたコンテンツは、当社側で保存または記録されることはありません。

どの言語がサポートされていますか?

当社の OCR エンジンは、英語、スペイン語、フランス語、ドイツ語、中国語、日本語、韓国語、アラビア語、ヒンディー語、ポルトガル語、ロシア語などを含む 100 以上の言語をサポートしています。最良の結果を得るために処理する前に、ドロップダウンから言語を選択してください。複数言語のドキュメントは、第一言語を選択すると最適に機能します。

テキスト抽出の精度はどの程度ですか?

精度は画質に依存します。コントラストが良好な鮮明で高解像度の画像は、通常 95% 以上の精度を達成します。手書きのテキスト、ぼやけた画像、または珍しいフォントを使用すると、精度が低下する可能性があります。最良の結果を得るには、印刷されたテキストが写っている明るい照明で正面から見た写真を使用し、アップロードする前に不要な境界線を切り取ってください。

ファイルサイズの制限はありますか?

画像の場合、ブラウザ内で処理が行われるため、厳密な制限はありません。ただし、非常に大きなファイルはモバイル デバイスでは遅くなる可能性があります。 PDF の場合、サーバー側での高速処理を確保するために、最大ファイル サイズは 20 MB です。 PDF が大きい場合は、まず小さいファイルに分割することを検討してください。

スクリーンショットからテキストを抽出できますか?

絶対に!スクリーンショットは、最も一般的な使用例の 1 つです。スクリーンショットを貼り付けるかアップロードするだけで、OCR エンジンが表示されているテキストをすべて抽出するため、画像、エラー メッセージ、チャット ウィンドウ、または通常は選択できない画面上のコンテンツからテキストを簡単にコピーできます。

携帯電話で撮影した書類の写真からテキストを抽出できますか?

はい。書類、レシート、ホワイトボード、本のページなどの電話写真はすべてうまく機能します。最高の精度を得るには、カメラを書類と平行に保ち、影のない均一な照明を確保し、ページを傾けないようにしてください。アップロードする前に画像をテキスト領域のみにトリミングすると、結果が大幅に向上します。

OCR ツールはテーブルや列などの書式設定を保持しますか?

OCR エンジンは、テキストを読み上げ順に抽出しますが、複雑なテーブル構造や複数列のレイアウトは再構築しません。単純な 1 列のテキストも正確に再現されます。表を含むドキュメントの場合は、抽出されたテキストを手動で調整するか、レイアウトをより適切に保持するデジタル PDF 抽出モードを使用する必要がある場合があります。

OCR処理にはどれくらい時間がかかりますか?

処理時間は、画像のサイズ、複雑さ、デバイスのパフォーマンスによって異なります。ほとんどの単一画像は 3 ~ 10 秒で処理されます。 OCR エンジンが言語データ ファイルをロードする必要があるため、最初の画像には少し時間がかかる場合があります。同じ言語を使用する後続の画像の処理が速くなります。

OCR およびテキスト抽出ガイド

OCR、スキャンされた PDF、スクリーンショットからのテキストの抽出、アップロードやフォーマットに関する一般的な問題の修正に関する役立つ記事。

ファイル変換に関する教師用ガイド — アクセシブルな学習教材の作成

ファイル変換に関する教師用ガイド: PDF、MP3 オーディオ、および Web に適した形式でアクセスしやすい学習教材を作成します。無料ツール、ソフトウェアなし。

スキャンした文書が大きすぎますか?可読性を失わずに圧縮する方法

スキャンしたドキュメントが大きすぎて電子メールで送信したり、アップロードしたりできませんか?読みやすさを損なうことなく、スキャンした PDF を無料で圧縮します。通常 70 ~ 80% のサイズ縮小。

スクリーンショットや写真からテキストを抽出する方法 — 無料の OCR ガイド

OCR を使用して、スクリーンショットや写真からテキストを無料で抽出します。画像、スキャンした文書、PDF からテキストを数秒でコピーします。

オンラインで PDF フォームに無料で記入する方法 — Adobe は必要ありません

PDF フォームに記入する必要があるが、編集できない場合?オンラインで PDF フォームに無料で入力します。インタラクティブなフォームやフラット スキャンされた PDF で機能します。 No Adobe, no account.

スキャンした PDF ページが上下逆になっている場合を回転して修正する方法

上下逆または横向きにスキャンされた PDF ページを無料で修正します。個々のページまたはドキュメント全体を回転して、即座にダウンロードします。