Umi-OCR - OCRバッチ画像からテキスト認識ソフトウェア、インターフェース付き、オフライン操作。写真の透かし領域の干渉を排除し、きれいなテキストを抽出できます。PaddleOCR に基づいています。

(OCR批量图片转文字识别软件,带界面,离线运行。可排除图片中水印区域的干扰,提取干净的文本。基于 PaddleOCR 。)

Created at: 2022-03-28 12:01:46
Language: Python

Umi-OCR バッチ イメージからテキストへの変換ツール

Win10 x64 プラットフォーム用のオフライン OCR ソフトウェア。ローカル画像のバッチ インポート/クリップボードの読み取り、画像内のテキストの認識、ソフトウェア パネルまたはローカルの .txt / .md ファイルへの出力。

  • 無料: このプロジェクトのすべてのコードはオープン ソースであり、完全に無料です。
  • 利便性: 解凍して使用できます。インストールする必要はありません。ネットワークは必要ありません。
  • 効率的: OCR 認識エンジンはC++ でコンパイルされたPaddleOCR-json (PP-OCRv2.6 cpu_avx_mkl)で、前世代より 20% 高速です。コンピュータに十分なパフォーマンスがあり、mkldnn をサポートしている限り、通常はオンライン OCR サービスよりも高速です。
  • Accurate : PPOCR-v3 モデル ライブラリがデフォルトで使用されます。通常のテキストを正確に認識するだけでなく、型にはまらないフォント (手書き、芸術的な文字、小さな文字、誤った向き、雑然とした背景など) の認識率も高くなります。透かしを除外するように無視領域を設定して、精度をさらに向上させることができます。

互換性

  • システムは Win10 x64 をサポートしています。

  • Win7 は推奨されません。認識エンジンが動作しない可能性が高くなります。試してみたい方は、win7 x64 sp1はシステムアップグレードパッチ+vcランタイムライブラリをインストール後、わずかな確率で動作します。

  • CPU には AVX 命令セットが必要です。一般的な家庭用 CPU は、一般的にこの条件を満たしています。

    AVX サポートされている製品ファミリー サポートしません 疑わしい
    インテル コア、ゼオンゼオン アトム、イタニウム セレロン、ペンティアム
    AMD Ryzen、Athlon、FX などのブルドーザー アーキテクチャとその後の製品。 K10 アーキテクチャと以前の製品

ダウンロード

Umi-OCR ソフトウェア本体には、簡体字中国語と英語の認識ライブラリのみが含まれていることに注意してください。以下のリンクにある多言語認識拡張パック

繁中,日,韩,德,法
言語をインポートできます。必要に応じてダウンロードしてください。

Github のダウンロード:

Umi-OCR バッチ イメージからテキスト v1.2.6

Blue Play クラウド ダウンロード: (リリース日とバージョン番号に注意してください)

https://wwn.lanzoul.com/b036wwa4d

パスワード:

1111

Umiシリーズ画像処理ソフト

Umi-OCRバッチ画像からテキストへのソフトウェア◁

Umi-CUT 一括画像切り出し・切り抜き・圧縮ソフト

序文

指定領域を無視する特殊機能について:

透かしに似たビデオのスクリーンショット、UI/ボタンを含むゲームのスクリーンショットなどの場合、多くの場合、サブタイトル領域のテキストを抽出するだけでよく、透かしと UI テキストの抽出を避ける必要があります。このソフトウェアは、この目的を達成するために、一部の領域のテキストを無視するように設定できます。

整理してアーカイブする必要があるビデオやゲームのスクリーンショットがたくさんある場合、または特定の行/字幕を含むスクリーンショットを見つけたい場合、これらの写真からテキストを抽出して Ctrl+F を押す方法は非常に効果的です。これは、このソフトウェアを開発する当初の意図です。

OCR エンジンについてPaddleOCR-json :

PaddleOCR 2.6 cpu_avx_mkl C++のラッパー。PPOCR の Python バージョンや Python で記述された一部の OCR エンジンよりも効率的であり、通常はオンライン OCR サービスよりも高速です (ネットワーク転送時間を節約します)。公式パドル モデル (v2 および v3 バージョンと互換性があります) または自分でトレーニングしたモデルの置き換えをサポートし、PPOCR のさまざまなパラメーターを変更することをサポートします。異なる言語モデルを追加することで、ソフトウェアは複数の言語を認識できます。

簡単に始められる

準備

zip パッケージをダウンロードし、すべてのファイルを解凍します。

ローカル画像ファイルのバッチ識別

  1. メイン プログラムを開き、任意の画像/フォルダをウィンドウの白い背景のテーブル エリアにドラッグするか、左上の [参照て画像を選択します。
  2. 右上の をクリックしてタスクを開始し、進行状況バーが終了するのを待ちます。
  3. [認識コンテンツ] タブをクリックして出力テキストを表示するか、最初のて認識結果の txt ファイルを表示します。

クリップボードのスクリーンショットをすばやく特定

  1. [Win+Shift+S] を押して、システムのスクリーンショットを撮るか、Web ページやその他の場所に写真をコピーします。

  2. [コンテンツの認識] タブに切り替えて、[クリップボード

  3. [設定] タブグローバル ショートカット キーを記録して有効にし、プログラムの認識をすばやく呼び出すことができます。このとき、プログラム ウィンドウが背面にある場合、または最小化されている場合は、自動的に前面の位置に移動します。

セットアップ手順

[設定] タブをクリックして、パラメーターを構成します。ほとんどの設定は、変更後に自動的に保存されます。

スケジュールされたタスク:

  • 画像認識タスクの完了後に実行する追加タスク。生成されたファイル/ディレクトリを開く実行可能ファイル、自動シャットダウン/スタンバイなど。
  • マップ認識タスクが進行中であっても、これらのオプションを自由に変更してください。
カスタム スケジュール タスク
  • 基本的に cmd コマンドを呼び出す、独自のスケジュールされたタスクを作成できます。
  • クリックして設定ファイルを開き、要素を
    okMission
    追加します。
  • キーはタスク名で、値は
    code
    cmd コマンドであるディクショナリです。複数のコマンドを
    &
    分離できます。例:
"我的任务": {"code": "cmd命令1 & 命令2"}

画像の特定の領域のテキストを無視します。

  • Add Zoneをクリックして、Configure Ignored Zones の新しいウィンドウを展開します。具体的な構成については、以下を参照してください。
  • [ Clear Area] をクリックして、設定されているすべての無視エリア パラメータをクリアします。
  • 領域が追加された後、上部のタイトル テキストは、現在無視されている領域の有効な

クリップボードから画像を読み取る:

  • 記録ボタンをクリックしてから、目的のショートカット キーを押します
    ctrl+shift+s
    。次に、 [グローバル ショートカットを有効にする] をオンにします。
  • ショートカット キーを押した後、プログラムは現在のクリップボードの最初の位置が画像かどうかをチェックし、画像の場合はトップ レベルにジャンプし、認識されたテキストを表示します。
  • グローバル ショートカット キーが他のプログラムと競合しないように確認してください。
  • 画像認識後に、認識した内容(タスク時間などの情報を含まないプレーンな内容テキスト)を自動。この設定は、バッチ タスクではなく、クリップボードの認識にのみ有効です。
  • 重要:
    v1.2.6
    このバージョンでは、バッチ処理の平均速度が向上しますが、初期化に時間がかかります。これは、クリップボードの認識 (各クリップボード タスクの再初期化) の速度に影響を与える可能性があります。この機能を頻繁に使用する場合は、古いバージョンを最初に使用することをお勧めします
    v1.2.5

設定を入力してください:

  • サブフォルダー内のすべての画像を再帰的に読み取るチェックすると、フォルダーを処理リストにドラッグすると、すべてのサブフォルダー内の画像がインポートされます。それ以外の場合、フォルダーの 1 つのレイヤーの下にある画像のみがインポートされます。
通常の状況では、ピクチャ接尾辞を変更する必要はありません。
  • 画像の接尾辞ソフトウェアによってロードできる画像の接尾辞を構成します. 異なる接尾辞はスペースで区切られ、すべて小文字でなければなりません.
    • 新しいイメージ サフィックスを追加する必要がある場合は、イメージが c++ モジュール
      PaddleOCR
      と pythonの両方
      PIL
      で認識できることを確認してください。たとえば、 .gif画像
      PIL
      は認識できますが、認識
      PaddleOCR
      できません.gif ファイルをロードするとソフトウェア タスクが失敗するため、 .gifのロードは許可されません.
    • ライセンス サフィックスの範囲外のファイルは、ソフトウェアに読み込まれません。現在のデフォルトの画像サフィックスは次のとおりです。
      .jpg .jpe .jpeg .jfif .png .webp .bmp .tif .tiff

出力設定:

  • 識別コンテンツをローカル ファイルに書き込むオフにすると、ローカル ファイルは再生成されず出力情報は [識別コンテンツ] タブでのみ表示できます。このタスクの完了後に自動的にシャットダウンするように設定されている場合は、これまでのすべての努力を無駄にしないように、必ずこのオプションをチェックしてください。
その他の項目は、通常の状況では変更する必要はありません。
  • デバッグ情報を出力するチェックすると、プログラムの動作状況の内容を追加で出力します。
  • テキストのない画像を無視チェックすると、テキストのない画像名 (またはすべてのテキストが無視された領域によってマスクされます) は出力情報に表示されません。
    • 閲覧用のマークダウンファイルを生成したい場合は、チェックを外すことをお勧めします。
  • ファイルの生成には、プレーン テキストの .txt ファイルMarkdown スタイルの .md ファイルの 2 つのスタイルがあります。前者は、ルックアップなどの一般的な目的に使用できます。後者は、ギャラリーを閲覧して楽しむために使用できるイラスト付きのページとしてエディターまたはブラウザーでレンダリングされます。
  • 出力ディレクトリ出力ファイル名生成されるファイルの場所と名前を設定します。
    • 最初の画像をドラッグし、これら 2 つの設定が空の場合、出力パスは自動的に最初の画像の親ディレクトリに設定され、出力ファイル名は
      [转文字]_{父目录}.txt
      . ディレクトリと名前をカスタマイズする場合を除き、これら 2 つの項目はデフォルトで空白のままにすることができます
  • [処理リスト] タブの [テーブルのクリアインポートされたイメージ リストのクリアに加えて、 [出力ディレクトリ] と [出力ファイル名]の設定をクリアします。これにより、次に新しい画像をドラッグしたときに、出力ファイルが新しい場所に保存されます。

認識設定:

  • 認識言語現在の認識言語 (つまり、OCR パラメータ ファイル) を選択します。英語は切り替える必要がなく、すべての言語が英字認識に対応しています。
  • 起動パラメータ文字列を入力してパラメータを設定し、タスクのニーズに合わせて認識プロセスを調整できます。
複数の言語を追加するには?
方法1:「海OCR多言語認識拡張パッケージ」をダウンロードし、ソフトウェアディレクトリにコピーします。

ここをクリックするとダウンロード先にジャンプします

拡張パックの組み込み言語:

繁中,日,韩,德,法

方法 2: PP-OCR モデル ライブラリを手動でダウンロードして追加する
  1. モデルは、det 検出、cls 方向分類、rec 認識の 3 つのタイプに分けられます。その中で、det と cls は複数の言語で共通です。新しい言語の rec 認識モデルをダウンロードするだけです。
  2. PP-OCR シリーズV3 多言語認識モデル一覧から、 rec 認識モデルのセットをダウンロードしてください。
    • ターゲット言語が V3 モデル リストに見つからない場合は、サポートされている言語リストに移動して、 PPOCR がこの言語を提供しているかどうかを確認できます。もしそうなら、まだV3モデルをリリースしていない可能性があり、古いV2モデルが最初に使用できます. (V3モデルのURLの2.xは、旧ページを閲覧する為に小さい数字に置き換えています)
  3. PP-OCRシリーズの辞書一覧から対応言語の辞書ファイルをダウンロードしてください。
  4. ダウンロードしたファイルをソフトウェア ディレクトリの
    PaddleOCR-json
    フォルダ。
  5. コピー
    PaddleOCR_json_config_[模板].txt
    を作成し、名前を変更します。
  6. コピーしたファイルを開き、
    PaddleOCR_json_config_目标语言.txt
    rec パス
    rec_model_dir
    とディクショナリ パス
    rec_char_dict_path
    をターゲット言語のファイル (フォルダー) の名前に変更します。モデル ライブラリが v2 バージョンの場合は、行も追加する必要があります
    rec_img_h 32
  7. 前のディレクトリに戻って
    Umi-OCR
    開き、新しい言語の情報をに
    Umi-OCR_config.json
    追加します。
    "ocrConfig"
    キーは言語名で、値は構成 txt ファイル
    path
    のです。json 形式を維持し、コンマに注意してください。
  8. ソフトウェアを開き、設定ページで認識言語が選択できるか確認してください。
識別できない場合はどうすればよいですか?ハイエンド CPU でさらに速度を上げるにはどうすればよいでしょうか?
起動パラメータの説明
  • 画像内のテキストの方向が真上でない場合は、起動パラメーターを追加します。
    --cls=1 --use_angle_cls=1
  • PaddleOCR は速度を向上させるために、余分な長さの画像を事前に圧縮してから、テキスト認識を実行します。これにより、非常に大きな解像度 (4k 以上) の画像の認識精度が低下する可能性があります。文字が認識できない場合、または小さい文字が欠落している場合は、起動パラメーターを追加します。
    --limit_side_len=压缩阈值
    • 圧縮しきい値には画像の最大辺の長さの半分を入力し、4000x3000 の画像の場合は 2000 を入力することをお勧めします。数値が大きいほど小さい文字の認識精度は高くなりますが、速度は大幅に低下しますのでご注意ください。
  • コンピューターの CPU が 8 コアと 16 スレッドを超える場合は、起動パラメーターを追加します。
    --cpu_threads=线程
    • 16 などの CPU スレッドの数を入力することをお勧めします。値が大きいほど、認識が速くなる場合があります。CPU スレッドの数を超えないようにしてください。
  • 認識エンジンの初期化時にソフトウェアが頻繁にエラーまたはクラッシュを報告し、コンピューターの CPU が初期の AMD モデルである場合は、起動パラメーターを追加してみてください。
    --enable_mkldnn=0
    • mkldnn アクセラレーションを無効にすると、以前の AMD との互換性が向上する可能性がありますが、認識速度は大幅に低下します。Intel および AMD Ryzen シリーズでは通常、この問題は発生しません。
    • 本当に mkldnn を使用できない場合は
      1.2.5
      、高速化を無効にした方が効率的な古いバージョンの Umi-OCRを使用することをお勧めします
      1.2.6
  • 起動パラメータは、次のように重ねてスペースで区切ることができます。
    --cls=1 --use_angle_cls=1 --use_angle_cls=1 --limit_side_len=1920 --cpu_threads=20
  • その他の起動パラメーターについては、PaddleOCR-json 構成情報の説明を参照してください。

エリア機能を無視

領域無視はこのソフトウェアの特別な機能で、画像の透かしの干渉を除去して、必要なテキストのみを認識結果に残すために使用できます。

詳細を展開

「無視領域」とは、画像上の指定された位置とサイズの矩形領域を指し、この領域内に完全に含まれるテキスト ブロックは除外されます。

  • [設定] タブの [無視領域の追加クリックして、[無視領域の選択] ウィンドウに入ります。
  • 将任意图片 拖入 该窗口,可预览该图片。将新图片拖入窗口可切换预览,但已绘制的忽略区域不会消失;可切换不同图片来仔细调整忽略区域。
  • 绘制 忽略区域 :拖入图片后,点击选中左起第一按钮 +忽略区域 A ,然后在图片上按住左键拖拽,绘制矩形区域。可 撤销 步骤。
  • 绘制完后,点击 完成 返回软件主窗口。若不想应用此次绘制,则右上角X,取消。

简单案例见下。

简单排除视频截图中的水印:

  1. 打开忽略区域设置窗口,拖入任一张截图。 稍等约1秒,面板上会显示出图片,识别到的文字区域会被虚线框起来。发现右上角的水印也被识别到了。
  2. 点击选择 +忽略区域 A 。在画面上按住左键拖拽,绘制方框完全包裹住水印区域,范围可以大一些。可绘制多个方框。
  3. 点击 完成 。返回主窗口, 开始任务

排除游戏截图中的两种UI:

  • 假设有一组游戏截图,主要分为两类图片,这两类图片的文字位置和UI位置不太相同:
    • 甲类(上图左)为对话模式,字数少,要保留的台词文本在画面下方,要排除的UI分布于底端。
    • 乙类(上图右)为历史文本模式,字数多,从上到下都有要保留的文本(与甲类UI位置有重合),要排除的UI分布在两侧。
  1. 拖入一张甲类图片。选择 +忽略区域 A ,绘制方框包裹住要排除的 底端UI 。可绘制多个方框。
  2. 拖入一张乙类图片。选择 +识别区域 ,绘制方框包裹住 小部分要保留的文本 。注意只要该区域内含有任意保留文本即可,不需要画得很大,不需要包裹住所有保留文本;不能与甲类图中 可能存在的任何文本 重合。
  3. 然后选择 +忽略区域 B ,绘制方框包裹住乙类图要排除的 两侧UI 。可绘制多个方框。
  4. 点击 完成 。返回主窗口, 开始任务

忽略区域处理逻辑:

  • 忽略区域A :正常情况下,处于 忽略区域A 内的文字 不会 输出。

  • 识别区域 :当识别区域内存在文本时,忽略区域A失效 ;即处于忽略区域A内的文字也 被输出。

  • 忽略区域B :当 忽略区域A失效 时,忽略区域B才生效;即处于区域1内的文字 输出、区域2内的文字 不会 输出。

    识别区域 忽略区域A 忽略区域B
    × 不存在文字 √ 生效 × 失效
    √ 存在文字 × 失效 √ 生效
  • “忽略区域配置”只针对一种分辨率生效。假如配置的分辨率是1920x1080,那么批量识别图片时,只有符合1920x1080的图片才会排除干扰文本;1920x1079的图片中的文字会全部输出。

  • プレビューにドラッグする画像は、同じ解像度である必要があります。最初に 1920x1080 の画像をドラッグしてから、他の解像度の画像をドラッグすると、ソフトウェアは警告を表示します。[クリアして現在構成されている無視領域を削除するだけで、他の解像度の画像をドラッグしてこの解像度を適用できます。

効率性試験と開発手順

詳細を展開

効率試験

試験機:

CPU TDP mkldnnと互換性がありますか
r5 4600u 15w 16g エラーなし

テスト セット:

写真の数 試験条件 解像度 平均ブロック数 平均文字数 テキスト言語
100 環境は同じで、複数回測定した平均値です。 1920×1080 15 250 簡体字中国語

試験結果:

海OCR版 1.2.5 1.2.5 1.2.6 1.2.6 1.2.6 1.2.6
PaddleOCR-json バージョン 1.1.1 1.1.1 1.2.0 1.2.0 1.2.0 1.2.0
PP-OCR C++ バージョン 2.1 2.1 2.6 2.6 2.6 2.6
mkldnn を有効にするかどうか
PP-OCR モデル ライブラリのバージョン v2 v2 v2 v3 v3 スリム v3
合計時間 (秒) 90 120 65 63 170 400
1 枚の平均時間 (秒) 0.9 1.2 0.65 0.63 1.7 4.0
ピーク時のメモリ使用量 (MB) 1000 350 1200 1700 5800 500

結論は:

  • mkldnn を有効にすると、新しいバージョンは前の世代よりも効率が大幅に向上します。新しいバージョンのチューニングは、ハードウェアのパフォーマンスを低下させる傾向があり、メモリ使用量は古いバージョンよりも高くなります。
  • mkldnn が有効になっていない場合、新しいバージョンは前の世代ほど効率的ではありません。したがって、お使いの CPU が mkldnn をサポートしていない場合 (初期の AMD モデルなど)、古いバージョンの Umi-OCR を使用することをお勧めします。
  • パドルの公式文書によると、圧縮、刈り込み、蒸留によって定量化されたモデルのスリム バージョンのパフォーマンスは従来のアルゴリズムを超えるとのことですが、測定された v3 スリム モデルのパフォーマンスは元のバージョンよりもはるかに悪く、それを伴う可能性もあります。メモリリークによって。PP-OCR C++ エンジンが適していない可能性があります。この問題が解決されるまで、Umi-OCR ディストリビューションは元のバージョンのモデルを提供します。

開発ノート

  • インターフェイスを使用して OCR を呼び出したい場合は、PaddleOCR-json 画像からテキストへのプログラム を試すことができます。
  • PaddleOCR-json はハードディスク ファイルのみを受け入れるため、クリップボードの画像を読み取るときは、メモリ内の画像が最初に同じディレクトリに保存されます
    Umi-OCR_temp
    。各タスクの以前のキャッシュをクリアします。
  • PPOCR v2.6 (PaddleOCR-json v1.2.0) バージョンでは、バッチ処理の平均速度が向上しますが、初期化に時間がかかります。mkldnn アクセラレーションが有効な場合は認識速度が向上しますが、アクセラレーションが有効でない場合は効率が低下します。(CPUが特に初期のAMDでない限り、mkldnnは一般的に使用できますが、高速化はIntelほど高くない場合があります。)
  • 将来的には、AMD の効率をさらに最適化するために、認識エンジンの openblas バージョンが追加される予定です。
  • コードが醜い、リファクタリングする時間がある次回は必ず
  • pyinstaller
    パッキングを 使用します。パラメーターは次のとおりです。
    pyinstaller -F -w -i icon/icon.ico -n "Umi-OCR 批量图片转文字" main.py

TODO

公開済み

詳細を展開
  • 出力コンテンツはオプションでマークダウン スタイルにすることができ、画像パスを埋め込むことができます。
  • 設定項目を保存できます。
  • 出力ファイルまたはフォルダーを自動的に開きます。
  • クリップボード内の写真を識別します。
  • タスクの進行中は、一部の設定項目が無効になります。
  • スケジュールされたタスク: 完了後の自動シャットダウン/休止状態など
  • フォルダーを再帰的にインポートします。
  • PaddleOCR v3 モデル用に最適化されています。

現像

新機能ベータ版のダウンロードアドレス (Blue Play Cloud、パスワード 1111) (さらにバグが含まれている可能性があります)

  • [x] OCR エンジン プロセスがバックグラウンドに常駐するモードを追加しました。これにより、クリップボード認識などの断片的なタスクの起動時間が大幅に短縮されます。
  • [x] OCR エンジン プロセスのメモリ使用量を監視し、いつでもプロセスを強制停止します。
  • [ ] CPU 命令セットに互換性があるかどうかを自動的に検出します。
  • [ ] Windows 言語の互換性を自動的に検出します。
  • [ ] 組み込みのスクリーンショット。
  • [ ] はシステム トレイに最小化できます。

絵を描いたケーキ (私の生涯で)

詳細を展開
  • 画像の名前を変更します。
  • 初期化速度を向上させます。
  • プリセットを保存する領域は無視してください。
  • オフライン OCR モジュールのサイズを小さくします。
  • 組版の最適化: 同じ段落のあいまい一致、カスタムの段落方向。
  • エンジン Opencv のさまざまな地域言語 Windows への互換性を解決します。
  • オフライン OCR モジュール
    no_avx
    openblas
    バージョンが追加されました。
  • テキストエラー修正。

変更ログ

v1.2.6
2022.9.1
  • PaddleOCR-json モジュールを更新して
    v1.2.0
    、認識速度と精度を向上させます。
  • UI の調整: ドロップダウン ボックスで認識言語を切り替えると、より便利になります。
  • UI の調整: メイン ウィンドウ/タブのどこからでも写真をドラッグできます。
  • バグ修正: プログラムの堅牢性を向上させ、子プロセスを起動する際の例外処理を追加します。
  • バグ修正: エッジが狭すぎる画像の不正確な認識結果の問題 #7を完全に解決しました。
  • PP-OCRv3 モデルを最適化および適合させ、v3 バージョンのモデルが v2 バージョンの問題 #4よりも遅く、不正確であるという問題を完全に解決しました。
v1.2.5
2022.7.22
  • 新機能の追加: スケジュールされたタスク。画像認識が完了したら、自動シャットダウンなどのタスクを実行します。
  • 新機能の追加: オプションで、フォルダーにドラッグするときにサブフォルダー内のすべての画像を再帰的にインポートします。
  • UI の調整: 構成ファイルのショートカット エントリをいくつか追加します。
v1.2.4
2022.6.4
  • 新機能の追加: オプションで、クリップボード イメージが認識された後、認識されたテキストをコピーします。
  • 補助機能: ショートカット キーでクリップボードの画像認識を呼び出すと、プログラム ウィンドウが最小化されている場合、フォアグラウンド状態に戻り、最前面の位置に移動します。
v1.2.3
2022.5.31
  • 新しい機能を追加しました: クリップボードの画像を読み込みます。この機能を呼び出すグローバル ショートカット キーを構成します。
v1.2.2
2022.4.30
  • 新機能の追加: オプションのタスクが完了した後、出力ファイルまたはディレクトリを自動的に開きます。
v1.2.1
2022.4.16
  • PaddleOCR-json モジュールを に更新し
    v1.1.1
    、間違ったバウンディング ボックスを取得するバグを修正しました。
v1.2.0
2022.4.8
  • 必要に応じて、画像とテキストを含む Markdown スタイルの .md ファイルを生成します。これは、インデックスとして使用すると、より良いルック アンド フィールになります。もちろん、引き続きプレーン テキストの .txt ファイルを生成することもできます。
  • 設定パネルのスタイルを変更してパネルをスクロールし、より多くの設定オプションに対応します。
  • ユーザーが構成アイテムを変更すると、自動的に保存されます。
v1.1.1
2022.3.30
  • バグ修正: [Ignore Area Window] を終了するときに OCR サブプロセスが閉じられなかった。
v1.1.0
2022.3.30
  • 追加された新機能: [領域ウィンドウを無視] 認識されたテキスト ブロックを破線のボックスで表示します。
v1.0.0
2022.3.28
  • 「夢のはじまり」