PaddleOCR - PaddlePaddleに基づく素晴らしい多言語OCRツールキット(実用的な超軽量OCRシステム、80以上の言語認識をサポート、データ注釈および合成ツールを提供、サーバー、モバイル、組み込み、IoTデバイス間のトレーニングと展開をサポート)

(Awesome multilingual OCR toolkits based on PaddlePaddle (practical ultra lightweight OCR system, support 80+ languages recognition, provide data annotation and synthesis tools, support training and deployment among server, mobile, embedded and IoT devices))

Created at: 2020-05-08 18:38:16
Language: Python
License: Apache-2.0

英語|简体中文

序章

PaddleOCRは、ユーザーがより優れたモデルをトレーニングして実践するのに役立つ、多言語で素晴らしい、最先端の実用的なOCRツールを作成することを目的としています。

最近の更新

  • 🔥2022.5.9リリースPaddleOCRリリース/2.5

    • リリースPP-OCRv3:同等の速度で、PP-OCRv2と比較して中国語シーンの効果がさらに5%向上し、英語シーンの効果が11%向上し、80言語の多言語モデルの平均認識精度が向上します。 5%以上。
    • リリースPPOCRLabelv2:テーブル認識タスク、キー情報抽出タスク、および不規則なテキスト画像の注釈機能を追加します。
    • インタラクティブな電子書籍「DiveintoOCR」をリリースし、OCRフルスタックテクノロジーの最先端の理論とコードの実践について説明します。
  • 2021.12.21リリースPaddleOCRリリース/2.4

    • リリース1のテキスト検出アルゴリズム(PSENet)、3つのテキスト認識アルゴリズム(NRTRSEEDSAR)。
    • リリース1の主要情報抽出アルゴリズムSDMGRおよび3つのDocVQAアルゴリズム(LayoutLM、LayoutLMv2、LayoutXLM)。
  • 2021.9.7リリースPaddleOCRリリース/2.3

    • PP-OCRv2をリリースします。PP-OCRv2の推論速度は、CPUデバイスのPP-OCRサーバーの推論速度より220%高速です。PP-OCRv2のFスコアはPP-OCRモバイルのFスコアより7%高くなっています。
  • 2021.8.3リリースPaddleOCRリリース/2.2

    • 新しい構造化ドキュメント分析ツールキット、つまりPP-Structureをリリースし、レイアウト分析とテーブル認識をサポートします(チャート画像をExcelファイルにエクスポートするためのワンキー)。
  • もっと

特徴

PaddleOCRは、OCRに関連するさまざまな最先端のアルゴリズムをサポートし、これに基づいて産業用機能モデル/ソリューションPP-OCRおよびPP-Structureを開発し、データ生成、モデルトレーニング、圧縮、推論、および展開のプロセス全体を実行します。

ドキュメントチュートリアルの「クイックスタート」から始めることをお勧めします

クイックエクスペリエンス

電子書籍:OCRに飛び込む

コミュニティ👬

  • 国際的な開発者にとって、私たちはPaddleOCRディスカッションを私たちの国際的なコミュニティプラットフォームと見なしています。すべてのアイデアや質問はここで英語で話し合うことができます。

  • 中国の開発者の場合、Wechatで以下のQRコードをスキャンすると、公式のテクニカルディスカッショングループに参加できます。より豊富なコミュニティコンテンツについては、中文READMEを参照してください。ご参加をお待ちしております。

PP-OCRシリーズモデルリスト(9月8日更新)

モデル紹介 モデル名 おすすめシーン 検出モデル 方向分類子 認識モデル
中国語と英語の超軽量PP-OCRv3モデル(16.2M) ch_PP-OCRv3_xx モバイルとサーバー 推論モデル/トレーニング済みモデル 推論モデル/トレーニング済みモデル 推論モデル/トレーニング済みモデル
英語超軽量PP-OCRv3モデル(13.4M) en_PP-OCRv3_xx モバイルとサーバー 推論モデル/トレーニング済みモデル 推論モデル/トレーニング済みモデル 推論モデル/トレーニング済みモデル
中国語と英語の超軽量PP-OCRv2モデル(11.6M) ch_PP-OCRv2_xx モバイルとサーバー 推論モデル/トレーニング済みモデル 推論モデル/トレーニング済みモデル 推論モデル/トレーニング済みモデル
中国語と英語の超軽量PP-OCRモデル(9.4M) ch_ppocr_mobile_v2.0_xx モバイルとサーバー 推論モデル/トレーニング済みモデル 推論モデル/トレーニング済みモデル 推論モデル/トレーニング済みモデル
中国語と英語の一般的なPP-OCRモデル(143.4M) ch_ppocr_server_v2.0_xx サーバ 推論モデル/トレーニング済みモデル 推論モデル/トレーニング済みモデル 推論モデル/トレーニング済みモデル

チュートリアル

視覚化もっと

PP-OCRv3中国モデル
PP-OCRv3英語モデル
PP-OCRv3多言語モデル
PP-構造
  • レイアウト分析+テーブル認識
  • SER(セマンティックエンティティ認識)
  • RE(関係抽出)

新しい言語リクエストのガイドライン

新しい言語のサポートをリクエストする場合は、次の1つのファイルを含むPRが必要です。

  1. フォルダppocr/utils / dictで、このパスにdictテキストを送信し、
    {language}_dict.txt
    すべての文字のリストを含む名前を付ける必要があります。そのフォルダ内の他のファイルのフォーマット例を参照してください。

あなたの言語に独自の要素がある場合は、役立つリンクやウィキペディアなど、何らかの方法で事前に教えてください。

詳細については、多言語OCR開発計画を参照してください。

ライセンス

このプロジェクトはApache2.0ライセンスの下でリリースされています