ESP32は、画像フレームからラズベリーパイピコ、ポルテンタH7、Wioターミナルを分類します
ビデオから次のことがわかります。
時間。画像フレームの場合、デジタル信号処理(DSP)ベースの特徴抽出時間は≈12ms、分類時間は≈ <20μs(DSPの1/1000)です。
FPS.これは 1000/12 ミリ秒 = 83.3 FPS で、TinyML-CAM システムが HOG 特徴抽出 (DSP を使用) と分類に要する時間です。ESP32のフレームレートは30FPSであるため、フレームをキャプチャするだけで、1000/30 = 33ミリ秒かかります。DSPと分類時間は≈わずか12ミリ秒であるため、画像認識は2つの連続するフレーム間でリアルタイムで行われ、ESP32カメラのFPSは変更されません。
精度。ペアプロット解析で予想されたように、Portenta と Pi (フィーチャが重複している) のラベルが誤って表示されることがよくありますが、データセットの品質を向上させることで修正できます。
記憶。消費するRAMはわずか1kBで、TinyML-CAM画像認識システムを追加する前後のArduino IDEによって計算されたRAMの差です。
https://dl.acm.org/doi/pdf/10.1145/3495243.3558264
フレームレートを向上させる数学的近似法を実装することにより、DSP時間(現在は12ミリ秒)を短縮するには、つまり、6ミリ秒に短縮すると、1000/6ミリ秒= 166.6FPSになります。
TinyMLベンチマークと同様に、さまざまなデータセット、MLアルゴリズム、IoTボードでパイプラインをテストする予定です。