オブジェクト認識 – ウィキペディア

before-content-x4

OPENCVソフトウェアを使用した自動オブジェクト検出。この目的のために、以前にCOCOデータセットで訓練されていたYolov3モデルが招待され、80の異なるオブジェクトを識別できます。

オブジェクト認識 画像処理またはコンピューターベースのビジョンのサブエリアであり、写真で個々のオブジェクトを識別しようとします。画像は、賢明なユニットを形成する領域に分割され、その後、オブジェクトのクラスの画像領域を割り当てることができるように特性についてさらに調べます。予備的なオブジェクト認識は通常、このスキームに従って期限切れになります。補助金の小さい画像セクション(ウィンドウ)固定サイズの写真を補助してから、このウィンドウに分類アルゴリズムを適用します。 [初め]

after-content-x4

私たち人間にとっては比較的簡単ですが、例えばB.プードルまたはドイツの羊飼い、抽象カテゴリ、この場合は犬のカテゴリーでは、これをコンピューターに教えることは非常に困難です。より多くのクラスがオブジェクトによって識別されます。それがあなたが私を回す理由です。 d。 R.画像上の特定のアルゴリズム、z。 B.顔のみを認識できます。 [2]

抽象画像処理では、オブジェクト検出方法は、特定のオブジェクトまたはパターンを他のオブジェクトと区別するのに役立ちます。これを行うには、実際のオブジェクトを最初に数学的に説明する必要があります。エッジ認識、変換、サイズと色の検出がよく使用されます。オブジェクトの説明がより正確に可能であり、より評価可能な情報が利用可能なほど、オブジェクト認識がより信頼性が高くなります。

機械学習や深い学習ベースのアプローチなど、オブジェクト認識のより複雑な方法は、人工知能の分野から生まれます。機械学習へのアプローチについては、最初に機能を次の方法のいずれかで定義し、次に分類にサポートベクターマシン(SVM)などのテクノロジーを使用する必要があります。

機械学習からのアプローチ:

一方、深い学習手法は、特定の特性を事前に定義することなく、オブジェクト認識を実行することができます。これらの手法は、通常、畳み込みニューラルネットワーク(CNN)に基づいています。このような人工ニューラルネットワークは、事前に訓練する必要があります。これには、大量の写真が必要です。トレーニングに使用されるこれらの画像は、事前に何らかの形で分類されている必要があります。したがって、写真に示されているものについての情報が必要です。この目的のために、などの特別なデータベースB. ImagenetまたはCOCOデータセット [3]

ディープラーニングアプローチ: [4]

after-content-x4
  • 地域の提案(R-CNN、高速R-CNN、より高速なR-CNN [5] )およびそれに基づいて検出 [6]
  • シングルショットマルチボックス検出器(SSD) [7] 、1つのステップ検出戦略を備えています。
  • あなたは一度だけ見る(ヨロ) [8] [9] 、1つのステップ検出戦略を備えています。

1つの段階検出戦略とは、分析する画像を1回読み取る必要があることを意味します。 2020年初頭の最速のアプローチはYolov5で、同じ年にのみ公開されました。シンプルなオープンソースソリューションは、その使用に利用できます [十] 。これらは、次のアプローチに基づいています。COCOデータベースからのデータレコードが多数あるため、人工ニューロンネットワークが広範囲に訓練されました。この準備が整ったネットワークはファイルとして利用可能であり、ローカルにインストールされたソフトウェアOpenCVの「ディープニューラルネットワークモジュール(DNN)」のメソッドとともに使用して、画像またはビデオシーケンスをリアルタイムで調べることができます。調べる画像資料では、「訓練された」オブジェクトが認識されます。

産業用アプリケーション [ 編集 | ソーステキストを編集します ]

たとえば、複雑な製造プロセスには、オブジェクトの検出が必要です。多くの場合、オブジェクトの形式の一致は、仕様で決定されます( テンプレートマッチング )、または組み立てラインでテストされた同じテストの正しい場所。光学センサーに加えて、誘導性、容量性、または磁気センサーを使用することもできます。これに関連して、感覚灌流についても語っています。

さらに、品質保証におけるオブジェクト認識は、完全性テストに使用されます。

ドライバーアシスタンスシステム [ 編集 | ソーステキストを編集します ]

赤または青のデザインで利用できるラベルは、すでにシンプルなカラーセンサーで区別できます。ただし、フォントが赤いラベルに適用されているかどうかも認識される場合は、通常、対応するカメラを使用する必要があります。

車両では、カメラベースのドライバーアシスタンスシステムを使用して、交通標識または車線を自動的に検出します。交通標識の検出は、円形のオブジェクトを検索します。その後、赤い境界線は禁止兆候を示します。あるいは、よく知られている文字のパターンとのみ比較できます( テンプレートマッチング )。

オブジェクト認識のより複雑な形式は、1つの写真でオブジェクトを回転または迅速に移動する必要がある場合に使用されます。次に、数学的な相関者が使用されます。これは、次のようなオブジェクトに適応できます。 B.ヘリコプターでは、その位置は複雑な背景に対して決定する必要があります。適切な画像処理システムを使用して、基礎となる画像のピクセル解像度の下のオブジェクトを決定できます。

農業 [ 編集 | ソーステキストを編集します ]

Plantixアプリの助けを借りて、人工ニューロンネットワークで動作する植物の病気を認識できます。 [11]

  1. デビッド・A・フォーサイス、ジャン・ポンセ: コンピュータービジョン:現代的なアプローチ 。第2版​​。ピアソン、ボストン2012、ISBN 978-0-13-608592-8。
  2. リチャード・セリスキ: コンピュータービジョン:アルゴリズムとアプリケーション、第2版。 2022年9月25日にアクセス
  3. COCO – コンテキスト内の一般的なオブジェクト。 2019年1月29日にアクセス (英語)。
  4. エイドリアン・ローズブロック: opencvを使用したYoloオブジェクトの検出。 の: pyimagesearch。 12. 2018年11月、 2019年1月14日にアクセス (アメリカ英語)。
  5. Shaoqing Ren、Kaiming He、Ross Girshick、Jian Sun: より速いR-CNN:地域の提案ネットワークを使用したリアルタイムオブジェクト検出に向けて 。 4. 2015年6月、arxiv: 1506.01497 [abs]
  6. Detectron。 Facebookの調査、 2019年1月21日にアクセス (英語)。
  7. Wei Liu、Dragomir Anguelov、Dumitru Erhan、Christian Szegedy、Scott Reed: SSD:シングルショットマルチボックス検出器 バンド 9905 、2016、 S. 21–37 、doi: 10,1007/978-3-319-46448-0_2 、arxiv: 1512.02325 [abs]
  8. ジョセフ・レドモン、アリ・ファーハディ: Yolov3:増分改善 。 8. 2018年4月、Arxiv: 1804.02767 [abs]
  9. ジョセフ・チェット・レドモン: Yolo:リアルタイムオブジェクト検出。 2019年1月14日にアクセス
  10. ジェイコブ・ソラウェッツ: Yolov5 Newバージョン – 改善と評価。 29. 2020年6月、 2021年9月23日にアクセス (英語)。
  11. Plantixアプリは病気の植物を認識しています。 Wired、2017年3月31日、 2019年1月21日にアクセス

after-content-x4