セグメンテーション(画像処理) – ウィキペディア

before-content-x4

セグメンテーション デジタル画像処理とコンピュータービジョンのサブエリアです。隣接するピクセルまたはボクセルの要約による内容に関連する領域の生成は、セグメンテーションと呼ばれます。

after-content-x4

通常、セグメンテーションは、マシンが見ているプロセスにおける画像分析の最初のステップであり、画像処理後に行われます。したがって、プロセスはそうです

シーン→画像録音→処理前→セグメンテーション→特徴的な抽出→分類→ステートメント

エリアで

おお r d {displaystyle omega subset mathbb {r} ^{d}}

写真になりなさい

おお Mk {displaystyle ucolon omega to {mathcal {m}}^{k}}

寸法で

d n {displaystyle din mathbb {n}}}

色空間で

Mk {displaystyle {mathcal {m}}^{k}}

チャネルの数で

after-content-x4
k n {displaystyle kin mathbb {n}}

エリアの分解と同様に

同じ大きな長方形(ピクセル、

d = 2 {displaystyle d = 2}

)またはキューブ(ボクセル、

d = 3 {displaystyle d = 3}

)。関連する画像データには、すべてのピクセルまたはボクセルが一定の値を示しています

c Mk {displaystyle cin {mathcal {m}}^{k}}

d。 H.

u|Ωi= c {displaystyle left.uright | _ {omega _ {i}} = c}

。たとえば、グレースケールの写真で(

k = 初め {displaystyle k = 1}

)カラースペースには16ビットの色深度があります

Mk = { 0 2 16 初め } 初め {displaystyle {mathcal {m}}^{k} = {0、ldots、2^{16} -1}^{1}}

。セグメンテーションはイラストです

画像関連の決定基準に基づいて、各ピクセルまたはボクセルにクラス(またはラベル)を割り当てます。 [初め]

[ 編集 | ソーステキストを編集します ]

ラベル値を持つ単一のオブジェクトのセグメンテーション用

初め {displaystyle1}

該当する:

1つについて話します 完了 セグメンテーション各ピクセルに少なくとも1つのセグメントが割り当てられている場合。で 重複 セグメンテーションは、最大1つのセグメントで各ピクセルに割り当てられます。完全に したがって、すべてのピクセルは重複していないセグメンテーションです その通り セグメントに割り当てられます。セグメンテーションが呼び出されます 筋の通った 各セグメントがコヒーレント領域を形成する場合。

特に機械学習では、セグメンテーションのさまざまなカテゴリが考慮されています。

  • セマンティックセグメンテーション 写真は異なるクラスに分かれています。歩行者やサイクリストなどのクラスは、各ピクセルまたはデータポイントに割り当てられます。 [2]
  • インスタンスセグメンテーション 写真はさまざまなインスタンスに分かれています。インスタンスのすべてのピクセルには、個々の値が割り当てられます。たとえば、1つの写真に数人の歩行者が表示されている場合、誰もがインスタンスを表します。これにより、さまざまなインスタンスの区画と追跡とも呼ばれる時間的迫害が可能になります。 [3]
  • パノプティックセグメンテーション セマンティックとインスタンスのセグメンテーションを組み合わせて、すべてのピクセルにクラスとインスタンスが割り当てられます。これにより、個々のインスタンスをクラスに割り当てることができます。 [4]
  • Amodaleセグメンテーション いくつかのクラスまたはインスタンスをピクセルに割り当てることができるように考慮します。たとえば、サイクリストが覆っている歩行者も完全にラベル付けできます。 [5]

自動セグメンテーションの多くの手順が知られています。基本的に彼らはしばしば入っています ピクセル- レース 地域指向 分割された手順。さらに、区別が行われます モデルベース 特定の形式のオブジェクトを想定する手順と テキストターベース オブジェクトの内部均質な構造も考慮される手順。手順間の境界はしばしば流動的です。また、さまざまな方法を組み合わせて、より良い結果を達成することもできます。

代わりに、手動の手順でセグメンテーションを実行することもできます。つまり、人が部門を行います。自動プロセスは完璧とはほど遠いため、半自動処理の可能性もあります。

ピクセル指向の手順 [ 編集 | ソーステキストを編集します ]

ピクセル指向の手順は、特定のセグメントに属しているかどうかにかかわらず、個々のピクセルごとに決定を下します。この決定は、環境の影響を受けない場合があります。ポイント指向のメソッドは通常、計算が容易であるため、高速ですが、最初は一貫したセグメントを提供しません。個々のオブジェクトを二等式の画像でカウントできる場合、セグメンテーションについて話します。その後、すべてのセグメント化されたオブジェクトは次のとおりです
z。 B.バイナリピクセルの実行長コーディングによって記述されています。二価はセグメンテーションの予備段階です。

最も一般的な二等分化プロセスは、確かにしきい値プロセスです。この手順は、最適なしきい値に基づいています
ヒストグラムが決定されます。

しきい値90による二等分化後の画像

図では、背景は黒いオブジェクトよりも明るいです。最も単純な場合、平均から二等分化のしきい値が生じます
写真の中で最も暗く明るい灰色の値の。多くの場合、セグメンテーションは分類の予備段階です。

エッジ指向の手順 [ 編集 | ソーステキストを編集します ]

これらの手順では、画像はエッジまたはオブジェクトの移行を検索します。多くのアルゴリズムはまだ閉じたエッジトレインを提供していません。これは、最初にオブジェクトを含むようにさらなる手順でまとめなければなりません。実際、常にエッジがあります 写真のピクセル領域。アルゴリズムの結果は、ポリゴン(または線または特別なケースの曲線)である可能性がありますが、一部の操作は、異なる色のピクセルとしてエッジを提供します。 OPENCVソフトウェアを使用すると、各セグメント化されたオブジェクトは、周囲のポリゴン列車で記述されます。セグメンテーションは、画像を前景レベルとバックグラウンドレベルに分割するのにも役立ちます。

SobelオペレーターやLaplaceオペレーターなどの手順とグラデーション検索では、エッジに属するピクセルが見つかります。ただし、これらは通常依然として緩んでおり、エッジ追跡アルゴリズムで完了する必要があります。コヒーレントオブジェクトのシルエットまたは少なくともエッジピクセルからのエッジトレインから生産するための一般的な手順は、E。モーテンセン、W.A。バレット、J。K。ウドゥパによるライブワイヤ手順です。このアイデアは、スタートアップから目的地までの最適なパスを決定するナビゲーションシステムに明確に話すことができます。セグメンテーションのコンテキストでは、最適なことは、スタートと終了の間のパスが常に最強のエッジピクセルにつながることを意味します。最適なパスを選択することは、コンピューターサイエンスの標準的な問題であり、たとえば幅の検索で解決できます。

グレースケール値が異なる2つの隣接する領域の間には常にエッジがあります。エッジは、画像の不連続な(中断された)ローカル機能と見なすことができます。この不連続性を使用してエッジを識別し、したがってオブジェクトの制限を定義できます。これは、特定の画像に存在するいくつかのオブジェクトの形式を識別するのに役立ちます。これはいくつかのステップで起こります:

  • 折り畳みマトリックス(フィルターコアとも呼ばれます)が定義されています
  • フィルターは写真の上部に配置されています
  • 乗算の要素が実行されます
  • 折りたたみマトリックスは、選択したステップごとに移動されます
  • 入力のすべてのピクセルが使用されるまで折り目を実行します

折り畳みマトリックスの値は、折りたたみの出力を定義します。このような折り畳みマトリックスはSOBEL演算子であり、通常、エッジの検出に使用されます。 Sobelオペレーターには、水平エッジをキャプチャするための2つの折りたたみマトリックス1つと、垂直エッジをキャプチャするための別の折りたたみがあります。エッジ検出は、指定された画像を介してこれらのフィルターを送信することにより機能します。 [6]

また、非常によく知られているプロセスは、グレースケールの画像で機能し、常に閉じたエッジ列車を提供するウォーター離婚の変革です。さらなる手順は、並列および連続エッジ抽出、最適な食堂検索、Felzenswalb-Huttenlocherアルゴリズム、アクティブな形状モデル、ヘビです。

地域指向の手順 [ 編集 | ソーステキストを編集します ]

さまざまなオブジェクトをセグメント化する簡単な方法は、ピクセル値を使用することです。オブジェクトの間にシャープなコントラストがある場合、オブジェクトと背景のピクセル値は異なります。この場合、しきい値を設定できます。このしきい値を超えるピクセル値は、それに応じてオブジェクトまたは背景として分類できます。この手法は次のとおりです しきい値 専用。画像を2つの領域(オブジェクトと背景)に分割する場合、単一のしきい値を持つことができます。 グローバル しきい値を定義します。背景以外にいくつかのオブジェクトがある場合、いくつかのしきい値を定義する必要があります。これらのしきい値値は次のとおりです 地元 説明されたしきい値。

zの場合。 B.ピクセル値はしきい値を上回っており、この例ではオブジェクトは背景よりも軽量で、ピクセルは特定のオブジェクトに属します。ピクセル値がしきい値よりも小さい場合、オブジェクトよりも暗いため、背景として扱われます。割り当ては、どのオブジェクトと背景(明るいか暗いか?)とは何ですか?もちろん、画像コンテンツに依存します。この方法の利点は、計算が単純で、迅速に計算できることです。オブジェクトと背景のコントラストが高い場合、この方法は非常にうまく機能します。ただし、このアプローチにはいくつかの制限があります。重要なグレースケールの違いや異なるオブジェクトの輝度値がオーバーラップされていない場合、オブジェクトにピクセルを割り当てることは非常に困難です。 [6]

地域指向の手順では、ポイント量全体を考慮しているため、コヒーレントオブジェクトを見つけようとします。地域の成長、地域の分割、ピラミッドのリンクと分割とマージなど、頻繁に使用できます。

写真はピクセルのマトリックスとして理解することはできませんが、たとえば、色空間のユニットの正方形を描いている一定の関数として理解されます(例:

0 [ 0 ; 初め ] 2 r {displaystyle u_ {0}:[0; 1]^{2} rightArrow mathbb {r}}

グレースケールの写真の場合)。

エネルギー方法 画像のすべての可能なセグメンテーションの実際のエネルギー値を注文し、このエネルギー関数の最小値を探します。これはセグメンテーションの下で

{displaystyleu}

均一な(しばしば一定の)色の強さの領域が理解されている絵、領域間で多くの分離があります

c {displaystyle c}

。アプリケーションの分野に応じて、異なるエネルギーを使用できます。主に入ります:

  • セグメンテーションと元の画像の違い、例えばB.
  • エッジの長さの尺度
  • セグメンテーション領域が一定の強度を持つ必要がない場合:

可能なソリューション手順は次のとおりです。

  • グラフカット手順 それは連続モデルから生じるが、それでも離散アルゴリズムをもたらし、
  • バリエーション方法 部分微分方程式の解としてエネルギー関数の降下を達成します。

前者は現在、リアルタイム(30 fps)で小さな写真のために実行されていますが、最大のピクセル精度を提供します。一方、バリエーションアプローチは、サブピクセルの精度も可能にします。これは、斜めのエッジで特に役立ちます。これは、個別の方法の場合、バリエーションアプローチで避ける階段効果が常に生成されるためです。現在、グラフィックカードのプロセッサのバリエーション(グラフィック処理装置、GPU)のバリエーションを解決するための方法が研究されています。 5〜40の係数の速度の利点が予測されているため、バリエーションがはるかに速くなります。

継続的な方法は、2002年頃から目に見える成功を収めて研究されているため、エンドユーザーソフトウェアではまだ見つかりません。

クラスタープロセス [ 編集 | ソーステキストを編集します ]

実行後の画像 k -K = 16の産科アルゴリズム。大きな画像のパフォーマンスを改善するための一般的な技術は、画像を計算し、クラスターを計算し、必要に応じてより大きな画像に値を割り当てることであることに注意してください。

k -meansアルゴリズムは、写真が k クラスターは分割されています。基本的なアルゴリズムには、次の手順があります。

  1. 選ぶ k ランダムまたはヒューリスティックな方法に基づくクラスターセンター
  2. 写真内のすべてのピクセルは、ピクセルとクラスター中心の間の距離を最小限に抑えるクラスターへの方法
  3. クラスター内のすべてのピクセルを平均することにより、クラスターセンターをもう一度計算します
  4. 収束に達するまで手順2と3を繰り返します。 H.クラスターを変更するピクセルはありません

この場合、距離はピクセルとクラスター中心の正方形または絶対的な差です。違いは通常、ピクセル塗料、強度、テクスチャ、場所、またはこれらの要因の加重組み合わせに基づいています。 k ランダムに、またはヒューリスティックによって手動で、ランダムに選択できます。このアルゴリズムは常に収束しますが、常に最適なソリューションを返すとは限りません。ソリューションの品質は、クラスターの初期量との値に依存します k ab。

モデルベースの手順 [ 編集 | ソーステキストを編集します ]

探しているオブジェクトのモデルが使用されます。これは、たとえばフォームに影響を与える可能性があります。そのため、写真に関する知識を使用します。よく知られている手順は、ハフ変換であり、パラメータールームにそれらを描くことで、ラインまたはサークルにポイントを配置できます。テンプレートを介した統計モデルとセグメンテーション(テンプレートマッチング)も使用されます。後者の手順では、写真は写真で検索されます。

テクスチャ指向の手順 [ 編集 | ソーステキストを編集します ]

一部の画像オブジェクトは均一な色ではなく、均一なテクスチャーを持っています。たとえば、オブジェクトには溝を持つことができます。これは、写真では、暗い色と明るい色の交互のストライプとして表示されます。これらのオブジェクトがテクスチャに基づいて多くの小さなオブジェクトに分解されないように、この問題を満たすためにアプローチを使用します。これらの方法は、分類または同時セグメンテーションと分類を可能にするために、一部は境界エリアにあります。

  • CoccurrenceMatrices(Haralick Matrices)
  • Texturenergiemaße(テクスチャエネルギー測定)
  • 実行されている長さの行列(run-lensh-matrix)
  • フラクタルの寸法と寸法
  • Markow-Random-FieldsとGibbsの可能性
  • 構造的アプローチ
  • 信号理論的概念

セグメンテーションの品質は、多くの場合、最適ではありません。これらの場合、より良い手順を選択することも、事前処理を使用して結果を最適化することもできます(また 前処理 )またはフォローアップ。どちらも自動的に実行できます(プロセスの問題を既に特定している場合)と手作業です。

多くのセグメンテーションアルゴリズムの問​​題の1つは、画像内の照明の変更に対する感受性です。これは、写真の一部のみが正しく知覚されるという事実につながる可能性がありますが、画像の他の部分ではセグメンテーションは使用できません。たとえば、シェーディング補正を使用して、透明度の違いは、前処理で補償することができます。

頻繁な問題は、たとえば、終了(セグメントが多すぎる)とその後の施設(セグメントが少なすぎる)です。これは、処理されるデータの知識の手順を強化することで対抗できます。最も簡単な場合、予想されるセグメント数を指定できます。また、その後の分類ステップを挿入して、分類されたセグメントを要約することもできます。もちろん、セグメントは手で要約することもできます。

提示されたアルゴリズムの多く(しきい値プロセス、水鞘の変換)は、単一チャネルグレースケール画像でのみ機能します。マルチチャネル画像(カラー画像など)を処理すると、情報は未使用のままでした。いくつかの単一チャネルセグメンテーションを要約するには、さらに処理手順が必要です。

セグメント化および分類された左のヒト大腿骨のモデル。外面(赤)、コンパクトとスポンジオサ(緑)の間の界面、およびSpongiosaと骨髄(青)の間の界面を示しています。

多くの場合、セグメンテーションは、データの後続の処理、たとえば分類のための画像分析の最初のステップです。

このような手順のアプリケーションは多様です。自動セグメンテーションは現在、薬物、たとえばコンピューター断層撮影や磁気共鳴画像法などで最も一般的です。セグメンテーションは、ジオダタ処理でも使用されます。たとえば、衛星画像や航空写真(リモート感覚を参照)が幾何学的なデータをセグメント化します。セグメンテーションは、ワークピースの自動光学品質制御にも使用されます(たとえば、ボアホールは適切な場所にありますか?)。書面でのセグメンテーション(OCR)は、スキャンされた画像を二等にすることにより、背景から書き込みを分離するためにも使用されます。
別のトピックは顔の認識です。

画像処理プログラム [ 編集 | ソーステキストを編集します ]

無料のScikit画像などの画像処理プログラム [7] さまざまなセグメンテーションアルゴリズムに基づいて、セグメンテーションアルゴリズムと「より高い」画像処理アルゴリズムを提供します。これらのプログラムを使用すると、たとえばロボットアプリケーションでオブジェクトの位置を決定できます(画像処理を参照)。

画像編集プログラム [ 編集 | ソーステキストを編集します ]

Free GimpやFree Irfanviewなどの多くの画像編集プログラムは、しきい値プロセスやSOBELまたはLAPLACEオペレーターによるエッジ検出など、簡単なセグメンテーションアルゴリズムを提供します。

執筆と特別なソフトウェア [ 編集 | ソーステキストを編集します ]

最初のステップでは、セグメンテーションを使用して、最初のステップとしてフォントを背景から分離できます。

画像のセグメンテーションのための特別なソフトウェアでは、医学と地理情報学も一般的なターゲット領域です。

  • ラファエルC.ゴンザレス、リチャードE.ウッズ: デジタル画像処理 。 Addison-Wesley、Redding 1992、ISBN 0-201-50803-6。 (英語)
  • レイナースタインブレヒャー: 実際の画像処理 。 Oldenbourg、Munich and Vienna 1993、ISBN 3-486-22372-0。
  • ThomasBräunl、Stefan Feyrer、Wolfgang Rapf、Michael Reinhardt: 並列画像処理 。 Addison-Wesley、Bonn 1995、ISBN 3-89319-951-9。
  • トーマス・レーマン、ウォルター・オーバーシェルプ、エーリッヒ・ペリカン、ルドルフの黙示録: 薬の画像処理 。 Springer、Berlin and Heidelberg 1997、ISBN 3-540-61458-3。
  • BerndJähne: デジタル画像処理 。第5版。 Springer、Berlin 2002、ISBN 3-540-41260-3。
  1. フィリップD.Lösel: 生物医学画像データのセグメンテーションのためのGPUベースの手順。 (PDF)ハイデルベルク大学、22。2022年4月、 S. 1–2 2022年9月9日にアクセス
  2. マリウス・コード、モハメド・オムラン、セバスチャン・ラモス、ティモ・レーフェルド、マルクス・エンツワイラー、ロドリゴ・ベネンソン、ウエ・フランケ、ステファン・ロス、ベルント・シーレ: セマンティックな都市シーンの理解のためのCityscapesデータセット 。 2016、 S. 3213–3223 theanvf.com [2023年2月1日にアクセス])。
  3. Abdul Mueed Hafiz、Ghulam Mohiuddin Bhat: インスタンスセグメンテーションに関する調査:最先端 。の: マルチメディア情報検索の国際ジャーナル バンド 9 いいえ。 3 、1。2020年9月、ISSN 2192-662X S. 171–189 、doi: 10.1007/s13735-020-00195-x springer.com [2023年2月1日にアクセス])。
  4. アレクサンダー・キリロフ、カイミング・彼、ロス・ギルシック、カルステン・ロザー、ピオトル・ダラー: パノプティックセグメンテーション 。 2019、 S. 9404–9413 theanvf.com [2023年2月1日にアクセス])。
  5. ジャスミンブライテンシュタイン、ティムフィングスチェイド: Amodal Cityscapes:新しいデータセット、その生成、およびAmodalセマンティックセグメンテーションチャレンジベースライン 。の: 2022 IEEEインテリジェントビークルシンポジウム(IV) 。 2022年6月、 S. 1018–1025 、doi: 10.1109/IV51971.2022.9827342 IEEE.org [2023年2月1日にアクセス])。
  6. a b Pulkit Sharma、Analytics Vidhya: コンピュータービジョンチュートリアル:画像セグメンテーション技術の段階的な紹介(パート1)
  7. scikit-image.org: モジュール:セグメンテーション – スキメージドキュメント。 2018年9月8日にアクセス (英語)。
after-content-x4