Kameraresektion – Wikipedia

Resektion der Kamera ist der Prozess des Schätzens der Parameter eines Lochkameramodells, das sich der Kamera annähert, die ein bestimmtes Foto oder Video erzeugt hat. Normalerweise werden die Lochkameraparameter in einer 3 × 4-Matrix dargestellt, die als Kameramatrix bezeichnet wird.

Dieser Prozess wird oft genannt geometrische Kamerakalibrierung oder einfach KamerakalibrierungDieser Begriff kann sich jedoch auch auf die photometrische Kamerakalibrierung beziehen.

Definitionen[edit]

Resektion der Kamera bestimmt, welches einfallende Licht jedem Pixel auf dem resultierenden Bild zugeordnet ist. In einer idealen Lochkamera reicht dazu eine einfache Projektionsmatrix aus. Bei komplexeren Kamerasystemen können Fehler aufgrund von falsch ausgerichteten Linsen und Verformungen in ihren Strukturen zu komplexeren Verzerrungen im endgültigen Bild führen.

Die Kameraprojektionsmatrix wird aus den intrinsischen und extrinsischen Parametern der Kamera abgeleitet und häufig durch die Reihe von Transformationen dargestellt. B. eine Matrix von kameraeigenen Parametern, eine 3 × 3-Rotationsmatrix und einen Translationsvektor. Die Kameraprojektionsmatrix kann verwendet werden, um Punkte im Bildraum einer Kamera mit Orten im 3D-Weltraum zu verknüpfen.

Die Kameraresektion wird häufig bei der Anwendung von Stereovision verwendet, bei der die Kameraprojektionsmatrizen von zwei Kameras verwendet werden, um die 3D-Weltkoordinaten eines Punkts zu berechnen, der von beiden Kameras betrachtet wird.

Manche Leute nennen das KamerakalibrierungViele beschränken jedoch den Begriff Kamerakalibrierung nur für die Schätzung interner oder intrinsischer Parameter.

Homogene Koordinaten[edit]

In diesem Zusammenhang verwenden wir

[u v 1]T.{ displaystyle [u v 1]^ {T}}

um eine 2D-Punktposition in darzustellen Pixel Koordinaten und

[xw yw zw 1]T.{ displaystyle [x_{w} y_{w} z_{w} 1]^ {T}}

wird verwendet, um eine 3D-Punktposition in darzustellen Welt Koordinaten. In beiden Fällen werden sie in homogenen Koordinaten dargestellt (dh sie haben eine zusätzliche letzte Komponente, die anfänglich gemäß Konvention eine 1 ist), was die häufigste Notation in der Robotik und bei Starrkörper-Transformationen ist.

Projektion[edit]

Bezugnehmend auf das Lochkameramodell eine Kameramatrix

M.{ displaystyle M}

wird verwendet, um eine projektive Zuordnung von zu bezeichnen Welt Koordinaten zu Pixel Koordinaten.

wo

M.=K.[RT]{ displaystyle M = K , { begin {bmatrix} R & T end {bmatrix}}}

.

Eigenparameter[edit]

Die intrinsische Matrix

K.{ displaystyle K}

enthält 5 intrinsische Parameter des spezifischen Kameramodells. Diese Parameter umfassen Brennweite, Bildsensorformat und Hauptpunkt. Die Parameter

αx=fmx{ displaystyle alpha _ {x} = f cdot m_ {x}}

und

αy=fmy{ displaystyle alpha _ {y} = f cdot m_ {y}}

stellen die Brennweite in Pixel dar, wobei

mx{ displaystyle m_ {x}}

und

my{ displaystyle m_ {y}}

sind die Umkehrungen der Breite und Höhe eines Pixels auf der Projektionsebene und

f{ displaystyle f}

ist die Brennweite in Bezug auf die Entfernung.
[1]

γ{ displaystyle gamma}

stellt den Versatzkoeffizienten zwischen der x- und der y-Achse dar und ist häufig 0.

u0{ displaystyle u_ {0}}

und

v0{ displaystyle v_ {0}}

stellen den Hauptpunkt dar, der sich idealerweise in der Bildmitte befindet.

Nichtlineare intrinsische Parameter wie Linsenverzerrung sind ebenfalls wichtig, obwohl sie nicht in das durch die intrinsische Parametermatrix beschriebene lineare Kameramodell aufgenommen werden können. Viele moderne Kamerakalibrierungsalgorithmen schätzen diese intrinsischen Parameter auch in Form nichtlinearer Optimierungstechniken. Dies erfolgt in Form einer Optimierung der Kamera- und Verzerrungsparameter in Form einer sogenannten Bündeleinstellung.

Extrinsische Parameter[edit]

[R3×3T3×101×31]4×4{ displaystyle {} { begin {bmatrix} R_ {3 times 3} & T_ {3 times 1} \ 0_ {1 times 3} & 1 end {bmatrix}} _ {4 times 4}}

R.,T.{ displaystyle R, T}

sind die extrinsische Parameter die die Koordinatensystemtransformationen von 3D-Weltkoordinaten zu 3D-Kamerakoordinaten bezeichnen. Entsprechend definieren die extrinsischen Parameter die Position des Kamerazentrums und die Richtung der Kamera in Weltkoordinaten.

T.{ displaystyle T}

ist die Position des Ursprungs des Weltkoordinatensystems, ausgedrückt in Koordinaten des kamerazentrierten Koordinatensystems.

T.{ displaystyle T}

wird oft fälschlicherweise als Position der Kamera angesehen. Die Position,

C.{ displaystyle C}

, der Kamera in Weltkoordinaten ausgedrückt ist

C.=– –R.– –1T.=– –R.T.T.{ displaystyle C = -R ^ {- 1} T = -R ^ {T} T}

(schon seit

R.{ displaystyle R}

ist eine Rotationsmatrix).

Die Kamerakalibrierung wird häufig in einem frühen Stadium der Bildverarbeitung eingesetzt.

Wenn eine Kamera verwendet wird, wird Licht aus der Umgebung auf eine Bildebene fokussiert und erfasst. Dieser Vorgang reduziert die Abmessungen der von der Kamera aufgenommenen Daten von drei auf zwei (Licht aus einer 3D-Szene wird auf einem 2D-Bild gespeichert). Jedes Pixel in der Bildebene entspricht daher einem Lichtstrahl aus der Originalszene.

Algorithmen[edit]

Es gibt viele verschiedene Ansätze, um die intrinsischen und extrinsischen Parameter für ein bestimmtes Kamera-Setup zu berechnen. Die häufigsten sind:

  1. DLT-Methode (Direct Linear Transformation)
  2. Zhangs Methode
  3. Tsais Methode
  4. Selbys Methode (für Röntgenkameras)

Zhangs Methode[edit]

Zhang Modell [2][3] ist eine Kamerakalibrierungsmethode, die herkömmliche Kalibrierungstechniken (bekannte Kalibrierungspunkte) und Selbstkalibrierungstechniken (Entsprechung zwischen den Kalibrierungspunkten, wenn sie sich an verschiedenen Positionen befinden) verwendet. Um eine vollständige Kalibrierung nach der Zhang-Methode durchzuführen, sind mindestens drei verschiedene Bilder des Kalibrierungsziels / Messgeräts erforderlich, entweder durch Bewegen des Messgeräts oder der Kamera selbst. Wenn einige der intrinsischen Parameter als Daten angegeben werden (Orthogonalität des Bildes oder Koordinaten des optischen Zentrums), kann die Anzahl der erforderlichen Bilder auf zwei reduziert werden.

In einem ersten Schritt eine Annäherung an die geschätzte Projektionsmatrix

H.{ displaystyle H}

zwischen dem Kalibrierungsziel und der Bildebene wird unter Verwendung der DLT-Methode bestimmt.[4] Anschließend werden Selbstkalibrierungstechniken angewendet, um das Bild der absoluten konischen Matrix zu erhalten [Link]. Der Hauptbeitrag der Zhang-Methode besteht darin, ein eingeschränktes Instrument zu extrahieren

K.{ displaystyle K}

und

n{ displaystyle n}

Anzahl von

R.{ displaystyle R}

und

T.{ displaystyle T}

Kalibrierungsparameter von

n{ displaystyle n}

Pose des Kalibrierziels.

Ableitung[edit]

Angenommen, wir haben eine Homographie

H.{ displaystyle { textbf {H}}}

das kartiert Punkte

xπ{ displaystyle x _ { pi}}

auf einer „Sondenebene“

π{ displaystyle pi}

zu Punkten

x{ displaystyle x}

auf dem Bild.

Die kreisförmigen Punkte

ich,J.=[1±j0]T.{ displaystyle I, J = { begin {bmatrix} 1 & pm j & 0 end {bmatrix}} ^ { mathrm {T}}}

liegen auf unserer beiden Sondenebene

π{ displaystyle pi}

und auf dem absoluten Kegel

Ω{ displaystyle Omega _ { infty}}

. Liegen auf

Ω{ displaystyle Omega _ { infty}}

bedeutet natürlich, dass sie auch auf die projiziert werden Bild des absoluten Kegels (IAC)

ω{ displaystyle omega}

also

x1T.ωx1=0{ displaystyle x_ {1} ^ {T} omega x_ {1} = 0}

und

x2T.ωx2=0{ displaystyle x_ {2} ^ {T} omega x_ {2} = 0}

. Die Kreispunkte projizieren als

Wir können tatsächlich ignorieren

x2{ displaystyle x_ {2}}

während wir unseren neuen Ausdruck für ersetzen

x1{ displaystyle x_ {1}}

wie folgt:

Tsais Algorithmus[edit]

Es handelt sich um einen zweistufigen Algorithmus, der die Pose (3D-Ausrichtung sowie Verschiebung der x- und y-Achse) in der ersten Stufe berechnet. In der zweiten Stufe werden die Brennweite, die Verzerrungskoeffizienten und die Translation der Z-Achse berechnet.[5]

Selbys Methode (für Röntgenkameras)[edit]

Selbys Kamerakalibrierungsmethode[6] befasst sich mit der automatischen Kalibrierung von Röntgenkamerasystemen. Röntgenkamerasysteme, bestehend aus der Röntgenerzeugungsröhre und einem Festkörperdetektor, können als Lochkamerasysteme modelliert werden, die 9 intrinsische und extrinsische Kameraparameter umfassen. Die intensitätsbasierte Registrierung basierend auf einem beliebigen Röntgenbild und einem Referenzmodell (als tomographischer Datensatz) kann dann verwendet werden, um die relativen Kameraparameter zu bestimmen, ohne dass ein spezieller Kalibrierungskörper oder Grundwahrheitsdaten erforderlich sind.

Siehe auch[edit]

Verweise[edit]

  1. ^ Richard Hartley und Andrew Zisserman (2003). Geometrie mit mehreren Ansichten in Computer Vision. Cambridge University Press. S. 155–157. ISBN 0-521-54051-8.
  2. ^ Z. Zhang, „Eine flexible neue Technik zur Kamerakalibrierung“, IEEE Transactions on Pattern Analysis and Machine Intelligence, Band 22, Nr. 11, Seiten 1330–1334, 2000
  3. ^ P. Sturm und S. Maybank, „Zur ebenenbasierten Kamerakalibrierung: ein allgemeiner Algorithmus, Singularitäten, Anwendungen“, In Proceedings der IEEE-Konferenz über Computer Vision und Mustererkennung (CVPR), Seiten 432–437, Fort Collins, CO, USA, Juni 1999
  4. ^ Abdel-Aziz, YI, Karara, HM „Direkte lineare Transformation von Komparatorkoordinaten in Objektraumkoordinaten in der Nahbereichsphotogrammetrie„, Proceedings of the Symposium on Close-Range Photogrammetry (S. 1-18), Falls Church, VA: Amerikanische Gesellschaft für Photogrammetrie, (1971)
  5. ^ Roger Y. Tsai, „Eine vielseitige Kamerakalibrierung für hochgenaue 3D-Bildverarbeitungsmessung mit handelsüblichen Fernsehkameras und Objektiven“, IEEE Journal of Robotics and Automation. RA-3, Nr. 4, August 1987
  6. ^ Boris Peter Selby et al., „Patientenpositionierung mit Selbstkalibrierung des Röntgendetektors für die bildgeführte Therapie“, Australasian Physical & Engineering Science in Medicine, Band 34, Nr. 3, Seiten 391–400, 2011

Externe Links[edit]