Analyse von Videoinhalten – Wikipedia

Analyse von Videoinhalten (ebenfalls Analyse von Videoinhalten, VCA) oder Videoanalyse ((VA) ist die Fähigkeit, Videos automatisch zu analysieren, um zeitliche und räumliche Ereignisse zu erkennen und zu bestimmen.

Diese technische Fähigkeit wird in einer Vielzahl von Bereichen eingesetzt, einschließlich Unterhaltung,[1]Videoabruf und Video-Browsing,[2] Gesundheitswesen, Einzelhandel, Automobil, Transport, Hausautomation, Flammen- und Raucherkennung, Sicherheit.[3] Die Algorithmen können als Software auf Allzweckmaschinen oder als Hardware in speziellen Videoverarbeitungseinheiten implementiert werden.

In VCA können viele verschiedene Funktionen implementiert werden. Die Video-Bewegungserkennung ist eine der einfacheren Formen, bei denen Bewegungen in Bezug auf eine feste Hintergrundszene erkannt werden. Zu den erweiterten Funktionen gehören Video-Tracking und Egomotion-Schätzung.

Basierend auf der internen Darstellung, die VCA in der Maschine generiert, ist es möglich, andere Funktionen wie Identifikation, Verhaltensanalyse oder andere Formen des Situationsbewusstseins aufzubauen.

VCA setzt auf gutes Eingangsvideo und wird daher häufig mit Videoverbesserungstechnologien wie Videoentrauschung, Bildstabilisierung, unscharfer Maskierung und Superauflösung kombiniert.

Funktionen[edit]

Mehrere Artikel bieten einen Überblick über die Module, die an der Entwicklung von Videoanalyseanwendungen beteiligt sind.[4][5]

Dies ist eine Liste bekannter Funktionen und eine kurze Beschreibung.

Funktion Beschreibung
Dynamische Maskierung Blockieren eines Teils des Videosignals basierend auf dem Signal selbst, beispielsweise aus Datenschutzgründen.
Flammen- und Raucherkennung IP-Kameras mit intelligenter Videoüberwachungstechnologie können dank des integrierten DSP-Chips Flammen und Rauch in 15 bis 20 Sekunden oder sogar weniger erkennen. Der Chip verarbeitet Algorithmen, die die aufgenommenen Videos auf Flammen- und Raucheigenschaften wie Farbchrominanz, Flackerverhältnis, Form, Muster und Bewegungsrichtung analysieren.
Egomotion Schätzung Die Bewegungsschätzung wird verwendet, um den Standort einer Kamera durch Analyse ihres Ausgangssignals zu bestimmen.
Bewegungserkennung Die Bewegungserkennung wird verwendet, um das Vorhandensein einer relevanten Bewegung in der beobachteten Szene zu bestimmen.
Formerkennung Die Formerkennung wird verwendet, um Formen im Eingabevideo zu erkennen, z. B. Kreise oder Quadrate. Diese Funktionalität wird normalerweise in erweiterten Funktionen wie der Objekterkennung verwendet.
Objekterkennung Die Objekterkennung wird verwendet, um das Vorhandensein eines Objekt- oder Entitätstyps zu bestimmen, beispielsweise einer Person oder eines Autos. Andere Beispiele umfassen die Brand- und Raucherkennung.
Anerkennung Die Gesichtserkennung und die automatische Nummernschilderkennung werden verwendet, um Personen oder Autos zu erkennen und daher möglicherweise zu identifizieren.
Stilerkennung Die Stilerkennung wird in Einstellungen verwendet, in denen das Videosignal erzeugt wurde, beispielsweise für Fernsehsendungen. Die Stilerkennung erkennt den Stil des Produktionsprozesses.[6]
Manipulationserkennung Die Manipulationserkennung wird verwendet, um festzustellen, ob die Kamera oder das Ausgangssignal manipuliert wurden.
Video-Tracking Video-Tracking wird verwendet, um den Standort von Personen oder Objekten im Videosignal zu bestimmen, möglicherweise in Bezug auf ein externes Referenzgitter.
Analyse der Videofehlerstufe Manipulationsanalyse von Inhalten von Videoszenen mit kostenloser Software. Video Error Level Analysis (VELA)
Objekt-Co-Segmentierung Gemeinsame Objekterkennung, Klassifizierung und Segmentierung von Zielen in einer oder mehreren verwandten Videosequenzen

Kommerzielle Anwendungen[edit]

VCA ist eine relativ neue Technologie. Mitte der 2000er Jahre bringen zahlreiche Unternehmen VCA-verbesserte Produkte auf den Markt[7][8][9] . Obwohl es viele Anwendungen gibt, unterscheiden sich die Erfolge verschiedener VCA-Lösungen erheblich. Funktionen wie Bewegungserkennung, Personenzählung und Waffenerkennung sind als handelsübliche Standardprodukte erhältlich und haben vermutlich eine anständige Erfolgsbilanz (z. B. kann sogar Freeware wie dsprobotics Flowstone Bewegungs- und Farbanalysen durchführen). Als Reaktion auf die COVID-19-Pandemie haben viele Softwarehersteller neue Analysen im Bereich der öffentlichen Gesundheit eingeführt, z. B. die Erkennung von Gesichtsmasken oder die Verfolgung sozialer Distanzierungen.[10][11][12]

In vielen Bereichen wird VCA auf CCTV-Systemen implementiert, entweder auf den Kameras verteilt (am Rande) oder zentral auf dedizierten Verarbeitungssystemen. Video Analytics und Smart CCTV sind Handelsbegriffe für VCA im Sicherheitsbereich. In Großbritannien hat die BSIA einen Einführungsleitfaden für VCA im Sicherheitsbereich entwickelt.[13] Neben der Videoanalyse und deren Ergänzung kann auch die Audioanalyse verwendet werden.[14]

Hersteller von Videomanagementsoftware erweitern ständig das Angebot der verfügbaren Videoanalysemodule. Mit der neuen Technologie zur Verfolgung von Verdächtigen ist es dann möglich, alle Bewegungen dieses Subjekts einfach zu verfolgen: woher sie kamen und wann, wo und wie sie sich bewegten. Innerhalb eines bestimmten Überwachungssystems kann die Indizierungstechnologie Personen mit ähnlichen Merkmalen lokalisieren, die sich während oder innerhalb eines bestimmten Zeitraums in den Blickwinkeln der Kameras befanden. Normalerweise findet das System viele verschiedene Personen mit ähnlichen Funktionen und präsentiert sie in Form von Schnappschüssen. Der Bediener muss nur auf die Bilder und Motive klicken, die verfolgt werden müssen. Innerhalb einer Minute ist es möglich, alle Bewegungen einer bestimmten Person zu verfolgen und sogar ein schrittweises Video der Bewegungen zu erstellen.

Kinect ist ein Add-On-Peripheriegerät für die Xbox 360-Spielekonsole, das VCA für einen Teil der Benutzereingaben verwendet.[15]

Im Einzelhandel wird VCA verwendet, um Käufer im Geschäft zu verfolgen.[16] Auf diese Weise kann eine Heatmap des Geschäfts erhalten werden, was für die Optimierung des Geschäftsdesigns und das Marketing von Vorteil ist. Andere Anwendungen umfassen die Verweilzeit beim Betrachten eines Produkts und die Entfernung von Gegenständen / Links.

Die Qualität von VCA im kommerziellen Umfeld ist schwer zu bestimmen. Dies hängt von vielen Variablen wie Anwendungsfall, Implementierung, Systemkonfiguration und Computerplattform ab. Typische Methoden, um eine objektive Vorstellung von der Qualität in kommerziellen Umgebungen zu erhalten, sind unabhängiges Benchmarking[17] und bezeichnete Testorte.

VCA wurde für Crowd-Management-Zwecke eingesetzt, insbesondere in der O2 Arena in London und im London Eye.

Strafverfolgung[edit]

Polizei und Forensiker analysieren CCTV-Videos bei der Untersuchung krimineller Aktivitäten. Die Polizei verwendet Software wie Kinesense, die eine Analyse des Videoinhalts durchführt, um nach wichtigen Ereignissen im Video zu suchen und Verdächtige zu finden. Umfragen haben ergeben, dass bis zu 75% der Fälle CCTV betreffen. Die Polizei verwendet eine Software zur Analyse von Videoinhalten, um lange Videos nach wichtigen Ereignissen zu durchsuchen.[18][19]

Wissenschaftliche Forschung[edit]

Die Analyse von Videoinhalten ist eine Teilmenge der Bildverarbeitung und damit der künstlichen Intelligenz. Zwei wichtige akademische Benchmark-Initiativen sind TRECVID,[20] Dabei werden ein kleiner Teil des i-LIDS-Videomaterials und die PETS-Benchmark-Daten verwendet.[21] Sie konzentrieren sich auf Funktionen wie Tracking, Gepäckaufbewahrung und virtuelles Fechten. Benchmark-Videodatensätze wie der UCF101[22] ermöglicht Aktionserkennungsforschungen, die zeitliche und räumliche visuelle Aufmerksamkeit mit einem Faltungsnetzwerk und einem langen Kurzzeitgedächtnis beinhalten. Die Videoanalysesoftware wird auch mit Filmmaterial von am Körper getragenen Kameras und Dashboard-Kameras kombiniert, um das Filmmaterial für die öffentliche Veröffentlichung einfacher zu redigieren und Ereignisse und Personen in Videos zu identifizieren.[23]

Die EU finanziert ein RP7-Projekt namens P-REACT[24] Integration von Video-Content-Analysen auf eingebetteten Systemen in Sicherheitsdatenbanken für Polizei und Verkehr.[25]

Siehe auch[edit]

Verweise[edit]

  1. ^ KINECT Archiviert 12. September 2010, auf der Wayback Machine, Add-On-Peripheriegerät für die Xbox 360-Konsole
  2. ^ Dimitrova, Nevenka et al. „“Anwendungen der Analyse und des Abrufs von VideoinhaltenIEEE Multimedia 9.3 (2002): 42-55.
  3. ^ Erhöhung der VCA-Nutzung in der britischen Sicherheit, BSIA-Bericht
  4. ^ Nik Gagvani, Einführung in Video Analytics
  5. ^ Cheng Peng, Videoanalyse
  6. ^ StilerkennungCees GM Snoek et al., Erkennung von TV-Nachrichtenmonologen durch Stilanalyse, ICME’04
  7. ^ Kwet, Michael (2020-01-27). „Der Aufstieg intelligenter Kameranetzwerke und warum wir sie verbieten sollten“. Das Abfangen. Abgerufen 2020-10-19.
  8. ^ „Aimetis“, Wikipedia, 2020-01-28abgerufen 2020-10-19
  9. ^ „Infografik: Geschichte der Videoüberwachung“. IFSEC Global | Sicherheits- und Brandnachrichten und -ressourcen. 2013-12-12. Abgerufen 2020-10-19.
  10. ^ „COVID-19 macht die Erkennung von Gesichtsmasken zu einer unverzichtbaren Videoanalyse – asmag.com“. www.asmag.com. Abgerufen 2020-10-06.
  11. ^ Looveren, Pieter van de. „Funktionalität jenseits der Sicherheit: Das Aufkommen von Open-Platform-Kameras“. www.securityinformed.com. Abgerufen 2020-10-06.
  12. ^ „StackPath“. www.securityinfowatch.com. Abgerufen 2020-10-06.
  13. ^ British Industry VCA Guide, 262 Eine Einführung in das Branchenhandbuch zur Analyse von Videoinhalten
  14. ^ Startup mit Sitz in Großbritannien, das Audioanalysen für die CCTV-Branche anbietet
  15. ^ „Projekt Natal 101“. Microsoft. 2009-06-01. Archiviert von das Original am 21.01.2012. Abgerufen 2009-06-02.
  16. ^ „Heat Map Intelligentes Modul“.
  17. ^ i-Deckel, Benchmarking-Initiative des britischen Innenministeriums
  18. ^ „Northgate bietet den Polizeikräften ein verbessertes CCTV-Analysesystem“. Abgerufen 29 Dez. 2015.
  19. ^ „Northgate arbeitet mit dem Dubliner Technologieunternehmen Kinesense zusammen, um die Videoanalyse der Polizei zu unterstützen.“. Risikomanager Online. Abgerufen 26. Mai 2014.
  20. ^ TRECVID, Akademische Benchmark-Initiative von NIST
  21. ^ PETS-Benchmark-Daten, Leistungsbewertung von Tracking und Surveillance (PETS) durch die University of Reading
  22. ^ Center, UCF (2013-10-17). „UCF101 – Aktionserkennungsdatensatz“. CRCV. Abgerufen 2018-09-12.
  23. ^ „Polizeikameras können mehr als nur Sie aufnehmen | Fast Company | Die Zukunft des Geschäfts“. Schnelle Gesellschaft. 2017-03-03. Abgerufen 2017-03-08.
  24. ^ P-REACT-Projektwebsite
  25. ^ „Kinesense startet P-REACT, ein RP7-Projekt gegen Petty Crime“. Abgerufen 27. Mai 2014.