Bildübersetzung – Wikipedia

before-content-x4

Form der Übersetzung

after-content-x4

Bildübersetzung ist die maschinelle Übersetzung von Bildern von gedrucktem Text (Poster, Banner, Speisekarten, Screenshots usw.). Dies geschieht durch Anwendung der OCR-Technologie (Optical Character Recognition) auf ein Bild, um den im Bild enthaltenen Text zu extrahieren, und dann diesen Text in eine Sprache ihrer Wahl übersetzen zu lassen und die digitale Bildverarbeitung auf das Originalbild anzuwenden, um die übersetztes Bild mit einer neuen Sprache.

Allgemein[edit]

Die über das Internet (Web und Mobile) zur Verfügung gestellte maschinelle Übersetzung stellt einen bemerkenswerten Fortschritt in der mehrsprachigen Kommunikation dar und macht einen zwischengeschalteten Übersetzer/Dolmetscher überflüssig fremden Text, den sie übersetzen und verstehen möchten. Die manuelle Eingabe des fremden Textes kann sich als schwierig erweisen, insbesondere in Fällen, in denen ein unbekanntes Alphabet aus einer Schrift verwendet wird, die der Benutzer nicht lesen kann, z Sprache oder umgekehrt.

Die technischen Fortschritte bei OCR machten es möglich, Text aus Bildern zu erkennen. Die Möglichkeit, mit der Kamera eines Mobilgeräts gedruckten Text zu erfassen und zu extrahieren, wird auch als mobile OCR bezeichnet und wurde erstmals 2004 in Mobiltelefonen japanischer Hersteller eingeführt es extrahiert (digitalisiert) zur weiteren Bearbeitung, wie zum Beispiel zum Speichern der Informationen in ihrer Kontaktliste, als Webseitenadresse (URL) oder Text zur Verwendung in einer SMS/E-Mail-Nachricht usw.

Derzeit verfügen mobile Geräte mit einer Kameraauflösung von 2 Megapixeln oder höher mit Autofokus-Fähigkeit häufig über den Textscanner-Dienst. Um die Textscanfunktion noch einen Schritt weiter zu gehen, entstand die Bildübersetzung, die Benutzern die Möglichkeit gibt, Text mit der Kamera ihres Mobiltelefons aufzunehmen, den Text zu extrahieren und in ihre eigene Sprache übersetzen zu lassen.

Immer mehr Anwendungen entstanden auf dieser Technologie, einschließlich Word Lens[1][circular reference]. Nachdem es von Google übernommen wurde, wurde es Teil der mobilen Google Translate-App.

Eine weitere gleichzeitige Weiterentwicklung in der Bildverarbeitung ermöglicht es jetzt auch, den Text auf dem Bild durch den übersetzten Text zu ersetzen und ein neues Bild insgesamt zu erstellen.[2]

Geschichte[edit]

Die Entwicklung des Bildübersetzungsdienstes entspringt den Fortschritten in der OCR-Technologie (Miniaturisierung und Reduzierung der verbrauchten Speicherressourcen), die das Scannen von Text auf Mobiltelefonen ermöglicht.

after-content-x4

Unter den ersten, die eine mobile Software ankündigen, die Text mit der Kamera des mobilen Geräts „lesen“ kann, ist International Wireless Inc., die im Februar 2003 ihre „CheckPoint“- und „WebPoint“-Anwendungen veröffentlicht haben. „CheckPoint“ liest kritische symbolische Informationen auf Schecks und zielt darauf ab, Verluste zu reduzieren, die mobile Händler durch „bounced“ Schecks erleiden, indem es die MICR-Nummer auf der Unterseite eines Schecks scannt, während „WebPoint“ die visuelle Erkennung und Dekodierung gedruckter URLs ermöglicht. die dann vom Webbrowser des Geräts geöffnet werden.[3]

Die erste kommerzielle Veröffentlichung eines mobilen Textscanners erfolgte jedoch im Dezember 2004, als Vodafone und Sharp mit dem Verkauf des 902SH-Handys begannen, das als erstes über eine 2-Megapixel-Digitalkamera mit optischem Zoom verfügte. Zu den verschiedenen Multimedia-Features des Geräts gehörte der integrierte Text-/Barcode-/QR-Code-Scanner. Die Textscannerfunktion kann bis zu 60 alphabetische Zeichen gleichzeitig verarbeiten. Der gescannte Text kann dann als E-Mail oder SMS versendet, als Wörterbucheintrag hinzugefügt oder bei gescannten URLs über den Webbrowser des Geräts geöffnet werden. Alle nachfolgenden Sharp-Handys verfügen über die Textscanner-Funktion.[4]

Im September 2005 kündigten die NEC Corporation und das Nara Institute of Science and Technology in Japan (NAIST) eine neue Software an, die Kameratelefone in Textscanner umwandeln kann. Die Anwendung unterscheidet sich wesentlich von ähnlich ausgestatteten Mobiltelefonen in Japan (in der Lage, Visitenkarten und kleine Textteile zu scannen und diese mit OCR in bearbeitbaren Text oder in URL-Adressen umzuwandeln) durch die Fähigkeit, eine ganze Seite zu scannen. Die beiden Unternehmen sagten jedoch, dass sie die Software nicht vor Ende 2008 kommerziell veröffentlichen würden.[5]

Die Kombination der Textscannerfunktion mit maschineller Übersetzungstechnologie wurde erstmals vom US-amerikanischen Unternehmen RantNetwork vorgenommen, das im Juli 2007 mit dem Verkauf des Communilator begann, einer maschinellen Übersetzungsanwendung für mobile Geräte mit Bildübersetzungsfunktion. Mit der eingebauten Kamera kann der mobile Benutzer einen gedruckten Text fotografieren, OCR anwenden, um den Text zu erkennen, und ihn dann in eine der über 25 verfügbaren Sprachen übersetzen.[6]

Im April 2008 stellte Nokia seine Shoot-to-Translate-Anwendung für das N73-Modell vor, die in der Lage ist, mit der Kamera des Geräts ein Bild aufzunehmen, den Text zu extrahieren und dann zu übersetzen. Die Anwendung bietet nur eine Chinesisch-Englisch-Übersetzung und verarbeitet keine großen Textsegmente. Nokia sagte, dass sie dabei sind, ihr Multiscanner-Produkt zu entwickeln, das neben dem Scannen von Text und Visitenkarten auch in 52 Sprachen übersetzen kann.[7]

Im April 2008 brachte das koreanische Unternehmen Unichal Inc. erneut seinen tragbaren Dixau-Textscanner auf den Markt, der englischen Text scannen und erkennen und dann mit Online-Übersetzungstools wie Wikipedia oder Google Translate ins Koreanische übersetzen kann. Über den USB-Port wird das Gerät mit einem PC oder Laptop verbunden.[8]

Im Februar 2009 präsentierte das bulgarische Unternehmen Interlecta auf dem Mobile World Congress in Barcelona seinen mobilen Übersetzer inklusive Bilderkennung und Sprachsynthese. Die Anwendung verarbeitet alle europäischen Sprachen sowie Chinesisch, Japanisch und Koreanisch. Die Software verbindet sich über das Internet mit einem Server, um die Bilderkennung und die Übersetzung durchzuführen.[9]

Im Mai 2014 erwarb Google Word Lens, um die Qualität der visuellen und sprachlichen Übersetzung zu verbessern. Es ist in der Lage, Text oder Bild mit dem eigenen Gerät zu scannen und sofort übersetzen zu lassen.[10][circular reference]

Da sich OCR verbessert hat, haben viele Unternehmen oder Websites damit begonnen, OCR und Übersetzung zu kombinieren, um den Text aus einem Bild zu lesen und den übersetzten Text anzuzeigen.

Im August 2018 gründete ein indisches Unternehmen ImageTranslate. Es kann das Bild in einer anderen Sprache lesen, übersetzen und neu erstellen.

Derzeit wird die Bildübersetzung von folgenden Unternehmen angeboten:

  • Google Übersetzer-App mit Kamera
  • ImageTranslate[11]
  • Yandex[12]

Verweise[edit]


after-content-x4