Dokumentinhaltsarchitektur – Wikipedia

Das Architektur des Dokumentinhalts, oder DCA Kurz gesagt, ist ein Standard, der Anfang der 1980er Jahre von IBM für Textdokumente entwickelt wurde. DCA wurde auf Mainframe- und iSeries-Systemen verwendet und bildete die Grundlage für das Dateiformat von DisplayWrite. DCA wurde später als MO: DCA (Mixed Object Document Content Architecture) erweitert, das eingebettete Datendateien wie Grafiken hinzufügte.

Der ursprüngliche Zweck von DCA bestand darin, ein gemeinsames Dokumentformat bereitzustellen, das auf mehreren IBM Textverarbeitungsplattformen verwendet werden kann, z. B. auf dem IBM PC, IBM Mainframes, dem dedizierten Textverarbeitungsprogramm von Displaywriter und dem IBM 5520 Administrative System.[1]

DCA definiert zwei Arten von Dokumenten:[2][3]

  • Text in überarbeitbarer Form (DCA / RFT), die bearbeitet werden kann.
  • Text in endgültiger Form (DCA / FFT), das “für ein bestimmtes Ausgabegerät formatiert ist und nicht geändert werden kann”.

Beschreibung[edit]

DCA definiert einen Datenstrom, der ein Dokument darstellt.

Dokumente können Schriftarten, Überlagerungen und andere Ressourcenobjekte enthalten, die zur Präsentationszeit erforderlich sind, um die Daten ordnungsgemäß darzustellen. Schließlich können Dokumente Ressourcenobjekte wie einen Dokumentindex und Kennzeichnungselemente enthalten, die die Suche und Navigation von Dokumentdaten für eine Vielzahl von Anwendungszwecken unterstützen.[4]::2

MO: DCA ist die Hülle oder der Behälter für verschiedene Objekte das kann das Dokument bilden. Jedes Objekt wird durch seine eigene untergeordnete Architektur definiert. Die Architekturen sind:[4]::4

  • PTOCA (Presentation Text Object Content Architecture) beschreibt formatierten Text, einschließlich Textattributen wie Schriftart oder Farbe.
  • Die Image Object Content Architecture (IOCA) beschreibt auflösungsunabhängige Bilder.
  • Die Grafikobjekt-Inhaltsarchitektur (GOCA) beschreibt Vektorgrafiken. Eine Variante von GOCA, AFP GOCA, wird in Advanced Function Presentation-Umgebungen verwendet.
  • Barcode Object Content Architecture ™ (BCOCA ™) beschreibt Barcodes in verschiedenen Formaten.
  • FOCA (Font Object Content Architecture) beschreibt Schriftarten, die im Dokument verwendet werden sollen
  • Die Farbmanagement-Objektinhaltsarchitektur (CMOCA) beschreibt die erforderlichen Farbmanagementinformationen.

Jede Architektur verwendet eine Reihe von binär strukturierten Feldern, um das entsprechende Objekt zu beschreiben.

Text in überarbeitbarer Form[edit]

Text in überarbeitbarer Form (abgekürzt RFT oder RFT-DCA) ist Teil von DCA. Es wird manchmal als bezeichnet Überarbeitbarer Formattext. Es wurde von IBM DisplayWrite 4- und 5-Textverarbeitungsprogrammen auf System / 360- und 370-Mainframe-Computern sowie von OfficeVision / 400 verwendet, um die Übertragung formatierter Dokumente auf andere Systeme zu ermöglichen.[citation needed]

RFT hat ein Gegenstück Text in endgültiger Form (abgekürzt FFT oder FFT-DCA), die nicht bearbeitbar sein sollte und nur ausgegeben werden konnte.

Geschichte[edit]

Das Bestreben, internationale Standards für die DCAs einzuführen, wurde 1980 im IBM Rochester-Werk eingeleitet. Das Team bestehend aus zwei MODCA-Architekten, einem RTOCA-Architekten und einem PTOCA-Architekten, wurde zusammengestellt. Diese Architekten, wie sie genannt wurden, waren dafür verantwortlich, den IBM-Konsens für das Design der Datenströme zusammenzubringen und die Arbeit in die internationale Standardarena zu bringen. Es wurden konzertierte Anstrengungen unternommen, um die internationale Gemeinschaft in die Entwicklung einzubeziehen. Diese Entscheidung beruhte teilweise auf den Erfahrungen, die mit der Aufnahme von GML in einen internationalen SGML-Standard gesammelt wurden. Um die lange Verzögerung bei der Erstellung der Architektur zu vermeiden, wollten sie alle frühzeitig einbeziehen. SGML [5]Die Entwicklung der Standardisierung hatte viele Jahre und Arbeitsstunden gedauert. Die Arbeit von IBM mit Dokumenteninhalten wurde durch die Anforderungen von Hauptrahmencomputern vorangetrieben, auf denen GML und DCA verwendet wurden. Diese Erfahrung zeigte jedoch, dass standardisierte Komponentenarchitekturen insbesondere für überarbeitbaren und nicht überarbeitbaren Text erforderlich sind.

1981, kurz nach ihrer Gründung, wurde die Gruppe zusammen mit dem IBM 5280 Distributed Data System nach IBM Austin in der Nähe von Round Rock, TX, verlegt, wo die Arbeit mit gemischtem Erfolg fortgesetzt wurde. Als die Architekturen auf der internationalen Bühne fester positioniert wurden, wurde das Team 1987 erneut in das IBM Dallas Programming Center in der Nähe von Roanoke, Texas (Westlake) verlegt, wo es 1998 aufgelöst und die Arbeiten an den DCA-Architekturen hauptsächlich aufgrund eingestellt wurden an die PC-Community, die in eine andere Richtung der Notwendigkeit gegangen war. Die DCA-Architekturen wurden vollständig fertiggestellt, aber nach 18 Jahren im Detail nicht vollständig vereinbart. Und es waren keine aktiven Implementierungen in Sicht.

Die Welt des PCs hatte sich für HTML entschieden (vermutlich eine Anwendung des internationalen SGML-Standards) und Teile davon für ihre Zwecke verwendet. Microsoft Word verwendete schließlich den ähnlichen Datenstrom für den internen Arbeitsdatenstrom zur Speicherung von bearbeitbaren Inhalten. Obwohl der SGML-Standard verfügbar war, war es unpraktisch, dass die vollständige Implementierung des SGML-Parsers nützlich war, sodass eine potenzielle Teilmenge davon zum De-facto-Standard für überarbeitbaren Text wurde, der heute in der PC-Arena verwendet wird.

Etwa zur gleichen Zeit entwarf und produzierte Adobe Systems die druckbare Dokumentcodierung PDF, die zum Standard für vom PC erstellte druckbare Dokumente geworden ist. Der internationale Standard wurde 2008 ohne Eingaben von irgendjemandem festgelegt, außer von den Benutzern, die beschlossen, die angebotenen Produkte in größerer Anzahl zu verwenden, als die Manager der Datenstromarchitekten es jemals für möglich gehalten hatten. Die Entscheidung wurde von der Notwendigkeit des Produkts bestimmt, und die gefundene Lösung war weitaus akzeptabler, als die Normungsausschüsse in dem Zeitraum, in dem die Entscheidung erforderlich war, als Standard entwerfen konnten. Über 10 Jahre Arbeit hatten nicht die akzeptable Methode hervorgebracht und die PC-Computer-Community hat in kürzerer Zeit das geschaffen, was sie brauchte.

Der Versuch, einen Konsensdaten-Datenstrom zu erzielen, wurde schnell von den verfügbaren und verwendbaren Inhalten der Unternehmen flankiert, die nicht versuchten, diese mit anderen zu teilen, sondern eine funktionsfähige Lösung erstellten und an Benutzer verkauften – und sie mochten sie. Daher wird die Ausgabe der Textverarbeitungssoftware in das PDF-Format gedruckt, das vom am häufigsten verwendeten Präsentationsprodukt bereitgestellt wird. Das heißt, Microsoft Word bietet beispielsweise die Druckerauswahl “Microsoft Print to PDF”, um die erforderliche Ausgabe für ein PDF-Dokument zu erstellen – eine für die meisten Benutzer sehr akzeptable Lösung. Eine ähnliche Methode hätte verwendet werden können, um den internationalen Standard herzustellen, wenn irgendwann einer eingetroffen wäre.

Als IBM 1998 sein Dallas Programming Center auflöste, zogen sich alle Mitarbeiter der Architekten zurück und verließen das Unternehmen mit Ausnahme des Managers, der an einen anderen Standort und an eine andere Position versetzt wurde, wodurch das DCA-Architekturprojekt auf absehbare Zeit bei IBM beendet wurde.

Siehe auch[edit]

Verweise[edit]

  1. ^ Henkel, Tom (21. Mai 1984), “IBM nimmt den Standardisierungsweg zu DPP”, Computerwelt, IDG Enterprise, 18 (21), p. 7, ISSN 0010-4841
  2. ^ “PC Magazine Encyclopedia”. Abgerufen 25. Juli 2012.
  3. ^ de la Beaujardière, Jean Marie (1988). “Etablierte Dokumentenaustauschformate”. Dokumentenmanipulation und Typografie: Vorträge der Internationalen Konferenz über elektronisches Publizieren, Dokumentenmanipulation und Typografie, Nizza (Frankreich), 20.-22. April 1988. CUP-Archiv. p. 83. ISBN 978-0-521-36294-8.
  4. ^ ein b IBM Corporation (Mai 2006). Referenz für die Inhaltsarchitektur von Dokumenten mit gemischten Objekten (PDF). Abgerufen 7. Februar 2020.
  5. ^ http://www.sgmlsource.com/

Externe Links[edit]