Métadat – wikipedia

before-content-x4

Au 21e siècle, les métadonnées se réfèrent généralement aux formes numériques. Les métadonnées peuvent également être trouvées dans les catalogues de cartes traditionnels. Les cartes sont constituées d’informations (auteur, titre, sujet, etc.) sur les livres d’une bibliothèque.

Métadonnées ou Méta-information sont des données structurées qui contient des informations sur les caractéristiques d’autres données.

after-content-x4

Les données décrites par les métadonnées sont souvent de plus grandes collections de données telles que des documents, des livres, des bases de données ou des fichiers. De cette manière, les informations des propriétés d’un seul objet (par exemple, “nom personnel”) sont également appelées métadonnées.

Les ordinateurs ne savent souvent pas que les données n’ont pas directement des métadonnées reconnaissables et qu’ils peuvent avoir un avantage plus avantageux pour les criminels ou les autorités informatiques que les données elle-même. [d’abord]

Les métadonnées typiques d’un livre sont, par exemple, le nom de l’auteur, l’édition, l’année de publication, l’éditeur et l’ISBN. Les métadonnées d’un fichier informatique incluent le nom de fichier, les droits d’accès et la date du dernier changement.

Pendant le concept de Métadonnées est relativement nouveau, le principe de référence et les directives formelles sont depuis des siècles de pratique de la bibliothèque. Cependant, une distinction valide entre les métadonnées et les données ordinaires n’existe que pour le cas spécial, car le nom est une question du point de vue. Pour le lecteur d’un livre, le contenu est les données réelles, tandis que le nom de l’auteur ou le numéro de l’édition est des métadonnées. Pour le rédacteur en chef d’un catalogue de livres, ces deux informations, en revanche, sont les propriétés des livres en général, “Auteur” et “Edition Number” sont des métadonnées, les formes concrètes (“Karl May”, “17”) sont les données réelles pour lui.

Utilisation prévue [ Modifier | Modifier le texte source ]]

Vous essayez entre Données et Métadonnées Pour distinguer, il est utile d’introduire le «but» en tant que terme. Le But détermine le résultat; Afin de pouvoir atteindre un certain objectif – d’atteindre un certain résultat – des métadonnées sont nécessaires. Le résultat peut être constitué de données, en particulier les métadonnées peuvent faire partie du résultat dans votre rôle de données.

after-content-x4

Exemples:

  • Objectif: Rechercher dans une bibliothèque selon tous les emplacements (signatures) des livres disponibles par un auteur spécifique
  • Métadonnées: “nom de l’auteur” et “disponible”
  • Résultat: “Signature” (l’emplacement est accessible via la signature)

Dans de nombreux cas, il n’y a pas de séparation consciente entre l’objet et le niveau de méta. Par exemple, on parle de chercher un livre dans un catalogue et pas seulement ses métadonnées. Lorsque vous utilisez des métadonnées, il devrait souvent être des composants inséparables d’un système fermé par couplage direct avec les données utilisateur.

Les métadonnées sont souvent utilisées pour décrire les ressources de l’information et le faciliter la recherche et pour établir des relations entre les matériaux. En règle générale, cela ne nécessite qu’un développement avec un certain degré de normalisation (par exemple par le biais de règles de bibliothèque).

Il existe différentes options pour stocker les métadonnées:

  • Dans le document lui-même. Dans un livre, l’auteur et l’année de publication sont toujours enregistrés. Dans les documents HTML, l’élément Par exemple, la langue, l’auteur, l’entreprise ou les mots clés.
  • Dans les œuvres de référence assignées, par exemple pour un livre dans une bibliothèque dans le catalogue de la bibliothèque.
  • Pour les fichiers informatiques dans les attributs de fichiers. La plupart des systèmes de fichiers permettent uniquement les métadonnées définies avec précision dans les attributs de fichiers; D’autres (HPF utilisant des attributs étendus) permettent l’association de toutes les données avec un fichier. Il est également courant de s’adapter à la méta-information “type de fichier” dans le nom du fichier; Généralement dans l’expansion des graines de fichier ou en nombre magique au début du fichier.

Il existe un certain nombre de formats de données et de modèles de données, tels que Dublin Core ou EXIF, qui peuvent être transférés à différents formats, qui peuvent être transférés aux personnes lisibles, et donc également chez l’homme.

Métadonnées interopérables [ Modifier | Modifier le texte source ]]

Dans les coïncidences du langage technique, «opérable» signifie initialement «pour que cela fonctionne, opéré peut être”. Le préfixe “inter” vient du latin et signifie quelque chose comme “entre”. Les métadonnées interopérables sont donc des métadonnées provenant de sources potentiellement différentes, entre lesquelles (“inter”) il existe une relation de telle manière qu’ils peuvent travailler ensemble (“opéré”) ensemble.

Les normes de métadonnées interopérables ont la tâche de rendre les métadonnées utilisables à partir de différentes sources. Pour ce faire, ils incluent d’abord les aspects de la sémantique, du modèle de données et de la syntaxe.

Le Sémantique Décrit le sens qui est généralement défini par les corps de normalisation (voir Dublin Core). Le Modèle de données Détermine la structure des métadonnées. En rapport avec les métadonnées, les instructions peuvent être considérées comme des “données” qui sont faites via un objet à décrire (document, ressource, …). En tant que composant “modèle” du terme Modèle de données Une description de la façon dont les déclarations sont structurellement peut être comprise (le terme Modèle de données Dans le contexte des métadonnées, cela signifie quelque chose comme “grammaire” ou “structure des déclarations”). Des exemples de modèles de données de métadonnées sont des combinaisons d’attribut / valeur simples (par exemple, des éléments de méta HTML) ou des phrases avec sujet, prédicat et objet (par exemple, triple dans RDF). Le Syntaxe Enfin, servir à représenter les instructions générées en fonction du modèle de données. Un exemple de format de représentation est XML (langage de balisage étendu).

La relation suivante existe maintenant entre ces trois aspects: la sémantique est représentée par les constructions du modèle de données. Le modèle de données est à son tour représenté par des constructions syntaxiques. Les constructions syntaxiques sont finalement composées de signes d’un jeu de caractères convenu (comme avec Unicode). Ces trois aspects peuvent être considérés comme se situant hiérarchiquement au-dessus de l’autre, car chaque couche s’appuie sur la couche ci-dessous. Les couches sont indépendantes les unes des autres, c’est-à-dire H. L’utilisation d’une certaine norme dans une couche est indépendante des autres couches (telles que les modèles de couche de communication réseau, tels que le modèle de couche ISO / OSI). Une certaine sémantique peut être représentée par des constructions à partir de différents modèles de données (par exemple, combinaison d’attribut / valeur, triple), qui à son tour peut être représenté par diverses syntaxes (graphiques, formats XML).

Orthogonal à ces couches est le quatrième aspect identification Cela affecte les trois couches. Afin de pouvoir traiter les métadonnées de différentes sources, (dans le monde) doit être clairement marqué, quelle sémantique, quel modèle de données et quelles sont la syntaxe. Pour cela, un mécanisme d’identification est nécessaire, car les URI (identifiant de ressources uniformes) le fournissent.

Les quatre aspects – Sémantique , Modèle de données , Syntaxe et identification – sont nécessaires pour créer des normes pour les métadonnées interopérables. Vous pouvez donc dans un Cadre être classifié. Un cadre offre donc une sorte de structure de base ou de squelette qui décrit déjà les éléments ou composants les plus importants d’un système et de ses relations, mais sans faire de spécifications précises concernant leur conception. Il agit donc comme une sorte de «système de référence» qui permet l’intégration sensible de nouveaux composants. Étant donné qu’un cadre montre les éléments et leurs relations, cela peut facilement être visualisé par la disposition graphique des éléments. L’illustration “Framework générique” montre un cadre pour les métadonnées, sur un La méta -tea . Contrairement à des formes spécifiques de cadres, d. H. alors le Expression – ou Instanzenebene , décrit un cadre au niveau de la méta généralisé Framework – reconnaissable par les noms génériques des composants.

À titre d’exemple d’un cadre spécifique pour les métadonnées, RDF (Cadre de description des ressources) du World Wide Web Consortium (W3C) est mentionné. RDF contient tous les quatre aspects mentionnés ci-dessus avec des formes spécifiques, comme le montre l’illustration.

RDF comme cadre de métadonnées

Les composants en détail:

  • Sémantique : La sémantique spécifique au domaine peut être importée via des espaces de nom, ce qui signifie que la sémantique d’un vocabulaire RDF peut être élargie comme vous le souhaitez
  • Modèle de données : RDF a un modèle de données défini qui permet des déclarations sur les ressources sous forme de triplets avec sujet, prédicat et objet
  • Syntaxe : Toute syntaxe peut être utilisée pour la représentation de ces instructions, RDF / XML, graphique ou notation n-triple; RDF / XML est cependant la syntaxe normative
  • Identification : Les URI sont obligatoires en tant que mécanisme d’identification universel

Suivant l’idée d’un cadre, RDF lui-même ne définit pas une sémantique spécifique au domaine, mais spécifie uniquement un mécanisme, comme peut être intégré via des noms à l’aide d’un URI. RDF, en revanche, définit un modèle de données commun sous la forme de triplets et de l’utilisation universelle de l’URI comme mécanisme d’identification. Ceux-ci sont utilisés pour identifier les composants individuels d’un triple (sujet, prédicat, objet), ainsi que leurs valeurs et types de données. Cependant, la syntaxe spécifique pour la représentation du triple peut être librement choisie, suivant à nouveau l’idée d’un cadre, par lequel RDF / XML est conçu comme la norme. Avec le schéma RDF, RDF contient également un langage de schéma pour définir son propre vocabulaire de métadonnées.

Le schéma RDF se comporte pour RDF similaire au schéma XML pour XML. Un schéma RDF est également un document RDF valide, et un schéma XML est également un document XML valide. Dans les deux cas, il existe des sous-quantités spécialisées d’une langue de récompense. Cependant, tandis que le schéma XML décrit les restrictions syntaxiques, par ex. Les noms d’élément, la fréquence d’occurrence, etc., décrit le schéma RDF Sémantique Restrictions, c’est-à-dire Par exemple, qu’un attribut “haspublié” ne peut être appliqué qu’aux instances dans la classe “humaine” ou “personne légale”, mais pas dans les cas dans la classe “animal” – dans la langue du schéma, l’attribut “Haspublié” a le domaine «Humain» ou «persop juridique».

Comment XML a complètement changé le principe de simplicité et d’extensibilité, le monde des données, dans lequel il permet au monde des métadonnées de changer le monde des métadonnées via un modèle de données uniforme à travers une syntaxe uniforme, un système de type standardisé et sa base de texte sans aucun problème entre différents systèmes et programmes. En raison du caractère d’un cadre, RDF lie également sur des principes éprouvés tels que la simplicité et l’extensibilité.

Les sections suivantes fournissent des exemples et des formats standard pour les métadonnées dans les zones d’application.

Métadonnées en statistiques [ Modifier | Modifier le texte source ]]

Dans les bases de données statistiques, ces données sont appelées métadonnées qui ne représentent pas directement le contenu des statistiques, telles que les noms de l’industrie ou des professionnels, les répertoires municipaux et autres catalogues. Les métadonnées statistiques comprennent également des descriptions des champs de données sous forme de formulaires d’enquête, éventuellement également compléter les descriptions de formulaires.
Les données statistiques réelles sont appelées délimitation aux métadonnées en tant que microdata et macarodata.

Dans la recherche enquête, les métadonnées spéciales de l’enquête sont appelées paradis.

Métadonnées à Geodata [ Modifier | Modifier le texte source ]]

Dans la directive Inspire et dans la loi sur l’accès aux géodata numériques (Geodata Access Law-Geozg) sur la base de cela, il existe une définition légale pour les métadonnées dans le domaine du traitement de l’information géographique:
“Les métadonnées sont des informations qui décrivent des services de géodata ou de géodate et leur permettent de déterminer les géodata et les services géodate, de les inclure et de les utiliser dans les répertoires.” (Section 3 (2) Geozg)

Métadonnées dans le développement de logiciels [ Modifier | Modifier le texte source ]]

Dans le développement de logiciels, le concept de métadonnées est utilisé à diverses fins:

  • Les composants d’un texte source de programme sont appelés métadonnées qui ne sont pas évaluées par l’outil de traduction réel, généralement un compilateur, mais des outils supplémentaires. Ces métadonnées sont principalement utilisées pour la documentation ou avec l’aide d’annotations pour Codegen. Les exemples sont les annotations en Java ou les attributs dans les frameworks .NET.
  • Une forme s’écartant de la programmation classique est l’utilisation de métadonnées dans les logiciels universels. La plupart des fonctions d’application nécessaires sont présentées et sont appelées et paramétrées via un moteur de métadonnées. L’application cible souhaitée doit être décrite au préalable à l’aide de métadonnées spécifiques. Cette approche est particulièrement suivie par Data Warehouse et Business Intelligence Products. Certains fabricants tels que Tenfold, Data-Warehouse GmbH et Scopeland Technology appliquent également ce principe à la création d’applications de la base de données de rédaction.
  • Les métadonnées désignent également la définition des enregistrements de données dans un dictionnaire de données d’une base de données.
  • Les informations dans la gestion des versions logicielles peuvent également être considérées comme des métadonnées. Ceux-ci permettent souvent d’identifier l’auteur de chaque ligne d’un code de programme. À cette fin, les données d’utilisation (code source) et les métadonnées de l’archive de gestion de version sont corrélées. Pour de nombreux logiciels de gestion de version (par exemple Git et SVN), cette commande fixe est appelée blâmer (étroit. Pour l’accusation).

Métadonnées dans les enregistrements musicaux [ Modifier | Modifier le texte source ]]

Les métadonnées typiques de la musique et d’autres enregistrements sonores sont par exemple. B. Titre, artiste, compositeur, date de publication, éditeur de musique ou numéro ISRC; Avec les enregistrements sonores numériques, il est possible d’enregistrer ces méta-informations directement dans le fichier (par exemple, dans le jour ID3 des fichiers MP3).

En plus de ces données primaires nécessaires pour créer une bibliothèque musicale conventionnelle, il existe des métadonnées musicales de contenu nettement plus complexes. Ceux-ci incluent, par exemple, la stylistique, les instruments principaux et secondaires, le genre, la vitesse, la clé, la dynamique, le caractère chantant et la description des humeurs et des scènes.

Métadonnées des images numériques [ Modifier | Modifier le texte source ]]

Les métadonnées des photos numériques, telles que la date / temps d’enregistrement, la distance focale, l’ouverture, la durée de l’exposition et d’autres paramètres techniques (éventuellement également les coordonnées géographiques du lieu d’enregistrement), sont stockées par presque tous les appareils photo numériques au début d’un fichier image au format EXIF. Une image numérique (photo, scan ou graphique) peut être enrichie par des métadonnées au format IPTC par un logiciel approprié; Cela peut essentiellement être donné sur le titre de l’image, la description de l’image, le lieu d’admission (coordonnées GPS / ville / état / état), auteur (photographe) ou propriétaire du droit d’auteur, coordonnées du titulaire ou du titulaire de licence des droits d’auteur, règlements sur le droit d’auteur et termes de recherche (mots clés). De nombreux programmes d’édition d’images ajoutent ou modifient les métadonnées lors de la modification des photos numériques (ou des images en général), afin que les conclusions puissent être tirées sur le logiciel de traitement d’image.

Métadonnées en communication sur Internet [ Modifier | Modifier le texte source ]]

Le protocole Internet suit un modèle de couche. Ceci doit être illustré en utilisant l’exemple de la norme pour l’envoi de courriels. Le protocole utilisé pour transmettre des e-mails est un protocole de transfert de courrier simple. Sa position dans la couche de protocole Internet peut être spécifiée exactement:

Du point de vue de l’expéditeur et du récepteur des e-mails peut Toutes les couches sous la couche d’application sont considérées comme des métadonnées. Cela devient particulièrement frappant lorsque la couche d’application est chiffrée. Même alors, la couche de transport (TCP) encodait déjà suffisamment d’informations pour déterminer le nom du serveur d’envoi et de réception (souvent la partie globale d’une adresse e-mail) ainsi que la longueur et la période de l’information de l’expédition. Avec un trafic e-mail fréquent entre deux parties, de simples informations sur la fréquence peuvent permettre une conclusion tierce liée à la recherche sur le contenu des e-mails.

La même situation se traduit par un principe avec d’autres protocoles de réseau, tels que les services de messagerie instantanée ou le World Wide Web.
En général, on parle de données de trafic ou de données marginales dans ce contexte.

Après §206 ABS. 5 En plus du contenu des télécommunications, le Code criminel allemand comprend également “Vos circonstances plus étroites, en particulier le fait que quelqu’un soit ou a été impliqué dans un processus de télécommunications” pour le secret des télécommunications.

Le philosophe italien et théoricien des médias Matteo Pasquinelli a mis en place la thèse selon laquelle l’explosion de données permet une nouvelle forme de contrôle: une “Society of Metadata”. Avec des métadonnées, de nouvelles formes de contrôle biopolitique pourraient être établies pour contrôler les masses et le contrôle du comportement, telles que les activités en ligne dans les réseaux sociaux ou les flux de passagers dans les transports publics. Pasquinelli ne voit pas le problème dans le fait que les individus, comme dans les systèmes totalitaires, sont surveillés à chaque tour, mais sont négligés et que la société devient calculable et contrôlable comme un agrégat. [2]

  • Gunnar Auth: Métadonnées – bases et signification dans l’entreposage de données . Dans: Gunnar Auth: Organisation axée sur le processus de gestion des métadonnées pour les systèmes d’entrepôt de données . Bod, Norderstedt 2004, ISBN 978-3-8334-1926-3, pp. 27–74.
  • Ingrid Schmidt: Modélisation des métadonnées . Dans: Henning Lobby; Lothar Lemnitzer: Technologie du texte. Perspectives et applications . Stauffenburg, Tübingen 2004, ISBN 3-86057-287-3, pp. 143–164.
  • Ulrich Hambuch: Facteur de réussite Gestion des métadonnées: pertinence de la gestion des métadonnées pour la qualité des données en intelligence commerciale . VDM, Sarm Break 2008, ISBN 3-639-07879-9
  1. Scandale entendant: les métadonnées souvent plus révélatrices que le contenu réel. Dans: datetensicherHeit.de. 23. septembre 2013, Récupéré le 11 septembre 2017 .
  2. Adrian Lobe: Philosophie – La Société des métadonnées. Dans: Süddeutsche.de. 31 juillet 2018, Consulté le 3 septembre 2018 .
after-content-x4