XML ist eine Auszeichnungssprache, die dazu dient, Texte mit zusätzlichen semantischen Informationen anzureichern. Im Gegensatz zu anderen Auszeichnungssprachen sind die Auszeichnungen in XML nicht fest definiert, sondern können für jeden Anwendungsfall in einer eigenen DTD (Document Type Definition) – oder etwas moderner in einer XML Schema Definition – festgelegt werden. Alternativ gibt es auch standardisierte XML-Definitionen, wie z. B. DITA oder DocBook, die von vielen Unternehmen genutzt werden, um XML-Dokumente auch mit Zulieferern oder Kunden auszutauschen oder mit anderen Dokumenten zusammenzufügen.

Daten, die mit XML-Auszeichnungen versehen sind, bieten vor allem zwei Vorteile für die praktische Arbeit:

  1. Durch die semantischen Auszeichnungen enthalten diese Texte zusätzliche Informationen (quasi Meta-Informationen) zu den Textinhalten. Ein Absatz kann z. B. als „Sicherheitsinformation“ oder ein Wort als „Produktname“ ausgezeichnet sein.
  2. Durch die zusätzlichen Informationen in den Auszeichnungen können die Texte leicht automatisch verarbeitet werden. Beispielsweise können alle Absätze, die in einem Dokument als Sicherheitsinformationen ausgezeichnet sind, hintereinander ausgegeben oder auf eine bestimmte Art formatiert werden.

Im Alltag ist der Vorteil also, dass nicht Layout-basiert gearbeitet wird, sondern dass die Daten ihrem Inhalt entsprechend ausgezeichnet werden und das Layout später dynamisch erzeugt wird. Eine Layout-Änderung ist also kein Problem, denn die Daten bleiben unverändert. Ihnen werden lediglich andere Formatierungen zugewiesen. Es gibt eine deutliche Trennung zwischen Inhalt und Formatierung. Der Inhalt wird von einem Menschen (z. B. einem Technischen Redakteur) erstellt und dabei möglichst detailliert ausgezeichnet. Für die Formatierung werden einmalig Festlegungen getroffen, die dann in ein Programm umgesetzt werden. Die Formatierung der einzelnen Dokumente erfolgt schließlich automatisch durch dieses Programm, ohne dass der Mensch eingreift.

Hier ein kurzes Beispiel, wie ein mit XML ausgezeichneter Text aussieht:

XML TechKomm-Glossar

XML TechKomm-Glossar