Kontrollierte natürliche Sprachen (Controlled Natural Languages, CNLs) sind eingegrenzte oder künstlich beschränkte Varianten natürlicher Sprachen. Durch Vereinfachung der Grammatik, Einschränkung des Wortschatzes und strikte Stilregeln wird Mehrdeutigkeit reduziert und die sprachliche Komplexität verringert. Ziel ist es, Texte sowohl für Menschen leichter verständlich als auch für Maschinen besser verarbeitbar zu machen.

Typen von CNL

Man unterscheidet grob zwei Zielgruppen von CNLs:

  • Human-orientierte (vereinfachte/technische) Sprachen: Sie sollen das Verstehen und die Verständigung zwischen Menschen – insbesondere Nicht-Muttersprachlern oder Fachfremden – erleichtern. Beispiele: das ASD Simplified Technical English (ASD-STE100), Caterpillar Technical English und IBM's Easy English. Diese Sprachen fördern klare, kurze Sätze und einheitliche Terminologie, was auch die halbautomatische Übersetzung unterstützt.
  • Maschinenorientierte (formalisierbare) Sprachen: Sie besitzen präzise, wohldefinierte Regeln, die eine automatische semantische Analyse und sogar die Übersetzung in formale Logiken (z. B. Logik erster Ordnung) erlauben. Solche CNLs werden eingesetzt, wenn maschinelle Prüfung, Inferenz oder Wissensrepräsentation erforderlich sind. Beispiele sind Attempto Controlled English (ACE) oder PENG (Processable English).

Typische Gestaltungsregeln

  • Begrenzter Wortschatz: Nur zugelassene Begriffe verwenden, oft mit einer Terminologieliste.
  • Einfache Grammatik: Vermeidung komplexer Satzgefüge, Nebensätze und verschachtelter Konstruktionen.
  • Kurze Sätze: Vorgabe einer maximalen Satzlänge oder Satzstrukturregeln.
  • Eindeutige Referenzen: Personen und Objekte namentlich oder durch präzise Nominalphrasen benennen (z. B. „John Smith“ anstelle von „ihn“).
  • Aktiv statt Passiv: Beschreiben, wer handelt, statt was getan wird, sofern nicht nötig.
  • Keine Idiome, Metaphern oder kulturell gebundene Ausdrücke.

Beispiele und Anwendungsfälle

  • Technische Dokumentation: ASD-STE100 und Caterpillar Technical English erhöhen Lesbarkeit und reduzieren Übersetzungsfehler.
  • Unternehmenskommunikation und Kundenservice: Vereinfachte Sprache senkt Missverständnisse und Supportkosten.
  • Wissensrepräsentation und semantische Web-Technologien: CNLs wie ACE erlauben das automatische Ableiten und Prüfen von Aussagen.
  • Rechtstexte oder Verträge (teilweise): Strukturierte, eindeutig formulierte Klauseln erleichtern die Auslegung.
  • Software-Anforderungen und Spezifikationen: Maschinell überprüfbare Formulierungen reduzieren Implementierungsfehler.

Vorteile

  • Weniger Missverständnisse und höhere Lesbarkeit für unterschiedliche Zielgruppen.
  • Verbesserte Qualität maschineller Übersetzungen und geringerer Nachbearbeitungsaufwand.
  • Ermöglichen automatische Prüfung, Suche und Wissensverarbeitung bei maschinenorientierten CNLs.
  • Förderung konsistenter Terminologie und einheitlicher Dokumente in großen Organisationen.

Einschränkungen und Herausforderungen

  • Weniger Ausdrucksvielfalt: Manche Konzepte lassen sich nur umständlich oder gar nicht ausdrücken.
  • Akzeptanz und Schulungsbedarf: Autoren müssen die Regeln erlernen und anwenden.
  • Wartung des Regelwerks und der Terminologielisten ist aufwändig.
  • Teilweise Balance-Probleme zwischen menschlicher Lesbarkeit und formaler Strenge.

Prüfung, Werkzeuge und Qualitätssicherung

Zur Durchsetzung von CNL-Regeln werden spezialisierte Checker und Authoring-Tools eingesetzt. Diese Werkzeuge prüfen Grammatik, Wortwahl und Stilregeln, markieren Verstöße und geben alternative Formulierungen vor. Qualitätsmetriken umfassen Lesbarkeitsindizes, Fehlerraten bei Übersetzungen und die Anzahl der mehrdeutigen Ausdrücke.

Fazit

Kontrollierte natürliche Sprachen verbinden die Natürlichkeit menschlicher Sprache mit einer strukturierten, oft formalen Regelbasis. Je nach Zielsetzung (menschliche Verständlichkeit vs. maschinelle Verarbeitbarkeit) sind unterschiedliche Kompromisse nötig. Richtig konzipiert und eingeführt, verbessern CNLs Kommunikation, reduzieren Fehler und ermöglichen neue Anwendungen in Übersetzung, Wissensmanagement und automatischer Analyse.