Ein Lemma ist die Form eines Wortes, die als Stichwort (Kopfwort) an der Spitze eines Wörterbucheintrags steht. Alle Kopfwörter in einem Wörterbuch sind Lemmata. Technisch kann man ein Lemma als „Grundwort und seine Flexionen“ beschreiben: Es ist die konventionell gewählte Zitierform, unter der die zugehörigen gebeugten oder flektierten Formen zusammengefasst werden.

Was ist der Unterschied zwischen Lemma und Lexem?

Ein Lexem ist eine abstrakte Bedeutungseinheit — die Menge aller Wortformen, die dieselbe lexikalische Bedeutung ausdrücken. Ein Lemma ist dagegen die konkrete Form, die man zur Darstellung dieses Lexems auswählt.

  • Beispiel Englisch: Die Formen run, runs und running gehören zum selben Lexem, das im Wörterbuch unter dem Lemma run eingetragen ist.
  • Beispiel Deutsch: Das Lexem „gehen“ umfasst Formen wie gehen, geht, ging, gegangen. Das Lemma ist hier üblicherweise der Infinitiv gehen.

Lexikographische Konventionen: Welche Form wird zum Lemma?

  • Nomen: in der Regel Nominativ Singular (z. B. Haus → Haus, Häuser).
  • Verben: meist der Infinitiv (z. B. laufen → läuft, lief, gelaufen).
  • Adjektive: Grundform (Positiv) (z. B. gut → besser, am besten).
  • Adverbien, Präpositionen, Konjunktionen: die unflektierte Form.
  • Bei zusammengesetzten Wörtern (Komposita) ist häufig die gesamte Zusammensetzung Lemma (z. B. Fußball).

Weitere wichtige Punkte

  • Mehrere Lexeme, gleiche Form: Dieselbe Lemmaform kann mehrere Lexeme repräsentieren, wenn sie verschiedene Bedeutungen oder Wortarten hat (z. B. engl. run als Verb und als Nomen). In Wörterbüchern werden solche Bedeutungen getrennt angelegt.
  • Mehrwort-Lemmata: Manche festen Ausdrücke oder idiomatischen Wendungen werden als Lemma eingetragen (z. B. ins Wasser fallen).
  • Orthographie und Varianten: Bei Schreibvarianten oder veralteten Formen kann das Wörterbuch eine Hauptform wählen und die Varianten verweisen lassen.
  • Lemmatisierung in der Computerlinguistik: Lemmatisierung ist das automatische Zurückführen von Wortformen auf das Lemma (z. B. ginggehen). Sie ist genauer als einfaches Stemming, weil sie auf morphologischer Analyse und Wortlisten beruht.

Aufbau eines Wörterbucheintrags (typisch)

  • Lemma (Kopfwort), oft mit Wortartangabe
  • Aussprache/Phonetik
  • Flexionsformen oder Verweistabellen
  • Bedeutungsangaben (bei mehreren Bedeutungen getrennte Sinne)
  • Beispiele und Kollokationen
  • Wortherkunft, Synonyme, Übersetzungen

Kurze Zusammenfassung

Ein Lemma ist die im Wörterbuch gewählte Zitierform eines Wortes, unter der alle zugehörigen flektierten Formen aufgeführt sind. Ein Lexem bezeichnet die abstrakte Bedeutungseinheit, die diese Formen zusammenfasst. Lemmatisierung ist das Verfahren, mit dem Wortformen auf ihr Lemma zurückgeführt werden — ein wichtiger Schritt sowohl in der Lexikografie als auch in der Computerlinguistik.

Im Englischen z. B. sind run, runs und running Formen desselben Lexems, aber run ist das Lemma.