Welche Wörter reimen sich?
Für einen Menschen ist es ganz leicht, herauszufinden, wann zwei Wörter sich reimen. Wir machen das „einfach nach Gefühl“. Natürlich gibt es eine zugrundeliegende Regel dafür, wann zwei Wörter sich reimen und wann nicht. Sie ist uns nur nicht bewusst. Was für einen Menschen einfach ist, ist für einen Computer allerdings umso komplizierter: Er muss das Reimen von Grund auf lernen.
Voraussetzung für ein gutes Reime-Tool
Eigentlich ist die Regel, welche Wörter sich reimen, nicht besonders komplex: Zwei Wörter reimen sich, wenn der betonte Vokal und alle folgenden Laute identisch sind. Wer Namen selbst entwickeln möchte, der bemerkt dabei, wie einfach es für uns Menschen ist, Reime zu finden. Dennoch ist es eine Herausforderung, diese scheinbar einfache Aufgabe von einer Maschine lösen zu lassen.
Denn: Woher soll der Computer wissen, wie die Wörter ausgesprochen werden? Wo liegt die Betonung? Und was ist eigentlich ein Laut, geschweige denn ein Vokal? Und was ist mit Markennamen in anderen Sprachen? Für die Entwicklung des Reime-Tools haben wir der Maschine hinter NameRobot daher Schritt für Schritt das Reimen beigebracht.
Für ein Reime-Tool sind folgende Voraussetzungen notwendig:
- Große Wortdatenbank, in der Ergebniswörter mit dem Ausgangswort verglichen werden können
- Theorie über die Aussprache von Wörtern
- Intelligente Regeln, um Reimendungen zu finden
Gewöhnliche Reim-Tools arbeiten nicht so raffiniert. Sie ...
- ... vergleichen die Schreibweise von Wörtern
- ... bestimmen Reime nach simplen Regeln
- ... haben zahlreiche Ausnahmeregeln, um Unregelmäßigkeiten in der Rechtschreibung auszubügeln.
Probleme, die z. B. durch Ausnahmeregelungen abgefangen werden müssen, sind:
- 'seit' und 'Leid' reimen sich, obwohl sie auf '-eit' und '-eid' enden
- 'Bieber' und 'Tester' reimen sich nicht, obwohl sie auf '-er' und '-er' enden
- 'Tine' und 'Beine' reimen sich nicht, obwohl sie auf '-ine' enden
Warum sind Ausnahmeregeln notwendig?
1. Ein Buchstabe, mehrere Laute
Ein Graphem (=Buchstabe) kann je nach Kontext, in dem er steht, mehrere Laute repräsentieren. Besonders im Englischen ist der zugewiesene Laut nahezu beliebig.
Hinweis: Diese Tatsache fällt uns nur deshalb nicht auf, weil wir die Wörter bereits kennen und „auswendig gelernt“ haben. Bei unbekannten englischsprachigen Wörtern hingegen wissen wir oft nicht, wie diese auszusprechen sind. Wie spricht man den Vokal in „pint“ aus? Mit welchem Laut fängt „celtic“ an?
2. Ein Laut, mehrere Buchstaben
Andersrum gilt das Gleiche:
Ein Laut kann durch verschiedene Buchstaben (bzw. Buchstabenkombinationen) repräsentiert werden. Besonders wenn man ein englisches Wort hört, weiß man noch lange nicht, wie es geschrieben wird.
Ein englischsprachiges Beispiel:
- height
- shine
- die
- choir
- buy
- hyphen
- style
Alle Wörter enthalten den gleichen Laut - 'ay' -, der orthografisch auf verschiedene Arten repräsentiert werden kann: ei, i, ie, oi, uy, y. Puh!
Hier liegt das Problem herkömmlicher Reime-Tools: Alle notwendigen Ausnahmeregelungen sind sehr fehleranfällig. Denn jede Ausnahme muss gesondert in eine Regel umgewandelt werden.
Unsere Lösung: Ein lautbasiertes Reimetool
Wir wollten ein Reimetool entwickeln, das nicht auf Orthografie, sondern auf den tatsächlich verwendeten Lauten basiert. Denn Reime interessieren sich nicht für Rechtschreibung, sondern nur für Aussprache!
Für jedes Wort in unserer umfangreichen Datenbank bestimmen wir die Aussprache der Reimendung. Nun müssen wir vergleichen, ob zwei Reimendungen identisch sind oder nicht. Die Schreibweise der Wörter interessiert uns nicht; wir schauen nur auf der Aussprache.
Zusätzliches Feature: Sprachübergreifend reimen
Da wir uns mit unserem Reime-Tool ohnehin nicht um Orthografie scheren, können wir auch einen Schritt weiter gehen als bisherige Reimmaschinen: Wir reimen sprachübergreifend!
Wir haben bereits die Reimendungen unserer Wörter gefunden. Nun mussten wir sicherstellen, dass englische und deutsche Reimendungen sich auch miteinander „verstehen“. Der Knackpunkt nämlich war, dass die in beiden Sprachen verfügbaren Laute nicht 1:1 korrespondieren. Die englische Aussprache notieren wir intern mit 39 Lauten, das Deutsche hingegen mit 55.
Herausforderungen bei der Erstellung eines intelligenten Reime-Tools
Die Herausforderung war es, ein Regelwerk zu erstellen, das Aussprache von zahllosen Wörtern bestimmt und anschließend die Reimendung errechnet. Diese trivial klingende Aufgabe hat uns zahllose schlaflose Nächte bereitet und den Kaffee-Konsum in unseren Büros in ungeahnte Höhen getrieben.
Doch die Arbeit hat sich bezahlt gemacht: In fruchtbarer Zusammenarbeit zwischen Sprachexperten, Computerlinguisten und Softwareentwicklern haben wir unserer Namensfindungsmaschine die Regeln zur Aussprache deutscher und englischer Wörter, sowie die Bestimmung von Reimendungen beigebracht.
Um unseren Algorithmus zu lehren, englischsprachige Wörter auf deutsche zu reimen und umgekehrt, waren weitere intensive Trainings und Tests nötig. Denn die 55 deutschen Laute wollten auf 39 englische Laute gemappt werden. Nun können wir z. B. „Smartphone“ auf „Onlineredaktion“ reimen.
Ein schnelles Tool!
Weil wir auf Basis von vorbereiteten Reimendungen arbeiten, die wir bereits in unserer Datenbank abgelegt haben, geht das Reimen ziemlich schnell:
Wenn ein Nutzer nach Reimen sucht, muss kaum etwas neu berechnet werden, da alle relevanten Informationen vorbereitet in unserer Datenbank liegen. Wie jeder Softwareentwickler weiß, sind Identitätsabfragen sehr schnell durchgeführt. Und so werden innerhalb kürzester Zeit die Ergebnisse aus unserer über 300.000 Wörter starken Datenbank gefiltert.
Als Nutzer bekommt man davon natürlich nichts mit. Man gibt lediglich ein Wort wie „Design“ ein und erhält Ergebnisse wie „Wein“, „Verein“, „shine“, „Bahrain", „outline“ und „sanguine“. Das Beste: das raffinierte phonetische Reime-Tool ist Teil der Wortwerkstatt – und damit kostenfrei im Demo-Zugang nutzbar.