Abruf

„Der Mann sieht die Frau mit dem Teleskop.“ – Wie man einem Computer das Sprechen beibringt

Wer von euch hat schon einmal sein Handy zur Hand genommen und zu ihm „Hallo Galaxy“, „Hey Siri“ oder vielleicht „Ok, Google“ gesagt? Wer von euch hat schon einmal einen fremdsprachigen Text nicht verstanden und dann im Google Übersetzer nachgeschaut? Habt ihr jemals einen Tippfehler in Word erst dadurch bemerkt, dass das Programm euch mit einer roten Linie höflichst darauf aufmerksam gemacht hat? Einige haben vielleicht sogar mal eine Handschrifterkennungs-Software ausprobiert (also von Hand etwas auf einen Bildschirm geschrieben und es wurde automatisch in einen Text verwandelt)! Gibt es jemanden, der schon mal eine Nachricht ins Handy eingetippt hat und das nächste Wort bereits vorgeschlagen bekam, obwohl dort erst ein einziger Buchstabe davon stand?

Und jetzt kommt die Preisfrage: War das, was das Programm da fabriziert hat, auch schon mal richtig…? In den meisten Fällen lautet die Antwort sicherlich „Ja“ – Dabei ist das eigentlich keinesfalls selbstverständlich! Bevor ein Computer mit so einer Aufgabe sinnvoll umgehen kann, muss nämlich Einiges passieren.

Nehmen wir das Beispiel mit dem Text, den ihr in Google-Übersetzer kopiert und den das Programm nun automatisch in einer anderen Sprache wieder ausspucken soll. Wie soll der Computer da rangehen? Er könnte natürlich jedes Wort im Wörterbuch nachschlagen und die Übersetzung hinschreiben, die er dort findet. Das wird spätestens dann scheitern, wenn er bei einem Satz wie „Ich renne“ ankommt. „renne“ steht nämlich nicht in seinem Wörterbuch, weil es nicht die Grundform des Wortes „rennen“ ist. Okay, sagen wir also, wir schreiben ein unendlich langes und ausführliches Wörterbuch, in dem alle Nicht-Grundformen ebenfalls drinstehen. Problem gelöst? Jetzt mal angenommen, da steht nicht „Ich renne“ sondern „Rennen ist anstrengend“. Soll der Computer das Wort „Rennen“ jetzt als Nomen („das Rennen“, also „the race“) ins Englische übersetzen oder als Verb (die Tätigkeit „rennen“, also „(to) run“)? Um zu wissen, was hier besser passt, muss er sich den Satzbau oder den Kontext angucken: Das Wort „Rennen“ kann zwar beides bedeuten, in diesem bestimmten Satz aber nur eins von beidem. Ein anderes berühmtes Beispiel ist der Satz „Der Mann sieht die Frau mit dem Teleskop“ – wer hat das Teleskop, der Mann oder die Frau? Wir müssten weiterlesen, um die Antwort zu erfahren. Haben wir das Problem damit dann gelöst? Wie sieht es denn aus, wenn die Sprache, in die übersetzt werden soll, eine andere Grammatik hat als das Deutsche? Was, wenn man im Deutschen zwar sagt „Ich renne schnell“, in der anderen Sprache aber „Renne schnell ich“ oder so? Und was soll der Computer mit Redewendungen anstellen? Das berühmte „Es regnet Katzen und Hunde“ im Englischen zum Beispiel: Wörtlich oder sinngemäß übersetzen?

Schon nach diesem kleinen Einblick stimmt ihr mir vielleicht zu: Das ist alles gar nicht so einfach, wie es aussieht. Also seid nachsichtig mit Google-Übersetzer, wenn er mal wieder wirres Zeug ausspuckt – immerhin steckt er noch in den Kinderschuhen und hat dementsprechend viel zu lernen. Wer ihm das alles beibringen soll? Richtig, an dieser Stelle komme ich ins Spiel. Ich arbeite zwar (noch) nicht unmittelbar an Google-Übersetzer, aber ich lerne immerhin gerade in meinem Studium, wie man solche Sprachverarbeitungsprogramme wie Google-Übersetzer, Siri oder auch Word entwickelt.

Diejenigen unter euch, die sich selbst für ein sprachliches Studienfach interessieren, haben es wahrscheinlich schon herausgefunden: Mit einem Abschluss in Germanistik (also Deutsch) wird man entweder Lehrer oder Journalist – oder, wenn man das beides nicht will, arbeitslos. Oder zumindest hat man mit einer hohen Wahrscheinlichkeit beruflich nichts mehr mit Germanistik zu tun. Also, was tun? Ich persönlich würde mich mit einem gewissen Stolz als „Philologin“ bezeichnen; das ist das Fachwort für einen Sprachwissenschaftler, eigentlich heißt es aber auf Griechisch „Jemand, der Worte liebt“. Und was kann ich mir davon jetzt kaufen? Die Aufgaben, die einst von Philologen erledigt wurden, übernehmen heute mehr und mehr die Computer: Übersetzen, Dolmetschen, Rechtschreibkorrektur, Sortieren und Klassifizieren von Texten, Zusammenfassungen schreiben, Fremdsprachenunterricht… Mit so einem Berufswunsch schreibt man sich schnell selbst auf die „Liste der aussterbenden Arten“, die bald von der Technik verdrängt werden könnten.

Meine persönliche Lösung sieht also ein bisschen anders aus: Anstatt mit den Computern um die vorhandenen Berufe im sprachlichen Feld zu wetteifern (und mit großer Wahrscheinlichkeit zu verlieren), beteilige ich mich selbst an der Weiterentwicklung dieser Computer. Dass die maschinelle Verarbeitung von Sprache in Zukunft sinnvoll und nützlich sein kann, muss man ja leider auch als noch so sturer Philologe zugeben – die zahlreichen schon existierenden Anwendungsbeispiele geben einen Hinweis. Also wurde mein erster Studienwunsch Germanistik kurzerhand zum Nebenfach degradiert und mein Hauptfach heißt jetzt „Computerlinguistik“! Die Idee dafür kam von einer großartigen Lehrerin, die sich an dieser Stelle gern angesprochen fühlen darf und der ich abermals für diesen wertvollen Vorschlag danken muss. Das Studium ist nämlich großartig! Da ich zuvor nicht viel über das Fach wusste und nicht recht einschätzen konnte, ob es das Richtige für mich ist, war das erste Semester zunächst ein Ausprobieren; nach dem Motto „Probieren geht über Studieren, und wenn‘s nichts wird, wechsele ich halt später noch!“

So hat es mich also in die wunderschöne Stadt Heidelberg verschlagen, und wenige Tage unter anderen Computerlinguisten (oder CoLis, das klingt viel netter!) haben mich schlagartig überzeugt, dass ich ganz genau hierher gehöre. War ich in unserem Jahrgang in der Schule immer ein bisschen außen vor, weil keiner meine Interessen so ganz nachvollziehen konnte, so bin ich jetzt plötzlich von allen Seiten von Menschen umgeben, die nicht genervt sind, wenn man mit ihnen über Grammatik diskutieren will, sondern die begeistert auf das Thema eingehen! Menschen, die den besten Humor haben, der mir je untergekommen ist, die die gleichen Bücher lesen und Filme schauen wie ich, die sogar genauso kakaosüchtig sind (ich hatte in meinem Jahrgang den Ruf, überall mit einer Tüte Kakao aus der KAVerne aufzutauchen...). Dazu kommt, dass wir ein recht kleines Fach sind, sodass man sich untereinander schnell persönlich kennen lernt. Dass das alles nicht selbstverständlich ist, bekomme ich von Kommilitonen und auch durch mein Nebenfach Germanistik mit – viele finden nicht so leicht Anschluss in ihrem Fach. Umso glücklicher bin ich, Leute gefunden zu haben, die genauso verrückt sind wie ich…

Um mich mit dem Stoff anzufreunden, brauchte ich ein wenig länger – ich werde nie vergessen, wie entsetzt ich in der ersten Vorlesung über das Tempo war, mit dem unsere Dozentin die 75 Powerpoint-Folien in 90 Minuten präsentiert hat. Danach hätte ich mich am liebsten in die Ecke gesetzt und geweint oder das Studium wegen völliger Überforderung abgebrochen. Inzwischen finde ich das Tempo angenehm. Kennt ihr das, wenn euch Studenten sagen „Oooh, das Abi war so einfach, das Studium ist viel anstrengender“ und ihr denkt, sie übertreiben bloß? Sie haben in den meisten Fällen recht. Die Arbeitsweise und das -tempo im Studium sind komplett anders als in der Schule (man ist viel selbstständiger, hat also mehr Eigenverantwortung) und der Stoffumfang in den Klausuren ist oft erheblich größer als beim Abi. Das heißt: Man muss den Abschluss schon wollen, um die nötige Motivation zum Arbeiten aufzubringen. Uni ist ja bekanntlich auch nicht jedermanns Sache. Mir ging es aber so, dass ich mich schnell darauf eingestellt habe, nachdem ich die neue Arbeitsweise erst einmal akzeptiert hatte.

Inhaltlich setzt sich die Computerlinguistik hauptsächlich aus den drei Teilbereichen Linguistik (Sprachwissenschaft), Mathematik und Informatik zusammen. Das heißt, man braucht einerseits ein gutes systematisches beziehungsweise analytisches Denken, andererseits aber auch idealerweise ein geisteswissenschaftliches Sprachgefühl. Besagte Lehrerin meinte einmal zu mir „Sie verstehen das System hinter einer Sprache schnell“, was das Ziel des Studiums eigentlich auf den Punkt bringt. Diese sehr spezielle Kombination von Fähigkeiten trägt sicher ebenfalls dazu bei, dass die CoLis viele Gemeinsamkeiten haben, die genau daraus hervorgehen. Im Grundstudium lernt man zunächst das Programmieren (man kann also auch Computerlinguistik studieren, wenn man noch nie vorher programmiert hat – ich denke im Moment oft an meinen ehemaligen Informatiklehrer, der mir sagte, ich sei zwar die Kursbeste, aber ich sollte auf keinen Fall etwas mit Informatik studieren) und erwirbt weitere Basiskenntnisse etwa in der Sprachwissenschaft, Mathematik, Logik und so weiter. Außerdem lernt man einige der wichtigsten computerlinguistischen Vorgehensweisen kennen, mit denen Texte verarbeitet, also zum Beispiel übersetzt, in bestimmte Klassen eingeordnet oder inhaltlich interpretiert werden. Man fängt also schon früh damit an, auch selbst kleine Programme zu entwickeln, die solche Aufgabenstellungen lösen. Erst danach spezialisiert man sich schließlich, auf diesem Grundwissen aufbauend, weiter auf bestimmte Themen, mit denen man sich näher befassen möchte.

Wer sich unter den aktuellen technischen Entwicklungen umsieht, kann sich denken, dass man als CoLi später auch beruflich recht gute Chancen hat, zum Beispiel in der Softwareentwicklung eine Stelle zu finden. Obwohl Computerlinguistik eigentlich ein Seitenzweig der Informatik ist, heißt es oft, dass man mit einem Abschluss darin leichter als mit einem Informatik-Abschluss eine Arbeit findet – weil man eben für bestimmte Aufgabenstellungen besser spezialisiert ist und man sich von der Masse der Informatiker, die alle so in etwa das Gleiche gemacht haben, abhebt. So werde ich zwar wegen meines Nebenfaches Germanistik, das weniger glorreiche Berufsaussichten hat, öfter mal gefragt: „Bist du nicht die, die Busfahren studiert?“ Gleichzeitig hoffe ich aber insgeheim, eines Tages vielleicht selbst mal ein Programm-Baby großzuziehen und zu betreuen, das sich mit Google oder Word messen kann.

Ich selbst bin also vollauf begeistert von meinem Studium und vielleicht kann ich ja den einen oder anderen von euch ebenfalls für Computerlinguistik begeistern, auch wenn – oder gerade, weil es ein eher unbekanntes Studienfach ist. Also: Wenn ich euch neugierig auf mehr gemacht habe, meldet euch gerne einfach bei mir, ich würde mich freuen!