• Alwine Hellmeier

Präsens-Unterricht: Was wir besser machen – Spracherkennung

Was sich einst in Science-Fiction Romanen ausgemalt wurde, ist lange nicht mehr nur das, sondern Wirklichkeit. Dass Unterhaltungen von Maschinen erkannt, in kürzester Zeit analysiert und zu Texten umgewandelt werden oder Antworten generieren, begegnet uns immer häufiger. Ermöglicht wird das durch Algorithmen, die die sprachlichen Daten analysieren.


Dass diese Systeme unfassbar komplex sind, liegt vor allem daran, dass der zugrunde liegende Gegenstand so komplex ist.


Eine einzelne Äußerung kann schon Schwierigkeiten bereiten. Denn wenn wir etwas Gesprochenes hören, dann nehmen wir einen Lautfluss wahr. Die Wörter werden i.d.R im Zusammenhang mit anderen Wörtern und nicht einzeln ausgesprochen. Dasselbe müssen Algorithmen leisten.



Aus einem Sprachschall Daten zu gewinnen, das ist die Herausforderung. Haben Sie erkannt, dass hier gesagt wurde »Druckkultur arago Consulting«?



Die wohl komplexeste Aufgabe ist jedoch, die sprachlichen Produkte in ihren Kontext einzuordnen. Denn manche Ausdrücke, wie zum Beispiel mehrdeutige, versteht man erst, wenn sie in einem Satz- oder Sachverhaltskomplex stehen: Er sitzt auf der Bank. - Er geht in die Bank (Sitzmöbel vs. Institution).


Hürden, die das System überwinden muss, entstehen auch durch den Sprachwandel. Sprache verändert sich andauernd. Das spiegelt sich beispielsweise in neuen Wortschöpfungen oder in Wörtern, die unmodern wirken, wider. Auch sich wandelnde grammatische Strukturen stellen eine Barriere dar.


Außerdem kommt die Schwierigkeit der dialektalen Sprache hinzu, an der nicht unbedingt nur die Algorithmen kapitulieren, sondern manchmal auch Zuhörende aus anderen Regionen.


Während wir bei einem Gespräch den Äußerungskontext einbeziehen, Umgebungsgeräusche ausblenden oder Versprecher einordnen, können Spracherkennungsalgorithmen (noch) nicht alles in einer kommunikativen Situation Vorkommende sortieren, filtern und ausgleichen.


Und damit befassen sich Computerlinguistinnen und –linguisten. Sie bilden die Schnittstelle zwischen der Sprachwissenschaft und der Informatik und befassen sich unter anderem damit, dass natürliche Sprache anhand verbaler oder textueller Information durch automatische Prozesse verarbeitet werden kann.


Alexa, Siri und Cortana sind da die wohl bekanntesten Spracherkennungssysteme, die auf Smartphones, aber auch auf Computern fester Bestandteil geworden sind. Diese Systeme begegnen uns aber auch beim Telefon-Banking, an Ticketautomaten oder in Call-Centern. Wenn es nach einer Bahn-Verspätung beim nächsten Informationscenter zu Missverständnissen kommt, wissen Sie hiermit, woran es liegen könnte.

13 Ansichten0 Kommentare

Aktuelle Beiträge

Alle ansehen