Wir sind unzufrienden mit der Genauigkeit der Spracherkennung für verschiedene deutsche Dialekte in allen Spracheingaben von OpenAI Google etc. Daher haben wir beschlossen, ein eigenes Modell zu trainieren, das verschiedene deutsche Dialekte besser versteht. Dafür brauchen wir jedoch möglichst viele Sprachproben von Muttersprachlern in verschiedenen Dialekten. Was das System noch nie gehört hat kann es auch nicht verstehen.
Deswegen suchen wir nach Menschen die im Alltag im Dialekt sprechen und bereit sind ein paar Sätze in ihrem Dialekt beiszusteuern.
Um das so einfach wie möglich zu machen, haben wir eine Android App+Webseite erstellt die Aufnahmen direkt im Browser oder per App ermöglicht.
Die Aufnahmen werden dann automatisch in unserem System gespeichert und für das Training des Modells verwendet.
Dialektsammler aus dem PlayStore)Die Aufnahmen werden geprüft um sicherzustellen, dass die Transkriptionen korrekt sind und keine sensiblen Informationen enthalten.
Es ist sehr wichtig dem Neuronalen Netz nur korrekte Beispiele zu geben, damit es lernt den Dialekt zu verstehen und nicht von wiedersprüchlichen Beispielen verwirrt wird.
Nach der Prüfung werden die Aufnahmen und Transkriptionen verwendet, um das Spracherkennungsmodell zu trainieren.
Das Modell wird dann in unseren Diensten eingesetzt, um die Spracherkennung für möglichst viele deutsche Dialekte zu verbessern.
Da wir in Niederbayern ansässig sind fokusieren wir uns als erstes auf bayerische Dialekte, aber wir freuen uns über Beiträge aus ganz Deutschland.
Wenn du mehr über das Projekt erfahren möchtest, besuche bitte die Dialektsammler Landingpage. Dort findest du weitere Informationen über das Projekt, die Technologie dahinter und wie du uns unterstützen kannst. Außerdem findest du dort auch eine FAQ Sektion die viele deiner Fragen beantworten könnte.