Coflnet

Dialekt Sprecher gesucht

Äkwav
#dialekt#Spracherkennung#Speech to text#bayersich
  • Wir sind unzufrienden mit der Genauigkeit der Spracherkennung für verschiedene deutsche Dialekte in allen Spracheingaben von OpenAI Google etc. Daher haben wir beschlossen, ein eigenes Modell zu trainieren, das verschiedene deutsche Dialekte besser versteht. Dafür brauchen wir jedoch möglichst viele Sprachproben von Muttersprachlern in verschiedenen Dialekten. Was das System noch nie gehört hat kann es auch nicht verstehen.

    Deswegen suchen wir nach Menschen die im Alltag im Dialekt sprechen und bereit sind ein paar Sätze in ihrem Dialekt beiszusteuern.
    Um das so einfach wie möglich zu machen, haben wir eine Android App+Webseite erstellt die Aufnahmen direkt im Browser oder per App ermöglicht. Die Aufnahmen werden dann automatisch in unserem System gespeichert und für das Training des Modells verwendet.

    Wie funktioniert das?

    1. Besuche dia.coflnet.com/app (Oder lade Dialektsammler aus dem PlayStore)
    2. Gib optional deine E-Mail Adresse ein (für eventuelle Rückfragen und damit du, wenn du dich umentscheidest, deine Aufnahmen löschen kannst)
    3. Gib deine Postleitzahl ein (damit wir den Dialekt zuordnen können)
    4. Drücke auf “Aufnahme starten”
    5. Sprich frei etwas ein, erzähle ideallerweise etwas aus deiner Kinderheit oder Alltag ohne bezug auf dritte Personen.
    6. Drücke auf “Aufnahme beenden” wenn du fertig bist.
    7. Die App teilt deine Sätze automatisch und erlaubt dir aufzuschreiben wie du erwarten würdest, dass das System deine Sätze transkribiert.
    8. Nach dem du dir deine Aufnahme erneut angehört hast, kannst du die Aufnahme beitragen.
    9. Wiederhole das so oft du möchtest je mehr Beispiele wir haben desto genauer wird das system.

    Was passiert mit meinen Aufnahmen?

    Die Aufnahmen werden geprüft um sicherzustellen, dass die Transkriptionen korrekt sind und keine sensiblen Informationen enthalten. Es ist sehr wichtig dem Neuronalen Netz nur korrekte Beispiele zu geben, damit es lernt den Dialekt zu verstehen und nicht von wiedersprüchlichen Beispielen verwirrt wird. Nach der Prüfung werden die Aufnahmen und Transkriptionen verwendet, um das Spracherkennungsmodell zu trainieren. Das Modell wird dann in unseren Diensten eingesetzt, um die Spracherkennung für möglichst viele deutsche Dialekte zu verbessern.
    Da wir in Niederbayern ansässig sind fokusieren wir uns als erstes auf bayerische Dialekte, aber wir freuen uns über Beiträge aus ganz Deutschland.

    Wo kann ich mehr erfahren?

    Wenn du mehr über das Projekt erfahren möchtest, besuche bitte die Dialektsammler Landingpage. Dort findest du weitere Informationen über das Projekt, die Technologie dahinter und wie du uns unterstützen kannst. Außerdem findest du dort auch eine FAQ Sektion die viele deiner Fragen beantworten könnte.

    ← Zurück zum Blog