RE: News und Infos zu KI - Künstliche Intelligenz
| 14.08.2024, 19:33 (Dieser Beitrag wurde zuletzt bearbeitet: 14.08.2024, 19:41 von minenfuchs.)
Gemini live ist da:
https://blog.google/intl/de-de/produkte/...ogle-2024/
Aber wie ist das nun mit der benutzerdefinierten Spracherkennung?
Bei Microsoft Azure trainiere ich noch, bin von 70% Wortfehlerrate auf 20% runter. Da sieht man, wie schlecht das Standardmodell undeutliche Sprache erkennt. Beim sprechenden Computer - mit meiner Stimme - bin ich noch am recherchieren, die großen Anbieter wollen keine privaten Nutzer.
Was schade ist, meine Microsoft-Stimme ist nahezu perfekt. Deutlich besser als die von elevenlabs und der Zero shot von coqui xtts kommt gar nicht ran. Microsoft lernte aber fast eine Stunde, deren Zero shot war auch nix.
https://blog.google/intl/de-de/produkte/...ogle-2024/
Aber wie ist das nun mit der benutzerdefinierten Spracherkennung?
Bei Microsoft Azure trainiere ich noch, bin von 70% Wortfehlerrate auf 20% runter. Da sieht man, wie schlecht das Standardmodell undeutliche Sprache erkennt. Beim sprechenden Computer - mit meiner Stimme - bin ich noch am recherchieren, die großen Anbieter wollen keine privaten Nutzer.
Was schade ist, meine Microsoft-Stimme ist nahezu perfekt. Deutlich besser als die von elevenlabs und der Zero shot von coqui xtts kommt gar nicht ran. Microsoft lernte aber fast eine Stunde, deren Zero shot war auch nix.