Die Website tagesschau.de berichtete am 12.04.2021, dass Microsoft für knapp 20 Milliarden Dollar das Unternehmen Nuance Communications übernahm. Dies ist die zweitteuerste Übernahme von Microsoft. Damit ergänzt Microsoft seine eigenen Spracherkennungsdienstleistungen, die unter dem Namen »Speech« bzw. »Azure Cognitive Service« bekannt sind.
Wer ist Nuance?
Seit 20 Jahren bietet Nuance Spracherkennungssoftware an, die gegenwärtig unter dem Namen »Dragon« bekannt ist. Es gibt nicht nur Versionen für Anwender wie Autoren und Firmen, sondern auch Speziallösungen für Ärzte und Juristen mit deren speziellem Vokabular. Die Technologie von Nuance wird auch von Daimler und BMW in ihren neuen Fahrzeugen genutzt. 77 % aller US-Krankenhäuser nutzen Nuance-Software.
Nuance für den normalen Benutzer
Für den normalen Anwender wird aktuell Dragon Individual in der Version 15 verkauft, die unter Windows 7, 8.1 und 10 läuft. Die Mac-Version (6.0.8) wurde 2017 eingestellt, da der Aufwand der Umstellung des Programms von 32- auf 64-Bit für den Hersteller vielleicht nicht lukrativ genug war.
Meine persönlichen Erfahrungen
Die Nuance-Software wurde von Version zu Version besser. Früher musste man ein Headset oder Spezialmikrofon zum Diktieren von Texten nutzen. Beim ersten Einsatz der Software war es notwendig Übungstexte vorlesen, damit die Software sich an die Stimme des Benutzers anpassen konnte.
Die Spracherkennung von Dragon 6 (Mac), Stand 2017, ist der von Apple Siri in Geschwindigkeit und Treffergenauigkeit überlegen. Obwohl Siri seit 2013 Technologie von Nuance nutzt. Dragon läuft auch ohne Internetverbindung und in einer ruhigen Umgebung reicht das Mikrofon in einem Laptop aus. Ein Training mit Übungstexten wie früher ist nicht mehr notwendig. Aber nicht nur das Diktieren von Texten ist damit möglich, sondern es können auch Programme wie MS WORD oder das Betriebssystem gesteuert werden.
Fazit
Die Konzentration im Software-Markt geht immer weiter. IBM ist der letzte Mitbewerber im Bereich Spracherkennungsdienstleistungen. Spracherkennung und auch Sprachausgabe (Text-to-Speech) mit Hilfe von künstlicher Intelligenz (KI) sind ein Wachstumsmarkt. Wohin technisch die Reise gehen wird, das kann man in Science-Fiction-Serien wie »Star Trek« sehen, wo der Computer jedes Wort versteht, sinnvoll antwortet und auch übersetzen kann. Ob eine so starke Konzentration in den Händen der Software-Riesen die Kreativität nicht bremst, das wird die Zukunft zeigen.
Links:
- https://www.tagesschau.de/wirtschaft/unternehmen/microsoft-nuance-ki-101.html
- https://www.nuance.com/de-de/index.html
- https://speech.microsoft.com
- https://www.ibm.com/de-de/cloud/watson-speech-to-text
----
Bildquellen:
Vorschau, Titel (Symbolbild): © 2008/2021 draupnir; gerendert mit Carrara 8.5 Pro