Deep Voice heißt die Stimm-KI des chinesischen Technologiekonzerns Baidu (bekannt auch für sein gleichnamiges soziales Netzwerk) und baut auf Googles „Deepmind-Wavenet-Technologie“ auf. Durch einen verbesserten Algorithmus kann die Deep-Voice-KI, natürliche Sprache innerhalb von Stunden lernen. Hierin besteht auch ein großer Vorteil gegenüber Microsofts Cortana.
Während unsere geliebte Halo-Assistentin Stunden eingesprochenen Materials benötigt, um mit uns zu kommunizieren, baut Baidus‘ (und Googles‘) Lösung einen Sprachschatz aus dem Nichts auf. Sowohl Baidu als auch Google setzen auf maschinelles Lernen, um ihren KIs Sprache beizubringen. Um wirkliche Konversation zu betreiben, muss die KI in Bruchteilen von Sekunden antworten können – dies erfordert sehr viel Rechenleistung.
Baidus neuer Algorithmus hat den Vorgang des maschinellen Lernens verbessert und so die benötigte Rechenpower reduziert. Außerdem haben die Chinesen die Aussprache der KI verbessern können. Sogar feine Abstufungen in der Betonung der Wörter sind möglich.
Es gibt aktuell leider keine öffentlichen Sprachproben. Baidu ist sich seiner Technologie aber sicher und behauptet, dass diese bis zu 400 mal schneller reagiere als manch andere Sprach-KIs.
Echte Konversation mit Computern scheint wirklich nicht mehr allzu fern zu sein. Hoffen wir, dass das Forschungsteam von Microsoft hier auch einige Trümpfe im Ärmel hat.
Was sagt ihr zum derzeitigen Entwicklungsstand der Sprach-KI. Wie lange wird es eurer Meinung noch dauern, bis wir natürlich mit Maschinen kommunizieren werden?
Wird auf jeden Fall wichtig werden. Die recht steife und unnatürliche Aussprache ist eins der wenigen Dinge, die mich an Cortana wirklich stören..
Die aussprache ist das eine, aber einer maschine moralische werte und somit einen Charakter zu geben das andere. Das denke ich wird dann nochmal ne sache für sich sein.
Und kontextbezogene Unterhaltungen… Das ist für mich das wichtigere
Wieso muss eine KI innerhalb von Bruchteilen von Sekunden antworten können, um Konversation zu betreiben? Welcher Mensch macht das denn bitte?
Dein Verstand formuliert bereits etwas, wenn die Person gegenüber den Satz noch nicht einmal vollendet hat. Natürlich kannst du dich dann entschließen, deine Antwort um eine Stunde zu verzögern.
„Alexa“ Lies mir bitte die Nachrichten zum CIA Leak vor…
Weshalb äußert sich WindowsUnited eigentlich nicht über die geleakten CIA Dokumente ( Vault7) von Wikileaks. Weshalb kommt da bis heute noch keine Einschätzung von Euch? Kein moralisches Pflichtbewusstsein? Hauptsache einen fetten Status von Ed Snowden tragen.., bin darüber jetzt echt irritiert ! „Change has to flow from the bottom to the top.“ – Ed Snowden
Und? Das Thema wurde in vielen großen Nachrichtenforen heiß diskutiert und um jetzt darauf zu reagieren finde ich es schon reichlich spät. Du weißt es doch schon also worauf wartest du? Es ist ja meine Meinung, aber ich erwarte nicht von einem Dienst/ einer Seite mir alle Nachrichten vorzulegen. So viel Zeit muss sein, sich das rauszupicken, was einen interessiert.
„Aufbauen tut sie…“ Wirklich? Ich bin sicher überkorrekt, aber ich lese hier auch wegen der guten Sprache. Darf ich das heute mal kritisieren..?
Star Trek Widerstand ist zwecklos….
Mich regt es auf, dass ich immer sehr laut mit meiner Kinect kommunizieren muss, damit sie mich versteht…
Bei mir geht „hex Cortana“ nimmer .. Ich finde auch die Einstellung nirgends mehr 🤷
Bin im Slow Ring, weiß man ob das entfernt wurde?