Damit KI-Funktionen wie Gemini Live wirklich gut funktionieren, muss vor allem die Verarbeitungsgeschwindigkeit schnell sein. Google arbeitet jedoch auch an mehr Natürlichkeit, damit der Sprachassistent auf eure Situation reagieren kann. Dafür wird eure Spracheingabe analysiert und die Tonart der KI-Stimme entsprechend angepasst.
Neu ist eine native Audioausgabe für Gemini Live, die gerade immer mehr Android-Geräte erreicht. Dahinter steckt eine neue API, damit die Audioverarbeitung auf direktem Weg funktioniert. Ziel ist eine „reaktionsfreudigere und ausdrucksstärkere Unterhaltung“ – also eine wesentlich natürlichere Sprachinteraktionen zwischen Nutzer und KI.
Das System analysiert Intonation, Rhythmus und Tonhöhe des Nutzers, um den Sprachstil der KI kontextabhängig anzupassen. Auf einen gestresst klingenden Nutzer reagiert die KI mit einer ruhigeren, ausgeglicheneren Stimme. Einer traurigen Stimme wird der KI wieder anders begegnen. Im Grunde genommen lernt die KI empathisch zu sein oder wenigstens empathisch zu klingen.
einfach nur grausam die neue Stimme! Leider kann man auf die Alte nicht zurück stellen!
gefällt mir sehr 👍