Gemini Live ist in den letzten Monaten etwas eingeschlafen, nun geht Google in die Vollen und plant ein umfangreiches Update für die Live-KI auf Android.
Gemini Live: Denkprozess, Gedächtnis und mehr
Gemini Live wird schon bald mit mehr Funktionen ausgestattet, das verrät der Quellcode der neuesten App-Version bereits vorab. Geplant ist „Gemini Labs“, dadurch werden experimentelle Funktionen bereits vorab freigeschaltet. Dazu gehört dann unter anderem der neue „Live Thinking Mode“.
Gemini Live antwortet normalerweise schnell und sofort, dabei kommt also niemals der erweiterte Denkprozess zum Einsatz, sondern eher Gemini Flash. Das scheint Google ändern zu wollen, der Nutzer kann bei Bedarf künftig in Gemini Live auch den „Thinking-Modus“ verwenden, dabei werden Antworten deutlich umfangreicher und länger überdacht.
Außerdem ist durch die neuesten Quellcode-Strings bekannt, dass Verbesserungen wie ein multimodales Gedächtnis, eine optimierte Geräuschunterdrückung sowie personalisierte Ergebnisse auf Basis von Google-Apps zusammengefasst, geplant sind und demnächst integriert werden.
UI Control ist hingegen eine Agentenfunktion, welche die Steuerung des Smartphones übernimmt, um Aufgaben eigenständig innerhalb von Apps auszuführen. Das erinnert an „Computer Use“, was vor wenigen Tagen für die Pixel-Smartphones aufgetaucht ist.
Was Gemini Live schon länger kann: Die Welt durch die Kamera erblicken und das soll künftig noch besser in Echtzeit funktionieren. Auf dem Kamerabild könnte sich etwas tun und Gemini Live würde dann wohl sofort selbst darauf reagieren.
Und zu guter Letzt ist Deep Research für Gemini Live geplant, das steht bislang auch nur in normalen Gemini-Chats zur Verfügung. Der Nutzer kann also im Live-Gespräch auf eine umfassende Recherche bestehen, wobei die genaue Umsetzung noch nicht bekannt ist.
Wechsel auf neues Gemini-Sprachmodell
Die enttarnten Hinweise offenbaren auch einen geplanten Wechsel auf Gemini 3, denn derzeit setzt Gemini Live noch auf das ältere Sprachmodell 2.5. Gemini 3 wurde vor wenigen Monaten eingeführt und war ein riesiger Sprung.
Ich bin gespannt, ob man diese neuen Funktionen dann auch verwenden kann, wenn Gemini Live zum Beispiel während der Fahrt in Android Auto verwendet wird. Das würde die Gesprächsmöglichkeiten noch einmal auf ein anderes Level bringen. Klar ist jedenfalls, dass die Gemini Live-UI aufgrund dieser neuen Funktionen dann auch ein Upgrade benötigt.
