Google hat mit einem Video demonstriert, was Gemini Live in Zukunft leisten können wird. Hier stellt man eine Verbindung mit den neuen Agentenfunktionen her, denn Gemini kann in naher Zukunft andere Software bedienen, etwa Webseiten oder Apps wie YouTube. Das wird einen signifikanten Unterschied ausmachen.
Statt euch einfach Fragen zu beantworten, kann sich Gemini Live zukünftig durch Webseiten und Dokumente bewegen, auch durch YouTube scrollen oder auf dem Bildschirm bestimmte Inhalte optisch hervorheben. Gezeigt wird ein Beispiel mit der Frage, welche Schraube der Nutzer benötigt und Gemini hebt die richtige hervor, die die KI durch die Smartphone-Kamera sehen kann.
KI-Agenten sind das nächste große Ding, denn sie können fremde Software bedienen und müssen nicht alles selbst beherrschen, was andere Anwendungen zu bieten haben. Beispiel: Statt selbst Photoshop sein zu wollen, kann die KI das echte Photoshop bedienen und liefert somit ein theoretisch sehr viel besseres Ergebnis durch die Verwendung des Originals.