Google arbeitet an völlig neuen Tools für seine Gemini-KI und dazu gehört auch endlich ein Agent. Der große Vorteil dieser Agenten ist, dass sie einen Computer bedienen können und das möglichst ähnlich wie ein echter Mensch. Sie scannen nicht nur den Inhalt einer Webseite, sie können die Webseite tatsächlich bedienen.
Dadurch wird es möglich sein, dass die KI-Tools wie Gemini und ChatGPT immer mehr Aufgaben für uns erledigen können, die wir bislang selbst tun mussten. Ich selbst nutze den ChatGPT-Agent bereits seit einiger Zeit und Google will mit einem Gemini Agent schon bald eine Antwort parat haben.
Leaks aus den vergangenen Tagen zeigen, dass Google an einem Gemini Agent arbeitet. Das Feature wird gerade in die Webversion integriert und stand testweise zur Verfügung.
Laut den bisherigen Erkenntnissen kann der Gemini Agent Webseiten durchsuchen, mit ihnen interagieren, externe Tools und Dienste nutzen und mehrere Aktionen über eine fortlaufende Sitzung hinweg ausführen. Der Gemini Agent behält sogar Logins und Sitzungszustände, was deutlich komplexere Aufgaben möglich macht.
Angeblich steht auch Gemini 3 bevor, beides könnten zusammen noch im Oktober 2025 in einem neuen Gemini Feature Drop angekündigt werden.
wie immer nur recht laue Infos von euch. hätte könnte vermutlich vorerst in den usa
langweilig bis in die Haarspitzen
ich muss Ulf da völlig recht geben, denn nicht mal der alte Assistant ist reibungslos gelaufen und das tut er auch bis heute nicht. Bin mal gespannt was noch den großen Ankündigungen wieder für ein Ärger auf einen zukommt.