OpenAI hat ChatGPT Agent vorgestellt, eine Erweiterung des Chatbots, die eigenständig am Computer arbeiten kann. Das System kombiniert die Fähigkeiten der bisherigen Tools Operator (den es nur im 200 US-Dollar-Tarif gab)und Deep Research und nutzt einen eigenen virtuellen Computer für die Aufgabenausführung.
OpenAI wirbt mit folgenden Funktionen des ChatGPT Agents:
- Das System kann Kalender analysieren und anhand aktueller Nachrichten über bevorstehende Kundenbesprechungen informieren.
- Es analysiert Wettbewerber und erstellt daraus automatisch Präsentationen mit bearbeitbaren Elementen.
- Das Tool führt eingehende Finanzrecherchen durch und erstellt detaillierte Berichte.
- Es füllt Online-Formulare aus und reicht beispielsweise Spesenabrechnungen ein.
- Das System erstellt ausgereifte Diashows und Tabellenkalkulationen als Output seiner Analysen.
- Es kann Screenshots oder Dashboards in Präsentationen mit bearbeitbaren Vektorelementen umwandeln.
- ChatGPT Agent plant und bucht Besprechungen um sowie Veranstaltungen außerhalb des Büros.
- Das System aktualisiert Tabellenkalkulationen mit neuen Finanzdaten unter Beibehaltung der ursprünglichen Formatierung.
- Es plant und bucht komplette Reiserouten sowie Dinnerpartys.
- Das Tool kann Experten finden und Termine mit ihnen vereinbaren.
- Es generiert automatisch wiederkehrende Berichte wie wöchentliche Messberichte jeden Montagmorgen.
Das zugrundeliegende Modell wurde speziell für mehrstufige Aufgaben trainiert und nutzt verschiedene Tools: einen visuellen Browser für Website-Interaktionen, einen textbasierten Browser für einfache Abfragen und direkten API-Zugriff für Datenabfragen.
OpenAI hat Sicherheitsmaßnahmen implementiert: Das System fordert vor irreversiblen Aktionen wie E-Mail-Versand oder Buchungen eine Nutzerbestätigung an. Finanztransaktionen sind derzeit gesperrt.
In verschiedenen Benchmarks zeigt ChatGPT Agent deutliche Leistungsverbesserungen gegenüber bestehenden Lösungen. Bei Tabellenkalkulationsaufgaben erreichte das System 45,5 Prozent Genauigkeit, während Microsofts Copilot in Excel nur 20 Prozent erzielte. In Datenanalyse-Tests übertraf ChatGPT Agent mit 89,9 Prozent sogar die menschliche Leistung von 64,1 Prozent.
ChatGPT Agent soll ab sofort für Pro-, Plus- und Team-Nutzer verfügbar sein, ich habe ihn bei mir allerdings noch nicht entdeckt. Ich wäre trotz aller großen Versprechen von OpenAI noch ziemlich vorsichtig bei solchen Agentensystemen und eher skeptisch, ob er alle Aktionen auch wirklich so zuverlässig wie beschrieben ausführen kann. Sollte das der Fall sein, könnte der ChatGPT Agent aber sowohl im privaten als auch beruflichen Alltag Arbeit und Klicks abnehmen. Fragt sich, zu welchem Preis.