Gemini Desktop testet Diktieren per Hotkey und einen Cursor, der mitdenkt

Google Gemini Hero

Bild: Google

Die Gemini-App auf dem Mac hängt seit dem Start hinter der Handy-Version her. Diese Lücke will Google jetzt offenbar schließen. Laut einem Bericht von TestingCatalog testet das Unternehmen mehrere neue Funktionen in der macOS-App. Die Live-Oberfläche sieht jetzt mehr so aus wie am Handy, was ja auch irgendwie Sinn ergibt.

TestingCatalog-Screenshot-2026-06-24-at-00.46.04
Bild: TestingCatalog

Dazu kommen drei neue Sprachfunktionen mit einem gemeinsamen Ziel: Gemini soll nicht länger im eigenen Fenster sitzen, sondern überall auf dem Rechner mitarbeiten.

Diktieren per Hotkey, überall

Die erste Funktion ist eine systemweite Diktierfunktion, die in den Berichten Speak to Window heißt. Ihr legt einen Hotkey fest, wechselt in Browser oder Editor und sprecht einfach los. Gemini blendet ein Panel ein und schreibt den Text dorthin, wo der Cursor steht. Im Grunde ist das eine Sprach-Tastatur fürs ganze System.

SmartDroid.de bei Google folgen
TestingCatalog-Screenshot-2026-06-22-at-23.02.32
Bild: TestingCatalog

Eine ähnliche, bildschirmbewusste Schreibhilfe hatte Google schon auf der I/O gezeigt. Auf dem Mac träte Gemini damit gegen Apples eigene Diktierfunktion und gegen Whisper-Tools wie Superwhisper an. Eine vergleichbare KI-Diktierfunktion bereitet Google parallel fürs Gboard auf Android vor.

Ein Cursor, der mitdenkt

Die zweite Neuerung erinnert an das Magic-Pointer-Konzept, das Google zuvor bei DeepMind vorgestellt hatte. Gemini soll verfolgen, worüber der Mauszeiger gerade schwebt, damit KI und Nutzer beim Sprechen über dasselbe Element auf dem Bildschirm reden.

Bei der dritten Funktion ist am wenigsten klar, worum es geht. Neben den Optionen für Video- und Bildgenerierung ist ein Menüeintrag aufgetaucht, über den sich andere Macs verbinden lassen. Was er genau tut, ist offen. Denkbar wäre, dass eine Desktop-Instanz künftig eine andere steuert.

Das passt zu Googles Plan, einen Gemini-Agenten im Sommer auf den Mac zu bringen, und rückt die KI näher an Fernsteuerungs-Funktionen von OpenAIs Codex und Claude Code.

TestingCatalog-Screenshot-2026-06-24-at-00.45.19
Bild: TestingCatalog

Einordnen muss man das alles aber erstmal als Test. TestingCatalog hat die Hinweise in der App entdeckt, offiziell angekündigt hat Google nichts. Aktuell sieht nur eine kleine Gruppe die Funktionen, einen Termin für den breiteren Rollout gibt es nicht.

Mein Eindruck

Ich finde extrem spannend, was sich hier andeutet: ein neues Paradigma der Computerbedienung, vielleicht das Disruptivste seit der Einführung der grafischen Benutzeroberfläche, aka GUI. Wenn die KI Cursor, Tastatur und Bildschirminhalt versteht, bedient ihr den Rechner irgendwann sprechend statt klickend.

Eine Zukunft hat das aus meiner Sicht aber nur, wenn die ganze Verarbeitung lokal passiert. Und genau dafür fehlt gerade zunehmend die Hardware, beziehungsweise sie ist wegen der allgemeinen GPU- und Speicherkrise schlicht nicht erschwinglich. Schauen wir in zehn Jahren vielleicht noch mal?

via Android Authority

SmartDroid.de als Quelle bei Google

Schreibe einen Kommentar

Bleibt bitte nett zueinander!