Google plant offenbar, die Möglichkeiten von Gemini Nano für Drittanbieter-Apps auf Android-Geräten deutlich zu erweitern. Das Unternehmen hat dafür still und leise die ML Kit GenAI API eingeführt, die Entwicklern Zugriff auf Gemini Nano auf einer Reihe von Flaggschiff-Geräten ermöglicht.
Mit den neuen APIs könnt ihr in Zukunft wahrscheinlich von KI-Funktionen wie Textzusammenfassung, Korrekturlesen, Umformulieren und Bildbeschreibungen in vielen verschiedenen Apps profitieren. Anders als beim experimentellen AI Edge SDK wird die ML Kit GenAI API im Beta-Status sein, Bildeingaben unterstützen und auf einer breiteren Palette von Android-Geräten verfügbar sein, nicht nur auf den neuesten Pixel-Geräten. Das hatte sich bereits letztes Jahr angedeutet, jetzt werden die Pläne konkreter.
Zu den unterstützten Funktionen gehören nach ersten Erkenntnissen von Android-Experte Mishaal Rahman:
- Zusammenfassung von Artikeln oder Chats als Aufzählung (auf Englisch, Japanisch und Koreanisch)
- Korrekturlesen kurzer Texte in sieben Sprachen
- Umformulieren von Nachrichten in verschiedenen Stilen und Tonlagen
- Generieren von Bildbeschreibungen (zunächst nur auf Englisch)
Die offizielle Ankündigung der neuen APIs wird für die Google I/O 2025 nächste Woche erwartet. Damit reagiert Google auf Bedenken bezüglich der Privatsphäre bei der Nutzung von Cloud-basierten KI-Diensten.
Gemini Nano ist so klein und ressourcensparsam, dass es direkt auf eurem Gerät, sodass sensible Daten nicht an Server übertragen werden müssen. Deshalb ist es allerdings auch nur für weniger anspruchsvolle Aufgaben geeignet im Vergleich etwa zu einem Gemini 2.5 Pro, für das es riesige Server-Center braucht und daher nur über das Internet funktioniert. Es wird euch jetzt aber keine wunderschön geschriebene Aufsätze texten.
Für euch als Nutzer bedeutet das: In Zukunft werdet ihr wahrscheinlich viele nützliche KI-Funktionen in euren Lieblings-Apps finden, die schnell und privat direkt auf eurem Smartphone arbeiten. Das sind doch gute Aussichten!