Der KI-Ingenieur Ethan Lim hat mit Android Use eine Open-Source-Bibliothek veröffentlicht, die KI-Agenten die Kontrolle über native Android-Apps ermöglicht. Das System richtet sich gezielt an Branchen wie Logistik, Lieferdienste und Außendienst, in denen Mitarbeiter hauptsächlich mit mobilen Endgeräten arbeiten.
Bestehende KI-Agenten wie browserbasierte Lösungen oder Anthropics Computer Use funktionieren primär auf Desktop-Computern oder in Webbrowsern. Android Use setzt dagegen direkt auf mobilen Endgeräten an und nutzt Androids Accessibility-API. Diese liefert strukturierte UI-Daten wie Buttons, Texte und Koordinaten, ohne dass teure Vision-Modelle für Screenshot-Analysen nötig sind.
Die technischen Vorteile zeigen sich in Kosten und Geschwindigkeit. Mit 0,01 US-Dollar pro Aktion liegt Android Use 95 Prozent unter den Kosten von Anthropics Computer Use, das 0,15 Dollar pro Aktion veranschlagt. Zudem arbeitet das System mit unter einer Sekunde Latenz deutlich schneller als die 3 bis 5 Sekunden von Computer Use.
Lim entwickelte die Lösung nach einer Woche Feldforschung mit LKW-Fahrern. Dabei beobachtete er, wie Fahrer nach jeder Lieferung manuell Daten von fotografierten Frachtbriefen in mobile Apps eintippten. Im Führerhaus fehlt der Platz für Laptops, die Internetverbindung ist oft unzuverlässig und viele Branchen-Apps bieten keine API-Schnittstellen.
Stattdessen könnte der Fahrer etwa einen Frachtbrief fotografieren und per WhatsApp versenden. Der Agent lädt das Bild herunter, öffnet eine Scanner-App, extrahiert die relevanten Daten, wechselt zur Factoring-App und reicht die Rechnung ein. Dieser Vorgang dauere etwa 30 Sekunden statt der üblichen 10 Minuten bei manueller Bearbeitung.
Nach eigenen Angaben erhielt Lim 150 Anfragen von Unternehmen und führt bereits Pilotprojekte mit fünf Logistikunternehmen sowie Gespräche mit drei Factoring-Gesellschaften.
Die Zielgruppe schätzt er als groß ein. Allein in den USA arbeiten 3,5 Millionen Trucker, weltweit gibt es 60 Millionen Gig-Worker. Lim schätzt das Marktpotenzial auf über 40 Billionen Dollar BIP aus mobilen Workflows. Neben Logistik eignet sich Android Use für Paketscanner-Automatisierung, Mobile Banking, Gesundheitswesen und automatisierte QA-Tests von Android-Apps.
Die Kernbibliothek umfasst weniger als 200 Zeilen Code und bleibt unter MIT-Lizenz frei verfügbar. Für die kommenden Wochen plant Lim ein PyPI-Paket, Multi-LLM-Support für Claude, Gemini und Llama sowie vorgefertigte WhatsApp-Integrationen. Mittelfristig sollen App-spezifische Agenten für gängige Branchen-Apps folgen. Langfristig ist eine gehostete Cloud-API mit Enterprise-Features wie SOC2-Compliance und Audit-Logs geplant.
