Google hat Project Genie für Abonnenten von Google AI Ultra in den USA (der teuerste Tarif, kostet ca 250 US-Dollar im Monat) freigeschaltet. Der experimentelle Prototyp basiert auf dem Weltmodell Genie 3. Damit könnt(et) ihr interaktive Umgebungen per Text- und Bildprompts erschaffen und in Echtzeit erkunden.
Das System arbeitet mit drei Kernfunktionen. Beim sogenannten World Sketching beschreibt ihr eure Welt per Text oder ladet Bilder hoch. Mithilfe von Nano Banana Pro könnt ihr vorab eine Vorschau generieren und Details anpassen. Ihr legt beispielsweise fest, ob ihr die Welt aus der Ego- oder Third-Person-Perspektive erleben wollt, und bestimmt, wie sich euer Charakter fortbewegt. Das reicht vom Gehen über Reiten und Fliegen bis zum Autofahren.
Anschließend navigiert ihr durch die erstellte Umgebung. Genie 3 berechnet dabei den Weg in Echtzeit, simuliert physikalische Gesetze und reagiert auf eure Aktionen. Anders als bei statischen 3D-Schnappschüssen entsteht die Welt dynamisch, während ihr euch bewegt. Zusätzlich lassen sich bestehende Welten remixen oder aus einer Galerie kuratierter Beispiele auswählen. Fertige Erkundungen könnt ihr als Video herunterladen.
Google räumt ein, dass der Prototyp noch deutliche Schwächen hat. Die generierten Welten wirken nicht immer realistisch und folgen Prompts oder physikalischen Gesetzen nur bedingt. Die Charaktersteuerung reagiere manchmal verzögert, und Sitzungen enden nach 60 Sekunden. Angekündigte Funktionen wie promptbasierte Ereignisse, die die Welt während der Erkundung verändern, fehlen im aktuellen Prototyp noch.
Google plant, den Zugang schrittweise auf weitere Regionen auszuweiten. Das Unternehmen will mit dem Feedback besser verstehen, wie Menschen Weltmodelle in der KI-Forschung und bei generativen Medien einsetzen. Langfristig soll die Technologie einem breiteren Publikum zugänglich werden.
Quelle Google
