Google baut das Live-Angebot für Gemini auf Android bald aus, nun wurde die nächste geplante Neuerung entdeckt. In der Beta-Version 16.30.59.sa.arm64 der Google App konnte gesichtet werden, dass Audio-Dateien wie MP3s demnächst an Gespräche mit Gemini angehangen werden können.
Wenn eine Audio-Datei angehängt wird, zeigt Gemini dann eine neue Option an: „Talk live about this“ (Live darüber sprechen). Diese Funktion ist jedoch noch nicht aktiv. Nach dem Hochladen einer Audio-Datei kann der Nutzer entweder eine normale Frage eingeben oder sogar live über den Inhalt der Audio-Datei sprechen, was daher eine Erweiterung von Gemini Live darstellt.
Die Gemini-API unterstützt bereits Audio-Eingaben seit längerer Zeit. Nutzer können Audio-Dateien hochladen und Gemini auffordern, den Inhalt zu beschreiben, zusammenzufassen oder zu transkribieren. Gemini kann auch Zeitstempel-Anfragen bearbeiten, wie z.B. „von 2:30 bis 3:29“, wobei die üblichen Dateiformate wie MP3, WAV und FLAC unterstützt werden.
Dass ihr zukünftig mit Gemini Live über Audio-Dateien sprechen könnt, ist nochmal eine andere Nummer als einfach den Inhalt als Transkript ausgeben oder analysieren zu lassen.
Jetzt unseren WhatsApp-Kanal abonnieren!