Amazon entwickelt Berichten zufolge mit Olympus ein neues KI-Modell, das Texte, vor allem aber auch Bilder und Videos verarbeiten und verstehen können soll.
Das System soll fortschrittliche Fähigkeiten zur Videoanalyse bieten. So könne Olympus beispielsweise in Sportaufnahmen die Bewegung eines Basketballs präzise verfolgen – eine Aufgabe, die bisher menschliche Analysten übernehmen mussten.
Potenzielle Kunden sind unter anderem Sportanalysefirmen, Medienunternehmen mit großen Videoarchiven sowie Öl- und Gasunternehmen, die KI zur Inspektion von Unterwasser-Bohranlagen einsetzen könnten.
Die genaue Architektur und Modellkombination hinter Olympus ist noch nicht bekannt. Amazons KI-Chef Rohit Prasad plante laut Insidern Ende letzten Jahres vier große Textmodelle, darunter eines mit 400 Milliarden Parametern und ein weiteres mit zwei Billionen Parametern, die mit einem kleineren Modell für visuelles Verständnis kombiniert werden sollten.
Berichten zufolge könnte Olympus bereits in der kommenden Woche auf der jährlichen AWS re:Invent-Konferenz vorgestellt werden. Das neue Modell soll als Alternative zu Claude dienen und die nahtlose Verarbeitung von Text, Bildern und Videos ermöglichen.
Die Ankündigung erfolgt kurz nach einer weiteren Investition von 4 Milliarden Dollar in das KI-Startup Anthropic, wodurch sich Amazons Beteiligung an dem Unternehmen auf insgesamt 8 Milliarden Dollar erhöht. Mit der Entwicklung eines eigenen multimodalen KI-Modells will Amazon jedoch die Abhängigkeit von Anthropics Chatbot Claude verringern, der bisher eine wichtige Rolle in den Amazon Web Services (AWS) spielt. Kürzlich hat Amazon auch einen Shopping-Chatbot in seine App integriert.