Xiaomi stellt sich gerade sehr breit auf und führt neben eigenen Smartphone-Chipsätzen auch eigene KI-Modelle ein. Darunter jetzt MiDashengLM-7B, das neuste selbstentwickelte Sprachverständnismodell. Ziel dessen ist, die Spracheingabe und Geräuscherkennung bei Smarthome-Geräten, auf den eigenen Mobilgeräten und bei den Elektroautos zu verbessern.
Xiaomi setzt bei seiner KI auf Open-Source und veröffentlicht daher alles. Kein gewöhnlicher Schritt für ein börsennotiertes Unternehmen. Xiaomis Sprachmodell basiert auf öffentlich zugänglichen Trainingsdaten und kombiniert Xiaomi Dasheng mit Qwen2.5-Omni-7B Thinker. Die Architektur nutzt eine neuartige Trainingsstrategie zur einheitlichen Beschreibung und Interpretation von Sprache, Umweltgeräuschen und Musik.
Xiaomi erzielt auch direkt einen Achtungserfolg, denn in 22 öffentlichen Benchmark-Datensätzen erzielte MiDashengLM neue Bestwerte (SOTA) im Bereich multimodaler KI. Es können mehr Daten parallel verarbeitet werden, die Latenz wurde reduziert. Bis heute kann Xiaomi mit Dasheng die Benchmarks im Audiobereich anführen.
Schon heute kommt Dasheng zum Einsatz, etwa in den Elektroautos von Xiaomi zur Erkennung bestimmter Geräusche (z. B. Kratzerkennung für Außenüberwachung). Aber auch im Smarthome, um Klatsch- oder Fingerschnipp-Sounds erkennen zu können.
Jetzt unseren WhatsApp-Kanal abonnieren!