OpenAI setzt auf Audio-KI – neue Hardware im Blick
Bei OpenAIs angekündigter, aber bisher ominöser Hardware soll Audio im Vordergrund stehen. Das interne Team wird massiv umgebaut.
Alles auf Audio heißt es offenbar bei OpenAI. In den vergangenen zwei Monaten soll das interne Team, das sich um Audio-Funktionen und Modelle kümmert, ausgebaut worden sein. Das deutet darauf hin, dass es sich bei der angekündigten Hardware aus dem Haus um ein Gerät handelt, das auf Audio basiert. Verwunderlich ist das nicht.
Wie The Information berichtet, hat OpenAI intern etwa Umstrukturierungen vorgenommen, um neue Teams auf die Entwicklung von Audio-Modellen anzusetzen. Alle sollen an einem „audio-first“ persönlichem Gerät arbeiten. Dieses ominöse, aber seit einer Weile groß angekündigte Gerät soll in etwa einem Jahr erscheinen.
ChatGPT kann freilich bereits mit Nutzern sprechen – wie auch andere KI-Chatbots. Wie das funktioniert, ist unterschiedlich. Wahlweise gibt es ein textbasiertes Modell, das Input und Output verarbeitet, dieses dann jedoch an ein anderes Modell weiterreicht, das Text in Audio umwandelt. Oder aber ein multimodales Modell kann Audio direkt verarbeiten, ohne diesen Übersetzungsschritt.
Eine mit der Entwicklung vertraute Person soll nun The Information gesagt haben, dass das von OpenAI bisher verwendete Modell dem reinen Textmodell in der Leistung unterlegen ist. Die Weitergabe an ein zweites Modell für die Sprachausgabe kostet Zeit – würde also die Kommunikation verlangsamen. Doch der Informant soll auch von ersten Erfolgen mit einem neuen, auf Audio spezialisierten Modell sprechen.
Andere Unternehmen setzen ebenfalls auf Audio. Weg vom Bildschirm scheint die Devise. Google plant beispielsweise mit den Audio Overviews eine Audio-Suchmaschine. Zunächst funktioniert das neue Sprechen mit einem Computer aber besonders gut bei smarten Brillen. Meta hat die Ray-Ban- und Oakley-Versionen bereits seit Längerem auf dem Markt, Google hinkt mit seinen neuen Glasses etwas hinterher, unterdessen haben sich aber auch einige Start-ups bereits auf dem Markt eingebracht. Dazu zählt etwa die Rokid Glasses oder jene von Even Realities.
OpenAI jedoch sagt, dass das eigene Gerät mehr sein soll als nur eine Brille. Es ist davon auszugehen, dass es neben Audio auch auf einen ununterbrochenen Betrieb setzt. „Always on“ soll KI-Hardware erst richtig hilfreich machen – so zumindest stellt sich das Silicon Valley das vor. Meta hat erst kürzlich das Start-up „Limitless“ übernommen, das ebenfalls auf einen dauerhaft zuhörenden Anhänger setzt.
(emw)