ChatGPT-App auf einem Smartphone. Die Software kann jetzt mit den Benutzern sprachlich interagieren. (Urheber/Quelle/Verbreiter: Matt Rourke/AP/dpa)

Der populäre Chatbot ChatGPT kann jetzt eine Unterhaltung mit Menschen führen. Die Entwicklerfirma OpenAI demonstrierte am Montag das neue KI-Modell GPT-4o, das mit menschlicher Stimme mit den Nutzern interagiert, zwischen verschiedenen Sprachen übersetzt und gleichzeitig mit gesprochenen Befehlen auch Informationen von einer Smartphone-Kamera verarbeiten kann. ChatGPT wird damit zu einem mächtigen Konkurrenten für die Sprachassistenten der Tech-Schwergewichte wie Amazons Alexa und Apples Siri.

In einem Livestream demonstrierte OpenAI unter anderem, wie das neue Modell helfen kann, eine Mathe-Gleichung zu lösen. Dabei gab die Software per Stimme Ratschläge für den Rechenweg, statt das Ergebnis zu verraten. Ein OpenAI schrieb dafür die Gleichung auf einem Blatt Papier und richtete die Smartphone-Kamera darauf. Seine Fragen an ChatGPT stellte er mündlich. Einziger Patzer: Die Software behauptete erst, sie sehe die Aufgabe, noch bevor er die Gleichung aufschrieb.

Gute-Nacht-Geschichte erfinden und vorlesen lassen

In einer weiteren Demo erfand ChatGPT eine Gute-Nacht-Geschichte und las sie vor. Dabei konnte man die Software unterbrechen und bitten, mehr Dramatik in die Stimme zu bringen oder wie ein Roboter zu sprechen. ChatGPT sprach dabei fließend und lebendig wie ein Mensch. Reibungslos funktionierte auch ein Live-Test, bei dem ChatGPT einige Sätze zwischen Italienisch und Englisch übersetzte. Alle Interaktionen wurden mit dem Weck-Satz «Hey, ChatGPT» eingeleitet.

OpenAI-Technologiechefin Mira Murati betonte, dass das neue Modell GPT-4o auch für Gratis-Nutzer verfügbar sein werde. Bisher packte das KI-Start-up erweiterte Funktionen eher in die kostenpflichtige Abo-Version.

Google-Entwicklerkonferenz am Dienstag

Der Zeitpunkt der Präsentation ist interessant: Am Dienstag hält Google seine jährliche Entwicklerkonferenz ab, bei der auch Ankündigungen zu neuen Funktionen mit Künstlicher Intelligenz erwartet werden. Google zeigte bereits vor einigen Monaten, wie seine KI-Software Gemini gesprochene und visuelle Informationen verarbeiten kann.

ChatGPT löste vor über einem Jahr den Hype um Künstliche Intelligenz aus. Solche KI-Chatbots werden mit gewaltigen Mengen an Informationen trainiert und können Texte auf dem sprachlichen Niveau eines Menschen formulieren, Software-Code schreiben und Informationen zusammenfassen. Das Prinzip dahinter ist, dass sie Wort für Wort abschätzen, wie ein Satz weitergehen sollte.

Von