Компания OpenAI представила новую версию ChatGPT — модель GPT-4o. Теперь чат-бот может в реальном времени вести диалог с пользователем и описывать полученные от него изображения.
Раньше в приложении сервиса пользователи могли записывать аудио, которое затем переводилось в текст. На текст GPT отвечал тоже текстом — его, в свою очередь, можно было прослушать с помощью встроенного диктора.
Теперь же в приложении появилась возможность вести диалог с AI-помощником в реальном времени. Пользователи могут говорить с GPT-4o напрямую и получать ответы голосом — это упрощает и ускоряет взаимодействие.
Кроме того, GPT-4o начал принимать от пользователя изображения и описывать их. Раньше такая функция была у нейросети только внутри приложения для помощи незрячим людям Be My Eyes.
К релизу новой GPT-4o Open AI и Be My Eyes подготовили ролик с участием незрячего человека, который пользуется AI-помощником во время прогулки по Лондону.
Сервис Be My Eyes, благодаря которому незрячие люди могут получать описания окружающей обстановки и предметов от волонтеров, начал тестировать интеграцию GPT в свое приложение летом 2023 года. Виртуальный волонтер, которого назвали Be My AI, заработал на базе GPT-4.
GPT-4o говорит в том числе и на русском языке, однако в России сервис официально не доступен.