Инструмент для клонирования голоса OpenAI всё ещё на стадии предварительного просмотра спустя год
Год спустя после анонса, инструмент OpenAI Voice Engine, способный клонировать голоса с минимальным количеством аудиоданных, остаётся на стадии ограниченного предварительного просмотра без чёткой даты запуска.

В марте прошлого года OpenAI представила предварительную версию Voice Engine, сервиса на основе ИИ, предназначенного для воссоздания голоса человека, используя всего 15 секунд аудио. Несмотря на первоначальный энтузиазм, инструмент до сих пор не был полностью выпущен, что заставляет многих задуматься о причинах задержки. Среди предполагаемых причин — опасения по поводу возможного неправильного использования и желание избежать регуляторных проблем.
OpenAI проводит тесты с избранной группой доверенных партнёров, чтобы улучшить полезность и безопасность модели. Технология показала перспективность в различных областях, включая логопедию, изучение языков и поддержку клиентов, среди прочего. Однако компания остаётся сдержанной в отношении каких-либо определённых планов по более широкому внедрению.
Voice Engine, который также поддерживает голоса в API для преобразования текста в речь OpenAI и в голосовом режиме ChatGPT, столкнулся с несколькими задержками с момента своего создания. Способность модели генерировать естественно звучащую речь, которая близко имитирует оригинального говорящего, была как восхвалена, так и подвергнута критике. OpenAI подчеркнула важность ответственного развёртывания и адаптации общества к синтетическим голосам, указывая, что любое решение о масштабировании технологии будет основываться на текущих тестах и обсуждениях.
Несмотря на ожидания, OpenAI не предоставила временных рамок для выпуска Voice Engine, оставляя его будущее неопределённым. Осторожный подход компании отражает общую тенденцию в индустрии, направленную на приоритизацию безопасности и этических соображений в разработке технологий ИИ.