OpenAI випустила нову голосову модель і знизила ціни на 20%
OpenAI представила велику мовну модель gpt-realtime, оптимізовану для генерації мовлення. Про це повідомляє блог компанії.
Новинка здатна відтворювати мовлення, яке звучить природніше, ніж усі попередні моделі. Наприклад, вона може змінювати інтонацію посеред речення.
До цього часу розробникам додатків OpenAI пропонувала лише попередню версію gpt-4o-realtime-preview. Вона дозволяла протестувати можливості, але для продакшн-сценаріїв мало підходила: були технічні обмеження та нестабільне ціноутворення.
Тепер розробники можуть використовуючи gpt-realtime в будь-яких програмах та налаштовувати її для конкретних завдань. Наприклад, команда, яка створює голосовий бот технічної підтримки, може доручити gpt-realtime цитувати інформацію з бази даних у відповідях на певні запити.
Доступ до gpt-realtime можна отримати через OpenAI Realtime API. Це інтерфейс прикладного програмування, який дозволяє клієнтам взаємодіяти з голосовими та мультимодальними моделями. В рамках оновлення продукту OpenAI зробила API загальнодоступним.
Що стосується вартості, то ціни на аудіо-токени знижено на 20% в порівнянні з версією gpt-4o-realtime-preview:
Відеосервіс Zoom анонсує технологію цифрових двійників, які самостійно відвідуватимуть робочі зустрічі. Про це пише TechCrunch.…
IT-гігант Meta (материнська компанія Facebook) офіційно оголосив про придбання Moltbook — вірусної соціальної мережі, яка…
Експериментальний агент штучного інтелекту ROME, якого створили дослідники, пов'язані з китайською компанією Alibaba, продемонстрував неочікувану…
Центральне бюро боротьби з кіберзлочинністю Польщі (CBZC) провело масштабну операцію, результатом якої стало викриття групи…
Microsoft оголосила про початок інтеграції технологій Anthropic у свої сервіси, представивши новий інструмент Copilot Cowork,…
Компанія Anthropic оголосила про доступність у Claude Code бета-версії нового інструменту Code Review. Він розробленій…