شرکت OpenAI به تازگی از APIهای جدید برای مدلهای هوش مصنوعی صوتی خود به نامهای gpt-4o-transcribe، gpt-4o-mini-transcribe و gpt-4o-mini-tts رونمایی کرده است. این مدلها از طریق API و وبسایت آزمایشی OpenAI.fm در دسترس هستند.
ویژگیهای کلیدی این مدلها:* قابلیت تنظیم صدا: کاربران میتوانند صدای هوش مصنوعی را مطابق میل خود تنظیم کنند، از جمله لهجه، لحن و احساسات. این امکان به کاربران اجازه میدهد تا صدایی منحصر به فرد برای هوش مصنوعی خود انتخاب کنند.
* دقت بالا در تبدیل گفتار به متن: این مدلها دقت بالایی در تبدیل گفتار به متن و تشخیص صدا، به ویژه در محیطهای پر سر و صدا و با لهجههای مختلف، دارند. همچنین از بیش از 100 زبان، از جمله فارسی، پشتیبانی میکنند.
* کاربرد در مراکز تماس و دستیارهای صوتی: انتظار میرود این مدلها به طور گسترده در مراکز تماس و دستیارهای صوتی مورد استفاده قرار گیرند.
https://www.openai.fm/
