سافت گذر دانشنامه نرم افزار - دانلود رایگان نرم افزار

همه دسته بندی ها

منو
جستجو
اطلاعیه های مهم سایت اطلاعیه های مهم سایت
💐 میلاد زینت پدر حضرت زینب سلام الله علیها مبارک باد 💐
 
 
  1. سافت گذر جهت آپدیت بخش نرم افزار نیاز به همکار حرفه ای دارد. ارسال درخواست به بخش ارتباط با ما / سردبیری
  2. جهت رفع مشکل باز شدن سایت به دلیل بلاک توسط  نود 32 این ویدیو یا این ویدیو(ورژن 9 به بالا) یا راهنمای تصویری را مشاهده کنید
  3. اکانت های بروزرسانی نود32 با قیمت های مناسب به صورت یک ، سه ، شش و دوازده ماهه از اینجا قابل خرید می باشد.

نرم افزار های پرکاربرد

ثبت نام | ورود

هوش مصنوعی

تغییرات صوتی OpenAI: معرفی نسل جدید مدل‌های هوش مصنوعی صدا

در ماه‌های اخیر، OpenAI چندین ابزار جدید از جمله Operator، Deep Research، Computer-Using Agents و Responses API را منتشر کرده که بر روی عامل‌های متنی متمرکز بوده‌اند. امروز، OpenAI مدل‌های جدید تبدیل گفتار به متن و متن به گفتار را در API خود اعلام کرد که به توسعه‌دهندگان امکان می‌دهد عامل‌های صوتی قدرتمندتر، قابل شخصی‌سازی‌تر و بیانگرتر از همیشه بسازند.

 

تغییرات صوتی OpenAI: معرفی نسل جدید مدل‌های هوش مصنوعی صدا

 

مدل‌های جدید تبدیل گفتار به متن OpenAI، gpt-4o-transcribe و gpt-4o-mini-transcribe، بهبودهای قابل توجهی در نرخ خطای کلمات، تشخیص زبان و دقت در مقایسه با مدل‌های Whisper موجود OpenAI ارائه می‌دهند. این پیشرفت‌ها از طریق یادگیری تقویتی و آموزش میانی گسترده با استفاده از مجموعه داده‌های صوتی متنوع و با کیفیت بالا به دست آمده است.

OpenAI ادعا می‌کند که این مدل‌های صوتی جدید می‌توانند ظرافت‌های گفتار را بهتر درک کنند، تشخیص‌های نادرست را کاهش دهند و قابلیت اطمینان رونویسی را حتی زمانی که صدای ورودی شامل لهجه‌ها، محیط‌های پر سر و صدا و سرعت‌های مختلف گفتار است، بهبود بخشند.

gpt-4o-mini-tts جدیدترین مدل تبدیل متن به گفتار است که قابلیت هدایت بهبود یافته‌ای را ارائه می‌دهد. توسعه‌دهندگان اکنون می‌توانند به مدل دستور دهند که چگونه محتوای متن را تلفظ کند. با این حال، فعلاً مدل تبدیل متن به گفتار به صداهای مصنوعی از پیش تعیین شده محدود است.

هزینه‌های مدل‌ها به شرح زیر است: مدل gpt-4o-transcribe: ۶ دلار برای هر میلیون توکن صوتی ورودی، ۲.۵۰ دلار برای هر میلیون توکن متنی ورودی و ۱۰ دلار برای هر میلیون توکن متنی خروجی مدل gpt-4o-mini-transcribe: ۳ دلار برای هر میلیون توکن صوتی ورودی، ۱.۲۵ دلار برای هر میلیون توکن متنی ورودی و ۵ دلار برای هر میلیون توکن متنی خروجی مدل gpt-4o-mini-tts: ۰.۶۰ دلار برای هر میلیون توکن متنی ورودی و ۱۲ دلار برای هر میلیون توکن صوتی خروجی

 

این هزینه‌ها به صورت دقیقه‌ای به شرح زیر محاسبه می‌شود:

  • gpt-4o-transcribe: حدود ۰.۶ سنت در دقیقه
  • gpt-4o-mini-transcribe: حدود ۰.۳ سنت در دقیقه
  • gpt-4o-mini-tts: حدود ۱.۵ سنت در دقیقه

تیم OpenAI درباره این مدل‌های صوتی جدید نوشت: “در آینده، ما قصد داریم به سرمایه‌گذاری در بهبود هوشمندی و دقت مدل‌های صوتی خود ادامه دهیم و راه‌هایی را برای اجازه دادن به توسعه‌دهندگان برای آوردن صداهای سفارشی خود جهت ساخت تجربیات شخصی‌سازی شده‌تر، به روش‌هایی که با استانداردهای ایمنی ما مطابقت دارند، بررسی کنیم.”

این مدل‌های صوتی جدید اکنون از طریق APIها برای همه توسعه‌دهندگان در دسترس هستند. OpenAI همچنین یک ادغام با Agents SDK را اعلام کرد که به توسعه‌دهندگان امکان می‌دهد به راحتی عامل‌های صوتی بسازند. برای تجربیات گفتار به گفتار با تأخیر کم، OpenAI استفاده از Realtime API را توصیه می‌کند.

نظرتان را ثبت کنید کد خبر: 52463 گروه خبری: هوش مصنوعی منبع خبر: سافت گذر تاریخ خبر: 1404/01/03 تعداد مشاهده: 2427
اخبار مرتبط با این خبر
نظر های کاربران
سرور آپدیت نود 32
پیشنهاد سافت گذر
Cross Set

Cross Set

فکری

با اکسل دوست شویم

با اکسل دوست شویم

نکته ها و ترفندهایی درباره Excel

Zombie HQ 1.8.0 for Android +2.3

Zombie HQ 1.8.0 for Android +2.3

بازی شهر زامبی ها

آشنایی با پایگاه داده اوراکل

آشنایی با پایگاه داده اوراکل

آموزش کامل و جامع پایگاه داده Oracle

DipTrace 4.3.0.4 Full

DipTrace 4.3.0.4 Full

طراحی سه بعدی و شبیه سازی مدارات الکتریکی دیپ تریس

EaseUS Todo PCTrans Technician 14.1.0 Build 20241224

EaseUS Todo PCTrans Technician 14.1.0 Build 20241224

انتقال فایل ها به کامپیوتر جدید

آموزش VMWare ESX Server در شبکه

آموزش VMWare ESX Server در شبکه

آموزش وی ام ویر ای اس ایکس سرور

Towtruck Simulator 2015

Towtruck Simulator 2015

شبیه‌ساز کامیون جرثقیل‌دار 2015

AppPerfect Java Profiler 14.5.0.20150602-4143 x86/x64/Linux

AppPerfect Java Profiler 14.5.0.20150602-4143 x86/x64/Linux

نرم افزار تشخیص خطا در برنامه نویسی

نقشه کیش Kish Map 1.0

نقشه کیش Kish Map 1.0

کاملترین و زیباترین نقشه جزیره کیش برای موبایل

Kodi 20.4

Kodi 20.4

مدیا پلیر کودی

همراه بانک ملت نسخه 1.3.4 برای اندروید

همراه بانک ملت نسخه 1.3.4 برای اندروید

موبایل بانک ملت

Windows Server 2019 Version 1809 Build 17763.3650 RTM MSDN

Windows Server 2019 Version 1809 Build 17763.3650 RTM MSDN

ویندوز سرور 2019

Jet Car Stunts MULTi6

Jet Car Stunts MULTi6

ماشین جت مسابقه‌ای بامانع

Learning IELTS

Learning IELTS

آموزش آیتلس

Lua Player Pro 3.5.3 for Android +4.1

Lua Player Pro 3.5.3 for Android +4.1

ویدئو پلیر متحرک

مداحی حاج میثم مطیعی در شان حضرت امیرالمومنین امام علی علیه السلام - ماه رمضان سال 93

مداحی حاج میثم مطیعی در شان حضرت امیرالمومنین امام علی علیه السلام - ماه رمضان سال 93

مداحی در شان امیرالمومنین امام علی علیه السلام از میثم مطیعی

ناگفته های پیشرفته در ویندوز XP شماره دو

ناگفته های پیشرفته در ویندوز XP شماره دو

ترفندهای کمیاب و کاربردی Windows Explorer

VovSoft IP to Country Converter 1.2.0

VovSoft IP to Country Converter 1.2.0

نمایش نام کشورها بر اساس آی پی

Total War ROME II Emperor Edition + Update v2.2.0 Incl DLC

Total War ROME II Emperor Edition + Update v2.2.0 Incl DLC

جدیدترین، کامل‌ترین و بهبودیافته‌ترین نسخه از بازی Total War ROME II دارای تمامی آپدیت‌ها و دی‌ال‌سی‌های منتشر شده تاکنون

Disk Sorter Pro + Ultimate + Enterprise 15.7.14

Disk Sorter Pro + Ultimate + Enterprise 15.7.14

دسته بندی فایل‌های موجود در هارد

کوروش در قرآن

کوروش در قرآن

ذوالقرنین در قرآن

سخنرانی مسعود عالی با موضوع سیره و مقام حضرت فاطمه معصومه س

سخنرانی مسعود عالی با موضوع سیره و مقام حضرت فاطمه معصومه س

سخنرانی سیره و مقام حضرت فاطمه معصومه س با مسعود عالی

پیام رسان بله Bale نسخه تحت وب

پیام رسان بله Bale نسخه تحت وب

پیام رسان بله

آموزش Flash MX

آموزش Flash MX

آموزش فلش ام ایکس

آموزش جامع Overclock

آموزش جامع Overclock

آموزش اورکلاک

Iron Sky - Invasion + Update 1.2

Iron Sky - Invasion + Update 1.2

آسمان آهنین - تهاجم

سخنرانی حجت الاسلام سید قاسم یعقوبی با موضوع عوامل وحدت در قرآن و سنت نبوی

سخنرانی حجت الاسلام سید قاسم یعقوبی با موضوع عوامل وحدت در قرآن و سنت نبوی

حاج آقا یعقوبی با موضوع عوامل وحدت در قرآن و سنت نبوی

سخنرانی حجت الاسلام محمدمهدی ماندگاری با موضوع شناخت حق و باطل ملاک ولایت‌مداری

سخنرانی حجت الاسلام محمدمهدی ماندگاری با موضوع شناخت حق و باطل ملاک ولایت‌مداری

سخنرانی شناخت حق و باطل ملاک ولایت‌مداری با ماندگاری

EaseUS Partition Master 19.5.0 All Edition + WinPE

EaseUS Partition Master 19.5.0 All Edition + WinPE

پارتیشن بندی هارد

Microsoft Visual C++ 2015-2022 Redistributable 14.44.34918.1 + AIO 2025.03.06

Microsoft Visual C++ 2015-2022 Redistributable 14.44.34918.1 + AIO 2025.03.06

ویژوال سی

Adobe Capture CC 5.2 for android +4.1

Adobe Capture CC 5.2 for android +4.1

اددوب کپچر

Garfield Kart - Furious Racing + Update

Garfield Kart - Furious Racing + Update

ماشین سواری گارفیلد

Topaz Gigapixel AI 8.2.3 (x64)

Topaz Gigapixel AI 8.2.3 (x64)

بزرگ کردن عکس بدون افت کیفیت

قرائت دعای عهد توسط آقای محسن فرهمند

قرائت دعای عهد توسط آقای محسن فرهمند

قرائت محسن فرهمند دعای عهد

Stickman Cliff Diving 3.1 for Android +2.2

Stickman Cliff Diving 3.1 for Android +2.2

بازی آدمک غواص

آموزش وبلاگ نویسی

آموزش وبلاگ نویسی

آشنایی و طریقه ایجاد وبلاگ

مجله تخصصی اتومبیل utomobile magazine

مجله تخصصی اتومبیل utomobile magazine

مجله Autocar ژانویه 6 ؛ 2021

97مولودی های زیبای ولادت حضرت زینب سال

97مولودی های زیبای ولادت حضرت زینب سال

مولودی کریمی و بنی فاطمه

گلستان سعدی با مقابله گلستان فروغی و قریب و طبع روسیه

گلستان سعدی با مقابله گلستان فروغی و قریب و طبع روسیه

گلستان سعدی

خبرنامه

با عضویت در خبرنامه، زودتر از همه باخبر باش!