سافت گذر دانشنامه نرم افزار - دانلود رایگان نرم افزار

همه دسته بندی ها

منو
جستجو
اطلاعیه های مهم سایت اطلاعیه های مهم سایت
💐 میلاد زینت پدر حضرت زینب سلام الله علیها مبارک باد 💐
 
 
  1. سافت گذر جهت آپدیت بخش نرم افزار نیاز به همکار حرفه ای دارد. ارسال درخواست به بخش ارتباط با ما / سردبیری
  2. جهت رفع مشکل باز شدن سایت به دلیل بلاک توسط  نود 32 این ویدیو یا این ویدیو(ورژن 9 به بالا) یا راهنمای تصویری را مشاهده کنید
  3. اکانت های بروزرسانی نود32 با قیمت های مناسب به صورت یک ، سه ، شش و دوازده ماهه از اینجا قابل خرید می باشد.

نرم افزار های پرکاربرد

ثبت نام | ورود

هوش مصنوعی

تغییرات صوتی OpenAI: معرفی نسل جدید مدل‌های هوش مصنوعی صدا

در ماه‌های اخیر، OpenAI چندین ابزار جدید از جمله Operator، Deep Research، Computer-Using Agents و Responses API را منتشر کرده که بر روی عامل‌های متنی متمرکز بوده‌اند. امروز، OpenAI مدل‌های جدید تبدیل گفتار به متن و متن به گفتار را در API خود اعلام کرد که به توسعه‌دهندگان امکان می‌دهد عامل‌های صوتی قدرتمندتر، قابل شخصی‌سازی‌تر و بیانگرتر از همیشه بسازند.

 

تغییرات صوتی OpenAI: معرفی نسل جدید مدل‌های هوش مصنوعی صدا

 

مدل‌های جدید تبدیل گفتار به متن OpenAI، gpt-4o-transcribe و gpt-4o-mini-transcribe، بهبودهای قابل توجهی در نرخ خطای کلمات، تشخیص زبان و دقت در مقایسه با مدل‌های Whisper موجود OpenAI ارائه می‌دهند. این پیشرفت‌ها از طریق یادگیری تقویتی و آموزش میانی گسترده با استفاده از مجموعه داده‌های صوتی متنوع و با کیفیت بالا به دست آمده است.

OpenAI ادعا می‌کند که این مدل‌های صوتی جدید می‌توانند ظرافت‌های گفتار را بهتر درک کنند، تشخیص‌های نادرست را کاهش دهند و قابلیت اطمینان رونویسی را حتی زمانی که صدای ورودی شامل لهجه‌ها، محیط‌های پر سر و صدا و سرعت‌های مختلف گفتار است، بهبود بخشند.

gpt-4o-mini-tts جدیدترین مدل تبدیل متن به گفتار است که قابلیت هدایت بهبود یافته‌ای را ارائه می‌دهد. توسعه‌دهندگان اکنون می‌توانند به مدل دستور دهند که چگونه محتوای متن را تلفظ کند. با این حال، فعلاً مدل تبدیل متن به گفتار به صداهای مصنوعی از پیش تعیین شده محدود است.

هزینه‌های مدل‌ها به شرح زیر است: مدل gpt-4o-transcribe: ۶ دلار برای هر میلیون توکن صوتی ورودی، ۲.۵۰ دلار برای هر میلیون توکن متنی ورودی و ۱۰ دلار برای هر میلیون توکن متنی خروجی مدل gpt-4o-mini-transcribe: ۳ دلار برای هر میلیون توکن صوتی ورودی، ۱.۲۵ دلار برای هر میلیون توکن متنی ورودی و ۵ دلار برای هر میلیون توکن متنی خروجی مدل gpt-4o-mini-tts: ۰.۶۰ دلار برای هر میلیون توکن متنی ورودی و ۱۲ دلار برای هر میلیون توکن صوتی خروجی

 

این هزینه‌ها به صورت دقیقه‌ای به شرح زیر محاسبه می‌شود:

  • gpt-4o-transcribe: حدود ۰.۶ سنت در دقیقه
  • gpt-4o-mini-transcribe: حدود ۰.۳ سنت در دقیقه
  • gpt-4o-mini-tts: حدود ۱.۵ سنت در دقیقه

تیم OpenAI درباره این مدل‌های صوتی جدید نوشت: “در آینده، ما قصد داریم به سرمایه‌گذاری در بهبود هوشمندی و دقت مدل‌های صوتی خود ادامه دهیم و راه‌هایی را برای اجازه دادن به توسعه‌دهندگان برای آوردن صداهای سفارشی خود جهت ساخت تجربیات شخصی‌سازی شده‌تر، به روش‌هایی که با استانداردهای ایمنی ما مطابقت دارند، بررسی کنیم.”

این مدل‌های صوتی جدید اکنون از طریق APIها برای همه توسعه‌دهندگان در دسترس هستند. OpenAI همچنین یک ادغام با Agents SDK را اعلام کرد که به توسعه‌دهندگان امکان می‌دهد به راحتی عامل‌های صوتی بسازند. برای تجربیات گفتار به گفتار با تأخیر کم، OpenAI استفاده از Realtime API را توصیه می‌کند.

نظرتان را ثبت کنید کد خبر: 52463 گروه خبری: هوش مصنوعی منبع خبر: سافت گذر تاریخ خبر: 1404/01/03 تعداد مشاهده: 2429
اخبار مرتبط با این خبر
نظر های کاربران
سرور آپدیت نود 32
پیشنهاد سافت گذر
چند فوت و فن در فتوشاپ

چند فوت و فن در فتوشاپ

آموزش فتوشاپ و فوت و فن ها

Defender Remover 12.7

Defender Remover 12.7

روشن و خاموش کردن آنتی ویروس ویندوز دیفندر

Truedialer - Dialer & Contacts 3.65 for Android +4.0

Truedialer - Dialer & Contacts 3.65 for Android +4.0

مدیریت مخاطبین و شماره‌گیر هوشمند و متفاوت

رخدادهای تاریخی ایران از هنگام مرگ نادرشاه افشار تا پایان زندگی آقامحمدخان قاجار

رخدادهای تاریخی ایران از هنگام مرگ نادرشاه افشار تا پایان زندگی آقامحمدخان قاجار

آغا محمد خان قاجار

الایمان و الکفر فی القرآن و السنه

الایمان و الکفر فی القرآن و السنه

ایمان و کفر در کتاب و سنت

مردان گوگل

مردان گوگل

گفت و گویی رک با میلیاردرهای جدید آمریکا

Farm Expert 2017 with Update v1.106 Incl Crackfix

Farm Expert 2017 with Update v1.106 Incl Crackfix

شبیه ساز کشاورزی و دامداری نسخه 2017

Paper Camera 4.4.4 for Android +2.1

Paper Camera 4.4.4 for Android +2.1

عکس برداری با افکت

Vangelis Chariots of Fire The Play 2012

Vangelis Chariots of Fire The Play 2012

بهترین آهنگ های بی کلام ونجلیس

Farming Simulator 19

Farming Simulator 19

شبیه ساز کشاورزی برای کامپیوتر

مداحی کربلایی هلالی سال 98

مداحی کربلایی هلالی سال 98

محرم شب اول تا شام غریبان هلالی

Joiku Phone Usage PRO 2.38 for Android

Joiku Phone Usage PRO 2.38 for Android

گزارش و نمایش اطلاعات

USB Disk Security 6.9.0.0

USB Disk Security 6.9.0.0

برنامه‌ای قدرتمند برای محافظت از رایانه در برابر ویروس‌های درایوهای USB

مجموعه آهنگ‌های فرید الاطرش با کیفیت عالی

مجموعه آهنگ‌های فرید الاطرش با کیفیت عالی

آهنگ های فرید الاطرش

Valentina Studio Pro 15.1.2

Valentina Studio Pro 15.1.2

مدیریت پایگاه داده

با هواپیما آشنا شویم

با هواپیما آشنا شویم

آشنایی با تحلیل ساختاری هواپیما

نکته هایی برای تبدیل روزهای کسل کننده به روزهای شاد

نکته هایی برای تبدیل روزهای کسل کننده به روزهای شاد

ده راز شادکامی

AUTOCROSS MADNESS

AUTOCROSS MADNESS

اتومبیلرانی برای کامپیوتر

پنج سخنرانی استاد شهید آیت‌اللّه‌ مطهری

پنج سخنرانی استاد شهید آیت‌اللّه‌ مطهری

احیای تفکر اسلامی شهید مطهری

سلسله مباحث استاد شجاعی قسمت چهارم

سلسله مباحث استاد شجاعی قسمت چهارم

مباحث شجاعی

Shift 2 Unleashed

Shift 2 Unleashed

جنون سرعت شیفت 2

Udemy – Ethereum and Solidity: The Complete Developer's Guide

Udemy – Ethereum and Solidity: The Complete Developer's Guide

آموزش اتریوم و سالیدیتی

Slime Rancher Pool Party v1.4.4

Slime Rancher Pool Party v1.4.4

اکشن برای کامپیوتر

Swype Keyboard 3.2.4.3020400.50699 for Android +4.0

Swype Keyboard 3.2.4.3020400.50699 for Android +4.0

کیبرد تایپ به صورت Swype

Worms 0.0.34 for Android

Worms 0.0.34 for Android

بازی معروف و محبوب کرم ها

Ballance

Ballance

بالانس

Ashampoo UnInstaller 15.00.22

Ashampoo UnInstaller 15.00.22

حذف برنامه های غیرضروری

سخنرانی حجت الاسلام پناهیان درمورد زندگی در بستر شهادت

سخنرانی حجت الاسلام پناهیان درمورد زندگی در بستر شهادت

سخنرانی حجت الاسلام پناهیان با موضوع زندگی در بستر شهادت

Easypad 4.0.0 for Android +4.0

Easypad 4.0.0 for Android +4.0

ویجت یادداشت

FaSubrip v1.0.9 Win

FaSubrip v1.0.9 Win

حل مشکل حروف زیرنویس های فارسی فاسابریپ

نکات و ترفندهای مقدماتی راه اندازی سایت دانلود

نکات و ترفندهای مقدماتی راه اندازی سایت دانلود

ترفندهای راه اندازی سایت دانلود

Photo Studio PRO 2.7.3.2445 for Android +4.1

Photo Studio PRO 2.7.3.2445 for Android +4.1

افکت گذاری تصاویر

حیات طیبه از حجت الاسلام والمسلمین کاظم صدیقی

حیات طیبه از حجت الاسلام والمسلمین کاظم صدیقی

حاج آقا کاظم صدیقی با موضوع حیات طیبه

Xamarin Studio 5.9.0.431 + Xamarin Visual Studio Enterprise 4.0.1.145 + X-Studio 5.10.871 for Mac

Xamarin Studio 5.9.0.431 + Xamarin Visual Studio Enterprise 4.0.1.145 + X-Studio 5.10.871 for Mac

ساخت برنامه‌های Android و iOS با استفاده از زبان C#

نکته های طلایی Outlook 2010

نکته های طلایی Outlook 2010

آموزش outlook

سخنرانی محسن کازرونی با موضوع درک عظمت ماه رمضان و شناخت آن

سخنرانی محسن کازرونی با موضوع درک عظمت ماه رمضان و شناخت آن

سخنرانی درک عظمت ماه رمضان و شناخت آن با محسن کازرونی

InfiniteSkills – Learning Adobe InDesign CC Training Video

InfiniteSkills – Learning Adobe InDesign CC Training Video

فیلم آموزش نرم افزار ادوبی این‌دیزاین سی‌سی

French Visual Vocabulary Builder 1.2.8

French Visual Vocabulary Builder 1.2.8

آموزش لغات فرانسوی همراه با تصویر و تلفظ

Clash of Puppets

Clash of Puppets

جنگ عروسک‌ها

تجربه کاربری مفهومی بسیار گسترده، چندرشته‌ای و شگفت‌انگیز

تجربه کاربری مفهومی بسیار گسترده، چندرشته‌ای و شگفت‌انگیز

تجربه کاربری و رابط کاربری

خبرنامه

با عضویت در خبرنامه، زودتر از همه باخبر باش!