سافت گذر دانشنامه نرم افزار - دانلود رایگان نرم افزار

همه دسته بندی ها

منو
آیکون جستجو در سایت سافت گذر
اطلاعیه های مهم سایت اطلاعیه های مهم سایت

 

💐 میلاد زینت پدر حضرت زینب سلام الله علیها مبارک باد 💐
 
 
  1. جهت رفع مشکل باز شدن سایت به دلیل بلاک توسط  نود 32 این ویدیو یا این ویدیو(ورژن 9 به بالا) یا راهنمای تصویری را مشاهده کنید
  2. اکانت های بروزرسانی نود32 با قیمت های مناسب به صورت یک ، سه ، شش و دوازده ماهه از اینجا قابل خرید می باشد.

نرم افزار های پرکاربرد

ثبت نام | ورود

هوش مصنوعی

تغییرات صوتی OpenAI: معرفی نسل جدید مدل‌های هوش مصنوعی صدا

در ماه‌های اخیر، OpenAI چندین ابزار جدید از جمله Operator، Deep Research، Computer-Using Agents و Responses API را منتشر کرده که بر روی عامل‌های متنی متمرکز بوده‌اند. امروز، OpenAI مدل‌های جدید تبدیل گفتار به متن و متن به گفتار را در API خود اعلام کرد که به توسعه‌دهندگان امکان می‌دهد عامل‌های صوتی قدرتمندتر، قابل شخصی‌سازی‌تر و بیانگرتر از همیشه بسازند.

 

تغییرات صوتی OpenAI: معرفی نسل جدید مدل‌های هوش مصنوعی صدا

 

مدل‌های جدید تبدیل گفتار به متن OpenAI، gpt-4o-transcribe و gpt-4o-mini-transcribe، بهبودهای قابل توجهی در نرخ خطای کلمات، تشخیص زبان و دقت در مقایسه با مدل‌های Whisper موجود OpenAI ارائه می‌دهند. این پیشرفت‌ها از طریق یادگیری تقویتی و آموزش میانی گسترده با استفاده از مجموعه داده‌های صوتی متنوع و با کیفیت بالا به دست آمده است.

OpenAI ادعا می‌کند که این مدل‌های صوتی جدید می‌توانند ظرافت‌های گفتار را بهتر درک کنند، تشخیص‌های نادرست را کاهش دهند و قابلیت اطمینان رونویسی را حتی زمانی که صدای ورودی شامل لهجه‌ها، محیط‌های پر سر و صدا و سرعت‌های مختلف گفتار است، بهبود بخشند.

gpt-4o-mini-tts جدیدترین مدل تبدیل متن به گفتار است که قابلیت هدایت بهبود یافته‌ای را ارائه می‌دهد. توسعه‌دهندگان اکنون می‌توانند به مدل دستور دهند که چگونه محتوای متن را تلفظ کند. با این حال، فعلاً مدل تبدیل متن به گفتار به صداهای مصنوعی از پیش تعیین شده محدود است.

هزینه‌های مدل‌ها به شرح زیر است: مدل gpt-4o-transcribe: ۶ دلار برای هر میلیون توکن صوتی ورودی، ۲.۵۰ دلار برای هر میلیون توکن متنی ورودی و ۱۰ دلار برای هر میلیون توکن متنی خروجی مدل gpt-4o-mini-transcribe: ۳ دلار برای هر میلیون توکن صوتی ورودی، ۱.۲۵ دلار برای هر میلیون توکن متنی ورودی و ۵ دلار برای هر میلیون توکن متنی خروجی مدل gpt-4o-mini-tts: ۰.۶۰ دلار برای هر میلیون توکن متنی ورودی و ۱۲ دلار برای هر میلیون توکن صوتی خروجی

 

این هزینه‌ها به صورت دقیقه‌ای به شرح زیر محاسبه می‌شود:

  • gpt-4o-transcribe: حدود ۰.۶ سنت در دقیقه
  • gpt-4o-mini-transcribe: حدود ۰.۳ سنت در دقیقه
  • gpt-4o-mini-tts: حدود ۱.۵ سنت در دقیقه

تیم OpenAI درباره این مدل‌های صوتی جدید نوشت: “در آینده، ما قصد داریم به سرمایه‌گذاری در بهبود هوشمندی و دقت مدل‌های صوتی خود ادامه دهیم و راه‌هایی را برای اجازه دادن به توسعه‌دهندگان برای آوردن صداهای سفارشی خود جهت ساخت تجربیات شخصی‌سازی شده‌تر، به روش‌هایی که با استانداردهای ایمنی ما مطابقت دارند، بررسی کنیم.”

این مدل‌های صوتی جدید اکنون از طریق APIها برای همه توسعه‌دهندگان در دسترس هستند. OpenAI همچنین یک ادغام با Agents SDK را اعلام کرد که به توسعه‌دهندگان امکان می‌دهد به راحتی عامل‌های صوتی بسازند. برای تجربیات گفتار به گفتار با تأخیر کم، OpenAI استفاده از Realtime API را توصیه می‌کند.

نظرتان را ثبت کنید کد خبر: 52463 گروه خبری: هوش مصنوعی منبع خبر: سافت گذر تاریخ خبر: 1404/01/03 تعداد مشاهده: 2714
اخبار مرتبط با این خبر
نظر های کاربران
سرور آپدیت نود 32
پیشنهاد سافت گذر
macOS Tahoe 26.0.1  (25A362) / Sequoia / Sonoma  / Ventura / Monterey / Big Sur / Catalina / Mojave / High Sierra

macOS Tahoe 26.0.1 (25A362) / Sequoia / Sonoma / Ventura / Monterey / Big Sur / Catalina / Mojave / High Sierra

سیستم عامل مک او اس

احیای فکر دینی

احیای فکر دینی

سخنرانی های استاد مطهری

تلاوت مجلسی استاد شحات محمد انور سوره مبارکه اخلاص

تلاوت مجلسی استاد شحات محمد انور سوره مبارکه اخلاص

تلاوت شحات محمد انور سوره اخلاص

Symantec System Recovery Management Solution 2013 R2 11.1.6.55604 / 2011 v10.0.1.41704  + Recovery Disk

Symantec System Recovery Management Solution 2013 R2 11.1.6.55604 / 2011 v10.0.1.41704 + Recovery Disk

نسخه جدید نرم افزار Backup Exec System Recovery جهت بکاپ گیری از سیستم عاملهای سرور

Fascinating Lions DOCUMENTARY

Fascinating Lions DOCUMENTARY

مستند شکار شیرها

ESET NOD32 Antivirus / Smart Security Business Edition 3.0.695.0 x86/x64 (Update 12000) 2015-07-27

ESET NOD32 Antivirus / Smart Security Business Edition 3.0.695.0 x86/x64 (Update 12000) 2015-07-27

نود 32 بیزینس 3

Nmap Security Scanner 7.94 Win/Mac/Linux

Nmap Security Scanner 7.94 Win/Mac/Linux

ان مپ

بخش‌های اصلی در ساختار URL چیست؟

بخش‌های اصلی در ساختار URL چیست؟

URL مخفف چیست و توسط چه کسی ابداع شده است؟

ساختمان داده ها و الگوریتمها

ساختمان داده ها و الگوریتمها

آموزش ساختمان داده ها و الگوریتم ها به زبانی ساده و روان

ISO Workshop 13.5

ISO Workshop 13.5

ساخت ایمیج ایزو

Drag Racing: Club Wars 2.0.47 for Android +2.3

Drag Racing: Club Wars 2.0.47 for Android +2.3

مسابقات سرعت

رژیم های دروغی

رژیم های دروغی

باورهای نادرست درمورد رژیم غذایی

Bus Simulator 21

Bus Simulator 21

شبیه ساز اتوبوس 21

Airport Simulator 2014

Airport Simulator 2014

شبیه‌ساز فرودگاه 2014

Corel VideoStudio Ultimate X10 v20.5.0.60 / x86/x64

Corel VideoStudio Ultimate X10 v20.5.0.60 / x86/x64

کورل ویدیو استودیو

علم نجوم و فضا

علم نجوم و فضا

آشنایی با آسمان

سخنرانی حجت الاسلام احمد دارستانی با موضوع حق مومن بر مومن

سخنرانی حجت الاسلام احمد دارستانی با موضوع حق مومن بر مومن

سخنرانی حجت الاسلام حمید میرباقری با موضوع حق مومن بر مومن

Kaspersky Security  21.23.6.614 Full Product / Endpoint Security 12.11.0.637

Kaspersky Security 21.23.6.614 Full Product / Endpoint Security 12.11.0.637

کسپرسکی

Magoshare AweClone Enterprise 3.0

Magoshare AweClone Enterprise 3.0

کپی کامل و کلون سازی هارد دیسک

Auto Call Recorder Pro 7.1.1 for Android

Auto Call Recorder Pro 7.1.1 for Android

ضبط خودکار مکالمات

Runtime RAID Reconstructor 5.16

Runtime RAID Reconstructor 5.16

ریکاوری RAID

مداحی میثم مطیعی سال 98

مداحی میثم مطیعی سال 98

محرم شب اول تا شام غریبان مطیعی

BaldBooth 2.4 for Android +2.3

BaldBooth 2.4 for Android +2.3

موهای سر خود را بتراشید!

آموزش تصویری نرم افزار MASH

آموزش تصویری نرم افزار MASH

آموزش ماش

nomacs 3.21.1

nomacs 3.21.1

مشاهده و ویرایش عکس

خیانت یا حماقت

خیانت یا حماقت

خیانت های قاجار

WordPress 26.3 for Android +8.0

WordPress 26.3 for Android +8.0

وردپرس

Lynda - Adapting a Print Layout for Digital Publishing

Lynda - Adapting a Print Layout for Digital Publishing

فیلم آموزش سازگار و آماده کردن یک طرح‌بندی چاپ برای انتشار دیجیتال

AndFTP Pro 5.4 for Android +3.0

AndFTP Pro 5.4 for Android +3.0

نرم افزار مدیریت اف تی پی برای آندروید

Circuits

Circuits

مدارها - نسخه‌ی جدید

مبانی نجوم رادیویی

مبانی نجوم رادیویی

کتاب الکترونیکی نجوم رادیویی

PhotoMontager Full 3.31 for Android +2.2

PhotoMontager Full 3.31 for Android +2.2

قاب گذاری بر روی تصاویر

Apache Helicopter National Geographic Documentary

Apache Helicopter National Geographic Documentary

مستند هلیکوپتر آپاچی

سخنرانی محسن کازرونی با موضوع درک عظمت ماه رمضان و شناخت آن

سخنرانی محسن کازرونی با موضوع درک عظمت ماه رمضان و شناخت آن

سخنرانی درک عظمت ماه رمضان و شناخت آن با محسن کازرونی

Fotor Photo Editor 7.7.6.2 for Android +7.0

Fotor Photo Editor 7.7.6.2 for Android +7.0

ویرایش عکس فوتور

Touch Hider 1.20 for Symbian

Touch Hider 1.20 for Symbian

برنامه ای برای پنهان سازی فایل ها برای سیمبین

GRAPHISOFT ArchiCAD 29.0.2 Build 3200 / macOS

GRAPHISOFT ArchiCAD 29.0.2 Build 3200 / macOS

گرافیسافت آرشیکد

نشانه های بندگان خوب خدا از حجت الاسلام والمسلمین علوی تهرانی- 3 بخش

نشانه های بندگان خوب خدا از حجت الاسلام والمسلمین علوی تهرانی- 3 بخش

حاج آقا علوی تهرانی با موضوع نشانه های بندگان خوب خدا

شناخت امام یازدهم: فرزندان و شاگردان امام حسن عسکری علیه السلام

شناخت امام یازدهم: فرزندان و شاگردان امام حسن عسکری علیه السلام

قطره ای از دریای کرامات امام حسن عسکری علیه السلام

CBT Nuggets - Microsoft Windows Server 2012 70-412 with R2 Updates

CBT Nuggets - Microsoft Windows Server 2012 70-412 with R2 Updates

ناگت Windows Server 2012

خبرنامه

با عضویت در خبرنامه، زودتر از همه باخبر باش!