سافت گذر دانشنامه نرم افزار - دانلود رایگان نرم افزار

همه دسته بندی ها

منو
آیکون جستجو در سایت سافت گذر
اطلاعیه های مهم سایت اطلاعیه های مهم سایت

 

💐 میلاد زینت پدر حضرت زینب سلام الله علیها مبارک باد 💐
 
 
  1. جهت رفع مشکل باز شدن سایت به دلیل بلاک توسط  نود 32 این ویدیو یا این ویدیو(ورژن 9 به بالا) یا راهنمای تصویری را مشاهده کنید
  2. اکانت های بروزرسانی نود32 با قیمت های مناسب به صورت یک ، سه ، شش و دوازده ماهه از اینجا قابل خرید می باشد.

نرم افزار های پرکاربرد

ثبت نام | ورود

هوش مصنوعی

تغییرات صوتی OpenAI: معرفی نسل جدید مدل‌های هوش مصنوعی صدا

در ماه‌های اخیر، OpenAI چندین ابزار جدید از جمله Operator، Deep Research، Computer-Using Agents و Responses API را منتشر کرده که بر روی عامل‌های متنی متمرکز بوده‌اند. امروز، OpenAI مدل‌های جدید تبدیل گفتار به متن و متن به گفتار را در API خود اعلام کرد که به توسعه‌دهندگان امکان می‌دهد عامل‌های صوتی قدرتمندتر، قابل شخصی‌سازی‌تر و بیانگرتر از همیشه بسازند.

 

تغییرات صوتی OpenAI: معرفی نسل جدید مدل‌های هوش مصنوعی صدا

 

مدل‌های جدید تبدیل گفتار به متن OpenAI، gpt-4o-transcribe و gpt-4o-mini-transcribe، بهبودهای قابل توجهی در نرخ خطای کلمات، تشخیص زبان و دقت در مقایسه با مدل‌های Whisper موجود OpenAI ارائه می‌دهند. این پیشرفت‌ها از طریق یادگیری تقویتی و آموزش میانی گسترده با استفاده از مجموعه داده‌های صوتی متنوع و با کیفیت بالا به دست آمده است.

OpenAI ادعا می‌کند که این مدل‌های صوتی جدید می‌توانند ظرافت‌های گفتار را بهتر درک کنند، تشخیص‌های نادرست را کاهش دهند و قابلیت اطمینان رونویسی را حتی زمانی که صدای ورودی شامل لهجه‌ها، محیط‌های پر سر و صدا و سرعت‌های مختلف گفتار است، بهبود بخشند.

gpt-4o-mini-tts جدیدترین مدل تبدیل متن به گفتار است که قابلیت هدایت بهبود یافته‌ای را ارائه می‌دهد. توسعه‌دهندگان اکنون می‌توانند به مدل دستور دهند که چگونه محتوای متن را تلفظ کند. با این حال، فعلاً مدل تبدیل متن به گفتار به صداهای مصنوعی از پیش تعیین شده محدود است.

هزینه‌های مدل‌ها به شرح زیر است: مدل gpt-4o-transcribe: ۶ دلار برای هر میلیون توکن صوتی ورودی، ۲.۵۰ دلار برای هر میلیون توکن متنی ورودی و ۱۰ دلار برای هر میلیون توکن متنی خروجی مدل gpt-4o-mini-transcribe: ۳ دلار برای هر میلیون توکن صوتی ورودی، ۱.۲۵ دلار برای هر میلیون توکن متنی ورودی و ۵ دلار برای هر میلیون توکن متنی خروجی مدل gpt-4o-mini-tts: ۰.۶۰ دلار برای هر میلیون توکن متنی ورودی و ۱۲ دلار برای هر میلیون توکن صوتی خروجی

 

این هزینه‌ها به صورت دقیقه‌ای به شرح زیر محاسبه می‌شود:

  • gpt-4o-transcribe: حدود ۰.۶ سنت در دقیقه
  • gpt-4o-mini-transcribe: حدود ۰.۳ سنت در دقیقه
  • gpt-4o-mini-tts: حدود ۱.۵ سنت در دقیقه

تیم OpenAI درباره این مدل‌های صوتی جدید نوشت: “در آینده، ما قصد داریم به سرمایه‌گذاری در بهبود هوشمندی و دقت مدل‌های صوتی خود ادامه دهیم و راه‌هایی را برای اجازه دادن به توسعه‌دهندگان برای آوردن صداهای سفارشی خود جهت ساخت تجربیات شخصی‌سازی شده‌تر، به روش‌هایی که با استانداردهای ایمنی ما مطابقت دارند، بررسی کنیم.”

این مدل‌های صوتی جدید اکنون از طریق APIها برای همه توسعه‌دهندگان در دسترس هستند. OpenAI همچنین یک ادغام با Agents SDK را اعلام کرد که به توسعه‌دهندگان امکان می‌دهد به راحتی عامل‌های صوتی بسازند. برای تجربیات گفتار به گفتار با تأخیر کم، OpenAI استفاده از Realtime API را توصیه می‌کند.

نظرتان را ثبت کنید کد خبر: 52463 گروه خبری: هوش مصنوعی منبع خبر: سافت گذر تاریخ خبر: 1404/01/03 تعداد مشاهده: 2713
اخبار مرتبط با این خبر
نظر های کاربران
سرور آپدیت نود 32
پیشنهاد سافت گذر
Nitro PDF Pro 4.42.0.34 Enterprise + Retail + Portable

Nitro PDF Pro 4.42.0.34 Enterprise + Retail + Portable

ویرایش پی دی اف

سخنرانی مسعود عالی با موضوع آسیب های مؤمنان در آخرالزمان- 6 جلسه

سخنرانی مسعود عالی با موضوع آسیب های مؤمنان در آخرالزمان- 6 جلسه

سخنرانی آسیب های مؤمنان در آخرالزمان با مسعود عالی

دایره‌المعارف دارویی خانواده

دایره‌المعارف دارویی خانواده

دایره‌المعارف

Lynda - Corel Painter 2017 Essential Training

Lynda - Corel Painter 2017 Essential Training

فیلم آموزش کورل پینتر 2017 لیندا

GNS3 3.0.5 Final / Wireshark 4.6.2 / macOS

GNS3 3.0.5 Final / Wireshark 4.6.2 / macOS

شبیه سازی شبکه های کامپیوتری جی ان اس3

Lynda - Foundations of Programming- Web Security

Lynda - Foundations of Programming- Web Security

فیلم آموزش اصول اولیه برنامه‌نویسی وب - امنیت وبسایت

Batman v Superman Dawn of Justice

Batman v Superman Dawn of Justice

بتمن در برابر سوپرمن: طلوع عدالت

TrackMania 2 Canyon

TrackMania 2 Canyon

ماشین‌سواری جذاب و منحصر به فرد مسیر جنون 2 تنگه

آشنایی با رژیم سالم غذایی روزانه

آشنایی با رژیم سالم غذایی روزانه

تغذیه روزانه در طب اسلامی

اطلاعات مختلف و جامعی در مورد کانادا

اطلاعات مختلف و جامعی در مورد کانادا

اطلاعات عمومی کانادا

Electrical calculations Pro 7.10.1 For Android +2.3

Electrical calculations Pro 7.10.1 For Android +2.3

ماشین حساب رشته برق

WebChangeMonitor 25.12

WebChangeMonitor 25.12

نظارت بر تغییرات سایت‌

All Updates for Windows XP SP3 February 2011

All Updates for Windows XP SP3 February 2011

آپدیت ویندوز xp ایکس پی

InfiniteSkills - CSS3 Dropdown Menus Training Video

InfiniteSkills - CSS3 Dropdown Menus Training Video

فیلم آموزش ساخت منوهای کشویی با سی‌اِس‌اِس3

PhotoInstrument 7.7 Build 1012

PhotoInstrument 7.7 Build 1012

روتوش عکس فتو اینسترومنت

ImDisk Toolkit 20250206

ImDisk Toolkit 20250206

باز کردن فایل های ایمیج در ویندوز

Lynda - Classroom Management Fundamentals

Lynda - Classroom Management Fundamentals

فیلم آموزش اصول مدیریت کلاس درس

Deep Freeze Standard 8.71.020.5734/ Enterprise 8.60.220.5582 / Server / macOS

Deep Freeze Standard 8.71.020.5734/ Enterprise 8.60.220.5582 / Server / macOS

دیپ فریز

Microsoft SQL Server 2005 Enterprise / Developer + SP4

Microsoft SQL Server 2005 Enterprise / Developer + SP4

نسخه 2005 نرم افزار بانک اطلاعاتی مایکروسافت

Kali Linux 2025.4 Final

Kali Linux 2025.4 Final

کالی لینوکس

Wallace And Gromit Eisode 4 The Boogey Man

Wallace And Gromit Eisode 4 The Boogey Man

والاس و گرومیت نسخه بوگی من

Google Gemini 1.0.795460806 For Android +10.0

Google Gemini 1.0.795460806 For Android +10.0

هوش مصنوعی گوگل جمینی

Beautiful Widgets 5.7.8 for Android +2.3

Beautiful Widgets 5.7.8 for Android +2.3

پک ویجت های قابل استفاده برای اندروید

طراحی قالب و صفحات وب

طراحی قالب و صفحات وب

آموزش طراحی قالب های وب

MSC Patran 2020 / 2018.0 / 2013

MSC Patran 2020 / 2018.0 / 2013

دستیار مهندسی با مکانیک سه بعدی و معماری باز

روش شناسی اسکینر

روش شناسی اسکینر

تحلیل اندیشه سیاسی

آموزش ویندوز 8

آموزش ویندوز 8

آموزش ویندوز 8

Mendeley Desktop 1.17.11

Mendeley Desktop 1.17.11

نرم افزار مدیریت منابع تحقیق و پژوهش

GnarBike Trials Pro 1.3.7 for Android

GnarBike Trials Pro 1.3.7 for Android

بازی موتور سوار تریل

آلبوم بهترین آهنگ‌های رشید طاها خواننده مشهور الجزایری-فرانسوی

آلبوم بهترین آهنگ‌های رشید طاها خواننده مشهور الجزایری-فرانسوی

آهنگ های رشید طاها

The Invincible

The Invincible

اکشن و ماجراجویی برای کامپیوتر

UCam Ultra Camera Pro 6.1.7.012417 for Android +2.2

UCam Ultra Camera Pro 6.1.7.012417 for Android +2.2

برنامه فیلمبرداری یو کم

Adobe Lightroom Classic 2026 15.1 / 2025 14.5.1 / 13.3.1 / 2023 / 2022 / 2021 / 2020 / macOS

Adobe Lightroom Classic 2026 15.1 / 2025 14.5.1 / 13.3.1 / 2023 / 2022 / 2021 / 2020 / macOS

فوتوشاپ لایتروم کلاسیک

The Devil's Advocate

The Devil's Advocate

وکیل مدافع شیطان

SMS Scheduler PRO 7.5.3 for Android +2.3

SMS Scheduler PRO 7.5.3 for Android +2.3

ارسال پیامک خودکار

Trend Micro Cleaner One Pro 6.8.0.333

Trend Micro Cleaner One Pro 6.8.0.333

بهینه سازی ویندوز

Ayat - Al Quran 2.9.1 for Android +2.2

Ayat - Al Quran 2.9.1 for Android +2.2

قرآن با خط زیبای عثمان طه

Ergos Memory Info 2.4 for Symbian

Ergos Memory Info 2.4 for Symbian

نشان دهنده برخی اطلاعات گوشی براي سيمبين

Duplicati 2.1.0.5

Duplicati 2.1.0.5

بکاپ گیری

Stick Stunt Biker 1 v5.1 / Stick Stunt Biker 2 v2.3 for Android +2.2

Stick Stunt Biker 1 v5.1 / Stick Stunt Biker 2 v2.3 for Android +2.2

موتور سواری و کنترل آن با سنسور

خبرنامه

با عضویت در خبرنامه، زودتر از همه باخبر باش!