سافت گذر دانشنامه نرم افزار - دانلود رایگان نرم افزار

همه دسته بندی ها

منو
آیکون جستجو در سایت سافت گذر
اطلاعیه های مهم سایت اطلاعیه های مهم سایت
💐 میلاد زینت پدر حضرت زینب سلام الله علیها مبارک باد 💐
 
 
  1. جهت رفع مشکل باز شدن سایت به دلیل بلاک توسط  نود 32 این ویدیو یا این ویدیو(ورژن 9 به بالا) یا راهنمای تصویری را مشاهده کنید
  2. به مناسبت ماه رجب، در سایت https://esetupdate.ir/ تخفیف ویژه‌ای برای محصولات در نظر گرفته شده است؛ فرصت را از دست ندهید. 🌸
  3. اکانت های بروزرسانی نود32 با قیمت های مناسب به صورت یک ، سه ، شش و دوازده ماهه از اینجا قابل خرید می باشد.

نرم افزار های پرکاربرد

ثبت نام | ورود

هوش مصنوعی

تغییرات صوتی OpenAI: معرفی نسل جدید مدل‌های هوش مصنوعی صدا

در ماه‌های اخیر، OpenAI چندین ابزار جدید از جمله Operator، Deep Research، Computer-Using Agents و Responses API را منتشر کرده که بر روی عامل‌های متنی متمرکز بوده‌اند. امروز، OpenAI مدل‌های جدید تبدیل گفتار به متن و متن به گفتار را در API خود اعلام کرد که به توسعه‌دهندگان امکان می‌دهد عامل‌های صوتی قدرتمندتر، قابل شخصی‌سازی‌تر و بیانگرتر از همیشه بسازند.

 

تغییرات صوتی OpenAI: معرفی نسل جدید مدل‌های هوش مصنوعی صدا

 

مدل‌های جدید تبدیل گفتار به متن OpenAI، gpt-4o-transcribe و gpt-4o-mini-transcribe، بهبودهای قابل توجهی در نرخ خطای کلمات، تشخیص زبان و دقت در مقایسه با مدل‌های Whisper موجود OpenAI ارائه می‌دهند. این پیشرفت‌ها از طریق یادگیری تقویتی و آموزش میانی گسترده با استفاده از مجموعه داده‌های صوتی متنوع و با کیفیت بالا به دست آمده است.

OpenAI ادعا می‌کند که این مدل‌های صوتی جدید می‌توانند ظرافت‌های گفتار را بهتر درک کنند، تشخیص‌های نادرست را کاهش دهند و قابلیت اطمینان رونویسی را حتی زمانی که صدای ورودی شامل لهجه‌ها، محیط‌های پر سر و صدا و سرعت‌های مختلف گفتار است، بهبود بخشند.

gpt-4o-mini-tts جدیدترین مدل تبدیل متن به گفتار است که قابلیت هدایت بهبود یافته‌ای را ارائه می‌دهد. توسعه‌دهندگان اکنون می‌توانند به مدل دستور دهند که چگونه محتوای متن را تلفظ کند. با این حال، فعلاً مدل تبدیل متن به گفتار به صداهای مصنوعی از پیش تعیین شده محدود است.

هزینه‌های مدل‌ها به شرح زیر است: مدل gpt-4o-transcribe: ۶ دلار برای هر میلیون توکن صوتی ورودی، ۲.۵۰ دلار برای هر میلیون توکن متنی ورودی و ۱۰ دلار برای هر میلیون توکن متنی خروجی مدل gpt-4o-mini-transcribe: ۳ دلار برای هر میلیون توکن صوتی ورودی، ۱.۲۵ دلار برای هر میلیون توکن متنی ورودی و ۵ دلار برای هر میلیون توکن متنی خروجی مدل gpt-4o-mini-tts: ۰.۶۰ دلار برای هر میلیون توکن متنی ورودی و ۱۲ دلار برای هر میلیون توکن صوتی خروجی

 

این هزینه‌ها به صورت دقیقه‌ای به شرح زیر محاسبه می‌شود:

  • gpt-4o-transcribe: حدود ۰.۶ سنت در دقیقه
  • gpt-4o-mini-transcribe: حدود ۰.۳ سنت در دقیقه
  • gpt-4o-mini-tts: حدود ۱.۵ سنت در دقیقه

تیم OpenAI درباره این مدل‌های صوتی جدید نوشت: “در آینده، ما قصد داریم به سرمایه‌گذاری در بهبود هوشمندی و دقت مدل‌های صوتی خود ادامه دهیم و راه‌هایی را برای اجازه دادن به توسعه‌دهندگان برای آوردن صداهای سفارشی خود جهت ساخت تجربیات شخصی‌سازی شده‌تر، به روش‌هایی که با استانداردهای ایمنی ما مطابقت دارند، بررسی کنیم.”

این مدل‌های صوتی جدید اکنون از طریق APIها برای همه توسعه‌دهندگان در دسترس هستند. OpenAI همچنین یک ادغام با Agents SDK را اعلام کرد که به توسعه‌دهندگان امکان می‌دهد به راحتی عامل‌های صوتی بسازند. برای تجربیات گفتار به گفتار با تأخیر کم، OpenAI استفاده از Realtime API را توصیه می‌کند.

نظرتان را ثبت کنید کد خبر: 52463 گروه خبری: هوش مصنوعی منبع خبر: سافت گذر تاریخ خبر: 1404/01/03 تعداد مشاهده: 2820
اخبار مرتبط با این خبر
نظر های کاربران
سرور آپدیت نود 32
پیشنهاد سافت گذر
InPixio Photo Maximizer Pro 5.3.8625.22430

InPixio Photo Maximizer Pro 5.3.8625.22430

بزرگنمایی تصاویر

PDF Architect Pro + OCR 9.1.88.23120

PDF Architect Pro + OCR 9.1.88.23120

ویرایش و تبدیل فایل‌های پی‌دی‌اف

To Do Reminder Premium 3.4.2 for Android +5.0

To Do Reminder Premium 3.4.2 for Android +5.0

یادآوری کارها

RealPlayer 24.0.4.303

RealPlayer 24.0.4.303

ریل پلیر

Udemy - Ultimate Photoshop Training - From Beginner to Pro

Udemy - Ultimate Photoshop Training - From Beginner to Pro

آموزش کامل فتوشاپ

Crazy Machines 2 Happy New Year Bundle Edition

Crazy Machines 2 Happy New Year Bundle Edition

ماشین‌های معیوب 2 - نسخه ارتقا یافته سال نو

SuperPhoto 2.4.3 for Android +4.0

SuperPhoto 2.4.3 for Android +4.0

افکت تصاویر

The Thaumaturge

The Thaumaturge

نقش‌آفرینی برای کامپیوتر

Pikuniku Collector's Edition

Pikuniku Collector's Edition

اکشن و معمایی برای کامپیوتر

Adobe Acrobat X Professional 10.1.4

Adobe Acrobat X Professional 10.1.4

نرم افزار اصلی ساخت و ویرایش فایلهای PDF

سخنرانی حجت الاسلام مهدی شریعتی‌تبار با موضوع فرازی از دعای مکارم الاخلاق درباره تنظیم اوقات زندگی

سخنرانی حجت الاسلام مهدی شریعتی‌تبار با موضوع فرازی از دعای مکارم الاخلاق درباره تنظیم اوقات زندگی

سخنرانی فرازی از دعای مکارم الاخلاق درباره تنظیم اوقات زندگی با شریعتی‌تبار

سخنرانی حجت‌الاسلام علی ثمری با موضوع ویژگیهای دوران زعامت امام صادق (ع)

سخنرانی حجت‌الاسلام علی ثمری با موضوع ویژگیهای دوران زعامت امام صادق (ع)

سخنرانی ویژگیهای دوران زعامت امام صادق (ع) با علی ثمری

Music Collection 3.9.4.3

Music Collection 3.9.4.3

آرشیو موسیقی

Email Backup Wizard Enterprise 15.2

Email Backup Wizard Enterprise 15.2

پشتیبان‌گیری از ایمیل‌ها

آموزش برنامه PDF Tools اندروید

آموزش برنامه PDF Tools اندروید

پی دی اف تولز برای اندروید

App Protector Pro 2.42 for Android

App Protector Pro 2.42 for Android

رمزگذاری برنامه ها

پیام رسان آی گپ 7.4.0.0 ویندوز / مک / لینوکس

پیام رسان آی گپ 7.4.0.0 ویندوز / مک / لینوکس

آی گپ

Windows XP Activator

Windows XP Activator

فعال ساز ویندوز xp

Rhinoceros 8.28.26041.11001 / macOS

Rhinoceros 8.28.26041.11001 / macOS

مدل سازی راینو

Need For Extreme 3D

Need For Extreme 3D

مسابقه ماشین سواری غیر ورزشی

InfiniteSkills – Getting Started With Microsoft Office 2013 Training Video

InfiniteSkills – Getting Started With Microsoft Office 2013 Training Video

فیلم آموزش مجموعه نرم افزارهای مایکروسافت آفیس 2013

Udemy - Adobe Photoshop CC: A Beginner to Advanced Photoshop Course

Udemy - Adobe Photoshop CC: A Beginner to Advanced Photoshop Course

دوره آموزش کامل فتوشاپ

Htaccess. چیست؟

Htaccess. چیست؟

آموزش هاستهای لینوکس

TransOcean 2 - Rivals with Update v1.0.8

TransOcean 2 - Rivals with Update v1.0.8

شبیه ساز تجارت با کشتی

Daylight

Daylight

اکشن هیجانی

Cyrobo Clean Space Pro 2025 v716

Cyrobo Clean Space Pro 2025 v716

بهینه سازی ویندوز

Ratchet & Clank: Rift Apart

Ratchet & Clank: Rift Apart

رچت و کلنک شکاف جدا برای کامپیوتر

راهنمای Google +

راهنمای Google +

راهنمای گوگل پلاس

Microsoft Office 16.0.19725.20126 for Android +10.0

Microsoft Office 16.0.19725.20126 for Android +10.0

مایکروسافت آفیس موبایل

XiiaLive Pro - Internet Radio 3.3.3.0 for Android +2.3

XiiaLive Pro - Internet Radio 3.3.3.0 for Android +2.3

رادیو اینترنتی

آوای محبت

آوای محبت

صلوات

سخنرانی حجت الاسلام انصاریان  با موضوع صراط مستقیم و وسوسه های شیاطین - 2 جلسه

سخنرانی حجت الاسلام انصاریان با موضوع صراط مستقیم و وسوسه های شیاطین - 2 جلسه

حاج آقا انصاریان با موضوع صراط مستقیم و وسوسه های شیاطین

Air Assault 2

Air Assault 2

چرخ بال 2

آموزش ضد ویروس کردن فلش

آموزش ضد ویروس کردن فلش

ترفندی برای ضد ویروس کردن فلش مموری و هارد اکسترنال

Cheat Engine 7.4

Cheat Engine 7.4

نرم افزار هک و تغییر مقادیر درون بازی

Insidious + Insidious: Chapter 2 + Insidious: Chapter 3

Insidious + Insidious: Chapter 2 + Insidious: Chapter 3

ترسناک با دوبله فارسی

YouWave for Android Premium 5.11 x64

YouWave for Android Premium 5.11 x64

سریع ترین نرم افزار اجرای برنامه های اندروید در ویندوز

iPhone Notifications 6.1 for Android

iPhone Notifications 6.1 for Android

اطلاع رسانی به سبک آیفون

Atlas Fallen

Atlas Fallen

اکشن برای کامپیوتر

آموزش سریع اتوکد برای ترسیم دوبعدی و سه بعدی قطعات صنعتی

آموزش سریع اتوکد برای ترسیم دوبعدی و سه بعدی قطعات صنعتی

آموزش گام به گام طراحی قطعات صنعتی در اتوکد

خبرنامه

با عضویت در خبرنامه، زودتر از همه باخبر باش!