سافت گذر دانشنامه نرم افزار - دانلود رایگان نرم افزار

همه دسته بندی ها

منو
آیکون جستجو در سایت سافت گذر
اطلاعیه های مهم سایت اطلاعیه های مهم سایت
💐 میلاد زینت پدر حضرت زینب سلام الله علیها مبارک باد 💐
 
 
  1. جهت رفع مشکل باز شدن سایت به دلیل بلاک توسط  نود 32 این ویدیو یا این ویدیو(ورژن 9 به بالا) یا راهنمای تصویری را مشاهده کنید
  2. به مناسبت ماه رجب، در سایت https://esetupdate.ir/ تخفیف ویژه‌ای برای محصولات در نظر گرفته شده است؛ فرصت را از دست ندهید. 🌸
  3. اکانت های بروزرسانی نود32 با قیمت های مناسب به صورت یک ، سه ، شش و دوازده ماهه از اینجا قابل خرید می باشد.

نرم افزار های پرکاربرد

ثبت نام | ورود

هوش مصنوعی

تغییرات صوتی OpenAI: معرفی نسل جدید مدل‌های هوش مصنوعی صدا

در ماه‌های اخیر، OpenAI چندین ابزار جدید از جمله Operator، Deep Research، Computer-Using Agents و Responses API را منتشر کرده که بر روی عامل‌های متنی متمرکز بوده‌اند. امروز، OpenAI مدل‌های جدید تبدیل گفتار به متن و متن به گفتار را در API خود اعلام کرد که به توسعه‌دهندگان امکان می‌دهد عامل‌های صوتی قدرتمندتر، قابل شخصی‌سازی‌تر و بیانگرتر از همیشه بسازند.

 

تغییرات صوتی OpenAI: معرفی نسل جدید مدل‌های هوش مصنوعی صدا

 

مدل‌های جدید تبدیل گفتار به متن OpenAI، gpt-4o-transcribe و gpt-4o-mini-transcribe، بهبودهای قابل توجهی در نرخ خطای کلمات، تشخیص زبان و دقت در مقایسه با مدل‌های Whisper موجود OpenAI ارائه می‌دهند. این پیشرفت‌ها از طریق یادگیری تقویتی و آموزش میانی گسترده با استفاده از مجموعه داده‌های صوتی متنوع و با کیفیت بالا به دست آمده است.

OpenAI ادعا می‌کند که این مدل‌های صوتی جدید می‌توانند ظرافت‌های گفتار را بهتر درک کنند، تشخیص‌های نادرست را کاهش دهند و قابلیت اطمینان رونویسی را حتی زمانی که صدای ورودی شامل لهجه‌ها، محیط‌های پر سر و صدا و سرعت‌های مختلف گفتار است، بهبود بخشند.

gpt-4o-mini-tts جدیدترین مدل تبدیل متن به گفتار است که قابلیت هدایت بهبود یافته‌ای را ارائه می‌دهد. توسعه‌دهندگان اکنون می‌توانند به مدل دستور دهند که چگونه محتوای متن را تلفظ کند. با این حال، فعلاً مدل تبدیل متن به گفتار به صداهای مصنوعی از پیش تعیین شده محدود است.

هزینه‌های مدل‌ها به شرح زیر است: مدل gpt-4o-transcribe: ۶ دلار برای هر میلیون توکن صوتی ورودی، ۲.۵۰ دلار برای هر میلیون توکن متنی ورودی و ۱۰ دلار برای هر میلیون توکن متنی خروجی مدل gpt-4o-mini-transcribe: ۳ دلار برای هر میلیون توکن صوتی ورودی، ۱.۲۵ دلار برای هر میلیون توکن متنی ورودی و ۵ دلار برای هر میلیون توکن متنی خروجی مدل gpt-4o-mini-tts: ۰.۶۰ دلار برای هر میلیون توکن متنی ورودی و ۱۲ دلار برای هر میلیون توکن صوتی خروجی

 

این هزینه‌ها به صورت دقیقه‌ای به شرح زیر محاسبه می‌شود:

  • gpt-4o-transcribe: حدود ۰.۶ سنت در دقیقه
  • gpt-4o-mini-transcribe: حدود ۰.۳ سنت در دقیقه
  • gpt-4o-mini-tts: حدود ۱.۵ سنت در دقیقه

تیم OpenAI درباره این مدل‌های صوتی جدید نوشت: “در آینده، ما قصد داریم به سرمایه‌گذاری در بهبود هوشمندی و دقت مدل‌های صوتی خود ادامه دهیم و راه‌هایی را برای اجازه دادن به توسعه‌دهندگان برای آوردن صداهای سفارشی خود جهت ساخت تجربیات شخصی‌سازی شده‌تر، به روش‌هایی که با استانداردهای ایمنی ما مطابقت دارند، بررسی کنیم.”

این مدل‌های صوتی جدید اکنون از طریق APIها برای همه توسعه‌دهندگان در دسترس هستند. OpenAI همچنین یک ادغام با Agents SDK را اعلام کرد که به توسعه‌دهندگان امکان می‌دهد به راحتی عامل‌های صوتی بسازند. برای تجربیات گفتار به گفتار با تأخیر کم، OpenAI استفاده از Realtime API را توصیه می‌کند.

نظرتان را ثبت کنید کد خبر: 52463 گروه خبری: هوش مصنوعی منبع خبر: سافت گذر تاریخ خبر: 1404/01/03 تعداد مشاهده: 2821
اخبار مرتبط با این خبر
نظر های کاربران
سرور آپدیت نود 32
پیشنهاد سافت گذر
منتخب سخنرانی های زیبا درباره شهادت حضرت رقیه

منتخب سخنرانی های زیبا درباره شهادت حضرت رقیه

سخنرانی های حجت الاسلام درباره شهادت حضرت رقیه

Photo Grid-Photo Collage Maker Premium 8.81 for Android +3.0

Photo Grid-Photo Collage Maker Premium 8.81 for Android +3.0

ترکیب تصاویر

Tutsplus – Introduction to Dreamweaver CC

Tutsplus – Introduction to Dreamweaver CC

فیلم آموزش مبانی نرم‌افزار دریم‌ویور سی‌سی

Tutsplus - ASP .NET 102: MVC Tutorial

Tutsplus - ASP .NET 102: MVC Tutorial

فیلم آموزش ساختار لایه‌ای طراحی وب شامل الگو، نمایش‌گر و کنترل‌کننده از طریق پلتفرم ASP .NET

تفسیر سوره توبه از دید استاد مطهری

تفسیر سوره توبه از دید استاد مطهری

مطهری تفسیر توبه

Plants vs. Zombies Replanted v1.5.1469

Plants vs. Zombies Replanted v1.5.1469

گیاهان علیه زامبی ها

توابع و فرمول‌های مالی پرکاربرد اکسل

توابع و فرمول‌های مالی پرکاربرد اکسل

Learning Microsoft Office Excel

مداحی نریمان پناهی سال 98

مداحی نریمان پناهی سال 98

محرم شب اول تا شام غریبان پناهی

مجموعه کتابهای استاد شهید مرتضی مطهری

مجموعه کتابهای استاد شهید مرتضی مطهری

شهید مطهری

فرهنگ لغات کامپیوتر و برق

فرهنگ لغات کامپیوتر و برق

واژه‌نامه تخصصی کامپیوتر و برق

آموزش تصویری برنامه نویسی BlueJ

آموزش تصویری برنامه نویسی BlueJ

آموزش بلوجی

مجله الکترونیکی دالان شماره 1 ، 2  ، 3 و 4

مجله الکترونیکی دالان شماره 1 ، 2 ، 3 و 4

مجله تخصصی مهندسی عمران و معماری دالان شماره های اول ، دوم ، سوم و چهارم

Double Team

Double Team

ژان کلود ون دام

Lynda - Android App Development with Java Essential Training

Lynda - Android App Development with Java Essential Training

مجموعه آموزش تصویری (فیلم) شرکت لیندا در مورد ساخت نرم افزارهای اندروید با استفاده از زبان جاوا

Build-a-lot 4 Power Source

Build-a-lot 4 Power Source

نسخه 4 پیمانکاری 8 شهردار اول جهان با محوریت انرژی

XnRetro Pro 1.86 for Android +2.2

XnRetro Pro 1.86 for Android +2.2

افکت گذاری تصاویر

BusyBox Pro 71 for Android +1.6

BusyBox Pro 71 for Android +1.6

نصب و حذف برنامه های موبایل

XL Converter 1.2.3

XL Converter 1.2.3

تبدیل فرمت و کاهش حجم عکس‌

مساله ولیعهدی و جانشینی شاه

مساله ولیعهدی و جانشینی شاه

بررسی بحران جانشینی در دوران قاجار

Volume Control 5.5.0 Premium for Android +4.4

Volume Control 5.5.0 Premium for Android +4.4

کنترل ولووم

Lua Player Pro 3.5.3 for Android +4.1

Lua Player Pro 3.5.3 for Android +4.1

ویدئو پلیر متحرک

پیام رسان ایتا Eitaa نسخه 4.3.2 ویندوز / مک / لینوکس

پیام رسان ایتا Eitaa نسخه 4.3.2 ویندوز / مک / لینوکس

ایتا

Red Orchestra 2 Heroes Of Stalingrad + Update 1 and 2-3

Red Orchestra 2 Heroes Of Stalingrad + Update 1 and 2-3

ارکستر سرخ 2

شیطان شناسی

شیطان شناسی

دشمن شناسی

Quickoffice Pro 6.5.1.12 for Android

Quickoffice Pro 6.5.1.12 for Android

برنامه کاربردی برای مشاهده و ویرایش و به اشتراک گذاشتن فایل های Office برای Android

Smart AppProtect 2 Pro 6.5.5 for Android +2.3

Smart AppProtect 2 Pro 6.5.5 for Android +2.3

رمز گذاری آسان برنامه ها

BitTorrent 8.2.52 Pro for Android +4.0

BitTorrent 8.2.52 Pro for Android +4.0

بیت تورنت

WALL-E

WALL-E

وال-ئی

آیین کشورداری و شهریاری

آیین کشورداری و شهریاری

سیاست‌نامه خواجه نظام‌الملک

Test Drive - Ferrari Racing Legends

Test Drive - Ferrari Racing Legends

تست درایو - اسطوره های مسابقات فِراری

Forward to the Sky

Forward to the Sky

اکشن چالشی

اندیشه سیاسی در اسلام

اندیشه سیاسی در اسلام

شماره اول دوفصلنامه علمی ـ تخصصی الفکر السیاسی الاسلامی

Far Cry 6

Far Cry 6

فارکرای 6

مداحی حاج محمود کریمی سال 90

مداحی حاج محمود کریمی سال 90

مداحی کریمی سال 90

بازاریابی بانکی - Bank marketing

بازاریابی بانکی - Bank marketing

آشنایی با بازاریابی بانکی به زبان خودمانی

SWF Player - Flash File Viewer 1.72 for Android +2.2

SWF Player - Flash File Viewer 1.72 for Android +2.2

اجرای فایلهای فلش در اندروید

مداحی حاج سید مهدی میرداماد سال 98

مداحی حاج سید مهدی میرداماد سال 98

دهه محرم میرداماد

Harry Potter 4

Harry Potter 4

هری پاتر برای کامپیوتر

AMS Photo Collage Maker 9.35

AMS Photo Collage Maker 9.35

ساخت کلاژ

سخنرانی حجت الاسلام رفیعی درباره برخورد والدین با فرزندان

سخنرانی حجت الاسلام رفیعی درباره برخورد والدین با فرزندان

برخورد والدین با فرزندان از زبان حجت الاسلام رفیعی

خبرنامه

با عضویت در خبرنامه، زودتر از همه باخبر باش!