سافت گذر دانشنامه نرم افزار - دانلود رایگان نرم افزار

همه دسته بندی ها

منو
جستجو
اطلاعیه های مهم سایت اطلاعیه های مهم سایت
💐 میلاد زینت پدر حضرت زینب سلام الله علیها مبارک باد 💐
 
 
  1. جهت رفع مشکل باز شدن سایت به دلیل بلاک توسط  نود 32 این ویدیو یا این ویدیو(ورژن 9 به بالا) یا راهنمای تصویری را مشاهده کنید
  2. اکانت های بروزرسانی نود32 با قیمت های مناسب به صورت یک ، سه ، شش و دوازده ماهه از اینجا قابل خرید می باشد.

نرم افزار های پرکاربرد

ثبت نام | ورود

هوش مصنوعی

تغییرات صوتی OpenAI: معرفی نسل جدید مدل‌های هوش مصنوعی صدا

در ماه‌های اخیر، OpenAI چندین ابزار جدید از جمله Operator، Deep Research، Computer-Using Agents و Responses API را منتشر کرده که بر روی عامل‌های متنی متمرکز بوده‌اند. امروز، OpenAI مدل‌های جدید تبدیل گفتار به متن و متن به گفتار را در API خود اعلام کرد که به توسعه‌دهندگان امکان می‌دهد عامل‌های صوتی قدرتمندتر، قابل شخصی‌سازی‌تر و بیانگرتر از همیشه بسازند.

 

تغییرات صوتی OpenAI: معرفی نسل جدید مدل‌های هوش مصنوعی صدا

 

مدل‌های جدید تبدیل گفتار به متن OpenAI، gpt-4o-transcribe و gpt-4o-mini-transcribe، بهبودهای قابل توجهی در نرخ خطای کلمات، تشخیص زبان و دقت در مقایسه با مدل‌های Whisper موجود OpenAI ارائه می‌دهند. این پیشرفت‌ها از طریق یادگیری تقویتی و آموزش میانی گسترده با استفاده از مجموعه داده‌های صوتی متنوع و با کیفیت بالا به دست آمده است.

OpenAI ادعا می‌کند که این مدل‌های صوتی جدید می‌توانند ظرافت‌های گفتار را بهتر درک کنند، تشخیص‌های نادرست را کاهش دهند و قابلیت اطمینان رونویسی را حتی زمانی که صدای ورودی شامل لهجه‌ها، محیط‌های پر سر و صدا و سرعت‌های مختلف گفتار است، بهبود بخشند.

gpt-4o-mini-tts جدیدترین مدل تبدیل متن به گفتار است که قابلیت هدایت بهبود یافته‌ای را ارائه می‌دهد. توسعه‌دهندگان اکنون می‌توانند به مدل دستور دهند که چگونه محتوای متن را تلفظ کند. با این حال، فعلاً مدل تبدیل متن به گفتار به صداهای مصنوعی از پیش تعیین شده محدود است.

هزینه‌های مدل‌ها به شرح زیر است: مدل gpt-4o-transcribe: ۶ دلار برای هر میلیون توکن صوتی ورودی، ۲.۵۰ دلار برای هر میلیون توکن متنی ورودی و ۱۰ دلار برای هر میلیون توکن متنی خروجی مدل gpt-4o-mini-transcribe: ۳ دلار برای هر میلیون توکن صوتی ورودی، ۱.۲۵ دلار برای هر میلیون توکن متنی ورودی و ۵ دلار برای هر میلیون توکن متنی خروجی مدل gpt-4o-mini-tts: ۰.۶۰ دلار برای هر میلیون توکن متنی ورودی و ۱۲ دلار برای هر میلیون توکن صوتی خروجی

 

این هزینه‌ها به صورت دقیقه‌ای به شرح زیر محاسبه می‌شود:

  • gpt-4o-transcribe: حدود ۰.۶ سنت در دقیقه
  • gpt-4o-mini-transcribe: حدود ۰.۳ سنت در دقیقه
  • gpt-4o-mini-tts: حدود ۱.۵ سنت در دقیقه

تیم OpenAI درباره این مدل‌های صوتی جدید نوشت: “در آینده، ما قصد داریم به سرمایه‌گذاری در بهبود هوشمندی و دقت مدل‌های صوتی خود ادامه دهیم و راه‌هایی را برای اجازه دادن به توسعه‌دهندگان برای آوردن صداهای سفارشی خود جهت ساخت تجربیات شخصی‌سازی شده‌تر، به روش‌هایی که با استانداردهای ایمنی ما مطابقت دارند، بررسی کنیم.”

این مدل‌های صوتی جدید اکنون از طریق APIها برای همه توسعه‌دهندگان در دسترس هستند. OpenAI همچنین یک ادغام با Agents SDK را اعلام کرد که به توسعه‌دهندگان امکان می‌دهد به راحتی عامل‌های صوتی بسازند. برای تجربیات گفتار به گفتار با تأخیر کم، OpenAI استفاده از Realtime API را توصیه می‌کند.

نظرتان را ثبت کنید کد خبر: 52463 گروه خبری: هوش مصنوعی منبع خبر: سافت گذر تاریخ خبر: 1404/01/03 تعداد مشاهده: 2486
اخبار مرتبط با این خبر
نظر های کاربران
سرور آپدیت نود 32
پیشنهاد سافت گذر
نمایش رادیویی شازده کوچولو

نمایش رادیویی شازده کوچولو

فایل صوتی نمایش شازده کوچولو

گلچین سخنرانی اینک بهار  - 26 جلسه

گلچین سخنرانی اینک بهار - 26 جلسه

سخنران های معروف با موضوع اینک بهار

سلسله مباحث استاد شجاعی قسمت دوم

سلسله مباحث استاد شجاعی قسمت دوم

استاد شجاعی

FastStone Capture 11.0 + Portable

FastStone Capture 11.0 + Portable

نرم افزار تصویر برداری از ویندوز

زندگی نامه حضرت زهرا (س) نسخه 3.0 برای اندروید 2.3+

زندگی نامه حضرت زهرا (س) نسخه 3.0 برای اندروید 2.3+

زندگی نامه حضرت زهرا (س)

VERO ALPHACAM 2020.1 / 2019 R1 SU2 / 2017 R1 SP2 / 2016 R2 SP3 / Desinger 2020.0.1926

VERO ALPHACAM 2020.1 / 2019 R1 SU2 / 2017 R1 SP2 / 2016 R2 SP3 / Desinger 2020.0.1926

شبیه ساز برش و ماشین کاری

سخنرانی حجت الاسلام سید حسین مومنی با موضوع اهمیت ماه محرم - 5 جلسه

سخنرانی حجت الاسلام سید حسین مومنی با موضوع اهمیت ماه محرم - 5 جلسه

سخنرانی اهمیت ماه محرم با سید حسین مومنی

Autodesk 3ds Max 2012 SP2 Update12 x86 x64 + Sample Files

Autodesk 3ds Max 2012 SP2 Update12 x86 x64 + Sample Files

نسخه 2012 معروفترین نرم افزار سه بعدی سازی

Bondware Poser Pro 13.3.895

Bondware Poser Pro 13.3.895

طراحی سه‌بعدی

سخنرانی حجت الاسلام مرتضی آقاتهرانی با موضوع بندگی، هدف آفرینش

سخنرانی حجت الاسلام مرتضی آقاتهرانی با موضوع بندگی، هدف آفرینش

سخنرانی بندگی، هدف آفرینش با مرتضی آقاتهرانی

Web PC Suite 3.2.3 for Android +2.2

Web PC Suite 3.2.3 for Android +2.2

وب پی سی سوئیت

Udemy - Machine Learning A-Z™ Hands-On Python & R In Data Science

Udemy - Machine Learning A-Z™ Hands-On Python & R In Data Science

آموزش یادگیری ماشین با زبان‌های برنامه‌نویسی پایتون و آر

Premium Wallpapers HD 4k Premium 5.6.20 for Android +2.3

Premium Wallpapers HD 4k Premium 5.6.20 for Android +2.3

گالری تصویر زمینه

Longman Dictionary of Contemporary English 5th Edition 2009

Longman Dictionary of Contemporary English 5th Edition 2009

نرم افزار فرهنگ لغت انگلیسی به انگلیسی لانگمن ویرایش پنجم

Autodesk Inventor Pro 2014 SP1 + SP2 x86/x64

Autodesk Inventor Pro 2014 SP1 + SP2 x86/x64

قویترین نرم افزار مدلینگ و جایگزین Mechanical Desktop

Persian Date 5.2 for Android

Persian Date 5.2 for Android

تاریخ شمسی برای آندروید

Introducing Windows Server 2012

Introducing Windows Server 2012

آموزش ویندوز سرور 2012

GAMS Distribution 23.5.1 x86 / 24.1.2 x86/x64

GAMS Distribution 23.5.1 x86 / 24.1.2 x86/x64

سیستم قدرتمند مدل سازی GAMS

دیکشنری پزشکی مصور

دیکشنری پزشکی مصور

دیکشنری پزشکی مصور BMA

Uninstalr 2.6

Uninstalr 2.6

آنیستالر

EaseUS Video Editor Pro 2.4.0 Build 20240910

EaseUS Video Editor Pro 2.4.0 Build 20240910

ویرایش فیلم

Nintendo Games

Nintendo Games

مجموعه بازی های میکرو

Udemy - Mastering Thymeleaf with Spring Boot

Udemy - Mastering Thymeleaf with Spring Boot

آموزش استفاده از تایم‌لیف در اسپرینگ بوت

ASAP Utilities 8.5

ASAP Utilities 8.5

افزونه اکسل

راهنمای عملیاتی نرم‌افزار GAMS

راهنمای عملیاتی نرم‌افزار GAMS

آموزش جی ای ام اس

Microsoft Visual Studio Team Foundation Server 2012 Update 1 x86/x64

Microsoft Visual Studio Team Foundation Server 2012 Update 1 x86/x64

ویرایش خاص نرم افزار Visual Studio‌ برای انجام گروهی پروژه های برنامه نویسی

Deadlight 1.1

Deadlight 1.1

نور مرده

سخنرانی دکتر ناصر رفیعی با موضوع فرار از مسئولیت

سخنرانی دکتر ناصر رفیعی با موضوع فرار از مسئولیت

سخنرانی فرار از مسئولیت با ناصر رفیعی

رژیم های دروغی

رژیم های دروغی

باورهای نادرست درمورد رژیم غذایی

آموزش توابع آماری در اکسل

آموزش توابع آماری در اکسل

آشنایی با توابع کاربردی آماری در اکسل

آشنایی با ساخت ابزارهای ActiveX

آشنایی با ساخت ابزارهای ActiveX

آموزش اکتیو ایکس

گوگل فراتر از زمان

گوگل فراتر از زمان

آشنایی با تاریخچه Google

Dead Effect

Dead Effect

اثر مُرده

دورهٔ آموزش ویدئویی خط تحریری - خوش‌خط‌شدن در ۱۰ جلسهٔ کوتاه‌مدت

دورهٔ آموزش ویدئویی خط تحریری - خوش‌خط‌شدن در ۱۰ جلسهٔ کوتاه‌مدت

آموزش خط تحریری

HyperSnap 9.5.3

HyperSnap 9.5.3

هایپر اسنپ عکس گرفتن از صفحه نمایش

سخنرانی آیت الله جوادی آملی با موضوع ولایت در قرآن

سخنرانی آیت الله جوادی آملی با موضوع ولایت در قرآن

سخنرانی آیت الله جوادی آملی با موضوع ولایت در قرآن

BlackList PRO 4.91 for Android +2.0

BlackList PRO 4.91 for Android +2.0

بلاک لیست قدرتمند اندروید

XnRetro Pro 1.86 for Android +2.2

XnRetro Pro 1.86 for Android +2.2

افکت گذاری تصاویر

Maxon CINEMA 4D Studio 2025.3.1 / 2024.4.1 / 2023.2.1 / R26.107 / R25.120 / S24.111 / macOS

Maxon CINEMA 4D Studio 2025.3.1 / 2024.4.1 / 2023.2.1 / R26.107 / R25.120 / S24.111 / macOS

مکسون سینما فور دی

Windows 8.1 Pro/Enterprise January 2023

Windows 8.1 Pro/Enterprise January 2023

ویندوز 8.1

خبرنامه

با عضویت در خبرنامه، زودتر از همه باخبر باش!