سافت گذر دانشنامه نرم افزار - دانلود رایگان نرم افزار

همه دسته بندی ها

منو
جستجو
اطلاعیه های مهم سایت اطلاعیه های مهم سایت
💐 میلاد زینت پدر حضرت زینب سلام الله علیها مبارک باد 💐
 
 
  1. جهت رفع مشکل باز شدن سایت به دلیل بلاک توسط  نود 32 این ویدیو یا این ویدیو(ورژن 9 به بالا) یا راهنمای تصویری را مشاهده کنید
  2. اکانت های بروزرسانی نود32 با قیمت های مناسب به صورت یک ، سه ، شش و دوازده ماهه از اینجا قابل خرید می باشد.

نرم افزار های پرکاربرد

ثبت نام | ورود

هوش مصنوعی

نوآوری هوش مصنوعی آمازون: مدل صوتی Nova Sonic برتر از گوگل و OpenAI

آمازون امروز Nova Sonic را معرفی کرد، یک مدل پیشرفته گفتار به گفتار که به توسعه‌دهندگان امکان می‌دهد برنامه‌هایی با قابلیت مکالمه صوتی شبیه انسان و در زمان واقعی بسازند. آمازون ادعا می‌کند این مدل صوتی جدید، بهترین عملکرد صنعت را از نظر قیمت و تأخیر کم ارائه می‌دهد.

معمولاً، برای توسعه یک برنامه صوتی، توسعه‌دهندگان باید با چندین مدل مختلف کار کنند - مانند مدل تشخیص گفتار برای تبدیل گفتار به متن، مدل‌های زبانی بزرگ برای درک و تولید پاسخ‌ها، و مدل تبدیل متن به گفتار برای تبدیل مجدد متن به صدا. این رویکرد نه تنها پیچیده است، بلکه اغلب در ثبت بافت‌های مهم صوتی و ظرافت‌هایی مانند لحن، آهنگ کلام و سبک صحبت کردن ناموفق است.

 

نوآوری هوش مصنوعی آمازون: مدل صوتی Nova Sonic برتر از گوگل و OpenAI

 

Nova Sonic این چالش را با یکپارچه‌سازی قابلیت‌های درک و تولید صدا در یک مدل واحد برطرف می‌کند. این رویکرد یکپارچه به مدل اجازه می‌دهد لحن، سبک و ورودی گفتاری را درک کند که منجر به مکالمه‌ای طبیعی‌تر می‌شود. همچنین می‌تواند زمان مناسب برای پاسخ را تشخیص دهد و وقفه‌ها (قطع کلام) را بهتر مدیریت کند.

Nova Sonic از صداهای مردانه و زنانه در لهجه‌های مختلف انگلیسی، از جمله آمریکایی و بریتانیایی پشتیبانی می‌کند. توسعه‌دهندگان می‌توانند از طریق Amazon Bedrock و با استفاده از API جریان دوطرفه، با پشتیبانی از فراخوانی توابع به این مدل دسترسی داشته باشند. همچنین شامل محافظت‌های داخلی مانند نظارت بر محتوا و واترمارک است.

 

جزئیات مدل در زیر آمده است:

Amazon Nova Sonic

شناسه مدل: amazon.nova-sonic-v1:0

ورودی‌ها: گفتار

خروجی‌ها: گفتار همراه با رونویسی و پاسخ‌های متنی

پنجره متن: ۳۰۰ هزار بافت

حداکثر مدت اتصال: ۸ دقیقه مهلت اتصال، با حداکثر ۲۰ اتصال همزمان برای هر مشتری

زبان‌های پشتیبانی شده: انگلیسی

مناطق: شرق ایالات متحده (ویرجینیای شمالی)

پشتیبانی API جریان دوطرفه: بله

پایگاه‌های دانش Bedrock: از طریق استفاده از ابزار (فراخوانی توابع) پشتیبانی می‌شود

 

نکته مرتبط اینکه، ماه گذشته OpenAI مدل‌های نسل بعدی گفتار به متن، gpt-4o-transcribe و gpt-4o-mini-transcribe را معرفی کرد که بهبودهای قابل توجهی در نرخ خطای کلمات، تشخیص زبان و دقت در مقایسه با مدل‌های Whisper موجود خود ارائه می‌دهند.

نظرتان را ثبت کنید کد خبر: 52604 گروه خبری: هوش مصنوعی منبع خبر: سافت گذر تاریخ خبر: 1404/01/20 تعداد مشاهده: 3130
اخبار مرتبط با این خبر
نظر های کاربران
سرور آپدیت نود 32
پیشنهاد سافت گذر
AfterFocus Pro 2.2.3 for Android +4.0

AfterFocus Pro 2.2.3 for Android +4.0

فوکوس بر روی تصاویر

تفسیر سوره حمد از دید استاد مطهری

تفسیر سوره حمد از دید استاد مطهری

مطهری تفسیر حمد

Dragonframe 5.2.7 (x64)

Dragonframe 5.2.7 (x64)

ساخت استاپ موشن

Pluralsight - Angular 2- Getting Started

Pluralsight - Angular 2- Getting Started

فیلم آموزش مبانی انگولار 2

Theatre of War 2 Africa 1943

Theatre of War 2 Africa 1943

جنگ در آفریقا

Aces of the Luftwaffe

Aces of the Luftwaffe

خلبانان نیروی هوایی

HotLead

HotLead

شلیک آتشین

Worms Clan Wars Update 6

Worms Clan Wars Update 6

کرمها - جنگهای قبیله ای

دوره آموزش تصویری Adobe Illustrator به زبان فارسی

دوره آموزش تصویری Adobe Illustrator به زبان فارسی

آموزش ایلوستریتور

FBReader Premium 3.8.19 for Android +5.0

FBReader Premium 3.8.19 for Android +5.0

کتابخوان اف بی ریدر

Pluralsight - HTML5 Canvas Fundamentals

Pluralsight - HTML5 Canvas Fundamentals

فیلم آموزش اصول ترسیمات گرافیکی و دیگر داده‌های تصویری در اچ‌تی‌ام‌ال5

Simple Scan – PDF Scanner App Full 4.7.0 For Android +4.4

Simple Scan – PDF Scanner App Full 4.7.0 For Android +4.4

اسکن آسان پی دی اف

AB Download Manager 1.7.1

AB Download Manager 1.7.1

مدیریت دانلود

Million Roses Songs - English + French + instrumental

Million Roses Songs - English + French + instrumental

آهنگ میلیون گل رز

MotionStudios Aircraft & Airline Companies 3.0 Retail

MotionStudios Aircraft & Airline Companies 3.0 Retail

نرم افزار شبیه سازی هواپیما و خطوط هوایی

Windows 10 AIO 22H2 Build 1904.05.6456 October 2025

Windows 10 AIO 22H2 Build 1904.05.6456 October 2025

ویندوز 10

Valentina Studio Pro 16.2.0

Valentina Studio Pro 16.2.0

مدیریت پایگاه داده

Udemy - The Complete ASP.NET MVC 5 Course

Udemy - The Complete ASP.NET MVC 5 Course

دوره آموزش برنامه‌نویسی

Microsoft Arrow Launcher 6.2.200602.89140 for Android +4.0

Microsoft Arrow Launcher 6.2.200602.89140 for Android +4.0

لانچر مایکروسافت

Frozen Synapse Collectors Edition

Frozen Synapse Collectors Edition

فروزن سیناپس - سیناپس منجمد

شرح پریشانی

شرح پریشانی

عزم کوی یار

EasyUEFI Enterprise 6.0.1 + WinPE

EasyUEFI Enterprise 6.0.1 + WinPE

مدیریت تنظیمات بوت

Odyssey - The Next Generation Science Game

Odyssey - The Next Generation Science Game

علمی تخیلی

آموزش Shell Programing

آموزش Shell Programing

آموزش برنامه نویسی شل

Wake-Sleep What to Eat and Do for More Energy and Better Sleep

Wake-Sleep What to Eat and Do for More Energy and Better Sleep

بیداری-خواب برای انرژی بیشتر و خواب بهتر چه بخورید و چه کاری انجام دهید

Baby Einstein 26 DVDs

Baby Einstein 26 DVDs

فیلم آموزشی برای کودکان 3 ماهه تا 3 ساله

Crash And Burn Racing

Crash And Burn Racing

ماشین جنگی - مسابقات مرگ‌بار

سخنرانی حجت الاسلام احمد دارستانی با موضوع انجام کارها به نیت امام زمان

سخنرانی حجت الاسلام احمد دارستانی با موضوع انجام کارها به نیت امام زمان

سخنرانی حجت الاسلام حمید میرباقری با موضوع اصغر آواره

Lynda - SQL Server Integration Services

Lynda - SQL Server Integration Services

فیلم آموزش سرویس یکپارچه‌سازی اِس‌کیو‌اِل سروِر

کارکردهای خانواده

کارکردهای خانواده

بررسی کارکردهای خانواده در شکل‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌گیری سبک زندگی اسلامی

The Very Best of Mozart

The Very Best of Mozart

منتخب بهترین آثار موتزارت

Acunetix Web Vulnerability Scanner 13.0.201126145

Acunetix Web Vulnerability Scanner 13.0.201126145

اکانتیکس اسکن امنیتی سایت

AV Music Morpher Gold 5.0.41 + Portable

AV Music Morpher Gold 5.0.41 + Portable

بهترین برنامه برای جدا کردن صدا از موزیک

مقاتل قدیمی شیعه

مقاتل قدیمی شیعه

چاپ سنگی، کهن و نفیس کتاب مخزن البکاء

Homesick

Homesick

خانه‌ی مرموز

جهان در انتظار منجی موعود از استاد محمد شجاعی

جهان در انتظار منجی موعود از استاد محمد شجاعی

استاد شجاعی با موضوع جهان در انتظار منجی موعود

Museum Secrets Topkapi Palace Museum Istanbul

Museum Secrets Topkapi Palace Museum Istanbul

مستند اسرار موزه

Google Keyboard ( Gboard ) 16.1.1.809934391 for Android +8.0

Google Keyboard ( Gboard ) 16.1.1.809934391 for Android +8.0

کیبورد گوگل

GooCubelets 2

GooCubelets 2

مکعب‌های ژله‌ای 2

Project Zomboid v46.60

Project Zomboid v46.60

زامبی برای کامپیوتر

خبرنامه

با عضویت در خبرنامه، زودتر از همه باخبر باش!