سافت گذر دانشنامه نرم افزار - دانلود رایگان نرم افزار

همه دسته بندی ها

منو
جستجو
اطلاعیه های مهم سایت اطلاعیه های مهم سایت
💐 میلاد زینت پدر حضرت زینب سلام الله علیها مبارک باد 💐
 
 
  1. جهت رفع مشکل باز شدن سایت به دلیل بلاک توسط  نود 32 این ویدیو یا این ویدیو(ورژن 9 به بالا) یا راهنمای تصویری را مشاهده کنید
  2. اکانت های بروزرسانی نود32 با قیمت های مناسب به صورت یک ، سه ، شش و دوازده ماهه از اینجا قابل خرید می باشد.

نرم افزار های پرکاربرد

ثبت نام | ورود

هوش مصنوعی

نوآوری هوش مصنوعی آمازون: مدل صوتی Nova Sonic برتر از گوگل و OpenAI

آمازون امروز Nova Sonic را معرفی کرد، یک مدل پیشرفته گفتار به گفتار که به توسعه‌دهندگان امکان می‌دهد برنامه‌هایی با قابلیت مکالمه صوتی شبیه انسان و در زمان واقعی بسازند. آمازون ادعا می‌کند این مدل صوتی جدید، بهترین عملکرد صنعت را از نظر قیمت و تأخیر کم ارائه می‌دهد.

معمولاً، برای توسعه یک برنامه صوتی، توسعه‌دهندگان باید با چندین مدل مختلف کار کنند - مانند مدل تشخیص گفتار برای تبدیل گفتار به متن، مدل‌های زبانی بزرگ برای درک و تولید پاسخ‌ها، و مدل تبدیل متن به گفتار برای تبدیل مجدد متن به صدا. این رویکرد نه تنها پیچیده است، بلکه اغلب در ثبت بافت‌های مهم صوتی و ظرافت‌هایی مانند لحن، آهنگ کلام و سبک صحبت کردن ناموفق است.

 

نوآوری هوش مصنوعی آمازون: مدل صوتی Nova Sonic برتر از گوگل و OpenAI

 

Nova Sonic این چالش را با یکپارچه‌سازی قابلیت‌های درک و تولید صدا در یک مدل واحد برطرف می‌کند. این رویکرد یکپارچه به مدل اجازه می‌دهد لحن، سبک و ورودی گفتاری را درک کند که منجر به مکالمه‌ای طبیعی‌تر می‌شود. همچنین می‌تواند زمان مناسب برای پاسخ را تشخیص دهد و وقفه‌ها (قطع کلام) را بهتر مدیریت کند.

Nova Sonic از صداهای مردانه و زنانه در لهجه‌های مختلف انگلیسی، از جمله آمریکایی و بریتانیایی پشتیبانی می‌کند. توسعه‌دهندگان می‌توانند از طریق Amazon Bedrock و با استفاده از API جریان دوطرفه، با پشتیبانی از فراخوانی توابع به این مدل دسترسی داشته باشند. همچنین شامل محافظت‌های داخلی مانند نظارت بر محتوا و واترمارک است.

 

جزئیات مدل در زیر آمده است:

Amazon Nova Sonic

شناسه مدل: amazon.nova-sonic-v1:0

ورودی‌ها: گفتار

خروجی‌ها: گفتار همراه با رونویسی و پاسخ‌های متنی

پنجره متن: ۳۰۰ هزار بافت

حداکثر مدت اتصال: ۸ دقیقه مهلت اتصال، با حداکثر ۲۰ اتصال همزمان برای هر مشتری

زبان‌های پشتیبانی شده: انگلیسی

مناطق: شرق ایالات متحده (ویرجینیای شمالی)

پشتیبانی API جریان دوطرفه: بله

پایگاه‌های دانش Bedrock: از طریق استفاده از ابزار (فراخوانی توابع) پشتیبانی می‌شود

 

نکته مرتبط اینکه، ماه گذشته OpenAI مدل‌های نسل بعدی گفتار به متن، gpt-4o-transcribe و gpt-4o-mini-transcribe را معرفی کرد که بهبودهای قابل توجهی در نرخ خطای کلمات، تشخیص زبان و دقت در مقایسه با مدل‌های Whisper موجود خود ارائه می‌دهند.

نظرتان را ثبت کنید کد خبر: 52604 گروه خبری: هوش مصنوعی منبع خبر: سافت گذر تاریخ خبر: 1404/01/20 تعداد مشاهده: 3104
اخبار مرتبط با این خبر
نظر های کاربران
سرور آپدیت نود 32
پیشنهاد سافت گذر
Hyper Fighters

Hyper Fighters

جنگنده‌های برتر

Chain3D Premium 1.2.6 for Android

Chain3D Premium 1.2.6 for Android

بازی مکعب سه بعدی

ایجاد کسب و کار الکترونیکی

ایجاد کسب و کار الکترونیکی

ایده پردازی در منابع مالی

Adobe Audition CS6 v5.0 Build 708 Registered

Adobe Audition CS6 v5.0 Build 708 Registered

یکی از حرفه ای ترین نرم افزارهای ضبط و ویرایش فایل های موزیک

Learn 50 languages 12.3 for Android +2.3

Learn 50 languages 12.3 for Android +2.3

آموزش 50 زبان

داستان‌های قرآنی

داستان‌های قرآنی

زندگی‌نامه پیامبران الهی

سخنرانی حجت الاسلام طبسی با موضوع راه های شناخت حضرت زهرا (س)

سخنرانی حجت الاسلام طبسی با موضوع راه های شناخت حضرت زهرا (س)

حاج آقا طبسی با موضوع راه های شناخت حضرت زهرا (س)

Adobe After Effects CC 2018 v15.1.2.69 x64 + 2017 + Mac

Adobe After Effects CC 2018 v15.1.2.69 x64 + 2017 + Mac

تدوین فیلم ادوب افتر افکت

کاریکاتورهای انگلیسی برای نوآموزان زبان

کاریکاتورهای انگلیسی برای نوآموزان زبان

Socio-political Caricatures

Angry Birds Blast 2.6.8 For Android +4.0

Angry Birds Blast 2.6.8 For Android +4.0

Angry Birds Blast

Bike Race Pro 7.9.3 for Android +2.3

Bike Race Pro 7.9.3 for Android +2.3

بازی موتور سواری با پرش از موانع

ترتیل کل قرآن کریم از استاد شحات محمد انور

ترتیل کل قرآن کریم از استاد شحات محمد انور

ترتیل قرآن کریم 30 جزء شحات محمد انور

آموزش تدوین فیلم و صدا

آموزش تدوین فیلم و صدا

تدوین صدا

Lightbender

Lightbender

بازتاب‌دهنده‌ی نور

آموزش پارسیکس

آموزش پارسیکس

آشنایی با سیستم عامل Parsix

3 جلسه شخصیت امام علی علیه السلام از حجت الاسلام والمسلمین رفیعی

3 جلسه شخصیت امام علی علیه السلام از حجت الاسلام والمسلمین رفیعی

حاج آقا رفیعی با موضوع شخصیت امام علی علیه السلام

Rayman 2 - The Great Escape

Rayman 2 - The Great Escape

رِیـمن 2 - فرار بزرگ

راهنمای وب سرور آپاچی

راهنمای وب سرور آپاچی

آشنایی کامل با Apache Web Server

Autodesk 3ds Max 2013 Product Update 6 x86/x64

Autodesk 3ds Max 2013 Product Update 6 x86/x64

جدیدترین نسخه برنامه تری دی مکس برای ساخت انیمیشن های پیشرفته و سه بعدی

Lynda - MEAN Stack and MongoDB Development Techniques

Lynda - MEAN Stack and MongoDB Development Techniques

فیلم آموزش تکنیک‌های برنامه‌نویسی MEAN Stack و مونگو دیبی

AgingBooth 2.4 for Android +2.3

AgingBooth 2.4 for Android +2.3

چهره شما در 20 سال بعد چگونه است؟

Call Recorder for Android pro 8.1 for Android +4.0.3

Call Recorder for Android pro 8.1 for Android +4.0.3

ضبط مکالمات

آموزش کامل اینستاگرام به همراه تمامی ترفندها

آموزش کامل اینستاگرام به همراه تمامی ترفندها

Instagram

مداحی آماده شده برای دهه اول محرم سال 96 - شب نهم ( شب تاسوعا )

مداحی آماده شده برای دهه اول محرم سال 96 - شب نهم ( شب تاسوعا )

مداحی برای نهم محرم 96

Darksiders II + Updates 1-4

Darksiders II + Updates 1-4

سواران تاریکی 2

Wayward Manor

Wayward Manor

روح سرکش

آموزش توابع Visual Basic.Net

آموزش توابع Visual Basic.Net

آموزش توابع ویژوال بیسیک دات نت

Readiris PDF 25.0.1049 / Corporate 23.1.95.0 / 17.4.192

Readiris PDF 25.0.1049 / Corporate 23.1.95.0 / 17.4.192

تبدیل عکس به متن ریداریس

Dinosaur Hunt Gold Edition

Dinosaur Hunt Gold Edition

شکار دایناسور

آموزش اکسس

آموزش اکسس

آشنایی باAccess

BIOMUTANT + Update v1.6.0

BIOMUTANT + Update v1.6.0

بایومیوتنت

آشنایی با ساخت ابزارهای ActiveX

آشنایی با ساخت ابزارهای ActiveX

آموزش اکتیو ایکس

Clean Disk Security 8.10

Clean Disk Security 8.10

حذف قطعی فایل ها

آموزش ویدئویی جاوااسکریپت در ۲ ساعت به زبان فارسی

آموزش ویدئویی جاوااسکریپت در ۲ ساعت به زبان فارسی

آموزش جاوااسکریپت

MazeLock 2.00 for Symbian

MazeLock 2.00 for Symbian

قفل امنیتی گوشی های نوکیا همانند آندروید برای سیمبین سری 60

Green Hell - Animal Husbandry

Green Hell - Animal Husbandry

تلاش برای بقا برای کامپیوتر

Active@ ISO Manager 25.0.0

Active@ ISO Manager 25.0.0

ساخت ایمیج ISO

QSR International NVivo Enterprise 20 v1.7.2.1560 (x64)

QSR International NVivo Enterprise 20 v1.7.2.1560 (x64)

تحلیل داده

آموزش اتوکد R14

آموزش اتوکد R14

آموزش اتوکد R14

فیشینگ چیست؟

فیشینگ چیست؟

فیشینگ چیست؟

خبرنامه

با عضویت در خبرنامه، زودتر از همه باخبر باش!