سافت گذر دانشنامه نرم افزار - دانلود رایگان نرم افزار

همه دسته بندی ها

منو
جستجو
اطلاعیه های مهم سایت اطلاعیه های مهم سایت
💐 میلاد زینت پدر حضرت زینب سلام الله علیها مبارک باد 💐
 
 
  1. جهت رفع مشکل باز شدن سایت به دلیل بلاک توسط  نود 32 این ویدیو یا این ویدیو(ورژن 9 به بالا) یا راهنمای تصویری را مشاهده کنید
  2. اکانت های بروزرسانی نود32 با قیمت های مناسب به صورت یک ، سه ، شش و دوازده ماهه از اینجا قابل خرید می باشد.

نرم افزار های پرکاربرد

ثبت نام | ورود

هوش مصنوعی

نوآوری هوش مصنوعی آمازون: مدل صوتی Nova Sonic برتر از گوگل و OpenAI

آمازون امروز Nova Sonic را معرفی کرد، یک مدل پیشرفته گفتار به گفتار که به توسعه‌دهندگان امکان می‌دهد برنامه‌هایی با قابلیت مکالمه صوتی شبیه انسان و در زمان واقعی بسازند. آمازون ادعا می‌کند این مدل صوتی جدید، بهترین عملکرد صنعت را از نظر قیمت و تأخیر کم ارائه می‌دهد.

معمولاً، برای توسعه یک برنامه صوتی، توسعه‌دهندگان باید با چندین مدل مختلف کار کنند - مانند مدل تشخیص گفتار برای تبدیل گفتار به متن، مدل‌های زبانی بزرگ برای درک و تولید پاسخ‌ها، و مدل تبدیل متن به گفتار برای تبدیل مجدد متن به صدا. این رویکرد نه تنها پیچیده است، بلکه اغلب در ثبت بافت‌های مهم صوتی و ظرافت‌هایی مانند لحن، آهنگ کلام و سبک صحبت کردن ناموفق است.

 

نوآوری هوش مصنوعی آمازون: مدل صوتی Nova Sonic برتر از گوگل و OpenAI

 

Nova Sonic این چالش را با یکپارچه‌سازی قابلیت‌های درک و تولید صدا در یک مدل واحد برطرف می‌کند. این رویکرد یکپارچه به مدل اجازه می‌دهد لحن، سبک و ورودی گفتاری را درک کند که منجر به مکالمه‌ای طبیعی‌تر می‌شود. همچنین می‌تواند زمان مناسب برای پاسخ را تشخیص دهد و وقفه‌ها (قطع کلام) را بهتر مدیریت کند.

Nova Sonic از صداهای مردانه و زنانه در لهجه‌های مختلف انگلیسی، از جمله آمریکایی و بریتانیایی پشتیبانی می‌کند. توسعه‌دهندگان می‌توانند از طریق Amazon Bedrock و با استفاده از API جریان دوطرفه، با پشتیبانی از فراخوانی توابع به این مدل دسترسی داشته باشند. همچنین شامل محافظت‌های داخلی مانند نظارت بر محتوا و واترمارک است.

 

جزئیات مدل در زیر آمده است:

Amazon Nova Sonic

شناسه مدل: amazon.nova-sonic-v1:0

ورودی‌ها: گفتار

خروجی‌ها: گفتار همراه با رونویسی و پاسخ‌های متنی

پنجره متن: ۳۰۰ هزار بافت

حداکثر مدت اتصال: ۸ دقیقه مهلت اتصال، با حداکثر ۲۰ اتصال همزمان برای هر مشتری

زبان‌های پشتیبانی شده: انگلیسی

مناطق: شرق ایالات متحده (ویرجینیای شمالی)

پشتیبانی API جریان دوطرفه: بله

پایگاه‌های دانش Bedrock: از طریق استفاده از ابزار (فراخوانی توابع) پشتیبانی می‌شود

 

نکته مرتبط اینکه، ماه گذشته OpenAI مدل‌های نسل بعدی گفتار به متن، gpt-4o-transcribe و gpt-4o-mini-transcribe را معرفی کرد که بهبودهای قابل توجهی در نرخ خطای کلمات، تشخیص زبان و دقت در مقایسه با مدل‌های Whisper موجود خود ارائه می‌دهند.

نظرتان را ثبت کنید کد خبر: 52604 گروه خبری: هوش مصنوعی منبع خبر: سافت گذر تاریخ خبر: 1404/01/20 تعداد مشاهده: 3105
اخبار مرتبط با این خبر
نظر های کاربران
سرور آپدیت نود 32
پیشنهاد سافت گذر
همه چیز درمورد تبلت

همه چیز درمورد تبلت

با تبلت آشنا شوید

Twoo 10.8.0 for Android +4.0

Twoo 10.8.0 for Android +4.0

شبکه اجتماعی توو

10 بحث سخنرانی آیت الله جوادی آملی

10 بحث سخنرانی آیت الله جوادی آملی

آیت الله جوادی آملی با موضوع تحلیل نهضت سیدالشهدا

اصالت مهدویت از جهت اتّکا بر مبانى معقول و منطقى

اصالت مهدویت از جهت اتّکا بر مبانى معقول و منطقى

سلسله مباحث امامت و مهدویت 7

Adobe Camera Raw 17.5 / Adobe DNG Converter 17.4.2 / macOS

Adobe Camera Raw 17.5 / Adobe DNG Converter 17.4.2 / macOS

پلاگین پردازش تصاویر

روش پنهان برای دستیابی به ثروت، سلامتی، آرامش

روش پنهان برای دستیابی به ثروت، سلامتی، آرامش

محدودیت صفر

Adobe Dimension 4.1.4 / 2019 / macOS

Adobe Dimension 4.1.4 / 2019 / macOS

ادوب دایمنشن

QUE$TOR 2023 Q3

QUE$TOR 2023 Q3

پیش‌بینی هزینه‌های نفت و گاز

Styx - Master of Shadows

Styx - Master of Shadows

استیکس - ارباب سایه‌ها

pdfFactory Pro 9.16

pdfFactory Pro 9.16

تبدیل اسناد به پی دی اف

داستان تخیلی

داستان تخیلی

مرد نامرئی

دورهٔ آموزش برنامه‌نویسی اندروید و ساخت اپلیکیشن‌های اندرویدی به زبان فارسی – سطح مقدماتی

دورهٔ آموزش برنامه‌نویسی اندروید و ساخت اپلیکیشن‌های اندرویدی به زبان فارسی – سطح مقدماتی

آموزش برنامه نویسی اندروید

تعریف شکاف دیجیتالی و مصداق‌های آن

تعریف شکاف دیجیتالی و مصداق‌های آن

شکاف دیجیتالی چیست؟

OFFTIME 3.0.11 for Android +4.0

OFFTIME 3.0.11 for Android +4.0

تست اعتیاد به موبایل!!!

اصول 29 گانه عکاسی

اصول 29 گانه عکاسی

عکس ھای پرتره و یادگاری حرفه ای

Malwarebytes Anti-Malware 5.16.1.459 for Android +9.0

Malwarebytes Anti-Malware 5.16.1.459 for Android +9.0

بهترین برنامه شناسایی بد افزار و تروجان در اندروید

Lynda - Microsoft Project Server 2013 Administration

Lynda - Microsoft Project Server 2013 Administration

فیلم آموزش مدیریت مایکروسافت پراجکت سروِر 2013

alWahid Books 1.1.3 for Android

alWahid Books 1.1.3 for Android

مجموعه مؤلفات حضرت آیت الله العظمى وحید خراسانى (مد ظله العالى) به زبان هاى فارسى و عربى

Oxford Advanced Dictionary 1.1.4 for Android

Oxford Advanced Dictionary 1.1.4 for Android

دیکشنری کامل آکسفورد

InfiniteSkills - Learning SAP Crystal Reports 2011/2013

InfiniteSkills - Learning SAP Crystal Reports 2011/2013

فیلم آموزش کریستال ریپورتس 2013/2011

تلاوت مجلسی استاد سید متولی عبدالعال سوره مبارکه آل عمران

تلاوت مجلسی استاد سید متولی عبدالعال سوره مبارکه آل عمران

تلاوت سید متولی عبدالعال سوره آل عمران

Portal Knights v1.2 incl DLC + Updates

Portal Knights v1.2 incl DLC + Updates

اکشن و ماجراجویی

سخنرانی حجت الاسلام طبسی با موضوع راه های شناخت حضرت زهرا (س)

سخنرانی حجت الاسلام طبسی با موضوع راه های شناخت حضرت زهرا (س)

حاج آقا طبسی با موضوع راه های شناخت حضرت زهرا (س)

مستند «فروشنده ۳ - رازهای مرد در سایه» قسمت اول

مستند «فروشنده ۳ - رازهای مرد در سایه» قسمت اول

فروشنده

Nitro Racer XD

Nitro Racer XD

نیترو ریسر ایکس‌دی

Tales of Hongyuan

Tales of Hongyuan

اکشن نقش آفرینی

The Warrior's Way

The Warrior's Way

رزمی نینجایی

AudioGuru - Audio Manager 1.38 for Android +2.1

AudioGuru - Audio Manager 1.38 for Android +2.1

مدیریت و ایجاد پروفایلهای صوتی

Not Dying Today

Not Dying Today

امروز نمی میرد

سخنرانی استاد شجاعی در زمینه آشتی با امام زمان

سخنرانی استاد شجاعی در زمینه آشتی با امام زمان

آشتی با امام زمان استاد شجاعی

EasyUEFI Enterprise 6.0.1 + WinPE

EasyUEFI Enterprise 6.0.1 + WinPE

مدیریت تنظیمات بوت

Audio MP3 Cutter Mix Converter and Make Ringtones 1.86 Pro For Android +4.0

Audio MP3 Cutter Mix Converter and Make Ringtones 1.86 Pro For Android +4.0

برنامه ویرایش و برش صدا

CBT Nuggets - Microsoft Exchange Server 2013 70-342

CBT Nuggets - Microsoft Exchange Server 2013 70-342

فیلم آموزش مایکروسافت اکسچنج سِروِر 2013 آزمون 342-70

Starfighter Origins

Starfighter Origins

شبیه ساز

Microsoft Visual Studio 2017 15.9.16

Microsoft Visual Studio 2017 15.9.16

ویژوال استودیو 2017

کسب و کار و موفقیت

کسب و کار و موفقیت

با این ۵ راهکار به عنوان یک کارآفرین با انگیزه بمانید

اصول و مؤلفه‌های مهم طراحی لوگو

اصول و مؤلفه‌های مهم طراحی لوگو

اهمیت غیرقابل‌انکار لوگو

Microsoft Exchange Server 2013 SP1 x64

Microsoft Exchange Server 2013 SP1 x64

نسخه 2013 قویترین نرم افزار مدیریت میل سرور(ویرایش 64 بیتی) یکپارچه شده با سرویس پک 1

Upgrading AND Repairing PCs 22th Edition

Upgrading AND Repairing PCs 22th Edition

آموزش تعمیر کامپیوتر

آموزش سرمایه گذاری در بورس

آموزش سرمایه گذاری در بورس

آموزش گام به گام بورس

خبرنامه

با عضویت در خبرنامه، زودتر از همه باخبر باش!