سافت گذر دانشنامه نرم افزار - دانلود رایگان نرم افزار

همه دسته بندی ها

منو
جستجو
اطلاعیه های مهم سایت اطلاعیه های مهم سایت
💐 میلاد زینت پدر حضرت زینب سلام الله علیها مبارک باد 💐
 
 
  1. جهت رفع مشکل باز شدن سایت به دلیل بلاک توسط  نود 32 این ویدیو یا این ویدیو(ورژن 9 به بالا) یا راهنمای تصویری را مشاهده کنید
  2. اکانت های بروزرسانی نود32 با قیمت های مناسب به صورت یک ، سه ، شش و دوازده ماهه از اینجا قابل خرید می باشد.

نرم افزار های پرکاربرد

ثبت نام | ورود

هوش مصنوعی

تحول تماس تصویری با هوش مصنوعی Character.AI؛ معرفی مدل جدید ویدئویی مبتنی بر صدا

Character.AI پژوهشی را که روی ویدئوی مولد انجام داده، به اشتراک گذاشته است. این شرکت مدل جدیدی به نام TalkingMachines توسعه داده که نوعی مدل انتشار خودرگرسیو (autoregressive diffusion) است و می‌تواند تنها با داشتن یک تصویر و یک سیگنال صوتی، ویدیوی شخصیت‌های هوش مصنوعی را به صورت بلادرنگ و با حرکت‌های هماهنگ با صدا تولید کند. با این فناوری، شرکت Character.AI یک قدم به تعاملات تصویری شبیه FaceTime با شخصیت‌های هوش مصنوعی نزدیک‌تر شده است.

مهم است بدانید که این فناوری فعلاً در مرحله پژوهش قرار دارد. یک مقاله علمی و دموهای ویدیویی از آن منتشر شده‌اند، اما هنوز امکان استفاده از این قابلیت در اپلیکیشن Character.AI وجود ندارد.

 

تحول تماس تصویری با هوش مصنوعی Character.AI؛ معرفی مدل جدید ویدئویی مبتنی بر صدا

 

اگر این فناوری روزی وارد اپلیکیشن Character.AI شود، به کاربران اجازه می‌دهد نقش‌آفرینی‌های تعاملی‌تر و واقعی‌تری با هوش مصنوعی داشته باشند، داستان‌پردازی تعاملی را تجربه کنند و دنیای بصری خود را بسازند.

مدل جدید TalkingMachines بر پایه فناوری‌ای به نام Diffusion Transformer (DiT) ساخته شده است؛ این فناوری در اصل مانند یک هنرمند عمل می‌کند که می‌تواند از نویز تصادفی، تصاویر دقیق و باجزئیات تولید کند و تصویر را تا رسیدن به حالت مطلوب اصلاح کند. کاری که Character.AI انجام داده، این است که این روند را فوق‌العاده سریع کرده تا حس بلادرنگ بودن ایجاد شود.

برای دستیابی به این پیشرفت‌ها، TalkingMachines از چندین تکنیک کلیدی استفاده می‌کند، از جمله: Flow-Matched Diffusion، Audio-Driven Cross Attention، Sparse Causal Attention و Asymmetric Distillation.

تکنیک Flow-Matched Diffusion روی حرکات مختلف، از حالات جزئی چهره تا ژست‌های بزرگ‌تر آموزش دیده است تا حرکت شخصیت‌های هوش مصنوعی طبیعی‌تر به نظر برسد. کار جالب‌تر را تکنیک Audio-Driven Cross Attention انجام می‌دهد؛ این روش به هوش مصنوعی کمک می‌کند نه فقط کلمات، بلکه ریتم، مکث‌ها و تکیه‌های صدا را درک کند و آن‌ها را به حرکت دقیق دهان، تکان دادن سر و پلک زدن تبدیل کند.

با استفاده از Sparse Causal Attention، Character.AI می‌تواند فریم‌های ویدئو را با هزینه کمتر و کارایی بیشتر پردازش کند و با Asymmetric Distillation، تولید ویدئوها به صورت بلادرنگ انجام می‌شود تا شبیه تماس تصویری FaceTime به نظر برسد.

Character.AI تأکید می‌کند که این پیشرفت فقط به انیمیشن صورت محدود نمی‌شود. این شرکت می‌گوید این یک گام به سوی شخصیت‌های هوش مصنوعی صوتی-تصویری تعاملی است که می‌توانید به‌صورت لحظه‌ای با آن‌ها ارتباط برقرار کنید. این مدل از سبک‌های مختلفی پشتیبانی می‌کند؛ از انسان‌های فوتورئال، انیمه، تا آواتارهای سه‌بعدی و امکان استریم با فازهای گوش دادن و صحبت کردن طبیعی را فراهم می‌کند.

این قابلیت هنوز برای استفاده در اپلیکیشن آماده نیست و Character.AI می‌گوید این فناوری فعلاً در حال پژوهش است. اگر این شرکت آن را عرضه کند، قطعاً یکی از اولین شرکت‌هایی خواهد بود که به این موفقیت رسیده و این دستاورد نقطه عطف مهمی در رقابت هوش مصنوعی به شمار می‌رود.

نظرتان را ثبت کنید کد خبر: 53271 گروه خبری: هوش مصنوعی منبع خبر: سافت گذر تاریخ خبر: 1404/04/14 تعداد مشاهده: 969
اخبار مرتبط با این خبر
نظر های کاربران
سرور آپدیت نود 32
پیشنهاد سافت گذر
Win Video Converter 2024 9.9.9.11

Win Video Converter 2024 9.9.9.11

تبدیل فرمت فیلم ها

InfiniteSkills - Learning Ubuntu Linux Training Video

InfiniteSkills - Learning Ubuntu Linux Training Video

فیلم آموزش لینوکس اوبونتو

OsmAnd+ Full Maps & GPS Offline 5.1.3 for Android +8.0

OsmAnd+ Full Maps & GPS Offline 5.1.3 for Android +8.0

نقشه ی اوسم اند

Drawn The Painted Tower

Drawn The Painted Tower

برج نقاشی شده

مجموعه سخنرانی با موضوع پیامبر اکرم (ص)

مجموعه سخنرانی با موضوع پیامبر اکرم (ص)

مجموعه سخنرانی موضوع شخصیت پیامبر اکرم (صلی الله علیه و آله)

ProtaStructure Suite Enterprise 2021 v5.1.255 / 2018 SP4

ProtaStructure Suite Enterprise 2021 v5.1.255 / 2018 SP4

مدل سازی چند عنصره

27 بحث مهارتهای کلامی از استاد محمد شجاعی

27 بحث مهارتهای کلامی از استاد محمد شجاعی

استاد شجاعی با موضوع مهارتهای کلامی

HYSYS 3.2

HYSYS 3.2

شبیه ساز سیستم های پالایشگاهی، پتروشیمی، الکترولیتی و جامد

مجله الکترونیکی آفلاین شماره 1 تا 12

مجله الکترونیکی آفلاین شماره 1 تا 12

مجله اطلاع رسانی دنیای IT

سخنرانی های مرحوم آیت الله مجتهدی تهرانی بخش اول

سخنرانی های مرحوم آیت الله مجتهدی تهرانی بخش اول

مجتهدی تهرانی مذمت و بی غیرتی

انواع بیماری‌ها و روشهای درمان آن به وسیلهٔ طب قدیم ایران

انواع بیماری‌ها و روشهای درمان آن به وسیلهٔ طب قدیم ایران

اولین دانشنامه پزشکی به زبان فارسی

Tales of Hongyuan

Tales of Hongyuan

اکشن نقش آفرینی

Expeditions: Viking

Expeditions: Viking

اکسپدیشنز وایکینگ

Cubway

Cubway

راه معکب

Habit Browser Donate 1.1.77 for Android

Habit Browser Donate 1.1.77 for Android

مرورگر اینترنت اندروید

Flight Unlimited Las Vegas

Flight Unlimited Las Vegas

پرواز بر فراز شهر لاس وگاس | شبیه‌ساز پرواز با انواع هواپیماها

آموزش جامع و تصویری cPanel

آموزش جامع و تصویری cPanel

آموزش سی پنل

در آمریکا چه می گذرد؟

در آمریکا چه می گذرد؟

مجله Newsweek USA ژانویه 15 ؛ 2021

Lynda - Managing Project Quality

Lynda - Managing Project Quality

فیلم آموزش مدیریت کیفیت پروژه

آموزش تصویری نرم افزار اتوکد دوبعدی 2011

آموزش تصویری نرم افزار اتوکد دوبعدی 2011

آشنایی با ترسیمات دستی در نرم افزار AutoCAD

Udemy - Machine Learning, Data Science and Deep Learning with Python

Udemy - Machine Learning, Data Science and Deep Learning with Python

دوره یادگیری ماشین با پایتون

مولودی ولادت امام جعفر صادق(ع) از حاج مهدی اکبری

مولودی ولادت امام جعفر صادق(ع) از حاج مهدی اکبری

مولودی امام صادق و پیامبر 97

Android SDK / ADT Bundle x86/x64 2014-07-02 + SDK Release 24.3.4  Win/Linux/Mac

Android SDK / ADT Bundle x86/x64 2014-07-02 + SDK Release 24.3.4 Win/Linux/Mac

محیط فوق العاده ی برنامه نویسی اندروید

Readiris PDF 25.0.1049 / Corporate 23.1.95.0 / 17.4.192

Readiris PDF 25.0.1049 / Corporate 23.1.95.0 / 17.4.192

تبدیل عکس به متن ریداریس

Star Defender 4 v1.20

Star Defender 4 v1.20

مدافع ستارگان 4 - جدیدترین نسخه

آموزش طراحی و ترجمه قالب بلاگفا

آموزش طراحی و ترجمه قالب بلاگفا

آشنایی کاربردی با طراحی و ترجمه قالب های بلاگفا

بیان وقایع روز عاشورا از آیت الله سیدمحمدمهدی میرباقری

بیان وقایع روز عاشورا از آیت الله سیدمحمدمهدی میرباقری

حاج آقا سیدمحمدمهدی میرباقری با موضوع بیان وقایع روز عاشورا

Pudding Camera 3.0.2 for Android

Pudding Camera 3.0.2 for Android

عکاسی حرفه ای با اندروید

Magisto Video Editor & Maker 4.52.1.19660 for Android +4.0

Magisto Video Editor & Maker 4.52.1.19660 for Android +4.0

ایجاد و به اشتراک گذاری کلیپ

Ant Download Manager Pro 2.15.8.91174

Ant Download Manager Pro 2.15.8.91174

مدیریت دانلود

Rope Escape 1.22 for Android +2.3

Rope Escape 1.22 for Android +2.3

پرش با طناب

دوره آموزش ویدئویی نرم‌افزار وُرد 2019 به زبان فارسی

دوره آموزش ویدئویی نرم‌افزار وُرد 2019 به زبان فارسی

آموزش ورد

EaseUS Key Finder Pro 4.1.6

EaseUS Key Finder Pro 4.1.6

اسکن و بازیابی رمزهای عبور

Jewel Quest III - Full Version

Jewel Quest III - Full Version

کشف فردی مرموز که راه درمان Natalie را مطالبه می کند

Autodesk Revit Architecture 2015 x64

Autodesk Revit Architecture 2015 x64

بهترین نرم افزار طراحی ساختمان و معماری

one hundred (100) Crypts 1.10 for Android

one hundred (100) Crypts 1.10 for Android

بازی فکری دربهای قلعه

ویسگون 6.4.0 برای اندروید +2.2

ویسگون 6.4.0 برای اندروید +2.2

شبکه اجتماعی عکس

Nero Multimedia 12.5.01900 Platinum HD + Burning ROM 12.5.01100 + Lite + Micro + Content Pack + Portable

Nero Multimedia 12.5.01900 Platinum HD + Burning ROM 12.5.01100 + Lite + Micro + Content Pack + Portable

برنامه ای کامل جهت پخش، تبدیل و رایت انواع فیلم و صوت

پارادایم چیست؟

پارادایم چیست؟

چرا بعضی افراد هرچه بیشتر تلاش می کنند نا موفق ترند؟

AwesomeNauts v1.22a + DLC + Update 1.22.1

AwesomeNauts v1.22a + DLC + Update 1.22.1

جنگجویان خفن

خبرنامه

با عضویت در خبرنامه، زودتر از همه باخبر باش!