سافت گذر دانشنامه نرم افزار - دانلود رایگان نرم افزار

همه دسته بندی ها

منو
جستجو
اطلاعیه های مهم سایت اطلاعیه های مهم سایت
💐 میلاد زینت پدر حضرت زینب سلام الله علیها مبارک باد 💐
 
 
  1. سافت گذر جهت آپدیت بخش نرم افزار نیاز به همکار حرفه ای دارد. ارسال درخواست به بخش ارتباط با ما / سردبیری
  2. جهت رفع مشکل باز شدن سایت به دلیل بلاک توسط  نود 32 این ویدیو یا این ویدیو(ورژن 9 به بالا) یا راهنمای تصویری را مشاهده کنید
  3. اکانت های بروزرسانی نود32 با قیمت های مناسب به صورت یک ، سه ، شش و دوازده ماهه از اینجا قابل خرید می باشد.

نرم افزار های پرکاربرد

ثبت نام | ورود

هوش مصنوعی

تحول تماس تصویری با هوش مصنوعی Character.AI؛ معرفی مدل جدید ویدئویی مبتنی بر صدا

Character.AI پژوهشی را که روی ویدئوی مولد انجام داده، به اشتراک گذاشته است. این شرکت مدل جدیدی به نام TalkingMachines توسعه داده که نوعی مدل انتشار خودرگرسیو (autoregressive diffusion) است و می‌تواند تنها با داشتن یک تصویر و یک سیگنال صوتی، ویدیوی شخصیت‌های هوش مصنوعی را به صورت بلادرنگ و با حرکت‌های هماهنگ با صدا تولید کند. با این فناوری، شرکت Character.AI یک قدم به تعاملات تصویری شبیه FaceTime با شخصیت‌های هوش مصنوعی نزدیک‌تر شده است.

مهم است بدانید که این فناوری فعلاً در مرحله پژوهش قرار دارد. یک مقاله علمی و دموهای ویدیویی از آن منتشر شده‌اند، اما هنوز امکان استفاده از این قابلیت در اپلیکیشن Character.AI وجود ندارد.

 

تحول تماس تصویری با هوش مصنوعی Character.AI؛ معرفی مدل جدید ویدئویی مبتنی بر صدا

 

اگر این فناوری روزی وارد اپلیکیشن Character.AI شود، به کاربران اجازه می‌دهد نقش‌آفرینی‌های تعاملی‌تر و واقعی‌تری با هوش مصنوعی داشته باشند، داستان‌پردازی تعاملی را تجربه کنند و دنیای بصری خود را بسازند.

مدل جدید TalkingMachines بر پایه فناوری‌ای به نام Diffusion Transformer (DiT) ساخته شده است؛ این فناوری در اصل مانند یک هنرمند عمل می‌کند که می‌تواند از نویز تصادفی، تصاویر دقیق و باجزئیات تولید کند و تصویر را تا رسیدن به حالت مطلوب اصلاح کند. کاری که Character.AI انجام داده، این است که این روند را فوق‌العاده سریع کرده تا حس بلادرنگ بودن ایجاد شود.

برای دستیابی به این پیشرفت‌ها، TalkingMachines از چندین تکنیک کلیدی استفاده می‌کند، از جمله: Flow-Matched Diffusion، Audio-Driven Cross Attention، Sparse Causal Attention و Asymmetric Distillation.

تکنیک Flow-Matched Diffusion روی حرکات مختلف، از حالات جزئی چهره تا ژست‌های بزرگ‌تر آموزش دیده است تا حرکت شخصیت‌های هوش مصنوعی طبیعی‌تر به نظر برسد. کار جالب‌تر را تکنیک Audio-Driven Cross Attention انجام می‌دهد؛ این روش به هوش مصنوعی کمک می‌کند نه فقط کلمات، بلکه ریتم، مکث‌ها و تکیه‌های صدا را درک کند و آن‌ها را به حرکت دقیق دهان، تکان دادن سر و پلک زدن تبدیل کند.

با استفاده از Sparse Causal Attention، Character.AI می‌تواند فریم‌های ویدئو را با هزینه کمتر و کارایی بیشتر پردازش کند و با Asymmetric Distillation، تولید ویدئوها به صورت بلادرنگ انجام می‌شود تا شبیه تماس تصویری FaceTime به نظر برسد.

Character.AI تأکید می‌کند که این پیشرفت فقط به انیمیشن صورت محدود نمی‌شود. این شرکت می‌گوید این یک گام به سوی شخصیت‌های هوش مصنوعی صوتی-تصویری تعاملی است که می‌توانید به‌صورت لحظه‌ای با آن‌ها ارتباط برقرار کنید. این مدل از سبک‌های مختلفی پشتیبانی می‌کند؛ از انسان‌های فوتورئال، انیمه، تا آواتارهای سه‌بعدی و امکان استریم با فازهای گوش دادن و صحبت کردن طبیعی را فراهم می‌کند.

این قابلیت هنوز برای استفاده در اپلیکیشن آماده نیست و Character.AI می‌گوید این فناوری فعلاً در حال پژوهش است. اگر این شرکت آن را عرضه کند، قطعاً یکی از اولین شرکت‌هایی خواهد بود که به این موفقیت رسیده و این دستاورد نقطه عطف مهمی در رقابت هوش مصنوعی به شمار می‌رود.

نظرتان را ثبت کنید کد خبر: 53271 گروه خبری: هوش مصنوعی منبع خبر: سافت گذر تاریخ خبر: 1404/04/14 تعداد مشاهده: 115
اخبار مرتبط با این خبر
نظر های کاربران
سرور آپدیت نود 32
پیشنهاد سافت گذر
حدیث کسا و آیه مباهله از زبان آیت الله حسن حسن زاده آملی

حدیث کسا و آیه مباهله از زبان آیت الله حسن حسن زاده آملی

حدیث کسا و آیه مباهله از زبان آیت الله حسن حسن زاده آملی

Pluralsight - TypeScript In-depth

Pluralsight - TypeScript In-depth

فیلم آموزش زبان برنامه‌نویسی تایپ‌ اسکریپت

Virtual CloneDrive 5.5.3.0

Virtual CloneDrive 5.5.3.0

سریع ترین نرم افزار ساخت درایو مجازی

The Bat! Professional 11.4.2.1 Halloween Edition

The Bat! Professional 11.4.2.1 Halloween Edition

مدیریت ایمیل ها

بهترین هارد دیسک های اکسترنال برای کنسول بازی PS4

بهترین هارد دیسک های اکسترنال برای کنسول بازی PS4

راهنمای خرید هارد درایوهای اکسترنال

برکات تقوا

برکات تقوا

پیامدهای تقوا

foobar2000 2.24.5

foobar2000 2.24.5

پخش کننده صوتی

ظهور و قیام حضرت مهدی موعود علیه السلام

ظهور و قیام حضرت مهدی موعود علیه السلام

نشانه‏‌های آخر الزمان

Islamic Compass 1.5 for Android for Android

Islamic Compass 1.5 for Android for Android

برنامه ای جهت نمایش قبله

Mozilla Firefox 140.0.2 Win/Mac/Linux + Farsi

Mozilla Firefox 140.0.2 Win/Mac/Linux + Farsi

فایرفاکس مرورگر اینترنتی

آموزش کامل با مدل مرجع OSI

آموزش کامل با مدل مرجع OSI

آموزش او اس ال

Emergency 2016

Emergency 2016

شبیه‌ساز عملیات امداد و انواع موقعیت‌های بحرانی 2016

Cube World

Cube World

دنیای مکعب

Infiniteskills - AutoCAD Civil 3D 2014 Training Video

Infiniteskills - AutoCAD Civil 3D 2014 Training Video

فیلم آموزش نرم افزار اتوکد سیویل تری‌دی 2014

MediaInfo 24.12 / macOS

MediaInfo 24.12 / macOS

مشاهده اطلاعات فایل صوتی و ویدئویی

Voice Aloud Reader 33.5.2 for Android +5.0

Voice Aloud Reader 33.5.2 for Android +5.0

وویس الود

Black Mesa Definitive Edition v12.05.2025

Black Mesa Definitive Edition v12.05.2025

بلک میسا

آشنایی با بالاترین مخاطرات امنیتی وب‌گاه‌ها

آشنایی با بالاترین مخاطرات امنیتی وب‌گاه‌ها

مخاطرات

Part of the Undergraduate Topics in Computer Science book series

Part of the Undergraduate Topics in Computer Science book series

مبانی زبان برنامه نویسی

مشاوره ازدواج

مشاوره ازدواج

حقوق زن و مرد

Takedown - Red Sabre

Takedown - Red Sabre

غلبه - شمشیر سرخ

دورهٔ ویدئویی «ارتباط با سرور با استفاده از کتابخانه Volley در اندروید» به زبان فارسی

دورهٔ ویدئویی «ارتباط با سرور با استفاده از کتابخانه Volley در اندروید» به زبان فارسی

آموزش کتابخانه Volley در اندروید

Boom Beach 45.542 for Android +4.0

Boom Beach 45.542 for Android +4.0

بوم بیچ

بالا بردن توانایی در ماهی گیری

بالا بردن توانایی در ماهی گیری

آشنایی با ابزارهای صید ماهیگیری

Nitro PDF Pro 14.39.0.18 Enterprise + Portable / Retail

Nitro PDF Pro 14.39.0.18 Enterprise + Portable / Retail

ساخت و ویرایش پی دی اف

تحول انقلابی اثر چالمرز جانسون

تحول انقلابی اثر چالمرز جانسون

بررسی نظری پدیده انقلاب

برنامه جهان آرا سری جدید | آتش به اختیاری فرهنگی و مطالبه عدالت

برنامه جهان آرا سری جدید | آتش به اختیاری فرهنگی و مطالبه عدالت

برنامه جهان آرا شبکه افق

ترس از شکست

ترس از شکست

بیزاری از شکست

تلاوت مجلسی استاد کریم منصوری سوره مبارکه ضحی و انشراح

تلاوت مجلسی استاد کریم منصوری سوره مبارکه ضحی و انشراح

تلاوت کریم منصوری سوره ضحی و انشراح

inMomentum

inMomentum

به سرعت

InfiniteSkills - Advanced Revit Architecture 2015 Training Video

InfiniteSkills - Advanced Revit Architecture 2015 Training Video

فیلم آموزش سطح پیشرفته‌ی نرم‌افزار رِویـت آرشیتکتور 2015

مسائل و چالش های تجارت

مسائل و چالش های تجارت

راه اندازی کسب و کار و تجارت

TripMode 1.0.5.237 x86/x64 + Portable / 2.2.1 Mac

TripMode 1.0.5.237 x86/x64 + Portable / 2.2.1 Mac

نظارت بر ترافیک برنامه‌ها، بروزرسانی‌ها و پردازش‌ها

Data Sharing – Tethering PRO 2.2.4 For Android +4.1

Data Sharing – Tethering PRO 2.2.4 For Android +4.1

مدیریت هات اسپات

Folder Protect 2.1.0

Folder Protect 2.1.0

محافظت از پوشه ها و برنامه ها فولدر پروتکت

جزئیات عصب‌شناختی حاکم بر مغزِ خفته

جزئیات عصب‌شناختی حاکم بر مغزِ خفته

خواب و رویا

باغ زیبا بسازیم

باغ زیبا بسازیم

روش های جدید باغ داری

یادداشت های کوتاه و برداشت هایی از روایات درباره حضرت مهدی علیه السلام

یادداشت های کوتاه و برداشت هایی از روایات درباره حضرت مهدی علیه السلام

روایات درباره حضرت مهدی علیه السلام

دیوان غزلیات حافظ نسخه 1.0.1 برای اندروید 2.2+

دیوان غزلیات حافظ نسخه 1.0.1 برای اندروید 2.2+

دیوان خواجه شمس‌الدین محمد حافظ شیرازی

AER Memories of Old

AER Memories of Old

دنیای آزاد

خبرنامه

با عضویت در خبرنامه، زودتر از همه باخبر باش!