گوگل امروز ویژگی جدیدی به نام «Gemini» معرفی کرد که به کاربران امکان میدهد کتابهای داستان شخصیسازیشده و مصور با قابلیت روایت صوتی اختیاری ایجاد کنند. این ویژگی اکنون در نسخههای موبایل و دسکتاپ Gemini به صورت جهانی و برای تمامی زبانها در دسترس است.

نحوه کار این ویژگی:
- کاربران میتوانند تنها با توصیف یک داستان خیالی به صورت متن، آن را به Gemini ارائه دهند.
- Gemini یک کتاب منحصربهفرد ۱۰ صفحهای با تصاویر سفارشی و صدا براساس داستان کاربر تولید میکند.
- برای شخصیسازی بیشتر، کاربران میتوانند از Gemini بخواهند که از عکسها و فایلهای خودشان الهام بگیرد.
- گوگل ادعا میکند که Gemini توانایی ایجاد انواع سبکهای بصری مانند هنر پیکسلی، کمیک، انیمیشن خمیری، قلاببافی و حتی کتابهای رنگآمیزی را دارد.
گوگل برای برجسته کردن قابلیتهای ویژگی داستانگویی هوش مصنوعی، موارد استفاده زیر را به اشتراک گذاشته است:
- کمک به کودکان برای درک موضوعات پیچیده: یک داستان بسازید که سیستم خورشیدی را به کودک ۵ سالهام توضیح دهد.
- آموزش درس اخلاق از طریق داستانگویی: به یک پسر ۷ ساله اهمیت مهربانی با برادر کوچکترش را آموزش دهید. پسرم عاشق فیلهاست، پس شخصیت اصلی داستان را یک فیل قرار دهید.
- جان بخشیدن به آثار هنری شخصی: تصویری از نقاشی کودکتان را آپلود کنید و این مثال را برای مورد استفاده خود تغییر دهید: «این نقاشی فرزند من است. او ۷ ساله است. یک کتاب داستان خلاقانه بنویس که نقاشی او را زنده کند.»
ویژگیهای جدید Gemini در ماههای اخیر
در چند ماه گذشته، گوگل ویژگیها و بهبودهای جدیدی را به اپلیکیشن Gemini اضافه کرده است. به عنوان مثال، ماه گذشته گوگل اعلام کرد که Gemini توانایی تبدیل هر عکس به یک ویدیوی ۸ ثانیهای را با استفاده از قدرت مدل ویدیوسازی Veo 3 دارد. کاربران اشتراک «Google AI Pro» میتوانند از این قابلیت برای جان بخشیدن به عکسهای خود استفاده کنند.
هفته گذشته، گوگل از عرضه حالت «Deep Think» نسخه ۲.۵ پرو Gemini خبر داد که از تکنیکهای پژوهشی جدید برای بررسی چندین فرضیه پیش از پاسخدهی استفاده میکند. مدل Deep Think شامل بهبودهایی براساس بازخورد آزمایشکنندگان معتبر و چندین پیشرفت پژوهشی است.
تلاشهای گوگل برای توسعه Gemini
این بهروزرسانیهای منظم نشاندهنده تلاشهای گسترده گوگل برای ارتقای قابلیتهای خلاقانه و تحلیلی Gemini است. با ترکیب ویژگیهایی مانند داستانگویی، ایجاد ویدیو و تفکر عمیق، گوگل در حال معرفی Gemini به عنوان ابزاری چندمنظوره برای کاربران عادی و حرفهای است.