در رویداد Google I/O 2025، این غول جستوجو مجموعهای از ابزارهای جدید هوش مصنوعی را معرفی کرد که مهمترین آنها Gemini Flash 2.5 بود و همه به آن دسترسی دارند. یکی دیگر از پیشرفتهای جالب مربوط به مدلهای زبانی کوچک (LLM) بود، جایی که شرکت، مدل Gemma 3n را معرفی کرد؛ مدلی که بهگونهای طراحی شده تا مستقیماً روی دستگاههای شخصی شما اجرا شود.
بزرگترین پیشرفت جدید در Gemma 3n این است که از نوآوریای استفاده میکند که توسط گوگل دیپمایند توسعه یافته و Per-Layer Embeddings (PLE) نام دارد. این فناوری نیاز به حافظه برای مدل را کاهش میدهد. تعداد پارامتر خام برای Gemma 3n، ۵ میلیارد و ۸ میلیارد است، اما میزان حافظهی مورد نیاز آن با مدلهای ۲ میلیاردی و ۴ میلیاردی قابل مقایسه است. گوگل ادعا میکند که این مدلها میتوانند تنها با ۲ گیگابایت و ۳ گیگابایت حافظه اجرا شوند.

علاوه بر داشتن مصرف حافظه کمتر، تکنیکهایی مانند PLE، اشتراکگذاری KVC و کوانتیزاسیون پیشرفتهی اکتیویشنها باعث میشوند Gemma 3n در موبایل ۱.۵ برابر سریعتر از Gemma 3 4B شروع به پاسخدهی کند و کیفیت بسیار بهتری داشته باشد. همچنین Gemma 3n از قابلیتی به نام mix‘n’match بهره میبرد که به آن اجازه میدهد به صورت پویا زیرمدلهایی بسازد که بهینهتر برای نیازهای خاص شما باشند.
یکی دیگر از مزیتها این است که Gemma 3n از اجرای محلی استفاده میکند، یعنی کاملاً توسط دستگاه شما اجرا میشود و هیچ دادهای به هیچ سروری ارسال نمیشود تا ورودیهای شما بررسی شوند. افزون بر این، این قابلیت باعث میشود که بتوانید بدون اتصال به اینترنت از آن استفاده کنید که مزیت بزرگی محسوب میشود.
همچنین گفته شده که این مدل در دریافت ورودیهای چندرسانهای (مالتیمودال) بسیار بهتر عمل میکند، زیرا میتواند صدا، متن و تصویر را درک کند و گفته شده که توانایی درک ویدیو در آن به طور قابل توجهی افزایش یافته است. این ویژگی به آن امکان میدهد که بین ورودیهای مختلف مانند تبدیل گفتار به متن، ترجمه و ورودیهای ترکیبی از چند رسانه را انجام دهد و بتواند تعاملات پیچیدهی چندرسانهای را بفهمد.
در نهایت، Gemma 3n وعده داده که در زبانهای غیر انگلیسی نیز عملکرد بهتری داشته باشد. کاربران به ویژه شاهد بهبود عملکرد در زبانهای ژاپنی، آلمانی، کرهای، اسپانیایی و فرانسوی خواهند بود. این مدل در آزمونهای چندزبانه عملکرد قوی از خود نشان داده، مثلاً امتیاز ۵۰.۱٪ در WMT24++ کسب کرده است.
شما میتوانید همین حالا استفاده از Gemma 3n را مستقیماً در مرورگر خود و از طریق Google AI Studio آغاز کنید، بدون اینکه نیاز به هیچ تنظیماتی داشته باشید. توسعهدهندگانی که میخواهند این مدل را به صورت محلی به کار بگیرند، میتوانند از طریق Google AI Edge این کار را انجام دهند که ابزارها و کتابخانههای لازم را فراهم میکند. این روش دوم، قابلیت درک و تولید متن و تصویر را همین امروز در اختیار شما قرار میدهد و امکانات بیشتری نیز در آینده اضافه خواهد شد.