خانواده مدلهای Gemini یک عضو جدید دارد. این بار، شرکت نسخه Gemini 2.5 Flash-Lite را به صورت پیشنمایش از امروز معرفی کرده است و همزمان مدلهای قویتر 2.5 Pro و 2.5 Flash را هم برای استفاده عمومی و تولیدی در دسترس قرار داده است.

گوگل اعلام کرده که Flash-Lite نسبت به مدلهای قبلی 2.0 خود در زمینههای کدنویسی، ریاضیات و استدلال عملکرد بهتری دارد. هدف اصلی این مدل، انجام کارهایی مانند ترجمه یا طبقهبندی در مقیاس بسیار بزرگ است که سرعت در آن اهمیت زیادی دارد. قیمتگذاری این مدل هم نشاندهنده همین تمرکز بر حجم بالا است. Flash-Lite با فاصله زیاد، ارزانترین گزینه است: هر یک میلیون توکن ورودی فقط ۰.۱۰ دلار و هر یک میلیون توکن خروجی ۰.۴۰ دلار هزینه دارد. اما عملکرد پایه آن در کارهای استدلالی دشوار نسبتاً پایین است و فقط ۵.۱ درصد در آزمون Humanity’s Last Exam امتیاز گرفته است (گزارش فنی کامل اینجا موجود است).
با این حال، جذابترین ویژگی این مدل، حالت “تفکر” (Thinking) آن است. وقتی این حالت را فعال میکنید، مدل زمان بیشتری برای پردازش یک درخواست صرف میکند و تواناییهایش به طور چشمگیری افزایش مییابد. مثلاً عملکرد آن در یک معیار دشوار ریاضی به نام AIME 2025 از ۴۹.۸ درصد به ۶۳.۱ درصد میرسد که پیشرفت قابل توجهی است. همین الگو در تست توانایی مدل برای یافتن اطلاعات در یک سند بزرگ هم دیده میشود که میزان یادآوری یا ریکال آن تقریباً دو برابر میشود. (جدول بنچمارکها توسط گوگل ارائه شده است.)
گوگل میگوید توسعهدهندگان از همین حالا میتوانند با این مدل جدید آزمایشهای خود را شروع کنند. نسخه پیشنمایش Gemini 2.5 Flash-Lite هماکنون از طریق Google AI Studio و پلتفرم Vertex AI که مخصوص توسعهدهندگان است، در دسترس قرار دارد. نسخههای قدرتمندتر و پایدارتر 2.5 Flash و Pro نیز در همین پلتفرمها موجود هستند و علاوه بر آن، در برنامه اصلی Gemini برای کاربران عادی نیز ادغام شدهاند. گوگل حتی اشاره کرده که نسخههای سفارشی هر دو مدل Flash-Lite و Flash همین حالا بخشهایی از موتور جستجوی خودش را تأمین میکنند.