ماه گذشته، OpenAI مدل GPT-5 را که پیشرفتهترین مدل هوش مصنوعی آن است، با بهروزرسانیهای چشمگیر در زمینههای استدلال، کدنویسی و سایر حوزههای کلیدی معرفی کرد. در زمان راهاندازی، OpenAI اعلام کرد که GPT-5 دارای قابلیتهای بهبود یافتهای است و در آزمون SWE-bench Verified نمره 74.9% و در Aider Polyglot نمره 88% را کسب کرده است.

امروز، OpenAI مدل جدیدی به نام GPT-5-Codex را معرفی کرد که برای کدنویسی بهینه شده است. OpenAI اشاره کرد که این مدل جدید برای عملکرد بهتر در کارهای مهندسی نرمافزار دنیای واقعی توسعه یافته است، از جمله ایجاد پروژههای جدید از صفر، افزودن ویژگیها و تستها به پروژههای موجود، انجام وظایف بازسازی کد در مقیاس بزرگ و موارد دیگر.
در آزمونهای SWE-bench Verified، مدل GPT-5 High نمره 72.8% کسب کرد در حالی که مدل جدید GPT-5-Codex نمره 74.5% را به دست آورد. در وظایف بازسازی کد، این مدل جدید نمره 51.3% کسب کرد که به طور قابل توجهی بالاتر از نمره 33.9% مدل GPT-5 است.
مدل GPT-5 Codex یکی از قابل توجهترین ویژگیهای GPT-5-Codex توانایی آن در تعیین زمان لازم برای تفکر بر اساس پیچیدگی وظیفه است. در طی آزمایشهای داخلی، OpenAI متوجه شد که GPT-5-Codex قادر است به طور مستقل بیش از 7 ساعت بر روی وظایف بزرگ و پیچیده کار کند.
GPT-5-Codex اکنون در انجام وظایف فرانتاند، از جمله وبسایتهای موبایل، عملکرد بهتری دارد. OpenAI اشاره کرد که این مدل میتواند تصاویر را به عنوان ورودی در فضای ابری بپذیرد، پیشرفت خود را بهصورت بصری بررسی کند و تصاویر صفحهنمایش کارهای انجام شده را نمایش دهد.
در نهایت، این مدل بهینهشده برای کدنویسی در بررسی کدها عملکرد بهتری دارد. این مدل میتواند هدف یک درخواست ادغام (pull request) را با تفاوت واقعی تطبیق دهد، بر روی کل کدپایه استدلال کند و حتی کد و تستها را اجرا کند تا رفتار مورد نظر را تأیید کند. OpenAI ادعا میکند که اکنون از Codex برای بررسی کدها بهطور داخلی استفاده میکند و هر روز صدها مشکل را شناسایی میکند.
Codex با مدل GPT-5-Codex اکنون به عنوان بخشی از برنامههای ChatGPT Plus، Pro، Business، Edu و Enterprise از طریق Codex CLI، IDE Extension، وب، موبایل و برای بررسی کدها در GitHub در دسترس است. برای توسعهدهندگانی که از Codex CLI از طریق کلید API استفاده میکنند، مدل GPT-5-Codex به زودی در API قابل دسترسی خواهد بود.