امروز شرکت Anthropic نسل جدید مدلهای کلود را معرفی کرد: Claude Opus 4 و Claude Sonnet 4. Anthropic ادعا میکند که مدل پرچمدار خود یعنی Claude Opus 4 بهترین مدل برنامهنویسی در جهان است و در انجام کارهای عاملمحور (agentic workflows) و وظایف پیچیده و طولانیمدت عملکردی عالی دارد. مدل Claude Sonnet 4 نیز در مقایسه با نسخه قبلی یعنی Claude Sonnet 3.7، عملکرد بهتری در برنامهنویسی و استدلال دارد.
همانطور که در جدول زیر مشاهده میکنید، Claude Sonnet 4 توانسته امتیاز پیشرفته ۷۲.۷ درصد را در SWE-bench Verified، که یک بنچمارک محبوب برای برنامهنویسی عاملمحور است، کسب کند. به خاطر تواناییهای قدرتمند این مدل در کدنویسی، امروز شرکت GitHub متعلق به مایکروسافت اعلام کرد که Sonnet 4 مدل اصلی عامل جدید برنامهنویسی در GitHub Copilot خواهد بود.

Anthropic درباره عملکرد این مدلهای جدید چنین نوشته است:
این مدلها استراتژی هوش مصنوعی مشتریان ما را در همه زمینهها ارتقا میدهند: Opus 4 مرزهای برنامهنویسی، تحقیق، نویسندگی و کشف علمی را جابجا میکند، در حالی که Sonnet 4 عملکردی پیشرفته را به کاربردهای روزمره میآورد و یک ارتقای فوری نسبت به Sonnet 3.7 محسوب میشود.
بنچمارکهای Claude 4
هر دو مدل جدید Claude 4 از دو حالت پشتیبانی میکنند: پاسخهای تقریبا فوری و تفکر عمیق برای استدلال عمیقتر. توسعهدهندگان بسته به نیاز خود میتوانند بین این دو حالت جابجا شوند.
کاربران رایگان Claude تنها به مدل جدید Sonnet 4 دسترسی دارند. اما کاربران پلنهای Pro، Max، Team و Enterprise میتوانند به هر دو مدل و حالت تفکر عمیق دسترسی پیدا کنند. Anthropic همچنین اعلام کرد که هر دو مدل جدید از طریق API اختصاصی Anthropic، پلتفرم Amazon Bedrock و سرویس Vertex AI گوگل نیز در دسترس هستند. نکته جالب این است که Anthropic قیمت این مدلهای جدید را کاهش نداده است. هزینه استفاده از Claude Opus 4 برابر با ۱۵ دلار به ازای هر یک میلیون توکن ورودی و ۷۵ دلار به ازای هر یک میلیون توکن خروجی خواهد بود، و برای Sonnet 4 این هزینه ۳ دلار به ازای هر یک میلیون توکن ورودی و ۱۵ دلار به ازای هر یک میلیون توکن خروجی است.
علاوه بر این مدلهای جدید، Anthropic بهروزرسانیهایی را برای Claude Code معرفی کرد که شامل پشتیبانی از اجرای وظایف پسزمینه از طریق GitHub Actions، یکپارچگی بومی با VS Code و JetBrains و موارد دیگر است. همچنین API Anthropic اکنون از ابزار اجرای کد، اتصالدهنده MCP، API فایلها و امکان ذخیرهسازی (کش) پرامپتها تا یک ساعت پشتیبانی میکند.