Claude 4 уничтожил все конкурирующие нейросети одним обновлением

Компания Anthropic только что представила Claude 4 — новое поколение искусственного интеллекта, которое кардинально меняет правила игры. Claude Opus 4 стал лучшей моделью для программирования в мире, а Claude Sonnet 4 превзошел все ожидания по точности и скорости работы. Эти модели не просто улучшили существующие возможности — они переписали понимание того, на что способен современный ИИ.

Революция в программировании

Claude Opus 4 установил новые рекорды в области программирования, показав результат 72,5% на SWE-bench — самом сложном тесте для оценки способностей ИИ в разработке программного обеспечения. Это не просто цифра — это доказательство того, что искусственный интеллект впервые в истории может самостоятельно решать реальные задачи программирования на уровне профессиональных разработчиков.

Компания Cursor, создающая ИИ-редактор кода, назвала Opus 4 «прорывом в понимании сложных кодовых баз». Replit сообщает о кардинальном улучшении точности при работе с изменениями в нескольких файлах одновременно. Block отмечает, что это первая модель, которая действительно повышает качество кода во время редактирования и отладки.

Но настоящий шок вызвал эксперимент компании Rakuten: их ИИ-агент на базе Opus 4 самостоятельно работал над рефакторингом открытого проекта в течение семи часов, поддерживая стабильную производительность без вмешательства человека. Семь часов непрерывной работы — это уже не просто инструмент, а виртуальный коллега.

Мыслящий ИИ с инструментами

Одной из самых впечатляющих новинок стала функция «расширенного мышления с использованием инструментов». Теперь Claude может не только долго и глубоко размышлять над задачей, но и в процессе мышления использовать внешние инструменты — например, поиск в интернете или выполнение кода.

Представьте себе ИИ, который анализирует сложную проблему, понимает, что ему нужна дополнительная информация, самостоятельно ищет ее в сети, анализирует найденное и продолжает работу с учетом новых данных. Это уже не просто большая языковая модель — это мыслящая система с доступом к внешнему миру.

Память, которая меняет все

Claude Opus 4 получил революционные возможности работы с памятью. Когда разработчики предоставляют модели доступ к локальным файлам, она учится создавать и поддерживать «файлы памяти» для хранения ключевой информации. Это открывает возможности для долгосрочного понимания задач и сохранения контекста между сессиями.

Anthropic продемонстрировала эту возможность на примере игры в Pokémon: Claude Opus 4 самостоятельно создал «Навигационное руководство» с заметками о прохождении игры, запоминая важные детали и стратегии. Если ИИ может эффективно играть в сложную RPG, представьте, что он сможет делать с рабочими проектами.

Claude Sonnet 4 — доступная мощь

Младший брат Opus 4 — модель Sonnet 4 — тоже показала впечатляющие результаты. С результатом 72,7% на SWE-bench она превзошла большинство конкурентов, оставаясь при этом более доступной и быстрой в работе.

GitHub уже объявил, что Sonnet 4 станет основой для нового агента программирования в GitHub Copilot. Компания Sourcegraph отмечает «существенный скачок в разработке программного обеспечения» — модель дольше остается на правильном пути, глубже понимает проблемы и предлагает более элегантные решения.

Особенно впечатляют результаты iGent: количество ошибок навигации в коде снизилось с 20% до практически нуля. Такая точность означает, что ИИ действительно понимает структуру проектов, а не просто генерирует правдоподобный код.

Claude Code выходит из бета-версии

Вместе с новыми моделями Anthropic объявила о полном запуске Claude Code — инструмента для интеграции ИИ в процесс разработки. Теперь Claude может работать прямо в популярных редакторах кода VS Code и JetBrains, предлагая изменения непосредственно в файлах.

Но самое интересное — интеграция с GitHub. Разработчики могут пометить Claude Code в pull request’ах, и ИИ автоматически ответит на замечания рецензентов, исправит ошибки CI или внесет необходимые изменения в код. Это превращает ИИ в полноценного участника команды разработки.

Технические прорывы

Claude 4 представляет собой гибридную модель с двумя режимами работы: мгновенные ответы для простых задач и расширенное мышление для сложных проблем. Модели научились работать с несколькими инструментами параллельно и на 65% реже используют «лазейки» или упрощения при выполнении сложных задач.

Новые возможности API включают инструмент выполнения кода, коннектор MCP, Files API и возможность кэширования промптов до одного часа. Эти нововведения позволяют разработчикам создавать более мощных ИИ-агентов для решения реальных бизнес-задач.

Ценообразование остается доступным

Несмотря на кардинальное улучшение возможностей, Anthropic сохранила прежние цены: Opus 4 стоит $15/$75 за миллион токенов (входящие/исходящие), а Sonnet 4 — $3/$15. Учитывая качественный скачок в возможностях, это делает новые модели исключительно выгодными.

Claude Sonnet 4 доступен даже бесплатным пользователям, что позволит широкой аудитории оценить возможности нового поколения ИИ. Обе модели работают через API Anthropic, Amazon Bedrock и Google Cloud Vertex AI.

Безопасность на новом уровне

Anthropic не забыла о безопасности, внедрив меры для соответствия уровню безопасности ASL-3. Компания провела обширное тестирование для минимизации рисков и максимизации безопасности использования новых возможностей.

Для пользователей, которым нужен доступ к полным цепочкам рассуждений для продвинутой работы с промптами, доступен специальный Developer Mode через отдел продаж.

Новая эра ИИ-сотрудничества

Claude 4 представляет собой большой шаг к созданию виртуального коллаборатора — ИИ, который поддерживает полный контекст, фокусируется на долгосрочных проектах и оказывает трансформационное влияние на рабочие процессы.

Результаты тестирования показывают, что мы находимся на пороге новой эры, когда ИИ перестает быть просто инструментом и становится полноценным участником творческого и технического процесса. Компании, которые первыми освоят эти возможности, получат значительное конкурентное преимущество.

Остается только один вопрос: готовы ли мы к миру, где искусственный интеллект становится таким же естественным коллегой, как и человек?

Следите за последними новостями в мире искусственного интеллекта в нашем Telegram-канале Digital Report

Об авторе
Недавние публикации

Digital Report

Digital Report — информационно-аналитический портал, который отслеживает изменения цифровой экономики. Мы описываем все технологические тренды, делаем обзоры устройств и технологических событий, которые влияют на жизнь людей.

Digital Report недавно публиковал (посмотреть все)

Subscribe to Updates

What's Hot