Публикация была переведена автоматически. Исходный язык: Русский
Апрель 2026 войдёт в историю AI не как месяц одного прорыва, а как месяц, когда сразу несколько событий дали чёткий ответ на вопрос: куда движется индустрия? Ответ оказался неожиданно конкретным — в сторону автономных агентов, которые не просто помогают думать, но и действуют сами.
Шесть недель — новая норма
23 апреля OpenAI выпустил GPT-5.5. Предыдущая версия, GPT-5.4, вышла 5 марта. Шесть недель между мажорными релизами — это уже не экстренный спринт, это производственный ритм.
GPT-5.5 позиционируется как модель, которая «понимает задачу раньше и берёт на себя больше работы». Технически это выражается в нескольких вещах: модель сохраняет ту же задержку на токен, что и GPT-5.4, при этом выдаёт значительно более умные ответы — и использует на это меньше токенов. На практике это означает снижение стоимости сложных задач при росте качества.
Показательная деталь: перед запуском GPT-5.5 и Codex переписали собственную инфраструктуру OpenAI — Codex проанализировал недели производственного трафика и написал кастомные алгоритмы балансировки нагрузки, увеличив скорость генерации токенов на 20%. Модель буквально оптимизировала систему, которая её обслуживает.
По бенчмаркам: Terminal-Bench 2.0 — 82,7% (против 69,4% у Claude Opus 4.7), OSWorld-Verified — 78,7% (против 78,0% у Claude). На FrontierMath GPT-5.5 лидирует с показателем 51,7% против 48,4% у конкурентов. Но независимое тестирование Tom's Guide показало обратное: в 7 из 7 категорий GPT-5.5 проиграл Claude Opus 4.7, хотя и оказался быстрее.
Вывод для продуктовых команд: разрыв между лидерами сужается до уровня задачи. Нет универсально лучшей модели — есть лучшая модель для вашего конкретного юзкейса.
Claude Mythos: когда модель слишком мощная для публичного релиза
Пока OpenAI наращивал обороты, Anthropic столкнулся с принципиально иной проблемой.
Компания разработала модель Claude Mythos, которую... не стала выпускать широкой публике. Причина — слишком высокая киберспособность. Во время внутреннего тестирования Mythos продемонстрировала способность находить и эксплуатировать уязвимости в 80%+ случаев, самостоятельно выстраивая цепочки атак через несколько систем одновременно и обнаруживая баги в крупных операционных системах и давно устоявшихся open-source проектах.
Вместо публичного релиза Anthropic запустил «Project Glasswing» — закрытое партнёрство с Amazon, Microsoft, Apple, Google и Nvidia. Цель: использовать Mythos для защиты инфраструктуры до того, как схожие возможности появятся у других лабораторий или злоумышленников. Anthropic выделил $100 млн в кредитах на использование и расширяет доступ к десяткам инфраструктурных организаций.
Это прецедент. Впервые крупная лаборатория публично признала: «Мы создали модель, которую не можем безопасно выпустить». Не потому что она нестабильна — а потому что слишком мощная.
Эксперты отрасли предупреждают: аналогичные возможности у других игроков — вопрос месяцев.
Агенты: от инструментов к коллегам
Оба события — и GPT-5.5, и Mythos — указывают в одну сторону: эпоха чат-ботов заканчивается, начинается эпоха агентов.
GPT-5.5 позиционируется как «агентная» модель. OpenAI описывает её так: дай ей запутанную многоэтапную задачу — она сама составит план, использует инструменты, проверит результат и продолжит работу без подсказок. Параллельно OpenAI запустил workspace-агентов в ChatGPT для бизнеса: команды могут создавать AI-агентов, которые сами выполняют задачи в Slack, Gmail и других инструментах — не просто помогают, а делают.
Greg Brockman назвал GPT-5.5 «фундаментом для того, как мы будем работать с компьютером в будущем». Математик-профессор из числа первых пользователей за 11 минут с нуля создал приложение по алгебраической геометрии из одного промпта.
По данным Fortune, у ChatGPT сегодня более 900 миллионов активных пользователей в неделю и свыше 50 миллионов платных подписчиков. Codex используют 4 миллиона разработчиков. Это уже не стартап с вирусным эффектом — это инфраструктура.
Что это значит
Темп релизов — раз в 6 недель — меняет экономику построения AI-продуктов. Команды, которые интегрируются с GPT-5.4 сегодня, через полтора месяца уже должны будут думать о 5.5. Это давление на архитектурные решения: строить нужно так, чтобы смена модели не требовала переписывания продукта.
Три практических вывода:
1. Не ставьте на одну модель. Разрыв в качестве между OpenAI и Anthropic зависит от задачи. Тестируйте оба пайплайна — в кодинге сейчас лидирует GPT-5.5, в аналитических задачах Claude может быть сильнее.
2. Агенты — это не будущее, это Q2 2026. OpenAI уже разворачивает workspace-агентов для enterprise. Если вы строите B2B-продукт, ответьте себе: как ваш инструмент встроится в агентный воркфлоу клиента?
3. Кибербезопасность стала AI-вопросом. Mythos — сигнал: AI-системы теперь представляют угрозу инфраструктуре масштаба, недостижимого для человека. Любой продукт, работающий с чувствительными данными, должен пересмотреть модель угроз уже сегодня.
Гонка моделей в апреле 2026-го — это уже не про то, кто умнее. Это про то, кто быстрее превратит интеллект в действие. И тот, кто строит на этом фундаменте прямо сейчас, получает фору, которую через год будет невозможно наверстать.
Апрель 2026 войдёт в историю AI не как месяц одного прорыва, а как месяц, когда сразу несколько событий дали чёткий ответ на вопрос: куда движется индустрия? Ответ оказался неожиданно конкретным — в сторону автономных агентов, которые не просто помогают думать, но и действуют сами.
Шесть недель — новая норма
23 апреля OpenAI выпустил GPT-5.5. Предыдущая версия, GPT-5.4, вышла 5 марта. Шесть недель между мажорными релизами — это уже не экстренный спринт, это производственный ритм.
GPT-5.5 позиционируется как модель, которая «понимает задачу раньше и берёт на себя больше работы». Технически это выражается в нескольких вещах: модель сохраняет ту же задержку на токен, что и GPT-5.4, при этом выдаёт значительно более умные ответы — и использует на это меньше токенов. На практике это означает снижение стоимости сложных задач при росте качества.
Показательная деталь: перед запуском GPT-5.5 и Codex переписали собственную инфраструктуру OpenAI — Codex проанализировал недели производственного трафика и написал кастомные алгоритмы балансировки нагрузки, увеличив скорость генерации токенов на 20%. Модель буквально оптимизировала систему, которая её обслуживает.
По бенчмаркам: Terminal-Bench 2.0 — 82,7% (против 69,4% у Claude Opus 4.7), OSWorld-Verified — 78,7% (против 78,0% у Claude). На FrontierMath GPT-5.5 лидирует с показателем 51,7% против 48,4% у конкурентов. Но независимое тестирование Tom's Guide показало обратное: в 7 из 7 категорий GPT-5.5 проиграл Claude Opus 4.7, хотя и оказался быстрее.
Вывод для продуктовых команд: разрыв между лидерами сужается до уровня задачи. Нет универсально лучшей модели — есть лучшая модель для вашего конкретного юзкейса.
Claude Mythos: когда модель слишком мощная для публичного релиза
Пока OpenAI наращивал обороты, Anthropic столкнулся с принципиально иной проблемой.
Компания разработала модель Claude Mythos, которую... не стала выпускать широкой публике. Причина — слишком высокая киберспособность. Во время внутреннего тестирования Mythos продемонстрировала способность находить и эксплуатировать уязвимости в 80%+ случаев, самостоятельно выстраивая цепочки атак через несколько систем одновременно и обнаруживая баги в крупных операционных системах и давно устоявшихся open-source проектах.
Вместо публичного релиза Anthropic запустил «Project Glasswing» — закрытое партнёрство с Amazon, Microsoft, Apple, Google и Nvidia. Цель: использовать Mythos для защиты инфраструктуры до того, как схожие возможности появятся у других лабораторий или злоумышленников. Anthropic выделил $100 млн в кредитах на использование и расширяет доступ к десяткам инфраструктурных организаций.
Это прецедент. Впервые крупная лаборатория публично признала: «Мы создали модель, которую не можем безопасно выпустить». Не потому что она нестабильна — а потому что слишком мощная.
Эксперты отрасли предупреждают: аналогичные возможности у других игроков — вопрос месяцев.
Агенты: от инструментов к коллегам
Оба события — и GPT-5.5, и Mythos — указывают в одну сторону: эпоха чат-ботов заканчивается, начинается эпоха агентов.
GPT-5.5 позиционируется как «агентная» модель. OpenAI описывает её так: дай ей запутанную многоэтапную задачу — она сама составит план, использует инструменты, проверит результат и продолжит работу без подсказок. Параллельно OpenAI запустил workspace-агентов в ChatGPT для бизнеса: команды могут создавать AI-агентов, которые сами выполняют задачи в Slack, Gmail и других инструментах — не просто помогают, а делают.
Greg Brockman назвал GPT-5.5 «фундаментом для того, как мы будем работать с компьютером в будущем». Математик-профессор из числа первых пользователей за 11 минут с нуля создал приложение по алгебраической геометрии из одного промпта.
По данным Fortune, у ChatGPT сегодня более 900 миллионов активных пользователей в неделю и свыше 50 миллионов платных подписчиков. Codex используют 4 миллиона разработчиков. Это уже не стартап с вирусным эффектом — это инфраструктура.
Что это значит
Темп релизов — раз в 6 недель — меняет экономику построения AI-продуктов. Команды, которые интегрируются с GPT-5.4 сегодня, через полтора месяца уже должны будут думать о 5.5. Это давление на архитектурные решения: строить нужно так, чтобы смена модели не требовала переписывания продукта.
Три практических вывода:
1. Не ставьте на одну модель. Разрыв в качестве между OpenAI и Anthropic зависит от задачи. Тестируйте оба пайплайна — в кодинге сейчас лидирует GPT-5.5, в аналитических задачах Claude может быть сильнее.
2. Агенты — это не будущее, это Q2 2026. OpenAI уже разворачивает workspace-агентов для enterprise. Если вы строите B2B-продукт, ответьте себе: как ваш инструмент встроится в агентный воркфлоу клиента?
3. Кибербезопасность стала AI-вопросом. Mythos — сигнал: AI-системы теперь представляют угрозу инфраструктуре масштаба, недостижимого для человека. Любой продукт, работающий с чувствительными данными, должен пересмотреть модель угроз уже сегодня.
Гонка моделей в апреле 2026-го — это уже не про то, кто умнее. Это про то, кто быстрее превратит интеллект в действие. И тот, кто строит на этом фундаменте прямо сейчас, получает фору, которую через год будет невозможно наверстать.