Неделя AI-агентов: Будущее интернета уже здесь

Миссия Cloudflare всегда заключалась в том, чтобы помогать строить лучший Интернет. Иногда это означает создание продуктов для Интернета в его нынешнем виде. Иногда это означает создание продуктов для Интернета, каким он вот-вот станет.

Сегодня мы запускаем Неделю агентов (Agents Week), посвященную строительству Интернета для того, что ждет нас впереди.

Интернет не был создан для эпохи ИИ. Как и облако.

Облако, каким мы его знаем, стало продуктом последнего крупного технологического сдвига парадигмы: смартфонов.

Когда смартфоны поместили Интернет в карман каждого, они не просто добавили пользователей — они изменили саму природу пребывания в сети. Всегда на связи, всегда ожидая мгновенного ответа. Приложениям пришлось справляться с на порядок большим числом пользователей, и инфраструктура, питающая их, должна была эволюционировать.

Подход, на котором сошлась индустрия, был простым: больше пользователей — больше копий вашего приложения. По мере усложнения приложений команды разбивали их на более мелкие части — микросервисы — чтобы каждая команда могла контролировать свою собственную судьбу. Но основной принцип оставался неизменным: конечное число приложений, каждое из которых обслуживает множество пользователей. Масштабирование означало больше копий.

Kubernetes и контейнеры стали стандартом. Они упростили запуск экземпляров, балансировку нагрузки и удаление ненужного. В рамках этой модели «один ко многим» один экземпляр мог обслуживать многих пользователей, и даже когда число пользователей выросло до миллиардов, количество вещей, которыми нужно было управлять, оставалось конечным.

Агенты ломают эту модель.

Один пользователь, один агент, одна задача

В отличие от всех приложений, которые были до них, агенты работают по принципу «один к одному». Каждый агент — это уникальный экземпляр. Обслуживает одного пользователя, выполняет одну задачу. Если традиционное приложение следует одному и тому же пути выполнения независимо от того, кто его использует, то агенту требуется собственная среда выполнения: среда, в которой LLM диктует путь выполнения кода, динамически вызывает инструменты, корректирует свой подход и сохраняется до завершения задачи.

Думайте об этом как о разнице между рестораном и личным шеф-поваром. В ресторане есть меню — фиксированный набор блюд — и кухня, оптимизированная для их массового приготовления. Таковы большинство современных приложений. Агент больше похож на личного шеф-повара, который спрашивает: что вы хотите поесть? Ему каждый раз могут потребоваться совершенно разные ингредиенты, посуда или техника приготовления. Вы не можете вести сервис личных шеф-поваров из той же кухни, что и ресторан.

За последний год мы наблюдаем взлет агентов, во главе которого идут агенты для написания кода — что неудивительно, поскольку разработчики склонны быть ранними последователями. Сегодня большинство таких агентов работают, запуская контейнер, чтобы предоставить LLM все необходимое: файловую систему, git, bash и возможность запускать произвольные бинарные файлы.

Но агенты для кодирования — это только начало. Такие инструменты, как Claude Cowork, уже делают агентов доступными для менее технических пользователей. Как только агенты выйдут за пределы сообщества разработчиков и окажутся в руках у всех — административных помощников, исследователей, сотрудников службы поддержки, личных планировщиков — математика масштабирования быстро отрезвит.

Математика масштабирования агентов для масс

Если более 100 миллионов работников умственного труда в США каждый использовал бы агента-помощника при ~15% одновременной активности, потребовалась бы мощность примерно для 24 миллионов одновременных сессий. При 25–50 пользователях на один CPU, это где-то между 500 тыс. и 1 млн серверных CPU — только для США, с одним агентом на человека.

А теперь представьте, что каждый человек запускает несколько агентов параллельно. А теперь представьте остальной мир с более чем 1 миллиардом работников умственного труда. Нам не просто немного не хватает вычислительных мощностей. Мы отстаем на порядки.

Так как же нам сократить этот разрыв?

Инфраструктура, созданная для агентов

Восемь лет назад мы запустили Workers — начало нашей платформы для разработчиков и ставку на бесконтейнерные, бессерверные вычисления. Мотивация в то время была практической: нам требовались легковесные вычисления без холодного старта для клиентов, зависящих от скорости Cloudflare. Построенные на изолятах (isolates) V8, а не на контейнерах, Workers оказались на порядок эффективнее — быстрее запускались, дешевле в работе и изначально подходили для модели «запустить, выполнить, завершить».

Чего мы не ожидали, так это того, насколько хорошо эта модель ляжет на эпоху агентов.

В то время как контейнеры дают каждому агенту целую коммерческую кухню: встроенную технику, холодильные камеры и прочее оборудование, нужно оно агенту или нет, изоляты, с другой стороны, дают личному шеф-повару ровно ту столешницу, конфорку и нож, которые нужны для приготовления конкретного блюда. Подготавливаются за миллисекунды. Убираются в момент подачи блюда.

Welcome to Agents Week

В мире, где нам нужно поддерживать не тысячи долгоживущих приложений, а миллиарды недолговечных, узкоспециализированных сред выполнения — изоляты являются правильной примитивной единицей.

Каждый из них запускается за миллисекунды. Каждый безопасно изолирован. И на одном и том же железе их можно запускать на порядки больше по сравнению с контейнерами.

Всего несколько недель назад мы пошли дальше, запустив открытый бета-тест Dynamic Workers: среды выполнения, запускаемые во время работы, по требованию. Изолят запускается за несколько миллисекунд и использует несколько мегабайт памяти. Это примерно в 100 раз быстрее и до 100 раз эффективнее по использованию памяти, чем контейнер.

Вы можете запускать новый изолят для каждого отдельного запроса, выполнять фрагмент кода и выбрасывать его — в масштабе миллионов в секунду.

Чтобы агенты вышли за пределы ранних последователей и оказались в руках у всех, они также должны быть доступными по цене. Запуск каждого агента в собственном контейнере достаточно дорог, поэтому сегодня агентные инструменты в основном ограничиваются помощниками по написанию кода для инженеров, которые могут оправдать эти затраты. Изоляты, будучи на порядки более эффективными, — это то, что делает экономику на единицу продукта жизнеспособной в том масштабе, которого требуют агенты.

Welcome to Agents Week

Фаза безлошадного экипажа

Хотя построить правильный фундамент для будущего критически важно, мы еще не там. И у каждого сдвига парадигмы есть период, когда мы пытаемся заставить новую вещь работать в рамках старой модели. Первые автомобили называли «безлошадными экипажами». Первые веб-сайты были цифровыми брошюрами. Первые мобильные приложения были уменьшенными десктопными интерфейсами. Сейчас мы находимся в этой фазе с агентами.

Это видно повсюду.

Мы даем агентам headless-браузеры для навигации по сайтам, созданным для человеческого восприятия, тогда как им нужны структурированные протоколы вроде MCP (Model Context Protocol), чтобы обнаруживать и вызывать сервисы напрямую.

Многие ранние MCP-серверы — это тонкие обертки вокруг существующих REST API — те же операции CRUD, новый протокол — тогда как LLM на самом деле гораздо лучше пишут код, чем делают последовательные вызовы инструментов.

Мы используем CAPTCHA и поведенческий фингерпринтинг, чтобы проверить, что находится на другом конце запроса, в то время как все чаще этим «чем-то» является агент, действующий от чьего-либо имени — и правильный вопрос не «вы человек?», а «какой вы агент, кто вас авторизовал и что вам разрешено делать?».

Мы запускаем полноценные контейнеры для агентов, которым просто нужно сделать несколько вызовов API и вернуть результат.

Это всего несколько примеров, но ни один из них не удивителен. Так выглядят переходные периоды.

Строительство для обеих эпох

Интернет всегда находится где-то между двумя эпохами. IPv6 объективно лучше, чем IPv4, но отказ от поддержки IPv4 сломает половину Интернета. HTTP/2 и HTTP/3 сосуществуют. TLS 1.2 все еще не уступил полностью место версии 1.3. Лучшая технология существует, старая технология сохраняется, и задача инфраструктуры — служить мостом между ними.

Cloudflare всегда занимался тем, что соединял эти переходы. Сдвиг в сторону агентов не является исключением.

Агентам для написания кода действительно нужны контейнеры — файловая система, git, bash, выполнение произвольных бинарных файлов. Это никуда не денется. На этой неделе наши песочницы на основе контейнеров становятся общедоступными (GA), потому что мы стремимся сделать их как можно лучше. Мы углубляем работу над рендерингом в браузере для агентов, потому что будет длинный хвост сервисов, которые еще не поддерживают MCP, и агентам все равно нужно будет с ними взаимодействовать. Это не временные решения — они являются частью полноценной платформы.

Но мы также строим то, что будет дальше: изоляты, протоколы и модели идентификации, которые действительно нужны агентам. Наша задача — убедиться, что вам не придется выбирать между тем, что работает сегодня, и тем, что правильно для завтрашнего дня.

Безопасность в модели, а не вокруг нее

Если агентам предстоит заниматься нашими профессиональными и личными задачами — читать электронную почту, работать с нашим кодом, взаимодействовать с нашими финансовыми сервисами — то безопасность должна быть встроена в модель выполнения, а не добавлена поверх постфактум.

CISO (руководители по информационной безопасности) первыми столкнулись с этим. Рост производительности от внедрения агентов для всех реален, но сегодня большинство развертываний агентов сопряжены с рисками: инъекции в промпты, утечка данных, несанкционированный доступ к API, непрозрачное использование инструментов.

Агенту для креативного кодирования разработчика нужен доступ к репозиториям и пайплайнам развертывания. Корпоративному агенту службы поддержки нужен доступ к внутренним API и пользовательским данным. В обоих случаях обеспечение безопасности среды сегодня означает сшивание вместе учетных данных, сетевых политик и средств контроля доступа, которые изначально не проектировались для автономного программного обеспечения.

Cloudflare параллельно строит две платформы: нашу платформу для разработчиков, предназначенную для создателей приложений, и нашу платформу нулевого доверия для организаций, которым необходимо защитить доступ. Какое-то время они обслуживали разные аудитории.

Но вопросы "как мне создать этого агента?" и "как мне убедиться, что он безопасен?" становятся все более одним и тем же вопросом. Мы объединяем эти платформы, чтобы всё это было неотъемлемой частью того, как работают агенты, а не отдельным слоем, который приходится прикручивать сверху.

Агенты, которые следуют правилам

В эпоху агентов есть ещё одно измерение, выходящее за рамки вычислений и безопасности: экономика и управление.

Когда агенты взаимодействуют с Интернетом от нашего имени — читают статьи, используют API, получают доступ к сервисам — у людей и организаций, которые создают этот контент и управляют этими сервисами, должна быть возможность устанавливать условия и получать оплату. Сегодня экономическая модель веба построена вокруг человеческого внимания: реклама, платный доступ, подписки.

У агентов нет внимания (ну, не того вида внимания). Они не видят рекламу. Они не кликают на баннеры с уведомлениями о куки.

Если мы хотим Интернета, где агенты могут свободно действовать и где издатели, создатели контента и поставщики услуг получают справедливое вознаграждение, нам нужна для этого новая инфраструктура. Мы создаём инструменты, которые позволяют издателям и правообладателям легко устанавливать и применять политики взаимодействия агентов с их контентом.

Создание лучшего Интернета всегда означало заботу о том, чтобы он работал для всех — не только для создателей технологий, но и для тех, чей труд и творчество делают Интернет стоящим того, чтобы им пользоваться. В эпоху агентов это не меняется. Это становится ещё важнее.

Платформа для разработчиков и агентов

Наше видение платформы для разработчиков всегда заключалось в предоставлении комплексной платформы, которая просто работает: от эксперимента, до MVP, до масштабирования на миллионы пользователей. Но предоставление базовых элементов — это только часть уравнения. Отличная платформа также должна думать о том, как всё работает вместе и как интегрируется в ваш рабочий процесс разработки.

Эта задача эволюционирует. Раньше она была чисто об опыте разработчика, о том, чтобы людям было легко создавать, тестировать и выпускать продукты. Все больше речь идёт также о помощи агентам в помощи людям и о том, чтобы платформа работала не только для создателей агентов, но и для самих агентов. Может ли агент найти самые свежие и актуальные лучшие практики? Насколько легко он может обнаружить и вызвать необходимые ему инструменты и CLI? Насколько беспрепятственно он может перейти от написания кода к его развертыванию?

На этой неделе мы выпускаем улучшения по обоим направлениям — делая Cloudflare лучше как для людей, которые на нём строят, так и для агентов, которые на нём работают.

Строить будущее — командный вид спорта

Мы не можем строить будущее в одиночку. Каждый крупный переход в Интернете — от HTTP/1.1 к HTTP/2 и HTTP/3, от TLS 1.2 к 1.3 — требовал от индустрии конвергенции на общих стандартах. Переход к агентам не станет исключением.

Cloudflare имеет долгую историю участия и продвижения стандартов, которые заставляют Интернет работать. Мы глубоко вовлечены в IETF уже более десяти лет, помогая разрабатывать и внедрять такие протоколы, как QUIC, TLS 1.3 и Encrypted Client Hello. Мы были одним из основателей WinterTC, технического комитета ECMA по взаимодействию сред выполнения JavaScript. Мы открыли исходный код самой среды выполнения Workers, потому что считаем, что основа должна быть открытой.

Мы применяем тот же подход к эпохе агентов. Мы рады быть частью Linux Foundation и AAIF, помогать поддерживать и продвигать такие стандарты, как MCP, которые станут основой агентного будущего. С тех пор как Anthropic представила MCP, мы тесно сотрудничали с ними, создавая инфраструктуру для удалённых серверов MCP, открывая исходный код наших собственных реализаций и инвестируя в то, чтобы сделать протокол практичным в масштабе.

В прошлом году вместе с Coinbase мы со-основали фонд x402 Foundation, открытый нейтральный стандарт, который возрождает давно бездействующий статус-код HTTP 402, чтобы дать агентам встроенный способ оплачивать услуги и контент, которые они потребляют.

Идентификация агентов, авторизация, оплата, безопасность: всё это требует открытых стандартов, которые ни одна компания не может определить в одиночку.

Оставайтесь на связи

На этой неделе мы делаем анонсы во всех измерениях стека агентов: вычисления, связность, безопасность, идентификация, экономика и опыт разработчика.