У нас сегодня есть важная новость: Replicate, ведущая платформа для запуска AI-моделей, присоединяется к Cloudflare.
Мы начали общаться с Replicate, потому что у нас было много общего помимо страсти к ярким цветовым палитрам. Наша миссия для платформы разработчиков Cloudflare Workers заключалась в том, чтобы сделать создание и развертывание полнофункциональных приложений максимально простым. Тем временем Replicate преследовала похожую миссию - сделать развертывание AI-моделей таким же простым, как написание одной строки кода. И мы поняли, что можем создать нечто еще лучшее вместе, интегрировав платформу Replicate напрямую в Cloudflare.
Мы рады поделиться этой новостью и еще больше рады тому, что это будет означать для клиентов. Интеграция инструментов Replicate в Cloudflare продолжит делать нашу Платформу для разработчиков лучшим местом в Интернете для создания и развертывания любых AI-рабочих процессов или агентских систем.
Что это значит для вас?
Прежде чем мы продолжим говорить о будущем AI, мы хотим ответить на вопросы, которые больше всего волнуют пользователей Replicate и Cloudflare. Короче говоря:
Для существующих пользователей Replicate: Ваши API и рабочие процессы продолжат работать без перерывов. Вскоре вы получите преимущества от дополнительной производительности и надежности глобальной сети Cloudflare.
Для существующих пользователей Workers AI: Готовьтесь к масштабному расширению каталога моделей и новой возможности запускать дообученные и пользовательские модели напрямую на Workers AI.
А теперь вернемся к тому, почему мы так воодушевлены нашим совместным будущим.
AI-революцию не показывали по телевизору, но она началась с открытого исходного кода
До того, как AI стал AI и темой каждого разговора, он десятилетиями был известен как "машинное обучение". Это была специализированная, почти академическая область. Прогресс был стабильным, но изолированным, с прорывами, происходящими внутри нескольких крупных, хорошо финансируемых исследовательских лабораторий. Модели были монолитными, данные были проприетарными, а инструменты были недоступны большинству разработчиков. Все изменилось, когда культура сотрудничества с открытым исходным кодом - та же сила, которая построила современный Интернет - столкнулась с машинным обучением, поскольку исследователи и компании начали публиковать не только свои статьи, но и веса моделей, и код.
Это вызвало невероятный взрыв инноваций. Темпы изменений всего за последние несколько лет были ошеломляющими; то, что было передовым 18 месяцев назад (или иногда кажется, что всего несколько дней назад), теперь стало базовым уровнем. Это ускорение наиболее заметно в генеративном AI.
Мы перешли от жутких, размытых диковинок к фотореалистичной генерации изображений за одно мгновение. Модели с открытым исходным кодом, такие как Stable Diffusion, открыли немедленные возможности для творчества разработчиков, и это было только началом. Если вы посмотрите на каталог моделей Replicate сегодня, вы увидите тысячи моделей изображений практически любого типа, каждая из которых итеративно улучшает предыдущую.
Это произошло не только с моделями изображений, но и с видео, аудио, языковыми моделями и многим другим...
Но этот невероятный, управляемый сообществом прогресс создает огромную практическую проблему: как фактически запускать эти модели? Каждая новая модель имеет разные зависимости, требует определенного GPU-оборудования (и достаточного количества его) и нуждается в сложной инфраструктуре обслуживания для масштабирования. Разработчики обнаружили, что тратят больше времени на борьбу с драйверами CUDA и файлами requirements.txt, чем на фактическое создание своих приложений.
Именно эту проблему решил Replicate. Они создали платформу, которая абстрагирует всю эту сложность (используя свой инструмент с открытым исходным кодом Cog для упаковки моделей в стандартные, воспроизводимые контейнеры), позволяя любому разработчику или специалисту по данным запускать даже самые сложные модели с открытым исходным кодом с помощью простого API-вызова.
Сегодня каталог Replicate включает более 50 000 моделей с открытым исходным кодом и дообученных моделей. Хотя открытый исходный код открыл так много возможностей, инструментарий Replicate выходит за эти рамки, позволяя разработчикам получать доступ к любым нужным моделям в одном месте. Точка. С помощью своего маркетплейса они также предлагают бесшовный доступ к ведущим проприетарным моделям, таким как GPT-5 и Claude Sonnet, все через единый унифицированный API.
Стоит отметить, что Replicate создал не просто сервис инференса; он создал сообщество. Огромное количество инноваций происходит благодаря вдохновению от работы других, итеративному улучшению и совершенствованию. Replicate стал определяющим центром для разработчиков, чтобы открывать, делиться, дообучать и экспериментировать с новейшими моделями в публичной песочнице.
Вместе мы сильнее: каталог AI встречается с AI-облаком
Возвращаясь к миссии платформы Workers: наша цель всегда заключалась в том, чтобы позволить разработчикам создавать полнофункциональные приложения без необходимости обременять себя инфраструктурой. И хотя это не изменилось, AI изменил требования к приложениям.
Типы приложений, которые создают разработчики, меняются - три года назад никто не создавал агентов или не генерировал AI-видео для запуска. Сегодня это делают. В результате то, что они нуждаются и ожидают от облака, или AI-облака, также изменилось.
Чтобы удовлетворить потребности разработчиков, Cloudflare создавала фундаментальные основы AI-облака, предназначенного для запуска инференса на границе, близко к пользователям. Это не просто один продукт, а целый стек:
Workers AI: Бессерверный GPU-инференс в нашей глобальной сети.
AI Gateway: Плоскость управления для кэширования, ограничения частоты запросов и наблюдения за любым AI API.
Data Stack: Включая Vectorize (нашу векторную базу данных) и R2 (для хранения моделей и данных).
Orchestration: Инструменты, такие как AI Search (ранее Autorag), Agents и Workflows для создания сложных многоэтапных приложений.
Foundation: Все построено на нашей основной платформе для разработчиков Workers, Durable Objects и остальной части нашего стека.
Пока мы помогали разработчикам масштабировать свои приложения, Replicate преследовал похожую миссию - сделать развертывание AI-моделей таким же простым, как развертывание кода. Здесь все сходится. Replicate приносит один из крупнейших и самых vibrant каталогов моделей и сообществ разработчиков в отрасли. Cloudflare приносит невероятно производительную глобальную сеть и бессерверную платформу инференса. Вместе мы можем предложить лучшее из обоих миров: самый полный выбор моделей, запускаемых на быстрой, надежной и доступной платформе инференса.
Наше общее видение
Для сообщества: центр для исследования AI
Возможность делиться моделями, публиковать дообученные версии, собирать звезды и экспериментировать в песочнице - это сердце сообщества Replicate. Мы продолжим инвестировать в это и развивать как премиальное направление для открытия и экспериментирования с AI, теперь усиленное глобальной сетью Cloudflare для еще более быстрого и отзывчивого опыта для всех.
Будущее инференса: одна платформа, все модели
Наше видение заключается в объединении лучшего из обеих платформ. Мы перенесем весь каталог Replicate - все 50 000+ моделей и дообученных версий - в Workers AI. Это дает вам максимальный выбор: запускать модели в гибкой среде Replicate или на бессерверной платформе Cloudflare, все из одного места.
Но мы не просто расширяем каталог. Мы рады объявить, что мы добавим возможности дообучения в Workers AI, используя глубокий опыт Replicate. Мы также делаем Workers AI более гибким, чем когда-либо. Скоро вы сможете приносить свои собственные пользовательские модели в нашу сеть. Мы будем использовать опыт Replicate с Cog, чтобы сделать этот процесс бесшовным, воспроизводимым и простым.
AI-облако: больше чем просто инференс
Запуск модели - это только часть головоломки. Настоящая магия происходит, когда вы подключаете AI ко всему вашему приложению. Представьте, что вы можете построить, когда огромный каталог Replicate будет глубоко интегрирован со всей платформой разработчиков Cloudflare: запустите модель и сохраните результаты напрямую в R2 или Vectorize; запустите инференс из Worker или Queue; используйте Durable Objects для управления состоянием AI-агента; или создавайте генеративный UI в реальном времени с помощью WebRTC и WebSockets.
Для управления всем этим мы глубоко интегрируем нашу унифицированную платформу инференса с AI Gateway, предоставляя вам единую плоскость управления для наблюдаемости, управления промптами, A/B-тестирования и анализа затрат для всех ваших моделей, независимо от того, работают ли они на Cloudflare, Replicate или любом другом провайдере.