Революция искусственного интеллекта: стартапы без дата-центров
Искусственный интеллект (ИИ) активно меняет мир, но подавляющее большинство мощных AI-моделей по-прежнему требуют сотен серверов в больших дата-центрах для своей работы. Однако складывается новая парадигма: стартапы, такие как Flower AI и Vana, разрабатывают прогрессивные модели ИИ, используя распределенные вычисления. Их совместный проект, модель Collective-1, может занять важное место в эволюции ИИ, открывая новые горизонты для более доступного и безопасного обучения.

Долгое время создание мощных ИИ-моделей требовало значительных ресурсов: большие объемы данных и вычислительных мощностей, сосредоточенных в дата-центрах, подключенных через оптоволокно. Данные, часто собранные из открытых источников, таких как веб-сайты и книги, использовались для обучения моделей. Однако эта модель в первую очередь доступна лишь крупным компаниям с высокими финансовыми возможностями.
Применение распределенных вычислений открывает новые возможности для стартапов и даже университетов создавать мощные ИИ-модели. Проект Collective-1, созданный с использованием распределенных вычислений, демонстрирует, что создание ИИ не обязательно должно быть привязано к большим дата-центрам.
Инновационные подходы к обучениюFlower AI, как отмечает Ник Лейн, сооснователь компании и ученый из Кембриджского университета, разработал технологии, позволяющие обучать ИИ-модели с использованием распределенных вычислений. Вместо того чтобы полагаться на традиционные дата-центры, данные могут быть собраны из различных источников и обучены на множестве компьютеров, подключенных к интернету.

Collective-1 имеет всего 7 миллиардов параметров — это скромный показатель по сравнению с современными моделями, такими как ChatGPT и Gemini, которые имеют сотни миллиардов параметров. Однако такие стартапы, как Flower AI, уже разрабатывают модели с использованием более 30 миллиардов параметров, что обещает серьезные изменения на рынке ИИ.
Доступ к новому типу данныхВажным аспектом новой модели является использование личных данных пользователей. Стартап Vana предлагает пользователям делиться своими данными из платформ, таких как X и Reddit, чтобы обучать ИИ, при этом предоставляя им контроль над тем, как будут использоваться их данные. Это открывает доступ к большому количеству непубличной информации, которая ранее не использовалась при обучении моделей.

Анна Казлаускас, сооснователь Vana, отмечает, что это первый случай, когда пользователи могут непосредственно участвовать в создании ИИ-модели, а также получать за это финансовое вознаграждение. Это может стать своим родом революцией в области ИТ, предоставляя людям возможность влиять на технологии, которые они используют.
Преимущества распределенного обученияРаспределенное обучение может привести к значительным изменениям в ИИ-индустрии. Микро Мусолеси, ученый из University College London, отмечает, что этот подход позволит использовать обширные и чувствительные к приватности данные из таких областей, как здравоохранение и финансы, без рисков, связанных с централизованной обработкой данных.
Далее, распределенное обучение дает возможность более мелким компаниям и университетам разработать собственные модели, что может снизить барьеры входа на рынок ИИ. Это также может привести к более демократичному распределению технологий и возможностей, что в свою очередь может повлиять на глобальную экономику.
Взгляд в будущееПерспективы распределенного обучения выглядят многообещающе. Модель Collective-1 — лишь один из примеров того, как этот подход может изменить индустрию. По мере развития технологий, которые делают распределенное обучение более доступным и эффективным, ИИ-модели станут более разнообразными и демократичными.
Учитывая, что технологии стремительно развиваются, потенциал распределенных моделей для создания мощных ИИ с использованием разрозненных ресурсов может изменить облик ИТ-индустрии. Идея о том, что мощные ИИ могут разрабатываться не только крупными игроками, но и мелкими компаниями и университетами, открывает новые горизонты для инноваций и сотрудничества.