Экосистема AI+Web3 в полном объеме: новые возможности от вычислительной мощности до приватных вычислений

AI+Web3: Башни и площади

Краткое содержание

  1. Проекты Web3 с концепцией ИИ становятся объектами притяжения капитала на первичном и вторичном рынках.

  2. Возможности Web3 в AI-отрасли проявляются в: использовании распределенных стимулов для координации потенциального предложения в длинном хвосте ------ через данные, хранение и вычисления; в то же время, создание открытой модели и децентрализованного рынка AI-агентов.

  3. Основные области применения ИИ в индустрии Web3 - это финансы на цепочке (криптоплатежи, торговля, анализ данных) и помощь в разработке.

  4. Эффективность AI+Web3 проявляется в их взаимодополняемости: Web3, как ожидается, сможет противостоять централизации AI, а AI, в свою очередь, сможет помочь Web3 выйти за пределы.

Введение

В последние два года развитие ИИ стало похоже на нажатие кнопки ускорения: порыв бабочки, вызванный Chatgpt, не только открыл новый мир генеративного искусственного интеллекта, но и вызвал волну в Web3 на другом берегу.

С поддержкой концепции ИИ, финансирование крипторынка явно возросло по сравнению с его замедлением. По данным СМИ, только в первой половине 2024 года 64 проекта Web3+AI завершили финансирование, а операционная система на базе искусственного интеллекта Zyber365 достигла максимальной суммы финансирования в 100 миллионов долларов на этапе A.

Вторичный рынок стал более процветающим, данные сайта агрегатора криптовалют Coingecko показывают, что за чуть больше года общая рыночная капитализация сектора ИИ достигла 48,5 миллиарда долларов, а объем торгов за 24 часа близок к 8,6 миллиарда долларов; очевидные преимущества, связанные с основными достижениями в области ИИ, после выпуска модели Sora текст-в-видео от одной компании, привели к увеличению средней цены по сектору ИИ на 151%; эффект ИИ также распространился на один из секторов криптовалют, привлекающих капитал, Meme: первая концепция MemeCoin с AI Agent ------ GOAT быстро завоевал популярность и достиг оценки в 1,4 миллиарда долларов, успешно запустив бум AI Meme.

Исследования и темы, связанные с AI+Web3, также на пике популярности. От AI+Depin до AI Memecoin и текущих AI Agent и AI DAO, FOMO-эмоции уже не успевают за скоростью смены новых нарративов.

AI+Web3, эта комбинация терминов, полная горячих денег, трендов и будущих фантазий, неизбежно воспринимается как брак по расчету, организованный капиталом. Нам, кажется, трудно разобраться, под этой роскошной одеждой, действительно ли это поле для спекулянтов или предрассветное время взрыва?

Чтобы ответить на этот вопрос, ключевым размышлением для обеих сторон является: станет ли лучше с другой стороной? Можно ли извлечь выгоду из модели другой стороны? В этой статье мы также пытаемся взглянуть на эту картину, стоя на плечах предшественников: как Web3 может сыграть роль на всех этапах технологического стека AI, и что нового AI может принести Web3?

! AI+Web3: Башни и площади

Часть 1. Какие возможности предлагает Web3 в контексте AI-стека?

Прежде чем развивать эту тему, нам нужно понять технологический стек больших моделей ИИ:

Говоря более простым языком, весь процесс можно описать так: «Большая модель» похожа на человеческий мозг. На ранней стадии этот мозг принадлежит новорождённому, который только что пришёл в этот мир и ему нужно наблюдать и поглощать огромные объемы информации из окружающего мира, чтобы понять его. Это стадия «сбора» данных. Поскольку компьютеры не обладают такими же визуальными, слуховыми и другими сенсорными способностями, как у людей, на этапе обучения масштабная неразмеченная информация должна быть преобразована через «предварительную обработку» в формат информации, который может быть понятен и использован компьютером.

После ввода данных ИИ через «обучение» создает модель с пониманием и предсказательной способностью, которую можно рассматривать как процесс, в котором младенец постепенно понимает и учится взаимодействовать с окружающим миром. Параметры модели подобны языковым способностям младенца, которые постоянно корректируются в процессе обучения. Когда содержание обучения начинает делиться на предметы или происходит обратная связь с людьми, и происходит коррекция, это переходит в стадию «доработки» большой модели.

Дети постепенно растут и учатся говорить, после чего могут понимать смысл в новых разговорах и выражать свои чувства и мысли. Этот этап аналогичен "выводам" в больших моделях ИИ, которые могут предсказывать и анализировать новый языковой и текстовый ввод. Младенцы выражают чувства, описывают предметы и решают различные проблемы с помощью языковых навыков, что также похоже на то, как большие модели ИИ применяются на этапе вывода для выполнения различных конкретных задач, таких как классификация изображений, распознавание речи и так далее.

А AI Agent ближе к следующей форме больших моделей ------ способным самостоятельно выполнять задачи и стремиться к сложным целям, обладая не только способностью к мышлению, но и памятью, планированием, а также способностью использовать инструменты для взаимодействия с миром.

В настоящее время, в ответ на проблемы, связанные с ИИ на различных уровнях, Web3 в настоящее время предварительно сформировала многоуровневую, взаимосвязанную экосистему, охватывающую все этапы процесса моделирования ИИ.

! AI+Web3: Башни и площади

Один. Базовый уровень: Airbnb для вычислительной мощности и данных

▎Мощность вычислений

На данный момент одной из самых больших затрат AI является вычислительная мощность и энергия, необходимая для обучения и вывода моделей.

Примером является то, что для обучения модели LLAMA3 одной компании требуется 16000 графических процессоров H100GPU, произведенных другой компанией (это графический процессор высшего класса, специально разработанный для искусственного интеллекта и высокопроизводительных вычислительных задач). Цена за 80 ГБ версию составляет от 30,000 до 40,000 долларов, что требует инвестиций в вычислительное оборудование (GPU + сетевые чипы) в размере от 400 до 700 миллионов долларов, в то время как ежемесячные тренировки требуют потребления 1.6 миллиарда киловатт-часов, а расходы на электроэнергию составляют почти 20 миллионов долларов в месяц.

Разгрузка вычислительных мощностей ИИ является одной из первых областей пересечения Web3 и ИИ ------ DePin (децентрализованная сеть физических инфраструктур). В настоящее время на сайте данных DePin Ninja представлено более 1400 проектов, среди которых проекты, представляющие собой совместное использование GPU, включают io.net, Aethir, Akash, Render Network и другие.

Основная логика заключается в том, что платформа позволяет индивидуумам или организациям, обладающим неиспользуемыми ресурсами GPU, вносить свой вычислительный потенциал в децентрализованной форме без разрешения. Это происходит через онлайн-рынок покупателей и продавцов, аналогичный некоторым платформам такси или размещения, что повышает уровень использования не полностью задействованных ресурсов GPU, а конечные пользователи, в свою очередь, получают более доступные и эффективные вычислительные ресурсы. В то же время механизм стейкинга также гарантирует, что в случае нарушения механизмов контроля качества или прерывания сети, поставщики ресурсов понесут соответствующие наказания.

Его особенности заключаются в следующем:

  • Сбор неиспользуемых ресурсов GPU: поставщиками являются в основном независимые малые и средние дата-центры, операторы крипто-майнинга и т.д., избыточные вычислительные ресурсы, а механизм консенсуса - оборудование для майнинга с PoS, такое как майнинг-устройства FileCoin и ETH. В настоящее время также есть проекты, нацеленные на запуск сетей вычислительной мощности с более низким порогом входа, такие как exolab, использующий локальные устройства, такие как MacBook, iPhone, iPad и т.д., для создания сети вычислительных мощностей для выполнения инференса больших моделей.

  • В условиях длинного хвоста рынка вычислительной мощности ИИ:

a. «С точки зрения технологий» децентрализованный рынок вычислительных мощностей лучше подходит для этапов вывода. Обучение больше зависит от вычислительной мощности, предоставляемой сверхбольшими кластерными GPU, в то время как для вывода требования к производительности GPU относительно ниже, как, например, Aethir, который сосредоточен на рендеринге с низкой задержкой и приложениях AI для вывода.

b. С точки зрения потребностей, малые и средние потребители вычислительной мощности не будут отдельно обучать свои большие модели, а просто выберут оптимизацию и дообучение вокруг нескольких ведущих больших моделей, и эти сценарии естественно подходят для распределенных неиспользуемых ресурсов вычислительной мощности.

  • Децентрализованная собственность: технологическое значение блокчейна заключается в том, что владельцы ресурсов всегда сохраняют контроль над своими ресурсами, гибко регулируя их в зависимости от потребностей, одновременно получая доход.

▎данные

Данные являются основой ИИ. Если данных нет, вычисления не имеют никакой пользы, как у плавника на поверхности воды, а отношение между данными и моделью похоже на пословицу "Мусор на входе, мусор на выходе". Количество данных и качество ввода определяют итоговое качество вывода модели. Для обучения современных ИИ-моделей данные определяют языковые способности модели, способности к пониманию, а также ее ценности и человечность. В настоящее время основные проблемы с потребностью в данных для ИИ сосредоточены на следующих четырех аспектах:

  • Жажда данных: Обучение AI-моделей зависит от большого объема входных данных. Официальные данные показывают, что количество параметров, использованных для обучения GPT-4 в одной компании, достигло триллионов.

  • Качество данных: с интеграцией ИИ в различные отрасли, актуальность данных, разнообразие данных, профессионализм вертикальных данных и новые источники данных, такие как анализ настроений в социальных медиа, выдвигают новые требования к их качеству.

  • Проблемы конфиденциальности и соблюдения норм: в настоящее время различные страны и компании постепенно осознают важность качественных наборов данных и вводят ограничения на сбор данных.

  • Высокие затраты на обработку данных: большой объем данных, сложный процесс обработки. Согласно открытым данным, более 30% затрат на исследования и разработки в AI-компаниях идет на сбор и обработку базовых данных.

В настоящее время решения web3 проявляются в следующих четырех аспектах:

  1. Сбор данных: возможность бесплатно предоставлять реальные данные, собранные с помощью парсинга, быстро иссякает, а расходы AI-компаний на покупку данных растут из года в год. Однако одновременно эти расходы не возвращаются к настоящим вкладчикам данных, а платформы полностью наслаждаются созданием ценности от данных, как, например, одна социальная платформа, которая заработала в общей сложности 203 миллиона долларов благодаря подписанию соглашения о лицензировании данных с AI-компанией.

Дать возможность действительно вносящим вклад пользователям участвовать в создании ценностей, возникающих от данных, а также получать более личные и ценные данные с помощью распределенной сети и механизмов стимулов с низкими затратами — это видение Web3.

  • Grass является децентрализованным уровнем данных и сетью, пользователи могут запускать узлы Grass, внося свой вклад в неиспользуемую пропускную способность и релейный трафик для захвата реальных данных из всего интернета и получать токеновые вознаграждения;

  • Vana ввела уникальную концепцию пула ликвидности данных (DLP), позволяя пользователям загружать свои личные данные (такие как записи покупок, привычки просмотра, активность в социальных сетях и т.д.) в определенный DLP и гибко выбирать, разрешать ли использовать эти данные определенным третьим лицам;

  • В PublicAI пользователи могут использовать #AI 或#Web3 в качестве метки категории и @PublicAI на определенной социальной платформе для сбора данных.

  1. Предварительная обработка данных: в процессе обработки данных ИИ, поскольку собранные данные обычно шумные и содержат ошибки, их необходимо очистить и преобразовать в пригодный формат до обучения модели, что включает в себя стандартизацию, фильтрацию и обработку пропущенных значений. Этот этап является одним из немногих ручных процессов в индустрии ИИ, что привело к появлению профессии аннотаторов данных. С повышением требований к качеству данных моделей, порог вхождения для аннотаторов данных также увеличивается, и эта задача естественным образом подходит для децентрализованной системы вознаграждений Web3.
  • В настоящее время Grass и OpenLayer рассматривают возможность включения этапа аннотации данных как ключевого.

  • Synesis представила концепцию «Train2earn», подчеркивая качество данных, пользователи могут получать вознаграждение за предоставление аннотированных данных, комментариев или других форм ввода.

  • Проект по аннотации данных Sapien геймифицирует задачи по маркировке и позволяет пользователям ставить баллы, чтобы зарабатывать больше баллов.

  1. Конфиденциальность и безопасность данных: необходимо прояснить, что конфиденциальность данных и безопасность данных — это две разные концепции. Конфиденциальность данных касается обработки чувствительных данных, тогда как безопасность данных защищает информацию от несанкционированного доступа, уничтожения и кражи. Таким образом, преимущества технологий конфиденциальности Web3 и потенциальные области применения проявляются в двух аспектах: (1) обучение на чувствительных данных; (2) сотрудничество по данным: несколько владельцев данных могут совместно участвовать в обучении ИИ, не делясь своими исходными данными.

Текущие распространенные технологии конфиденциальности в Web3 включают:

  • Доверенная исполняемая среда ( TEE ), например, Super Protocol;

  • Полностью гомоморфное шифрование (FHE), например BasedAI, Fhenix.io или Inco Network;

  • Технология нулевых знаний (zk), такая как Reclaim Protocol, использует технологию zkTLS для генерации доказательства нулевых знаний HTTPS-трафика, что позволяет пользователям безопасно импортировать данные о деятельности, репутации и идентичности с внешних сайтов, не раскрывая конфиденциальную информацию.

Тем не менее, в настоящее время эта область все еще находится на ранней стадии, большинство проектов все еще находятся в стадии исследования, текущая проблема заключается в вычислительных затратах.

Посмотреть Оригинал
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
  • Награда
  • 7
  • Поделиться
комментарий
0/400
pumpamentalistvip
· 07-12 03:49
Эта волна немного хороша! Фиолетовая бутылка~
Посмотреть ОригиналОтветить0
RektDetectivevip
· 07-11 10:52
韭被 разыгрывайте людей как лохов太多 现在都不敢进场了
Посмотреть ОригиналОтветить0
Blockblindvip
· 07-09 18:23
Эта волна была слишком сильной.
Посмотреть ОригиналОтветить0
ConsensusBotvip
· 07-09 18:17
Найти деньги?
Посмотреть ОригиналОтветить0
ZenMinervip
· 07-09 18:08
Долго копать не уставая, если устал, покупай токен
Посмотреть ОригиналОтветить0
EthSandwichHerovip
· 07-09 18:01
Сказать по правде, Web3 с этим ИИ довольно надежен.
Посмотреть ОригиналОтветить0
SignatureDeniedvip
· 07-09 18:01
Монополия является корнем проблемы.
Посмотреть ОригиналОтветить0
  • Закрепить