DataFi: Web3 продвигает новую тенденцию активов данных AI

robot
Генерация тезисов в процессе

Данные как активы: DataFi открывает новое море возможностей

В мире сейчас идет гонка за создание лучших базовых моделей. Хотя вычислительная мощность и архитектура моделей важны, настоящим конкурентным преимуществом являются обучающие данные. Главной новостью в мире ИИ в этом месяце стало то, что Meta продемонстрировала свои силы: Марк Цукерберг активно нанимает талантов и сформировал роскошную команду ИИ, состоящую в основном из китайских исследователей. Возглавляет команду 28-летний Александр Ванг, который создал Scale AI, в настоящее время оцененную в 29 миллиардов долларов, предоставляющую услуги по обработке данных для нескольких конкурирующих гигантов ИИ, включая американские вооруженные силы, OpenAI, Anthropic и Meta. Основной деятельностью Scale AI является предоставление большого количества точных аннотированных данных.

Путь к успеху Scale AI

Причина, по которой Scale AI выделяется среди множества единорогов, заключается в том, что она рано осознала важность данных в индустрии ИИ.

Мощность, модель и данные являются тремя основными столпами AI модели. Если сравнить большую модель с человеком, то модель – это тело, мощность – это пища, а данные – это знания/информация.

В процессе быстрого развития LLM акцент в индустрии сместился от моделей к вычислительной мощности. В настоящее время большинство моделей уже утвердили transformer в качестве основы, иногда появляются такие инновации, как MoE или MoRe; крупные компании либо создают собственные суперкомпьютерные кластеры, либо подписывают долгосрочные соглашения с облачными провайдерами для решения проблем с вычислительной мощностью. После удовлетворения базовых потребностей в вычислительной мощности важность данных постепенно становится более очевидной.

Scale AI стремится создать надежнуюData базу для AI моделей. Их бизнес включает не только добычу существующих данных, но и внимание к долгосрочному бизнесу по генерации данных. Компания формирует команды по обучению AI из экспертов в различных областях, чтобы предоставить более качественные данные для обучения AI моделей.

Данные как актив: DataFi открывает новое голубое море

Два этапа обучения модели

Обучение модели делится на две части: предварительное обучение и дообучение.

Предварительное обучение, аналогичное процессу, через который проходят человеческие младенцы, когда учатся говорить, требует ввода в модель ИИ большого количества текстов, кода и другой информации, собранной из Интернета, чтобы модель могла самостоятельно освоить основные навыки общения.

Финетюнинг аналогичен учебе, обычно есть четкие правильные и неправильные ответы, а также направление. Разные "школы" будут воспитывать "таланты" с разными характеристиками. Мы используем некоторые тщательно подготовленные, целенаправленные наборы данных, чтобы наделить модель необходимыми нам способностями.

Таким образом, нам нужны два типа данных:

  1. Обширные данные, которые не требуют значительной обработки, в основном поступают из данных пауков крупных платформ UGC, открытых баз данных литературы, частных баз данных предприятий и т.д.

  2. Специально разработанные и отобранные профессиональные наборы данных требуют работы по очистке данных, отбору, аннотации, обратной связи от пользователей и т.д.

Эти два типа наборов данных составляют основу AI Data трека. В настоящее время считается, что с постепенным исчезновением преимуществ вычислительной мощности данные станут ключевым фактором для производителей крупных моделей в поддержании конкурентоспособности.

С повышением способности модели разнообразные более тонкие и профессиональные тренировочные данные станут ключевыми факторами, определяющими способности модели. Если сравнить обучение модели с подготовкой мастера боевых искусств, то качественный набор данных — это лучший учебник по боевым искусствам.

В долгосрочной перспективе AI Data является долгосрочной нишей с эффектом снежного кома. С накоплением первоначальных работ данные активы будут иметь способность к сложным процентам, а их ценность будет расти с течением времени.

Данные как актив: DataFi открывает новый голубой океан

Web3 DataFi: Идеальная почва для AI данных

По сравнению с традиционными компаниями по обработке данных, Web3 обладает естественными преимуществами в области AI-данных, что привело к появлению концепции DataFi.

В идеале, преимущества Web3 DataFi включают в себя:

  1. Умные контракты обеспечивают суверенитет данных, безопасность и конфиденциальность
  2. Распределенная архитектура привлекает наиболее подходящую глобальную рабочую силу
  3. Блокчейн предоставляет явные преимущества в стимуляции и расчете
  4. Способствует созданию эффективного и открытого единого рынка данных

Для обычных пользователей DataFi — это самый простой децентрализованный AI проект для участия. Пользователям достаточно просто войти в кошелек, чтобы участвовать в нем, выполняя различные задачи, такие как предоставление данных, оценка моделей, использование AI инструментов для простого творчества, участие в торговле данными и т.д.

Потенциальные проекты Web3 DataFi

В настоящее время несколько проектов DataFi получили крупное финансирование, ниже приведены некоторые из представительных проектов:

  • Sahara AI: стремится создать инфраструктуру и рынок для децентрализованного ИИ
  • Yupp: платформа обратной связи для AI-моделей, собирающая отзывы пользователей о выводах моделей
  • Vana: Превращение личных данных пользователей в цифровые активы, которые можно монетизировать.
  • Chainbase: сосредоточение на данных цепочки, охватывающих более 200 блокчейнов
  • Sapien: Превращение человеческих знаний в качественные данные для обучения ИИ
  • Prisma X: нацелен на создание открытого координационного слоя для роботов
  • Masa: дочерний проект экосистемы Bittensor, предоставляющий доступ к данным в реальном времени
  • Irys: Сосредоточен на программируемом хранении данных и вычислениях
  • ORO: наделение обычных людей возможностью участвовать в вкладе в ИИ
  • Gata: децентрализованный уровень данных, предлагающий множество способов участия в данных

Эти проекты в настоящее время имеют общие низкие барьеры, но с накоплением пользователей и экосистемной привязанности преимущества платформы быстро сформируются. Ранние проекты должны сосредоточиться на стимульных мерах и пользовательском опыте, чтобы привлечь достаточное количество пользователей.

В то же время этим платформам необходимо обратить внимание на то, как управлять человеческими ресурсами, обеспечивать качество данных и избегать явления "плохие деньги вытесняют хорошие", вызванного "помощниками". Некоторые проекты, такие как Sahara и Sapien, уже начали подчеркивать качество данных и стремятся установить долгосрочные и здоровые отношения с пользователями платформы.

Кроме того, повышение прозрачности является одной из текущих проблем, с которыми сталкиваются проекты на блокчейне. Многие проекты все еще должны ускорить шаги к открытости и прозрачности, чтобы способствовать долгосрочному здоровому развитию Web3 DataFi.

Масштабное принятие DataFi необходимо продвигать с двух сторон: во-первых, привлечь достаточное количество индивидуальных пользователей для участия в сборе/генерации данных, чтобы сформировать потребительскую группу для ИИ-экономики; во-вторых, получить признание от основных компаний, поскольку в краткосрочной перспективе они являются основным источником крупных объемов данных.

Данные как актив: DataFi открывает новое голубое море

Заключение

С одной стороны, DataFi - это использование человеческого интеллекта для долгосрочного обучения машинного интеллекта, при этом через смарт-контракты гарантируется доход от человеческого интеллектуального труда, в конечном итоге наслаждаясь вознаграждением от машинного интеллекта.

Для тех, кто испытывает неопределенность в эпоху ИИ или все еще сохраняет идеалы в области блокчейна, следовать за капитальными магнатами и погружаться в DataFi является разумным выбором.

Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • 4
  • Поделиться
комментарий
0/400
SneakyFlashloanvip
· 17ч назад
Боже мой, 28 лет и 290 миллиардов. Мне стоит постараться!
Посмотреть ОригиналОтветить0
MetaMuskRatvip
· 18ч назад
Снова Зак делает что-то забавное, смеюсь до слез.
Посмотреть ОригиналОтветить0
NftDataDetectivevip
· 18ч назад
кажется, цукерберг наконец-то понимает... данные — новая нефть, по факту
Посмотреть ОригиналОтветить0
AirdropChaservip
· 18ч назад
Сидите и смотрите, это действительно денежный проект, пришло время для размещения.
Посмотреть ОригиналОтветить0
  • Закрепить