Panorama do ecossistema AI+Web3: novas oportunidades desde o compartilhamento de poder de computação até a computação em privacidade

AI+Web3: Torres e Praças

TL;DR

  1. Projetos Web3 com conceito de IA tornam-se alvos de captação de recursos nos mercados primário e secundário.

  2. As oportunidades do Web3 na indústria de IA manifestam-se em: usar incentivos distribuídos para coordenar o potencial de fornecimento na cauda longa ------ através de dados, armazenamento e computação; ao mesmo tempo, estabelecer um modelo de código aberto e um mercado descentralizado para Agentes de IA.

  3. O principal campo de aplicação da IA no setor Web3 é a finança em blockchain (pagamentos em criptomoeda, negociações, análise de dados) e suporte ao desenvolvimento.

  4. A utilidade do AI+Web3 está na complementaridade entre os dois: o Web3 promete combater a centralização da IA, enquanto a IA promete ajudar o Web3 a romper barreiras.

Introdução

Nos últimos dois anos, o desenvolvimento da IA parece ter sido acelerado, e esta onda provocada pelas asas de borboleta do Chatgpt não apenas abriu um novo mundo de inteligência artificial generativa, mas também está gerando uma corrente no Web3 do outro lado.

Com o apoio do conceito de IA, o aumento do financiamento no mercado de criptomoedas, que está em desaceleração, é evidente. De acordo com estatísticas da mídia, apenas no primeiro semestre de 2024, um total de 64 projetos Web3+IA concluíram financiamento, com o sistema operacional baseado em inteligência artificial Zyber365 atingindo o maior valor de financiamento de 100 milhões de dólares na rodada A.

O mercado secundário está mais próspero, com dados do site de agregação de criptomoedas Coingecko mostrando que, em pouco mais de um ano, o valor total de mercado da área de IA atingiu 48,5 bilhões de dólares, com um volume de negociação em 24 horas próximo de 8,6 bilhões de dólares; os benefícios trazidos pelos avanços nas principais tecnologias de IA são evidentes, após o lançamento do modelo de texto para vídeo Sora de uma certa empresa, o preço médio do setor de IA subiu 151%; o efeito da IA também se estendeu a um dos setores de captação de recursos em criptomoedas, Meme: o primeiro conceito de MemeCoin com IA Agent------GOAT rapidamente se tornou popular e alcançou uma avaliação de 1,4 bilhões de dólares, gerando um calor de Meme de IA.

A pesquisa e os tópicos sobre AI+Web3 também estão em alta, desde AI+Depin até AI Memecoin, passando pelos atuais AI Agent e AI DAO, a emoção de FOMO já não consegue acompanhar a velocidade da rotação da nova narrativa.

AI+Web3, esta combinação de termos repleta de dinheiro fácil, oportunidades e fantasias do futuro, é inevitavelmente vista por alguns como um casamento arranjado por capital, e parece difícil distinguir sob este manto deslumbrante, se é realmente o campo dos especuladores ou a véspera de uma explosão ao amanhecer?

Para responder a esta questão, uma reflexão crucial para ambas as partes é: ficará melhor com a outra parte? É possível beneficiar-se do modelo da outra parte? Neste artigo, também tentamos, apoiando-nos nos ombros de gigantes, examinar este padrão: como o Web3 pode desempenhar um papel em várias camadas da pilha de tecnologia de IA e o que a IA pode trazer de novo ao Web3?

AI+Web3: Torres e Praças

Parte.1 Quais são as oportunidades do Web3 sob a pilha de IA?

Antes de abordar este tópico, precisamos entender a pilha tecnológica dos grandes modelos de IA:

Expresse todo o processo em uma linguagem mais simples: "O grande modelo" é como o cérebro humano; nas fases iniciais, esse cérebro pertence a um bebê que acabou de chegar ao mundo e precisa observar e absorver uma vasta quantidade de informações do ambiente para entender este mundo, que é a fase de "coleta" de dados; como os computadores não possuem os sentidos humanos de visão e audição, antes do treinamento, as grandes quantidades de informações não rotuladas do ambiente precisam ser convertidas, através do "pré-processamento", em um formato de informação que o computador possa entender e utilizar.

Após a entrada de dados, a IA construiu um modelo com capacidade de compreensão e previsão através de "treinamento", que pode ser visto como o processo em que um bebê gradualmente entende e aprende sobre o mundo exterior. Os parâmetros do modelo são como a capacidade linguística que o bebê ajusta continuamente durante o processo de aprendizagem. Quando o conteúdo aprendido começa a ser dividido em disciplinas, ou quando há comunicação com outras pessoas e feedback para correção, entra-se na fase de "ajuste fino" do grande modelo.

As crianças, ao crescerem e aprenderem a falar, conseguem entender o significado em novas conversas e expressar seus sentimentos e pensamentos; essa fase é semelhante ao "raciocínio" dos grandes modelos de IA, que são capazes de prever e analisar novas entradas de linguagem e texto. Os bebês expressam sentimentos, descrevem objetos e resolvem vários problemas por meio de suas habilidades linguísticas, o que também é semelhante à aplicação dos grandes modelos de IA na fase de raciocínio em várias tarefas específicas, como classificação de imagens e reconhecimento de voz, após terem sido treinados e colocados em uso.

E o AI Agent está mais próximo da próxima forma dos grandes modelos ------ capaz de executar tarefas de forma independente e buscar objetivos complexos, não apenas com capacidade de raciocínio, mas também com memória, planejamento e capacidade de utilizar ferramentas para interagir com o mundo.

Atualmente, em resposta aos pontos críticos da IA em várias pilhas, o Web3 está a formar, de forma preliminar, um ecossistema interconectado e multi-nível, que abrange todas as fases do processo de modelos de IA.

AI+Web3:Torre e Praça

Uma, camada básica: Airbnb de poder de cálculo e dados

▎Poder de cálculo

Atualmente, um dos maiores custos da IA é a potência computacional e a energia necessárias para treinar e inferir modelos.

Um exemplo é que a LLAMA3 de uma determinada empresa necessita de 16.000 H100GPU produzidos por uma empresa (que é uma unidade de processamento gráfico de ponta projetada para cargas de trabalho de inteligência artificial e computação de alto desempenho). O preço unitário da versão de 80 GB varia entre 30.000 e 40.000 dólares, o que requer um investimento em hardware de computação de 400 a 700 milhões de dólares (GPU + chip de rede). Além disso, a formação mensal consome 1,6 bilhões de quilowatts-hora, com gastos com energia de quase 20 milhões de dólares por mês.

A descompressão da capacidade computacional de IA é, de fato, uma das primeiras áreas de interseção entre Web3 e IA ------ DePin (Rede de Infraestrutura Física Descentralizada). Atualmente, o site de dados DePin Ninja já listou mais de 1400 projetos, entre os quais os projetos representativos de compartilhamento de capacidade GPU incluem io.net, Aethir, Akash, Render Network, entre outros.

A sua principal lógica reside em: a plataforma permite que indivíduos ou entidades com recursos de GPU ociosos contribuam com sua capacidade computacional de forma descentralizada e sem permissão, através de um mercado online de compradores e vendedores semelhante a certas plataformas de transporte ou alojamento, aumentando a taxa de utilização dos recursos de GPU que não estão sendo plenamente aproveitados, e os usuários finais também obtêm assim recursos computacionais eficientes a um custo mais baixo; ao mesmo tempo, o mecanismo de staking também garante que, se ocorrerem violações dos mecanismos de controle de qualidade ou interrupções na rede, os provedores de recursos tenham suas respectivas penalidades.

As suas características são:

  • Agregação de recursos de GPU ociosos: O fornecedor principal são os operadores de centros de dados independentes de pequeno e médio porte, como mineradoras de criptomoedas, com recursos de computação excedentes, e hardware de mineração com mecanismo de consenso PoS, como máquinas de mineração de FileCoin e ETH. Atualmente, também há projetos dedicados a iniciar dispositivos com uma barreira de entrada mais baixa, como o exolab, que utiliza MacBook, iPhone, iPad e outros dispositivos locais para estabelecer uma rede de computação para inferência de grandes modelos.

  • Enfrentando o mercado de cauda longa da capacidade de cálculo de IA:

a. "Em termos de tecnologia", o mercado de poder de computação descentralizado é mais adequado para etapas de inferência. O treinamento depende mais da capacidade de processamento de dados proporcionada por clusters de GPU de escala super grande, enquanto a inferência tem requisitos relativamente baixos de desempenho de computação em GPU, como a Aethir, que se concentra em trabalhos de renderização de baixa latência e aplicações de inferência de IA.

b. Do lado da demanda, os pequenos e médios consumidores de poder computacional não treinarão seus próprios grandes modelos de forma isolada, mas apenas escolherão otimizar e ajustar finamente em torno de alguns grandes modelos, e esses cenários são naturalmente adequados para recursos computacionais ociosos distribuídos.

  • Propriedade descentralizada: O significado técnico da blockchain é que os proprietários de recursos sempre mantêm o controle sobre seus recursos, ajustando-se de forma flexível às necessidades, ao mesmo tempo que obtêm lucros.

▎Dados

Os dados são a base da IA. Sem dados, o cálculo é tão inútil quanto uma planta flutuante, e a relação entre dados e modelos é como diz o provérbio "Garbage in, Garbage out". A quantidade de dados e a qualidade da entrada determinam a qualidade da saída do modelo final. Para o treinamento dos modelos de IA atuais, os dados determinam a capacidade linguística, a capacidade de compreensão, e até mesmo os valores e a humanização do modelo. Atualmente, as dificuldades na demanda por dados para IA concentram-se principalmente em quatro áreas:

  • Fome de dados: O treinamento de modelos de IA depende de grandes volumes de dados. Dados públicos mostram que uma empresa treinou o GPT-4 com um número de parâmetros que chegou à casa dos trilhões.

  • Qualidade dos dados: À medida que a IA se combina com várias indústrias, a atualidade dos dados, a diversidade dos dados, a especialização dos dados verticais e a incorporação de novas fontes de dados, como a emoção nas redes sociais, também impõem novas exigências à sua qualidade.

  • Questões de privacidade e conformidade: Atualmente, vários países e empresas estão gradualmente percebendo a importância de conjuntos de dados de qualidade e estão impondo restrições à coleta de conjuntos de dados.

  • Custo elevado de processamento de dados: grande volume de dados e processo de tratamento complexo. Dados públicos mostram que mais de 30% dos custos de P&D das empresas de IA são utilizados para a coleta e processamento de dados básicos.

Atualmente, as soluções web3 manifestam-se nas seguintes quatro áreas:

  1. Coleta de dados: O fornecimento gratuito de dados do mundo real que podem ser capturados está rapidamente se esgotando, e os gastos das empresas de IA com dados aumentam a cada ano. No entanto, esses gastos não estão retornando aos verdadeiros contribuidores de dados, enquanto as plataformas desfrutam inteiramente da criação de valor que os dados trazem, como uma determinada plataforma de redes sociais que gerou uma receita total de 203 milhões de dólares através de um acordo de autorização de dados com uma empresa de IA.

Permitir que os usuários que realmente contribuem participem na criação de valor trazido pelos dados, bem como obter dados mais privados e valiosos dos usuários de uma forma de baixo custo através de uma rede distribuída e mecanismos de incentivo, é a visão do Web3.

  • O Grass é uma camada de dados e rede descentralizada, onde os usuários podem contribuir com largura de banda ociosa e tráfego de retransmissão executando nós do Grass para capturar dados em tempo real de toda a Internet e receber recompensas em tokens;

  • Vana introduziu um conceito único de pool de liquidez de dados (DLP), onde os usuários podem fazer upload de seus dados privados (como histórico de compras, hábitos de navegação, atividades em redes sociais, etc.) para um DLP específico e escolher de forma flexível se autorizam ou não o uso desses dados por terceiros específicos;

  • No PublicAI, os usuários podem usar #AI 或#Web3 como etiqueta de classificação em uma plataforma social e @PublicAI para realizar a coleta de dados.

  1. Pré-processamento de dados: No processo de tratamento de dados da IA, devido ao fato de que os dados coletados costumam ser ruidosos e conter erros, eles devem ser limpos e convertidos em um formato utilizável antes de treinar o modelo, envolvendo tarefas repetitivas de normalização, filtragem e tratamento de valores ausentes. Esta fase é uma das poucas etapas manuais na indústria de IA, resultando na profissão de rotulador de dados, e à medida que a demanda do modelo pela qualidade dos dados aumenta, o nível de exigência para rotuladores de dados também se eleva, sendo essa tarefa naturalmente adequada para o mecanismo de incentivo descentralizado do Web3.
  • Neste momento, a Grass e a OpenLayer estão a considerar a inclusão da rotulagem de dados nesta fase crítica.

  • A Synesis propôs o conceito de "Train2earn", enfatizando a qualidade dos dados, onde os usuários podem receber recompensas por fornecer dados anotados, comentários ou outras formas de input.

  • O projeto de anotação de dados Sapien gamifica as tarefas de marcação e permite que os usuários empenhem pontos para ganhar mais pontos.

  1. Privacidade e segurança dos dados: É importante esclarecer que privacidade e segurança dos dados são dois conceitos diferentes. A privacidade dos dados envolve o tratamento de dados sensíveis, enquanto a segurança dos dados protege as informações contra acesso, destruição e roubo não autorizados. Assim, as vantagens das tecnologias de privacidade do Web3 e os potenciais cenários de aplicação manifestam-se em dois aspectos: (1) treinamento de dados sensíveis; (2) colaboração de dados: vários proprietários de dados podem participar conjuntamente no treinamento de IA, sem a necessidade de compartilhar seus dados originais.

As tecnologias de privacidade mais comuns no Web3 atualmente incluem:

  • Ambiente de Execução Confiável ( TEE ), como o Super Protocol;

  • Criptografia homomórfica completa (FHE), por exemplo, BasedAI, Fhenix.io ou Inco Network;

  • Tecnologia de conhecimento zero (zk), como o Protocolo Reclaim, utiliza a tecnologia zkTLS para gerar provas de conhecimento zero de tráfego HTTPS, permitindo que os usuários importem com segurança dados de atividades, reputação e identidade de sites externos, sem expor informações sensíveis.

No entanto, atualmente este setor ainda está em fase inicial, a maioria dos projetos ainda está em exploração, e um dos dilemas atuais é o custo computacional.

Ver original
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
  • Recompensa
  • 7
  • Partilhar
Comentar
0/400
pumpamentalistvip
· 07-12 03:49
Esta onda está um pouco boa! Garrafa roxa~
Ver originalResponder0
RektDetectivevip
· 07-11 10:52
韭被 fazer as pessoas de parvas太多 现在都不敢进场了
Ver originalResponder0
Blockblindvip
· 07-09 18:23
Esta onda foi demasiado intensa.
Ver originalResponder0
ConsensusBotvip
· 07-09 18:17
Procurar dinheiro, hmm?
Ver originalResponder0
ZenMinervip
· 07-09 18:08
Cavar por muito tempo e sem descanso, quando cansar, compre moeda.
Ver originalResponder0
EthSandwichHerovip
· 07-09 18:01
Para ser honesto, esta onda de AI no Web3 é bastante confiável.
Ver originalResponder0
SignatureDeniedvip
· 07-09 18:01
O monopólio é a raiz do problema.
Ver originalResponder0
  • Pino
Negocie cripto em qualquer lugar e a qualquer hora
qrCode
Digitalizar para transferir a aplicação Gate
Novidades
Português (Portugal)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)