Integración de la IA y Web3: Aplicaciones y oportunidades de la tecnología de Descentralización en cada etapa de la inteligencia artificial

AI+Web3: Torres y Plaza

TL;DR

  1. Los proyectos de Web3 con concepto de IA se convierten en objetivos de atracción de capital en los mercados primario y secundario.

  2. Las oportunidades de Web3 en la industria de la IA se reflejan en: el uso de incentivos distribuidos para coordinar el suministro potencial en la larga cola, abarcando datos, almacenamiento y computación; al mismo tiempo, establecer un modelo de código abierto y un mercado descentralizado para los Agentes de IA.

  3. La principal aplicación de la IA en la industria de Web3 es en las finanzas en cadena (pagos en criptomonedas, transacciones, análisis de datos) y en el desarrollo asistido.

  4. La utilidad de AI+Web3 se refleja en la complementariedad de ambos: Web3 espera contrarrestar la centralización de la IA, y la IA espera ayudar a Web3 a romper barreras.

AI+Web3: Torres y Plazas

Introducción

En los últimos dos años, el desarrollo de la IA ha parecido presionar un botón de aceleración; este efecto mariposa provocado por Chatgpt ha abierto no solo un nuevo mundo de inteligencia artificial generativa, sino que también ha generado un gran impulso en el Web3.

Con el respaldo del concepto de IA, la financiación en el mercado de criptomonedas, que ha ido desacelerándose, ha mejorado notablemente. Las estadísticas muestran que solo en la primera mitad de 2024, un total de 64 proyectos de Web3+IA completaron su financiación, y el sistema operativo basado en inteligencia artificial Zyber365 logró un monto máximo de financiación de 100 millones de dólares en su ronda A.

El mercado secundario está más próspero, los datos de agregación de criptomonedas muestran que en poco más de un año, la capitalización total del sector de IA ha alcanzado los 48.5 mil millones de dólares, con un volumen de transacciones de 24 horas cercano a los 8.6 mil millones de dólares; los beneficios derivados de los avances en tecnologías de IA son evidentes, después del lanzamiento del modelo de OpenAI Sora para convertir texto en video, el precio promedio del sector de IA aumentó un 151%; el efecto de la IA también se ha extendido a uno de los sectores de atracción de capital en criptomonedas, Meme: el primer concepto de MemeCoin con Agent de IA, GOAT, se ha vuelto popular rápidamente y ha alcanzado una valoración de 1.4 mil millones de dólares, provocando un exitoso auge de los Meme de IA.

La investigación y los temas sobre AI+Web3 también son candentes, desde AI+Depin hasta AI Memecoin y ahora AI Agent y AI DAO, la emoción del FOMO ya no puede seguir el ritmo de la rotación de nuevas narrativas.

AI+Web3, esta combinación de términos llena de dinero fácil, oportunidades y fantasías futuras, inevitablemente es vista como un matrimonio arreglado por el capital, parece que es difícil discernir bajo esta hermosa túnica, ¿realmente es el terreno de los especuladores o es la víspera de una explosión en el amanecer?

Para responder a esta pregunta, una reflexión clave para ambas partes es: ¿se volverá mejor con el otro? ¿Se puede beneficiar de los modelos del otro? En este artículo, también intentamos examinar este patrón desde la perspectiva de quienes nos precedieron: ¿cómo puede Web3 desempeñar un papel en cada uno de los componentes de la pila tecnológica de IA, y qué nueva vitalidad puede aportar la IA a Web3?

Parte 1 ¿Qué oportunidades hay en Web3 bajo la pila de IA?

Antes de abordar este tema, necesitamos entender la pila tecnológica de los grandes modelos de IA:

Usando un lenguaje más sencillo para describir todo el proceso: "el gran modelo" es como el cerebro humano. En las primeras etapas, este cerebro pertenece a un bebé que acaba de llegar al mundo, y necesita observar e incorporar una gran cantidad de información del entorno para entender este mundo. Esta es la fase de "recolección" de datos. Dado que las computadoras no tienen los sentidos visuales, auditivos y otros que poseen los humanos, antes del entrenamiento, la gran cantidad de información sin etiquetar del exterior necesita ser transformada a través de "preprocesamiento" en un formato de información que la computadora pueda entender y utilizar.

Después de ingresar los datos, la IA construye un modelo con capacidad de comprensión y predicción a través del "entrenamiento", que se puede considerar como el proceso en el que un bebé gradualmente entiende y aprende sobre el mundo exterior. Los parámetros del modelo son como la capacidad lingüística del bebé que se ajusta continuamente durante el proceso de aprendizaje. Cuando el contenido de aprendizaje comienza a especializarse, o cuando se recibe retroalimentación al comunicarse con otros y se realizan correcciones, se entra en la etapa de "ajuste fino" del gran modelo.

Los niños, a medida que crecen y aprenden a hablar, pueden comprender el significado en nuevas conversaciones y expresar sus propios sentimientos e ideas. Esta etapa es similar a la "razonamiento" de los modelos de IA a gran escala, donde el modelo puede predecir y analizar nuevas entradas de lenguaje y texto. Los bebés expresan sus sentimientos, describen objetos y resuelven diversos problemas a través de su capacidad lingüística, lo cual también es similar a cómo los modelos de IA a gran escala se aplican en la fase de razonamiento para llevar a cabo tareas específicas, como la clasificación de imágenes, el reconocimiento de voz, entre otras.

Y el Agente de IA se acerca más a la próxima forma de los grandes modelos: capaz de ejecutar tareas de forma independiente y perseguir objetivos complejos, no solo tiene capacidad de pensamiento, sino que también puede recordar, planificar y utilizar herramientas para interactuar con el mundo.

Actualmente, en respuesta a los puntos críticos de la IA en diversas capas, Web3 ha comenzado a formar un ecosistema interconectado y de múltiples niveles que abarca todas las etapas del proceso del modelo de IA.

AI+Web3: Torres y Plaza

Uno, Capa Básica: Airbnb de Potencia de Cálculo y Datos

Poder de cómputo

Actualmente, uno de los costos más altos de la IA es la potencia de cálculo y la energía necesarias para entrenar modelos y realizar inferencias.

Un ejemplo es que LLAMA3 de Meta necesita 16,000 H100GPU producidas por NVIDIA (una unidad de procesamiento gráfico de primer nivel diseñada para cargas de trabajo de inteligencia artificial y computación de alto rendimiento). Toma 30 días completar el entrenamiento. El precio unitario de la versión de 80GB oscila entre 30,000 y 40,000 dólares, lo que requiere una inversión en hardware de cálculo de entre 400 y 700 millones de dólares (GPU + chip de red), mientras que el entrenamiento mensual consume 1,600 millones de kilovatios-hora, con gastos energéticos de casi 20 millones de dólares al mes.

La descompresión del poder de cálculo de la IA es precisamente el primer campo donde Web3 se cruza con la IA: DePin (Red de Infraestructura Física Descentralizada). Actualmente, el sitio web de estadísticas de datos ha listado más de 1400 proyectos, entre los cuales los proyectos representativos de compartición de poder de cálculo GPU incluyen io.net, Aethir, Akash, Render Network, entre otros.

Su lógica principal radica en que: la plataforma permite a individuos o entidades que poseen recursos de GPU inactivos contribuir con su capacidad de cálculo de manera descentralizada y sin necesidad de permisos, a través de un mercado en línea para compradores y vendedores similar a Uber o Airbnb, aumentando así la tasa de utilización de los recursos de GPU que no se están utilizando adecuadamente; al mismo tiempo, el mecanismo de staking también garantiza que si se produce una violación de los mecanismos de control de calidad o una interrupción de la red, los proveedores de recursos enfrentan las sanciones correspondientes.

Su característica es que:

  • Reunir recursos de GPU ociosos: los proveedores son principalmente centros de datos independientes de tamaño pequeño y mediano de terceros, operadores de criptomonedas y otros recursos de potencia de cálculo excedente, utilizando hardware de minería con mecanismo de consenso PoS, como las máquinas de minería de FileCoin y ETH. Actualmente, también hay proyectos que buscan iniciar equipos con un umbral más bajo, como exolab, que utiliza dispositivos locales como MacBook, iPhone, iPad, etc., para establecer una red de potencia de cálculo para la inferencia de modelos grandes.

  • Enfrentando el mercado de cola larga de la potencia de cálculo de IA:

a. "Desde el punto de vista técnico", el mercado de potencia de cómputo descentralizado es más adecuado para los pasos de inferencia. El entrenamiento depende más de la capacidad de procesamiento de datos que ofrecen los clústeres de GPU de gran tamaño, mientras que la inferencia tiene un rendimiento computacional relativamente bajo en GPU, como Aethir que se centra en trabajos de renderización de baja latencia y aplicaciones de inferencia de IA.

b. Desde el lado de la demanda, los demandantes de potencia de cómputo de bajo a medio no entrenarán por separado sus propios grandes modelos, sino que simplemente elegirán optimizar y ajustar finamente alrededor de unos pocos grandes modelos destacados, y estos escenarios son naturalmente adecuados para recursos de potencia de cómputo distribuidos e inactivos.

  • Propiedad descentralizada: El significado técnico de la blockchain radica en que los propietarios de recursos siempre mantienen el control sobre sus recursos, ajustando de manera flexible según la demanda y obteniendo beneficios.

Datos

Los datos son la base de la IA. Sin datos, el cálculo es tan inútil como un junco flotante, y la relación entre los datos y el modelo es como dice el refrán: "Garbage in, Garbage out". La cantidad de datos y la calidad de la entrada determinan la calidad de la salida del modelo final. En cuanto al entrenamiento de los modelos de IA actuales, los datos determinan la capacidad lingüística, la capacidad de comprensión, e incluso los valores y la humanización del modelo. Actualmente, las dificultades en la demanda de datos de IA se centran principalmente en los siguientes cuatro aspectos:

  • Hambre de datos: El entrenamiento de modelos de IA depende de una gran cantidad de entradas de datos. Los documentos públicos muestran que OpenAI entrenó GPT-4 con una cantidad de parámetros que alcanza el nivel de billones.

  • Calidad de datos: Con la integración de la IA en diversas industrias, la actualidad de los datos, la diversidad de los datos, la especialización de los datos verticales y la incorporación de nuevas fuentes de datos como las emociones en las redes sociales han planteado nuevos requisitos para su calidad.

  • Problemas de privacidad y cumplimiento: Actualmente, varios países y empresas están comenzando a prestar atención a la importancia de los conjuntos de datos de calidad y están imponiendo restricciones a la recopilación de conjuntos de datos.

  • Costos de procesamiento de datos elevados: gran volumen de datos, proceso de manejo complejo. La información pública muestra que más del 30% de los costos de I+D de las empresas de IA se destinan a la recolección y procesamiento de datos básicos.

Actualmente, las soluciones de web3 se reflejan en los siguientes cuatro aspectos:

  1. Recopilación de datos: La disponibilidad de datos del mundo real que se pueden rastrear de forma gratuita se está agotando rápidamente, y los gastos de las empresas de IA en la compra de datos están aumentando año tras año. Sin embargo, este gasto no está beneficiando a los verdaderos contribuyentes de los datos, ya que las plataformas disfrutan por completo del valor creado por los datos, como Reddit, que logró ingresos totales de 203 millones de dólares a través de acuerdos de autorización de datos con empresas de IA.

El verdadero objetivo de Web3 es permitir que los usuarios que realmente contribuyen participen en la creación de valor que aporta la data, así como obtener datos más privados y valiosos de los usuarios a bajo costo a través de redes distribuidas y mecanismos de incentivos.

  • Grass es una capa de datos y red descentralizada, donde los usuarios pueden contribuir con ancho de banda ocioso y tráfico de retransmisión al ejecutar nodos de Grass para capturar datos en tiempo real de toda la Internet y obtener recompensas en tokens;

  • Vana ha introducido un concepto único de pool de liquidez de datos (DLP), donde los usuarios pueden subir sus datos privados (como registros de compras, hábitos de navegación, actividades en redes sociales, etc.) a un DLP específico y elegir de manera flexible si autorizan a terceros específicos a utilizar esos datos;

  • En PublicAI, los usuarios pueden usar #AI 或#Web3 como etiqueta de clasificación en X y @PublicAI para realizar la recolección de datos.

  1. Preprocesamiento de datos: En el proceso de tratamiento de datos de la IA, dado que los datos recopilados suelen ser ruidosos y contener errores, deben ser limpiados y transformados en un formato utilizable antes de entrenar el modelo, lo que implica tareas repetitivas de normalización, filtrado y manejo de valores faltantes. Esta etapa es uno de los pocos pasos manuales en la industria de la IA, y ha dado origen a la profesión de etiquetadores de datos. A medida que las exigencias de calidad de los datos por parte de los modelos aumentan, también lo hace el umbral para los etiquetadores de datos, y esta tarea se adapta perfectamente al mecanismo de incentivos descentralizados de Web3.
  • Actualmente, Grass y OpenLayer están considerando unirse a esta etapa clave de la anotación de datos.

  • Synesis ha propuesto el concepto de «Train2earn», enfatizando la calidad de los datos. Los usuarios pueden obtener recompensas proporcionando datos etiquetados, comentarios u otras formas de entrada.

  • El proyecto de etiquetado de datos Sapien gamifica las tareas de etiquetado y permite a los usuarios apostar puntos para ganar más puntos.

  1. Privacidad y seguridad de los datos: es necesario aclarar que la privacidad de los datos y la seguridad de los datos son dos conceptos diferentes. La privacidad de los datos se refiere al manejo de datos sensibles, mientras que la seguridad de los datos protege la información contra el acceso, la destrucción y el robo no autorizados. Por lo tanto, las ventajas de la tecnología de privacidad de Web3 y los posibles escenarios de aplicación se manifiestan en dos aspectos: (1) Entrenamiento de datos sensibles; (2) Colaboración de datos: múltiples propietarios de datos pueden participar juntos en el entrenamiento de IA sin necesidad de compartir sus datos originales.

Las tecnologías de privacidad más comunes en Web3 actualmente incluyen:

  • Entornos de ejecución confiables ( TEE ), como Super Protocol;

  • Criptografía homomórfica completa (FHE), por ejemplo, BasedAI, Fhenix.io o Inco Network;

  • La tecnología de conocimiento cero (zk), como el Protocolo Reclaim que utiliza la tecnología zkTLS, genera pruebas de conocimiento cero del tráfico HTTPS, permitiendo a los usuarios importar de manera segura actividades, reputación y datos de identidad desde sitios externos sin exponer información sensible.

Sin embargo, actualmente este campo aún se encuentra en una etapa temprana, la mayoría de los proyectos aún están en exploración, y uno de los dilemas actuales es que los costos de computación son demasiado altos, algunos ejemplos son:

  • El marco zkML EZKL necesita alrededor de 80 minutos.
Ver originales
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
  • Recompensa
  • 6
  • Compartir
Comentar
0/400
HodlKumamonvip
· hace3h
¡Los datos hablan! Este 40% de calidez del mercado ya ha superado el umbral de ansiedad de los osos.
Ver originalesResponder0
GateUser-bd883c58vip
· hace3h
赶紧 introducir una posición囤点 AI Token
Ver originalesResponder0
GasFeeBarbecuevip
· hace3h
Está bastante claro, tarde o temprano la IA tendrá que estar en la cadena.
Ver originalesResponder0
SchroedingerAirdropvip
· hace3h
¿Solo esto? El concepto de IA ya está muy desgastado.
Ver originalesResponder0
MidnightTradervip
· hace3h
Ay, lo único que tiene potencial es que una vez que se acabe el concepto, se despide.
Ver originalesResponder0
BearMarketSagevip
· hace3h
Otra vez con estas tonterías.
Ver originalesResponder0
  • Anclado
Opere con criptomonedas en cualquier momento y lugar
qrCode
Escanee para descargar la aplicación Gate
Comunidad
Español
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)