Panorama del ecosistema AI+Web3: nuevas oportunidades desde la Potencia computacional compartida hasta la computación privada

AI+Web3: Torres y plazas

TL;DR

  1. Los proyectos de Web3 con concepto de IA se convierten en objetivos de atracción de capital en los mercados primario y secundario.

  2. Las oportunidades de Web3 en la industria de la IA se manifiestan en: el uso de incentivos distribuidos para coordinar el suministro potencial en la larga cola------a través de datos, almacenamiento y computación; al mismo tiempo, establecer un modelo de código abierto y un mercado descentralizado de Agentes de IA.

  3. La principal área de aplicación de la IA en la industria Web3 es la financiación en cadena (pagos en criptomonedas, transacciones, análisis de datos) y el apoyo al desarrollo.

  4. La utilidad de AI+Web3 se refleja en la complementariedad de ambos: Web3 tiene la esperanza de combatir la centralización de AI, y AI tiene la esperanza de ayudar a Web3 a romper barreras.

Introducción

En los últimos dos años, el desarrollo de la IA ha sido como si se hubiera pulsado un botón de aceleración; esta mariposa que ha agitado Chatgpt no solo ha abierto un nuevo mundo de inteligencia artificial generativa, sino que también ha creado un gran impulso en el Web3 del otro lado.

Con el apoyo del concepto de IA, la financiación en el mercado de criptomonedas, que se ha desacelerado, ha mostrado un notable aumento. Según estadísticas de los medios, solo en la primera mitad de 2024, se han financiado un total de 64 proyectos de Web3+IA, y el sistema operativo basado en inteligencia artificial Zyber365 logró una financiación máxima de 100 millones de dólares en su ronda A.

El mercado secundario es aún más próspero. Según los datos del agregador de criptomonedas Coingecko, en poco más de un año, la capitalización total del sector de IA ha alcanzado los 48.5 mil millones de dólares, con un volumen de transacciones de 8.6 mil millones de dólares en 24 horas; los avances en las tecnologías de IA han traído beneficios evidentes, después del lanzamiento del modelo Sora de conversión de texto a video de una cierta compañía, el precio promedio del sector de IA ha subido un 151%; el efecto de IA también se ha extendido a uno de los sectores de captación de criptomonedas, Meme: el primer concepto de MemeCoin como Agente de IA------GOAT ha ganado rápidamente popularidad y ha alcanzado una valoración de 1.4 mil millones de dólares, iniciando con éxito el auge de los Memes de IA.

La investigación y los temas sobre AI+Web3 también están en auge, desde AI+Depin hasta AI Memecoin y ahora AI Agent y AI DAO, la emoción del FOMO ya no puede seguir el ritmo de la rotación de nuevos relatos.

AI+Web3, esta combinación de términos llena de dinero caliente, oportunidades y fantasías futuras, inevitablemente se ve como un matrimonio concertado por el capital; parece que es difícil distinguir, bajo esta lujosa vestidura, si realmente es el terreno de los especuladores o la víspera de una explosión al amanecer.

Para responder a esta pregunta, una reflexión clave para ambas partes es: ¿mejorará si hay una de la otra? ¿Se puede beneficiar de los patrones del otro? En este artículo, también intentamos examinar este patrón desde la perspectiva de quienes nos precedieron: ¿cómo puede Web3 desempeñar un papel en cada uno de los niveles de la pila tecnológica de IA, y qué nueva vitalidad puede aportar la IA a Web3?

AI+Web3: Torres y Plaza

Parte 1 ¿Cuáles son las oportunidades de Web3 bajo la pila de AI?

Antes de abordar este tema, necesitamos entender la pila tecnológica de los grandes modelos de IA:

Expresado en un lenguaje más simple, el proceso completo es el siguiente: el "modelo grande" es como el cerebro humano. En las primeras etapas, este cerebro pertenece a un bebé que acaba de llegar al mundo, que necesita observar e ingerir una gran cantidad de información del entorno para entender este mundo. Esta es la fase de "recolección" de datos. Dado que las computadoras no poseen los sentidos humanos como la vista y el oído, antes del entrenamiento, la gran cantidad de información no etiquetada del exterior necesita ser convertida a un formato de información que las computadoras pueden entender y utilizar a través del "preprocesamiento".

Después de ingresar los datos, la IA construye un modelo con capacidad de comprensión y predicción a través del "entrenamiento", lo que se puede considerar como el proceso en el que un bebé gradualmente entiende y aprende sobre el mundo exterior. Los parámetros del modelo son como la capacidad lingüística del bebé que se ajusta continuamente durante el proceso de aprendizaje. Cuando el contenido que se aprende comienza a especializarse, o se obtiene retroalimentación a través de la comunicación con otras personas y se realizan correcciones, se entra en la fase de "ajuste fino" del gran modelo.

A medida que los niños crecen y aprenden a hablar, pueden entender el significado en nuevas conversaciones y expresar sus sentimientos e ideas. Esta etapa es similar a la "razonamiento" de los grandes modelos de IA, donde el modelo es capaz de predecir y analizar nuevas entradas de lenguaje y texto. Los bebés expresan sentimientos, describen objetos y resuelven diversos problemas a través de su capacidad lingüística, lo que también es similar a cómo los grandes modelos de IA aplican el razonamiento en diversas tareas específicas, como la clasificación de imágenes y el reconocimiento de voz, una vez que han sido entrenados y puestos en uso.

El Agente de IA se acerca más a la próxima forma de los grandes modelos: capaz de ejecutar tareas de forma independiente y perseguir objetivos complejos, no solo tiene la capacidad de pensamiento, sino que también puede recordar, planificar y utilizar herramientas para interactuar con el mundo.

Actualmente, en respuesta a los puntos críticos de la IA en diversas pilas, Web3 ha comenzado a formar un ecosistema interconectado y multicapas que abarca todas las etapas del proceso de modelos de IA.

AI+Web3: Torres y Plazas

Uno, Capa Básica: Airbnb de Potencia de Cálculo y Datos

▎Poder de cómputo

Actualmente, uno de los costos más altos de la IA es la potencia computacional y la energía necesarias para entrenar modelos y realizar inferencias.

Un ejemplo es que LLAMA3 de una empresa necesita 16,000 H100GPU producidos por otra empresa (que es una unidad de procesamiento gráfico de primer nivel diseñada para cargas de trabajo de inteligencia artificial y computación de alto rendimiento). Se requieren 30 días para completar el entrenamiento. El precio unitario de la versión de 80 GB oscila entre 30,000 y 40,000 dólares, lo que requiere una inversión en hardware de cómputo (GPU + chip de red) de entre 400 y 700 millones de dólares, y al mismo tiempo, el entrenamiento mensual consume 1.6 mil millones de kilovatios hora, con un gasto energético mensual de cerca de 20 millones de dólares.

La descompresión de la potencia de cálculo de la IA es precisamente el primer campo en el que Web3 se cruza con la IA------DePin (red de infraestructura física descentralizada). Actualmente, el sitio de datos DePin Ninja ha listado más de 1400 proyectos, entre los cuales los proyectos representativos de compartición de potencia de GPU incluyen io.net, Aethir, Akash, Render Network, entre otros.

Su lógica principal radica en que: la plataforma permite a individuos o entidades que poseen recursos de GPU ociosos contribuir con su capacidad de cálculo de manera descentralizada y sin necesidad de permisos, a través de un mercado en línea para compradores y vendedores similar a ciertas plataformas de transporte o alojamiento, aumentando así la tasa de utilización de recursos de GPU que no están plenamente aprovechados; además, los usuarios finales obtienen recursos de cálculo eficientes a un costo más bajo; al mismo tiempo, el mecanismo de staking asegura que si se produce una violación del mecanismo de control de calidad o una interrupción de la red, los proveedores de recursos enfrentan las sanciones correspondientes.

Sus características son:

  • Reunir recursos de GPU ociosos: los proveedores son principalmente operadores de centros de datos independientes y de pequeña y mediana escala, así como campos de minería de criptomonedas que tienen recursos de poder de cálculo excedentes, y el mecanismo de consenso es hardware de minería PoS, como mineros de FileCoin y ETH. Actualmente, también hay proyectos dedicados a iniciar dispositivos con un umbral de entrada más bajo, como exolab, que utiliza dispositivos locales como MacBook, iPhone, iPad, etc. para establecer una red de poder de cálculo para la inferencia de grandes modelos.

  • Enfrentando el mercado de cola larga de la potencia de cálculo de IA:

a. "Desde el punto de vista técnico", el mercado de potencia de cálculo descentralizado es más adecuado para los pasos de inferencia. El entrenamiento depende más de la capacidad de procesamiento de datos que brinda un clúster de GPU de gran escala, mientras que la inferencia tiene un rendimiento de cálculo relativamente bajo en GPU, como Aethir que se centra en trabajos de renderizado de baja latencia y aplicaciones de inferencia de IA.

b. Desde la perspectiva de la demanda, los demandantes de baja capacidad de cómputo no entrenarán sus propios modelos grandes, sino que solo elegirán optimizar y ajustar unos pocos modelos grandes líderes, y estos escenarios son naturalmente adecuados para los recursos de cómputo distribuidos y ociosos.

  • Propiedad descentralizada: el significado técnico de la blockchain radica en que los propietarios de los recursos siempre mantienen el control sobre ellos, ajustándose de manera flexible según la demanda, al mismo tiempo que obtienen beneficios.

▎Datos

Los datos son la base de la IA. Sin datos, el cálculo es tan inútil como un lirio flotante, y la relación entre los datos y el modelo es como el dicho "Basura entra, basura sale"; la cantidad de datos y la calidad de la entrada determinan la calidad de salida del modelo final. En el entrenamiento actual de los modelos de IA, los datos determinan la capacidad lingüística, la capacidad de comprensión, e incluso la perspectiva de valores y la representación humanizada del modelo. Actualmente, las dificultades en la demanda de datos de IA se centran principalmente en los siguientes cuatro aspectos:

  • Hambre de datos: El entrenamiento de modelos de IA depende de una gran cantidad de entradas de datos. Los documentos públicos muestran que una empresa entrenó GPT-4 con un volumen de parámetros que alcanzó niveles de billones.

  • Calidad de los datos: A medida que la IA se combina con diversas industrias, la actualidad de los datos, la variedad de datos, la especialización de los datos por sectores y la incorporación de nuevas fuentes de datos, como las emociones en redes sociales, han planteado nuevos requisitos para su calidad.

  • Problemas de privacidad y cumplimiento: Actualmente, los países y empresas están comenzando a reconocer la importancia de los conjuntos de datos de calidad y están imponiendo restricciones a la recopilación de conjuntos de datos.

  • Costos de procesamiento de datos elevados: gran volumen de datos y procesos complejos. Según información pública, más del 30% de los costos de investigación y desarrollo de las empresas de IA se destinan a la recolección y procesamiento de datos básicos.

Actualmente, las soluciones de web3 se manifiestan en los siguientes cuatro aspectos:

  1. Recopilación de datos: La disponibilidad de datos del mundo real que se pueden extraer de forma gratuita se está agotando rápidamente, y los gastos de las empresas de IA por datos están aumentando año tras año. Pero al mismo tiempo, estos gastos no se están revirtiendo a los verdaderos contribuyentes de los datos; las plataformas disfrutan por completo de la creación de valor que aportan los datos, como una plataforma social que generó ingresos por un total de 203 millones de dólares a través de un acuerdo de autorización de datos con una empresa de IA.

Permitir que los usuarios que realmente contribuyen también participen en la creación de valor que aporta los datos, y obtener datos más privados y valiosos de los usuarios de manera económica a través de redes distribuidas y mecanismos de incentivos, es la visión de Web3.

  • Grass es una capa de datos y red descentralizada, los usuarios pueden contribuir con ancho de banda y tráfico de retransmisión en desuso ejecutando nodos de Grass para capturar datos en tiempo real de toda Internet y obtener recompensas en tokens;

  • Vana ha introducido un concepto único de piscina de liquidez de datos (DLP), donde los usuarios pueden subir sus datos privados (como registros de compras, hábitos de navegación, actividades en redes sociales, etc.) a un DLP específico y elegir de manera flexible si autorizan a terceros específicos a utilizar esos datos;

  • En PublicAI, los usuarios pueden usar #AI 或#Web3 como etiqueta de clasificación en una plataforma de redes sociales y @PublicAI para realizar la recolección de datos.

  1. Preprocesamiento de datos: En el proceso de tratamiento de datos de la IA, dado que los datos recopilados suelen ser ruidosos y contener errores, deben limpiarse y transformarse en un formato utilizable antes de entrenar el modelo, lo que implica tareas repetitivas de normalización, filtrado y manejo de valores faltantes. Esta fase es uno de los pocos pasos manuales en la industria de la IA, lo que ha dado lugar a la profesión de etiquetador de datos. A medida que los modelos requieren una mayor calidad de datos, el umbral para los etiquetadores de datos también ha aumentado, y esta tarea se adapta naturalmente al mecanismo de incentivos descentralizados de Web3.
  • Actualmente, Grass y OpenLayer están considerando unirse a esta etapa clave de la anotación de datos.

  • Synesis ha propuesto el concepto de "Train2earn", enfatizando la calidad de los datos, los usuarios pueden obtener recompensas al proporcionar datos etiquetados, comentarios u otras formas de entrada.

  • El proyecto de etiquetado de datos Sapien gamifica las tareas de etiquetado y permite a los usuarios apostar puntos para ganar más puntos.

  1. Privacidad y seguridad de los datos: Es necesario aclarar que la privacidad de los datos y la seguridad son dos conceptos diferentes. La privacidad de los datos se refiere al manejo de datos sensibles, mientras que la seguridad de los datos protege la información contra accesos no autorizados, destrucción y robo. Así, las ventajas de la tecnología de privacidad en Web3 y sus posibles escenarios de aplicación se reflejan en dos aspectos: (1) Entrenamiento de datos sensibles; (2) Colaboración de datos: múltiples propietarios de datos pueden participar conjuntamente en el entrenamiento de IA sin necesidad de compartir sus datos originales.

Las tecnologías de privacidad más comunes en Web3 actualmente incluyen:

  • Entorno de ejecución confiable ( TEE ), como Super Protocol;

  • Cifrado homomórfico completo (FHE), por ejemplo, BasedAI, Fhenix.io o Inco Network;

  • La tecnología de prueba de conocimiento cero (zk), como el Protocolo Reclaim que utiliza la tecnología zkTLS, genera pruebas de conocimiento cero para el tráfico HTTPS, permitiendo a los usuarios importar de manera segura datos de actividades, reputación e identidad desde sitios web externos, sin revelar información sensible.

Sin embargo, en este momento el campo todavía se encuentra en una etapa temprana, la mayoría de los proyectos aún están en exploración, y una de las dificultades actuales es el costo de computación.

Ver originales
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
  • Recompensa
  • 7
  • Compartir
Comentar
0/400
pumpamentalistvip
· 07-12 03:49
¡Esta ola es un poco genial! Botella morada~
Ver originalesResponder0
RektDetectivevip
· 07-11 10:52
tomar a la gente por tonta demasiado, ahora nadie se atreve a entrar en el mercado.
Ver originalesResponder0
Blockblindvip
· 07-09 18:23
Esta ola fue demasiado intensa.
Ver originalesResponder0
ConsensusBotvip
· 07-09 18:17
¿Buscar dinero?
Ver originalesResponder0
ZenMinervip
· 07-09 18:08
Sigue cavando sin descanso, cuando estés cansado, compra moneda.
Ver originalesResponder0
EthSandwichHerovip
· 07-09 18:01
La verdad es que esta ola de IA en Web3 es bastante confiable.
Ver originalesResponder0
SignatureDeniedvip
· 07-09 18:01
El monopolio es la raíz del problema.
Ver originalesResponder0
  • Anclado
Opere con criptomonedas en cualquier momento y lugar
qrCode
Escanee para descargar la aplicación Gate
Comunidad
Español
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)