Los proyectos de Web3 con concepto de IA se han convertido en objetivos de captación de fondos en los mercados primario y secundario.
Las oportunidades de Web3 en la industria de la IA se manifiestan en: utilizar incentivos distribuidos para coordinar el suministro potencial en la cola larga------a través de datos, almacenamiento y computación; al mismo tiempo, establecer un modelo de código abierto y un mercado descentralizado para Agentes de IA.
La principal aplicación de la IA en la industria Web3 es en las finanzas en cadena (pagos en criptomonedas, transacciones, análisis de datos) y en el apoyo al desarrollo.
La utilidad de AI+Web3 se refleja en la complementariedad de ambos: Web3 tiene la esperanza de combatir la centralización de la IA, y la IA tiene la esperanza de ayudar a Web3 a romper barreras.
Introducción
En los últimos dos años, el desarrollo de la IA ha sido como si se hubiera presionado un botón de aceleración; las alas de mariposa agitadas por Chatgpt no solo han abierto un nuevo mundo de inteligencia artificial generativa, sino que también han generado una corriente en Web3 al otro lado.
Bajo el impulso del concepto de IA, la financiación en el mercado de criptomonedas, que se ha desacelerado, muestra un claro repunte. Según estadísticas de los medios, solo en la primera mitad de 2024, se completaron 64 proyectos de Web3+IA en financiamiento, siendo Zyber365, un sistema operativo basado en inteligencia artificial, el que logró un monto máximo de financiamiento de 100 millones de dólares en su ronda A.
El mercado secundario es más próspero, los datos de un sitio web de agregación de criptomonedas muestran que en poco más de un año, la capitalización total del mercado de la pista de IA ha alcanzado los 48,5 mil millones de dólares, con un volumen de transacciones de 8,6 mil millones de dólares en 24 horas; es evidente que los avances en las tecnologías de IA han traído beneficios, después del lanzamiento del modelo de OpenAI Sora para convertir texto en video, el precio promedio del sector de IA ha aumentado un 151%; el efecto de la IA también se ha irradiado a uno de los sectores que atraen capital en criptomonedas, Meme: el primer concepto de MemeCoin de Agente de IA ------ GOAT se ha vuelto popular rápidamente y ha logrado una valoración de 1,4 mil millones de dólares, desencadenando con éxito la fiebre de los Memes de IA.
La investigación y los temas sobre AI+Web3 también son candentes, desde AI+Depin hasta AI Memecoin y ahora AI Agent y AI DAO, la emoción de FOMO ya no puede seguir el ritmo de la rotación de nuevas narrativas.
AI+Web3, esta combinación de términos llena de dinero fácil, oportunidades y fantasías futuras, inevitablemente es vista como un matrimonio arreglado por el capital; parece que es difícil distinguir, bajo esta lujosa vestimenta, si realmente es el escenario de los especuladores o la víspera de una explosión al amanecer.
Para responder a esta pregunta, una reflexión clave para ambas partes es: ¿se volverá mejor con el otro? ¿Se puede beneficiar de los patrones del otro? En este artículo, también intentamos examinar este patrón desde la perspectiva de quienes nos precedieron: ¿cómo puede Web3 desempeñar un papel en cada etapa de la pila tecnológica de IA, y qué nueva vitalidad puede aportar la IA a Web3?
Parte 1 ¿Qué oportunidades hay en Web3 bajo la pila de IA?
Antes de abordar este tema, necesitamos entender la pila tecnológica de los grandes modelos de IA:
Utilizando un lenguaje más sencillo para describir todo el proceso: el "gran modelo" es como el cerebro humano, en sus primeras etapas, este cerebro pertenece a un bebé que acaba de llegar al mundo, necesita observar e incorporar una gran cantidad de información del entorno para entender este mundo, esta es la etapa de "recopilación" de datos; dado que las computadoras no tienen los sentidos de visión y audición humanos, antes del entrenamiento, la gran cantidad de información no etiquetada del exterior necesita ser convertida a través de "preprocesamiento" en un formato de información que la computadora pueda entender y utilizar.
Después de ingresar los datos, la IA construye un modelo con capacidad de comprensión y predicción a través del "entrenamiento", lo que se puede considerar como el proceso mediante el cual un bebé gradualmente comprende y aprende sobre el mundo exterior. Los parámetros del modelo son como la capacidad lingüística que el bebé ajusta continuamente durante su proceso de aprendizaje. Cuando el contenido que se está aprendiendo comienza a especializarse, o cuando se recibe retroalimentación al comunicarse con otros y se realizan correcciones, se entra en la fase de "ajuste fino" del gran modelo.
Los niños, al crecer y aprender a hablar, pueden entender el significado y expresar sus sentimientos e ideas en nuevas conversaciones. Esta etapa es similar al "razonamiento" de los grandes modelos de IA, donde el modelo puede predecir y analizar nuevas entradas de lenguaje y texto. Los bebés utilizan su capacidad lingüística para expresar sentimientos, describir objetos y resolver diversos problemas, lo que también es similar a cómo los grandes modelos de IA aplican el razonamiento en diversas tareas específicas, como la clasificación de imágenes y el reconocimiento de voz, después de completar el entrenamiento y ser utilizados.
Y el Agente AI se acerca más a la próxima forma de un gran modelo------capaz de ejecutar tareas de forma independiente y perseguir objetivos complejos, no solo tiene capacidad de pensamiento, sino que también puede recordar, planificar y utilizar herramientas para interactuar con el mundo.
Actualmente, en respuesta a los puntos críticos de la IA en las diferentes pilas, Web3 ha comenzado a formar un ecosistema multidimensional e interconectado que abarca todas las etapas del proceso de modelos de IA.
Una, Capa Básica: Airbnb de Potencia de Cómputo y Datos
Potencia de cálculo
Actualmente, uno de los mayores costos de la IA es la potencia de cálculo y la energía necesarias para entrenar modelos y hacer inferencias.
Un ejemplo es que el LLAMA3 de Meta necesita 16,000 H100GPU producidas por NVIDIA (que es una unidad de procesamiento gráfico de primera clase diseñada específicamente para cargas de trabajo de inteligencia artificial y computación de alto rendimiento). Toma 30 días completar el entrenamiento. El precio unitario de la versión de 80GB oscila entre 30,000 y 40,000 dólares, lo que requiere una inversión en hardware de computación de entre 400 y 700 millones de dólares (GPU + chip de red), al mismo tiempo, el entrenamiento mensual consume 1,600 millones de kilovatios hora, con gastos energéticos de casi 20 millones de dólares al mes.
Para la descompresión de la potencia de cálculo de la IA, este es precisamente el primer campo donde Web3 se cruza con la IA------DePin (Red de Infraestructura Física Descentralizada). Actualmente, un sitio de datos de DePin ya ha exhibido más de 1400 proyectos, entre los cuales los proyectos representativos de compartición de potencia de GPU incluyen io.net, Aethir, Akash, Render Network, entre otros.
Su lógica principal radica en que: la plataforma permite a individuos o entidades que poseen recursos de GPU ociosos contribuir con su capacidad de cálculo de manera descentralizada y sin necesidad de permisos, a través de un mercado en línea de compradores y vendedores similar a Uber o Airbnb, aumentando la tasa de utilización de los recursos de GPU que no se están utilizando adecuadamente; al mismo tiempo, el mecanismo de staking también garantiza que, si se producen violaciones del mecanismo de control de calidad o interrupciones en la red, los proveedores de recursos enfrentan las sanciones correspondientes.
Su característica es que:
Reunir recursos de GPU ociosos: los proveedores son principalmente centros de datos independientes de tamaño pequeño y mediano, operadores de minería de criptomonedas, etc., que cuentan con recursos de potencia de cálculo excedentes, y el mecanismo de consenso es hardware de minería PoS, como las máquinas de minería de FileCoin y ETH. Actualmente, también hay proyectos dedicados a iniciar equipos con un umbral de entrada más bajo, como exolab, que utiliza dispositivos locales como MacBook, iPhone, iPad, etc., para establecer una red de potencia de cálculo para la inferencia de modelos grandes.
Enfrentando el mercado de cola larga de la potencia de cálculo de IA:
a. Desde el punto de vista técnico, el mercado de potencia de cálculo descentralizado es más adecuado para los pasos de inferencia. El entrenamiento depende más de la capacidad de procesamiento de datos que brinda el GPU a gran escala, mientras que la inferencia requiere un rendimiento de cálculo de GPU relativamente bajo, como Aethir, que se centra en trabajos de renderizado de baja latencia y aplicaciones de inferencia de IA.
b. Desde el lado de la demanda, las pequeñas y medianas empresas que requieren potencia de cálculo no entrenarán sus propios grandes modelos de forma aislada, sino que simplemente elegirán optimizar y ajustar unos pocos grandes modelos líderes, y estos escenarios son naturalmente adecuados para los recursos de potencia de cálculo distribuidos e inactivos.
Propiedad descentralizada: El significado técnico de la blockchain radica en que los propietarios de recursos siempre mantienen el control sobre sus recursos, ajustándolos de manera flexible según la demanda, al mismo tiempo que obtienen beneficios.
Datos
Los datos son la base de la IA. Sin datos, el cálculo es tan inútil como una ramita flotante, y la relación entre los datos y el modelo es como el dicho "basura entra, basura sale"; la cantidad de datos y la calidad de la entrada determinan la calidad de salida del modelo final. Para el entrenamiento de los modelos de IA actuales, los datos determinan la capacidad lingüística del modelo, su capacidad de comprensión, e incluso sus valores y su representación humanizada. Actualmente, las dificultades en la demanda de datos de la IA se centran principalmente en los siguientes cuatro aspectos:
Hambre de datos: El entrenamiento de modelos de IA depende de una gran cantidad de entradas de datos. Los datos públicos muestran que OpenAI entrenó GPT-4 con un número de parámetros que alcanzó el nivel de billones.
Calidad de los datos: Con la integración de la IA en diversas industrias, la actualidad de los datos, la diversidad de los datos, la especialización de los datos verticales y la incorporación de nuevas fuentes de datos, como la emoción en las redes sociales, han planteado nuevos requisitos para su calidad.
Problemas de privacidad y cumplimiento: Actualmente, los países y empresas están comenzando a darse cuenta de la importancia de los conjuntos de datos de alta calidad y están imponiendo restricciones a la recopilación de conjuntos de datos.
Costos de procesamiento de datos elevados: gran volumen de datos y procesos complejos. La información pública muestra que más del 30% de los costos de I+D de las empresas de IA se destinan a la recopilación y procesamiento de datos básicos.
Actualmente, las soluciones de web3 se manifiestan en los siguientes cuatro aspectos:
Recolección de datos: La disponibilidad de datos del mundo real que se pueden extraer de forma gratuita está disminuyendo rápidamente, y el gasto de las empresas de IA en datos está aumentando año tras año. Sin embargo, este gasto no se está reinvirtiendo en los verdaderos contribuyentes de datos, ya que las plataformas disfrutan por completo de la creación de valor que aportan los datos, como Reddit, que generó ingresos por un total de 203 millones de dólares a través de acuerdos de licencia de datos con empresas de IA.
Permitir que los usuarios que realmente contribuyen también participen en la creación de valor que aportan los datos, y obtener datos más privados y valiosos de los usuarios a bajo costo a través de una red distribuida y mecanismos de incentivos, es la visión de Web3.
Grass es una capa de datos y red descentralizada, donde los usuarios pueden contribuir con ancho de banda ocioso y tráfico de retransmisión al ejecutar nodos de Grass para capturar datos en tiempo real de toda la Internet y recibir recompensas en tokens;
Vana ha introducido un concepto único de piscina de liquidez de datos (DLP), donde los usuarios pueden subir sus datos privados (como registros de compras, hábitos de navegación, actividades en redes sociales, etc.) a un DLP específico y elegir de manera flexible si autorizan a terceros específicos a usar esos datos;
En PublicAI, los usuarios pueden usar #AI 或#Web3 como etiqueta de clasificación en X y @PublicAI para realizar la recolección de datos.
Preprocesamiento de datos: En el proceso de manejo de datos de la IA, dado que los datos recopilados suelen ser ruidosos y contener errores, deben limpiarse y transformarse en un formato utilizable antes de entrenar el modelo, lo que implica tareas repetitivas de normalización, filtrado y manejo de valores faltantes. Esta fase es uno de los pocos eslabones manuales en la industria de la IA, y ha dado lugar a la industria de los etiquetadores de datos. A medida que los modelos aumentan sus requisitos de calidad de datos, las barreras de entrada para los etiquetadores de datos también han aumentado, y esta tarea es naturalmente adecuada para el mecanismo de incentivos descentralizados de Web3.
Actualmente, Grass y OpenLayer están considerando unirse a esta etapa clave de etiquetado de datos.
Synesis ha propuesto el concepto de "Train2earn", enfatizando la calidad de los datos, donde los usuarios pueden obtener recompensas al proporcionar datos etiquetados, comentarios u otras formas de entrada.
El proyecto de etiquetado de datos Sapien gamifica las tareas de etiquetado y permite a los usuarios apostar puntos para ganar más puntos.
Privacidad y seguridad de los datos: Es necesario aclarar que la privacidad de los datos y la seguridad de los datos son dos conceptos diferentes. La privacidad de los datos se refiere al manejo de datos sensibles, mientras que la seguridad de los datos protege la información de los datos contra el acceso, destrucción y robo no autorizados. Así, las ventajas de la tecnología de privacidad de Web3 y sus posibles escenarios de aplicación se manifiestan en dos aspectos: (1) Entrenamiento de datos sensibles; (2) Colaboración de datos: múltiples propietarios de datos pueden participar conjuntamente en el entrenamiento de IA sin necesidad de compartir sus datos originales.
Las tecnologías de privacidad más comunes en Web3 incluyen:
Entornos de ejecución confiables ( TEE ), como Super Protocol;
Encriptación homomórfica completa (FHE), como BasedAI, Fhenix.io o Inco Network;
La tecnología de conocimiento cero (zk), como el Protocolo Reclaim que utiliza la tecnología zkTLS, genera pruebas de conocimiento cero para el tráfico HTTPS, permitiendo a los usuarios importar de manera segura actividades, reputación y datos de identidad desde sitios externos sin exponer información sensible.
Sin embargo, actualmente este campo aún se encuentra en una etapa temprana, la mayoría de los proyectos todavía están en exploración, un dilema actual es que el costo de cálculo es demasiado alto, algunos ejemplos son:
zkML框
Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
9 me gusta
Recompensa
9
7
Compartir
Comentar
0/400
NestedFox
· hace15h
¿Ya está en marcha? Ahora todos los proyectos están utilizando IA.
Ver originalesResponder0
TokenToaster
· hace15h
Solo es una moda pasajera.
Ver originalesResponder0
CryptoSurvivor
· hace15h
Esta ola está segura, hagamos más monedas relacionadas con la IA.
Ver originalesResponder0
GateUser-cff9c776
· hace15h
¿Web3 aún quiere salvar la IA? La Descentralización de Schrödinger.
Ver originalesResponder0
DaoGovernanceOfficer
· hace15h
*suspiro* empíricamente hablando, esto es solo teatro de descentralización 2.0
Ver originalesResponder0
GasFeeWhisperer
· hace15h
El mundo Cripto realmente se mueve por todas partes.
Ver originalesResponder0
ShibaOnTheRun
· hace15h
Qué delicioso, ¿quién puede resistir la tentación del dinero?
AI+Web3 fusión: explorando nuevas oportunidades de descentralización y potencia computacional.
AI+Web3: Torres y plazas
TL;DR
Los proyectos de Web3 con concepto de IA se han convertido en objetivos de captación de fondos en los mercados primario y secundario.
Las oportunidades de Web3 en la industria de la IA se manifiestan en: utilizar incentivos distribuidos para coordinar el suministro potencial en la cola larga------a través de datos, almacenamiento y computación; al mismo tiempo, establecer un modelo de código abierto y un mercado descentralizado para Agentes de IA.
La principal aplicación de la IA en la industria Web3 es en las finanzas en cadena (pagos en criptomonedas, transacciones, análisis de datos) y en el apoyo al desarrollo.
La utilidad de AI+Web3 se refleja en la complementariedad de ambos: Web3 tiene la esperanza de combatir la centralización de la IA, y la IA tiene la esperanza de ayudar a Web3 a romper barreras.
Introducción
En los últimos dos años, el desarrollo de la IA ha sido como si se hubiera presionado un botón de aceleración; las alas de mariposa agitadas por Chatgpt no solo han abierto un nuevo mundo de inteligencia artificial generativa, sino que también han generado una corriente en Web3 al otro lado.
Bajo el impulso del concepto de IA, la financiación en el mercado de criptomonedas, que se ha desacelerado, muestra un claro repunte. Según estadísticas de los medios, solo en la primera mitad de 2024, se completaron 64 proyectos de Web3+IA en financiamiento, siendo Zyber365, un sistema operativo basado en inteligencia artificial, el que logró un monto máximo de financiamiento de 100 millones de dólares en su ronda A.
El mercado secundario es más próspero, los datos de un sitio web de agregación de criptomonedas muestran que en poco más de un año, la capitalización total del mercado de la pista de IA ha alcanzado los 48,5 mil millones de dólares, con un volumen de transacciones de 8,6 mil millones de dólares en 24 horas; es evidente que los avances en las tecnologías de IA han traído beneficios, después del lanzamiento del modelo de OpenAI Sora para convertir texto en video, el precio promedio del sector de IA ha aumentado un 151%; el efecto de la IA también se ha irradiado a uno de los sectores que atraen capital en criptomonedas, Meme: el primer concepto de MemeCoin de Agente de IA ------ GOAT se ha vuelto popular rápidamente y ha logrado una valoración de 1,4 mil millones de dólares, desencadenando con éxito la fiebre de los Memes de IA.
La investigación y los temas sobre AI+Web3 también son candentes, desde AI+Depin hasta AI Memecoin y ahora AI Agent y AI DAO, la emoción de FOMO ya no puede seguir el ritmo de la rotación de nuevas narrativas.
AI+Web3, esta combinación de términos llena de dinero fácil, oportunidades y fantasías futuras, inevitablemente es vista como un matrimonio arreglado por el capital; parece que es difícil distinguir, bajo esta lujosa vestimenta, si realmente es el escenario de los especuladores o la víspera de una explosión al amanecer.
Para responder a esta pregunta, una reflexión clave para ambas partes es: ¿se volverá mejor con el otro? ¿Se puede beneficiar de los patrones del otro? En este artículo, también intentamos examinar este patrón desde la perspectiva de quienes nos precedieron: ¿cómo puede Web3 desempeñar un papel en cada etapa de la pila tecnológica de IA, y qué nueva vitalidad puede aportar la IA a Web3?
Parte 1 ¿Qué oportunidades hay en Web3 bajo la pila de IA?
Antes de abordar este tema, necesitamos entender la pila tecnológica de los grandes modelos de IA:
Utilizando un lenguaje más sencillo para describir todo el proceso: el "gran modelo" es como el cerebro humano, en sus primeras etapas, este cerebro pertenece a un bebé que acaba de llegar al mundo, necesita observar e incorporar una gran cantidad de información del entorno para entender este mundo, esta es la etapa de "recopilación" de datos; dado que las computadoras no tienen los sentidos de visión y audición humanos, antes del entrenamiento, la gran cantidad de información no etiquetada del exterior necesita ser convertida a través de "preprocesamiento" en un formato de información que la computadora pueda entender y utilizar.
Después de ingresar los datos, la IA construye un modelo con capacidad de comprensión y predicción a través del "entrenamiento", lo que se puede considerar como el proceso mediante el cual un bebé gradualmente comprende y aprende sobre el mundo exterior. Los parámetros del modelo son como la capacidad lingüística que el bebé ajusta continuamente durante su proceso de aprendizaje. Cuando el contenido que se está aprendiendo comienza a especializarse, o cuando se recibe retroalimentación al comunicarse con otros y se realizan correcciones, se entra en la fase de "ajuste fino" del gran modelo.
Los niños, al crecer y aprender a hablar, pueden entender el significado y expresar sus sentimientos e ideas en nuevas conversaciones. Esta etapa es similar al "razonamiento" de los grandes modelos de IA, donde el modelo puede predecir y analizar nuevas entradas de lenguaje y texto. Los bebés utilizan su capacidad lingüística para expresar sentimientos, describir objetos y resolver diversos problemas, lo que también es similar a cómo los grandes modelos de IA aplican el razonamiento en diversas tareas específicas, como la clasificación de imágenes y el reconocimiento de voz, después de completar el entrenamiento y ser utilizados.
Y el Agente AI se acerca más a la próxima forma de un gran modelo------capaz de ejecutar tareas de forma independiente y perseguir objetivos complejos, no solo tiene capacidad de pensamiento, sino que también puede recordar, planificar y utilizar herramientas para interactuar con el mundo.
Actualmente, en respuesta a los puntos críticos de la IA en las diferentes pilas, Web3 ha comenzado a formar un ecosistema multidimensional e interconectado que abarca todas las etapas del proceso de modelos de IA.
Una, Capa Básica: Airbnb de Potencia de Cómputo y Datos
Potencia de cálculo
Actualmente, uno de los mayores costos de la IA es la potencia de cálculo y la energía necesarias para entrenar modelos y hacer inferencias.
Un ejemplo es que el LLAMA3 de Meta necesita 16,000 H100GPU producidas por NVIDIA (que es una unidad de procesamiento gráfico de primera clase diseñada específicamente para cargas de trabajo de inteligencia artificial y computación de alto rendimiento). Toma 30 días completar el entrenamiento. El precio unitario de la versión de 80GB oscila entre 30,000 y 40,000 dólares, lo que requiere una inversión en hardware de computación de entre 400 y 700 millones de dólares (GPU + chip de red), al mismo tiempo, el entrenamiento mensual consume 1,600 millones de kilovatios hora, con gastos energéticos de casi 20 millones de dólares al mes.
Para la descompresión de la potencia de cálculo de la IA, este es precisamente el primer campo donde Web3 se cruza con la IA------DePin (Red de Infraestructura Física Descentralizada). Actualmente, un sitio de datos de DePin ya ha exhibido más de 1400 proyectos, entre los cuales los proyectos representativos de compartición de potencia de GPU incluyen io.net, Aethir, Akash, Render Network, entre otros.
Su lógica principal radica en que: la plataforma permite a individuos o entidades que poseen recursos de GPU ociosos contribuir con su capacidad de cálculo de manera descentralizada y sin necesidad de permisos, a través de un mercado en línea de compradores y vendedores similar a Uber o Airbnb, aumentando la tasa de utilización de los recursos de GPU que no se están utilizando adecuadamente; al mismo tiempo, el mecanismo de staking también garantiza que, si se producen violaciones del mecanismo de control de calidad o interrupciones en la red, los proveedores de recursos enfrentan las sanciones correspondientes.
Su característica es que:
Reunir recursos de GPU ociosos: los proveedores son principalmente centros de datos independientes de tamaño pequeño y mediano, operadores de minería de criptomonedas, etc., que cuentan con recursos de potencia de cálculo excedentes, y el mecanismo de consenso es hardware de minería PoS, como las máquinas de minería de FileCoin y ETH. Actualmente, también hay proyectos dedicados a iniciar equipos con un umbral de entrada más bajo, como exolab, que utiliza dispositivos locales como MacBook, iPhone, iPad, etc., para establecer una red de potencia de cálculo para la inferencia de modelos grandes.
Enfrentando el mercado de cola larga de la potencia de cálculo de IA:
a. Desde el punto de vista técnico, el mercado de potencia de cálculo descentralizado es más adecuado para los pasos de inferencia. El entrenamiento depende más de la capacidad de procesamiento de datos que brinda el GPU a gran escala, mientras que la inferencia requiere un rendimiento de cálculo de GPU relativamente bajo, como Aethir, que se centra en trabajos de renderizado de baja latencia y aplicaciones de inferencia de IA.
b. Desde el lado de la demanda, las pequeñas y medianas empresas que requieren potencia de cálculo no entrenarán sus propios grandes modelos de forma aislada, sino que simplemente elegirán optimizar y ajustar unos pocos grandes modelos líderes, y estos escenarios son naturalmente adecuados para los recursos de potencia de cálculo distribuidos e inactivos.
Datos
Los datos son la base de la IA. Sin datos, el cálculo es tan inútil como una ramita flotante, y la relación entre los datos y el modelo es como el dicho "basura entra, basura sale"; la cantidad de datos y la calidad de la entrada determinan la calidad de salida del modelo final. Para el entrenamiento de los modelos de IA actuales, los datos determinan la capacidad lingüística del modelo, su capacidad de comprensión, e incluso sus valores y su representación humanizada. Actualmente, las dificultades en la demanda de datos de la IA se centran principalmente en los siguientes cuatro aspectos:
Hambre de datos: El entrenamiento de modelos de IA depende de una gran cantidad de entradas de datos. Los datos públicos muestran que OpenAI entrenó GPT-4 con un número de parámetros que alcanzó el nivel de billones.
Calidad de los datos: Con la integración de la IA en diversas industrias, la actualidad de los datos, la diversidad de los datos, la especialización de los datos verticales y la incorporación de nuevas fuentes de datos, como la emoción en las redes sociales, han planteado nuevos requisitos para su calidad.
Problemas de privacidad y cumplimiento: Actualmente, los países y empresas están comenzando a darse cuenta de la importancia de los conjuntos de datos de alta calidad y están imponiendo restricciones a la recopilación de conjuntos de datos.
Costos de procesamiento de datos elevados: gran volumen de datos y procesos complejos. La información pública muestra que más del 30% de los costos de I+D de las empresas de IA se destinan a la recopilación y procesamiento de datos básicos.
Actualmente, las soluciones de web3 se manifiestan en los siguientes cuatro aspectos:
Permitir que los usuarios que realmente contribuyen también participen en la creación de valor que aportan los datos, y obtener datos más privados y valiosos de los usuarios a bajo costo a través de una red distribuida y mecanismos de incentivos, es la visión de Web3.
Grass es una capa de datos y red descentralizada, donde los usuarios pueden contribuir con ancho de banda ocioso y tráfico de retransmisión al ejecutar nodos de Grass para capturar datos en tiempo real de toda la Internet y recibir recompensas en tokens;
Vana ha introducido un concepto único de piscina de liquidez de datos (DLP), donde los usuarios pueden subir sus datos privados (como registros de compras, hábitos de navegación, actividades en redes sociales, etc.) a un DLP específico y elegir de manera flexible si autorizan a terceros específicos a usar esos datos;
En PublicAI, los usuarios pueden usar #AI 或#Web3 como etiqueta de clasificación en X y @PublicAI para realizar la recolección de datos.
Actualmente, Grass y OpenLayer están considerando unirse a esta etapa clave de etiquetado de datos.
Synesis ha propuesto el concepto de "Train2earn", enfatizando la calidad de los datos, donde los usuarios pueden obtener recompensas al proporcionar datos etiquetados, comentarios u otras formas de entrada.
El proyecto de etiquetado de datos Sapien gamifica las tareas de etiquetado y permite a los usuarios apostar puntos para ganar más puntos.
Las tecnologías de privacidad más comunes en Web3 incluyen:
Entornos de ejecución confiables ( TEE ), como Super Protocol;
Encriptación homomórfica completa (FHE), como BasedAI, Fhenix.io o Inco Network;
La tecnología de conocimiento cero (zk), como el Protocolo Reclaim que utiliza la tecnología zkTLS, genera pruebas de conocimiento cero para el tráfico HTTPS, permitiendo a los usuarios importar de manera segura actividades, reputación y datos de identidad desde sitios externos sin exponer información sensible.
Sin embargo, actualmente este campo aún se encuentra en una etapa temprana, la mayoría de los proyectos todavía están en exploración, un dilema actual es que el costo de cálculo es demasiado alto, algunos ejemplos son: