El auge de AI DePIN: una red GPU descentralizada que transforma la infraestructura computacional

La intersección de la IA y DePIN: el auge de las redes GPU descentralizadas

Recientemente, la IA y DePIN se han convertido en tendencias populares en el ámbito de Web3, con un valor de mercado de 30 mil millones de dólares y 23 mil millones de dólares, respectivamente. Este artículo se centrará en el campo de intersección de ambos, explorando el desarrollo de los protocolos relacionados.

AI y el punto de intersección de DePIN

En la pila tecnológica de la IA, la red DePIN empodera la IA al proporcionar recursos de computación. Debido a la escasez de GPU provocada por las grandes empresas tecnológicas, otros desarrolladores tienen dificultades para obtener suficientes GPU para el cálculo de modelos de IA. La práctica tradicional es optar por proveedores de servicios en la nube centralizados, pero esto requiere firmar contratos a largo plazo poco flexibles y es ineficiente.

DePIN ofrece una alternativa más flexible y rentable, incentivando la contribución de recursos a través de recompensas en tokens. En el ámbito de la IA, DePIN integra los recursos de GPU personales en centros de datos, proporcionando un suministro unificado a los usuarios. Esto no solo brinda a los desarrolladores servicios personalizados bajo demanda, sino que también genera ingresos adicionales para los propietarios de GPU.

Existen varias redes AI DePIN en el mercado, este artículo analizará las funciones, objetivos y logros de cada protocolo, así como las diferencias entre ellos.

Resumen de la red DePIN de IA

Render

Render es el pionero de la red de computación GPU P2P, inicialmente centrado en la renderización de creación de contenido, y luego se expandió a tareas de computación AI mediante la integración de herramientas como Stable Diffusion.

Destacar:

  • Fundada por la empresa OTOY, ganadora del premio Oscar por su tecnología
  • Paramount Pictures, PUBG y otros gigantes de la industria del entretenimiento utilizan su red GPU
  • Colaborar con Stability AI y otros para integrar modelos de IA en flujos de trabajo de renderización de contenido 3D
  • Aprobar múltiples clientes de cálculo, integrar más GPU de redes DePIN.

Akash

Akash se posiciona como una plataforma de "supernube" que soporta almacenamiento, computación GPU y CPU, en sustitución de proveedores de servicios tradicionales como AWS. Utilizando una plataforma de contenedores y nodos de computación gestionados por Kubernetes, se pueden desplegar sin problemas cualquier aplicación nativa de la nube.

Destacar:

  • Dirigido a una amplia gama de tareas computacionales, desde la computación general hasta el alojamiento web.
  • AkashML permite ejecutar más de 15,000 modelos en Hugging Face
  • Aplicaciones como el chatbot LLM de Mistral AI, SDXL de Stability AI, etc.
  • Metaverso, despliegue de IA y plataforma de aprendizaje federado utilizan su Supercloud

io.net

io.net ofrece un clúster de GPU en la nube distribuido, diseñado específicamente para escenarios de IA y ML. Integra recursos de GPU de centros de datos, mineros de criptomonedas y otros sectores.

Destacar:

  • IO-SDK compatible con frameworks como PyTorch, la arquitectura de múltiples capas se puede expandir automáticamente según las necesidades.
  • Soporta la creación de 3 tipos diferentes de clústeres, iniciando en 2 minutos.
  • Colaborar e integrar más recursos GPU con Render, Filecoin y otros.

Gensyn

Gensyn ofrece capacidades de computación GPU centradas en el aprendizaje automático y el aprendizaje profundo. Mejora la eficiencia de verificación a través de mecanismos como la prueba de aprendizaje.

Destacar:

  • El costo por hora de la GPU V100 es de aproximadamente 0.40 dólares, lo que representa un gran ahorro de costos.
  • A través de la apilación de pruebas, se puede ajustar un modelo base preentrenado.
  • El modelo básico será Descentralización, de propiedad global, y ofrecerá funciones adicionales.

Aethir

Aethir está diseñado específicamente para albergar GPU de nivel empresarial, enfocándose en campos intensivos en computación como IA, ML y juegos en la nube. A través de contenedores, se trasladan las cargas de trabajo desde el local a la nube, logrando baja latencia.

Aspectos destacados:

  • Ampliación del servicio de teléfono en la nube, colaboración con APhone para lanzar un teléfono en la nube descentralizado.
  • Establecer una amplia colaboración con gigantes de Web2 como NVIDIA, Super Micro
  • Colaboración con varias empresas como CARV, Magic Eden en el ámbito de Web3

Phala Network

Phala Network como la capa de ejecución de la solución Web3 AI, aborda los problemas de privacidad a través del entorno de ejecución confiable (TEE). Permite que los agentes de IA sean controlados por contratos inteligentes en la cadena.

Destacar:

  • Actuar como un protocolo de coprocesador de cálculo verificable, permitiendo que los agentes de IA utilicen recursos en la cadena.
  • Los contratos de agente de IA se pueden obtener a través de Redpill con LLM de primer nivel como OpenAI.
  • En el futuro, se incorporarán sistemas de múltiples pruebas como zk-proofs, MPC, FHE.
  • Se planea soportar GPU TEE como H100, mejorando la capacidad de cálculo

Comparación de proyectos

| | Render | Akash | io.net | Gensyn | Aethir | Phala | |--------|-------------|-------------------|---------------------|---------|---------------|----------| | Hardware | GPU & CPU | GPU & CPU | GPU & CPU | GPU | GPU | CPU | | Enfoque comercial | Renderizado gráfico y AI | Computación en la nube, renderizado y AI | AI | AI | AI, juegos en la nube y telecomunicaciones | Ejecución de AI en cadena | | Tipo de tarea de IA | Inferencia | Bidireccional | Bidireccional | Entrenamiento | Entrenamiento | Ejecución | | Precio del trabajo | Basado en el rendimiento | Subasta inversa | Precio de mercado | Precio de mercado | Sistema de licitación | Cálculo de derechos | | Blockchain | Solana | Cosmos | Solana | Gensyn | Arbitrum | Polkadot | | Privacidad de datos | Encriptación&Hash | Autenticación mTLS | Encriptación de datos | Mapeo seguro | Encriptación | TEE | | Costos de trabajo | 0.5-5%/trabajo | 20% USDC, 4% AKT | 2% USDC, 0.25% reserva | Baja tarifa | 20%/sesión | Proporcional a la participación | | Seguridad | Prueba de Renderizado | Prueba de Participación | Prueba de Cálculo | Prueba de Participación | Prueba de Capacidad de Renderizado | Heredado de la Cadena Intermedia | | Prueba de finalización | - | - | Prueba de bloqueo temporal | Prueba de aprendizaje | Prueba de trabajo de renderizado | Prueba de TEE | | Garantía de calidad | Mecanismo de disputa | - | - | Verificadores y denuncias | Comprobación de nodos | Prueba remota | | Clúster de GPU | No | Sí | Sí | Sí | Sí | No |

AI y el punto de intersección de DePIN

Importancia

Disponibilidad de clústeres y cálculo paralelo

El marco de computación distribuida implementa un clúster de GPU, proporcionando un entrenamiento más eficiente y mejorando la escalabilidad. Entrenar modelos de IA complejos requiere una gran capacidad de cálculo, que suele depender de la computación distribuida. Por ejemplo, el modelo GPT-4 de OpenAI tiene más de 1.8 billones de parámetros y tarda de 3 a 4 meses, utilizando un clúster de 128 con aproximadamente 25,000 GPUs Nvidia A100.

La mayoría de los proyectos ahora han integrado clústeres para lograr computación paralela. io.net ha colaborado con otros proyectos y ha desplegado más de 3,800 clústeres en el primer trimestre. Render, aunque no soporta clústeres, descompone un solo fotograma para ser procesado simultáneamente en múltiples nodos. Phala actualmente solo soporta CPU, pero permite la clústerización de los trabajadores de CPU.

El marco de clúster es importante para la red de flujos de trabajo de IA, pero la cantidad y el tipo de GPU en clúster que satisfacen las necesidades de los desarrolladores de IA es otro problema.

Privacidad de datos

El desarrollo de modelos de IA requiere grandes conjuntos de datos, que pueden involucrar información sensible. Los métodos de privacidad de datos son cruciales para proteger el control de los datos.

La mayoría de los proyectos utilizan algún tipo de protección criptográfica para la privacidad de los datos. Render utiliza cifrado y hash al publicar los resultados de renderizado. io.net y Gensyn emplean cifrado de datos. Akash utiliza autenticación mTLS, permitiendo solo a proveedores específicos recibir datos.

io.net recientemente colaboró con Mind Network para lanzar la Encriptación Homomórfica Total (FHE), permitiendo el procesamiento directo de datos encriptados. Esto protege la privacidad mejor que las tecnologías de encriptación existentes.

Phala Network introduce un entorno de ejecución confiable ( TEE ), que aísla y previene el acceso o la modificación de datos por parte de fuentes externas. También combina el uso de zk-proofs para integrar programas de RiscZero zkVM.

Prueba de cálculo completada y control de calidad

La prueba de finalización de cálculo demuestra que la GPU se utilizó para el servicio requerido, y la inspección de calidad es beneficiosa para los usuarios.

Gensyn y Aethir generan pruebas de trabajo completadas, io.net demuestra que el rendimiento de la GPU se utiliza adecuadamente. Gensyn y Aethir realizan controles de calidad. Gensyn vuelve a ejecutar algunas pruebas con validadores, y los denunciantes sirven como una verificación adicional. Aethir utiliza puntos de verificación para evaluar la calidad del servicio. Render sugiere utilizar procesos de resolución de disputas para manejar nodos problemáticos. Phala genera pruebas TEE, asegurando que los agentes de IA realicen las operaciones necesarias.

Datos de estadísticas de hardware

| | Render | Akash | io.net | Gensyn | Aethir | Phala | |-------------|--------|-------|--------|------------|------------|--------| | Cantidad de GPU | 5600 | 384 | 38177 | - | 40000+ | - | | Cantidad de CPU | 114 | 14672 | 5433 | - | - | 30000+ | | Cantidad H100/A100 | - | 157 | 2330 | - | 2000+ | - | | Costo H100/hora | - | $1.46 | $1.19 | - | - | - | | Costo A100/hora | - | $1.37 | $1.50 | $0.55 ( estimado ) | $0.33 ( estimado ) | - |

AI y el punto de intersección de DePIN

Demanda de GPU de alto rendimiento

Los modelos de IA tienden a utilizar GPU de alto rendimiento como Nvidia A100 y H100 para el entrenamiento. El rendimiento de inferencia del H100 es 4 veces mayor que el del A100, convirtiéndose en la opción preferida para las grandes empresas que entrenan LLM.

Los proveedores de mercado de GPU descentralizados no solo deben ofrecer precios más bajos, sino también satisfacer la demanda real. En 2023, Nvidia entregó más de 500,000 H100 a grandes empresas tecnológicas, lo que dificultó la obtención de hardware equivalente. Es importante considerar la cantidad de hardware que se puede introducir a bajo costo en el proyecto.

Akash solo tiene un poco más de 150 H100 y A100, mientras que io.net y Aethir tienen más de 2000 cada uno. El entrenamiento de LLM desde cero generalmente requiere de 248 a más de 2000 clústeres de GPU, siendo los dos últimos proyectos más adecuados para el cálculo de modelos grandes.

Actualmente, el costo de los servicios de GPU descentralizados ha caído por debajo del de los servicios centralizados. Gensyn y Aethir afirman que la tarifa de alquiler por hora del hardware de nivel A100 es de menos de 1 dólar, pero aún necesita ser verificado.

Conexiones de red en clústeres de GPU son baratas, pero la memoria es limitada. NVLink permite la comunicación directa entre GPUs, ideal para LLMS con muchos parámetros y grandes conjuntos de datos.

A pesar de ello, la red GPU descentralizada sigue proporcionando una potente capacidad y escalabilidad para la computación distribuida, abriendo la monopolización para construir más casos de uso de IA y ML.

AI y el punto de intersección de DePIN

Proporcionar GPU/CPU de nivel de consumo

La CPU también es muy importante en el entrenamiento de modelos de IA, utilizada para el preprocesamiento de datos y la gestión de memoria. Las GPU de consumo se pueden utilizar para ajustar modelos preentrenados o para entrenamientos a pequeña escala.

Considerando que más del 85% de los consumidores tienen GPU inactivas, proyectos como Render, Akash y io.net también pueden servir a este mercado. Ofrecer estas opciones les permite desarrollar una posición de mercado única, enfocándose en computación intensiva a gran escala, renderizado de pequeña escala general o un modo híbrido.

Conclusión

El campo de DePIN de IA sigue siendo relativamente nuevo y enfrenta desafíos. Por ejemplo, io.net fue acusado de falsificar la cantidad de GPU, y luego resolvió el problema introduciendo la prueba de trabajo.

A pesar de ello, el número de tareas y hardware ejecutados en redes GPU descentralizadas ha aumentado significativamente, destacando el crecimiento de la demanda de alternativas a los servicios en la nube de Web2. El aumento de proveedores de hardware también muestra la oferta que antes no se había aprovechado adecuadamente. Esto demuestra el ajuste del mercado de productos de la red AI DePIN, que aborda de manera efectiva los desafíos de demanda y oferta.

Mirando hacia el futuro, la IA se desarrollará en un próspero mercado de billones de dólares, y estas redes de GPU descentralizadas ofrecerán a los desarrolladores alternativas de computación económicas y eficientes. Al cerrar continuamente la brecha entre la demanda y la oferta, estas redes harán contribuciones significativas al futuro de la IA y la infraestructura de computación.

AI y el punto de intersección de DePIN

AI y el punto de intersección de DePIN

AI y el punto de intersección de DePIN

AI y el punto de convergencia de DePIN

Ver originales
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
  • Recompensa
  • 4
  • Compartir
Comentar
0/400
MEVHuntervip
· hace13h
inversor minorista también puede tener su parte
Ver originalesResponder0
LiquidationWatchervip
· hace13h
Una buena oportunidad
Ver originalesResponder0
GateUser-4745f9cevip
· hace13h
Resolvió la ansiedad de recursos.
Ver originalesResponder0
SandwichHuntervip
· hace13h
Es un buen momento para comprar tarjetas de minería.
Ver originalesResponder0
  • Anclado
Opere con criptomonedas en cualquier momento y lugar
qrCode
Escanee para descargar la aplicación Gate
Comunidad
Español
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)