Штучний інтелект та Web3: нові можливості від обчислювальної потужності до стимулювання даних

AI+Web3: Вежа та площа

Укратко

  1. Проекти Web3 з концепцією штучного інтелекту стали привабливими для інвестицій на первинному та вторинному ринках.

  2. Можливості Web3 в індустрії штучного інтелекту проявляються в: використанні розподілених стимулів для координації потенційних постачань у довгому хвості, через дані, зберігання та обчислення; одночасно, створення відкритої моделі та децентралізованого ринку для AI Agent.

  3. ШІ в індустрії Web3 в основному використовується для фінансів на ланцюгу ( криптооплат, торгівлі, аналізу даних ) та допомоги в розробці.

  4. Корисність AI+Web3 проявляється в їхній взаємодоповнювальності: Web3 має надію протистояти централізації AI, AI має надію допомогти Web3 вийти за межі.

! AI+Web3: Вежі та Плази

Вступ

Останні два роки розвиток ШІ, здається, натиснув на кнопку прискорення. Цей метеликовий ефект, спровокований Chatgpt, відкрив новий світ генеративного штучного інтелекту і також спричинив потужний рух у сфері Web3.

Під впливом концепції AI помітно зросли фінансування на ринку криптовалют, що сповільнюється. Згідно зі статистикою медіа, лише в першій половині 2024 року 64 проєкти Web3+AI завершили фінансування, а операційна система на базі штучного інтелекту Zyber365 на етапі A залучила максимальну суму фінансування в 100 мільйонів доларів.

Другорядний ринок став ще більш процвітаючим, дані криптоагрегатора Coingecko показують, що всього за трохи більше року загальна капіталізація сегмента штучного інтелекту досягла 48,5 мільярда доларів, а 24-годинний обсяг торгів наближається до 8,6 мільярда доларів; позитивні новини, пов'язані з прогресом у провідних технологіях штучного інтелекту, очевидні: після випуску моделі перетворення тексту в відео Sora від OpenAI середня ціна в сегменті AI зросла на 151%; ефект AI також поширюється на один з сегментів криптовалют, що залучає капітал - Meme: перша концепція AI Agent, MemeCoin GOAT, швидко стала популярною та отримала оцінку 1,4 мільярда доларів, успішно запустивши бум AI Meme.

Дослідження та теми, пов'язані з AI+Web3, також користуються великою популярністю. Від AI+Depin до AI Memecoin, а потім до поточних AI Agent та AI DAO, емоція FOMO вже не встигає за швидкістю зміни нових наративів.

AI+Web3, ця комбінація термінів, наповнена гарячими грошима, трендовими напрямками та фантазіями майбутнього, неминуче сприймається як шлюб, укладений капіталом, здається, нам важко визначити, під цією розкішною мантією, чи є це справжнім полігоном для спекулянтів, чи це ніч перед світанком вибуху?

Щоб відповісти на це питання, важливе роздуми, яке є ключовим для обох сторін, полягає в тому, чи стане краще з присутністю однієї сторони? Чи можна отримати вигоду з моделі іншої сторони? У цій статті ми також намагаємося подивитися на цю картину, спираючись на досвід попередників: як Web3 може відігравати роль на всіх етапах технологічного стеку AI, і яку нову життєздатність AI може принести Web3?

Частина 1 Які можливості існують у Web3 під управлінням AI?

Перш ніж розглядати цю тему, нам потрібно зрозуміти технологічний стек великих моделей ШІ:

! AI+Web3: Вежі та Квадрати

Викладіть весь процес простішою мовою: «Велика модель» подібна до людського мозку, на ранніх етапах цей мозок належить немовляті, яке тільки-но з'явилося на світ, і йому потрібно спостерігати та сприймати величезну кількість інформації з навколишнього світу, щоб зрозуміти цей світ, це етап «збирання» даних; оскільки комп'ютери не мають людських зорових, слухових та інших сенсорних можливостей, перед навчанням великі обсяги не маркованої інформації ззовні потрібно перетворити за допомогою «попередньої обробки» в формат інформації, зрозумілий і придатний для використання комп'ютером.

Після введення даних ШІ за допомогою «навчання» створює модель, яка має здатність розуміти та прогнозувати, що можна розглядати як процес поступового розуміння та навчання дитини зовнішнього світу. Параметри моделі подібні до мовних навичок дитини, які постійно коригуються в процесі навчання. Коли вміст навчання починає поділятися на категорії або під час спілкування з людьми отримується зворотний зв'язок та коригування, це переходить до етапу «доладження» великої моделі.

Діти, поступово виростаючи і навчаючись говорити, можуть розуміти значення в нових діалогах і висловлювати свої почуття та думки. Цей етап подібний до «інференції» у великих моделях ШІ, де модель може робити прогнози та аналізувати нові мовні та текстові входи. Діти через мовні навички виражають свої почуття, описують об'єкти та вирішують різноманітні проблеми, що також подібно до того, як великі моделі ШІ застосовуються в інференційній фазі для виконання різних специфічних завдань після завершення навчання, таких як класифікація зображень, розпізнавання мови тощо.

А AI Agent, у свою чергу, наближається до наступної форми великої моделі - здатної самостійно виконувати завдання та ставити складні цілі, він не тільки має здатність мислити, але й може запам'ятовувати, планувати та взаємодіяти з світом, використовуючи інструменти.

На даний момент, враховуючи проблеми AI на різних рівнях, Web3 наразі початково сформував багаторівневу, взаємопов'язану екосистему, яка охоплює всі етапи процесу AI-моделей.

Один. Базовий рівень: обчислювальна потужність та дані Airbnb

потужність

На даний момент однією з найбільших витрат AI є обчислювальна потужність та енергія, необхідні для навчання моделей і моделювання висновків.

Один з прикладів - це LLAMA3 від Meta, який потребує 16000 графічних процесорів H100, вироблених NVIDIA(, що є провідним графічним процесором, спеціально розробленим для штучного інтелекту та обчислень високої продуктивності. Навчання займає 30 днів. Ціна за одиницю для версії з 80 ГБ коливається між 30 000 і 40 000 доларів, що потребує інвестицій у комп'ютерне обладнання в розмірі 4-7 мільярдів доларів), GPU+ мережеві чіпи(, при цьому щомісячне навчання вимагає споживання 1,6 мільярда кіловат-годин, а витрати на енергію щомісяця становлять близько 20 мільйонів доларів.

Розвантаження AI обчислювальної потужності є однією з перших областей перетворення Web3 з AI - DePin) децентралізовані фізичні інфраструктурні мережі( на сьогоднішній день сайт DePin Ninja вже представив понад 1400 проектів, серед яких проекти, що представляють спільне використання GPU обчислювальної потужності, включають io.net, Aethir, Akash, Render Network тощо.

Основна логіка полягає в тому, що платформа дозволяє особам або організаціям, які мають невикористані ресурси GPU, без дозволу в децентралізований спосіб вносити свій обчислювальний потенціал. Це робиться через онлайн-ринок покупців і продавців, подібний до Uber або Airbnb, що підвищує використання не повністю використовуваних ресурсів GPU, в результаті чого кінцеві користувачі отримують більш дешеві та ефективні обчислювальні ресурси; одночасно механізм стейкінгу також забезпечує, що у разі порушення механізму контролю якості або переривання мережі, постачальники ресурсів отримують відповідні покарання.

Його особливості полягають у:

  • Збір вільних ресурсів GPU: постачальниками є переважно незалежні малі та середні центри обробки даних, криптомайнерські господарства та інші оператори з надлишковими обчислювальними ресурсами, обладнання для видобутку з механізмом консенсусу PoS, такі як майнери FileCoin та ETH. Наразі також є проекти, які прагнуть запустити обладнання з нижчим порогом входу, такі як exolab, що використовує локальні пристрої, такі як MacBook, iPhone, iPad, для створення мережі обчислювальної потужності для запуску великих моделей інференції.

  • Перед довгим хвостом ринку обчислювальної потужності ШІ:

a. «З технологічної точки зору» децентралізований ринок обчислювальних потужностей більше підходить для етапів висновку. Навчання більше залежить від можливостей обробки даних, які надає надвеликий кластер GPU, тоді як висновок вимагає від GPU відносно нижчої обчислювальної продуктивності, наприклад, Aethir зосереджується на рендерингу з низькою затримкою та AI-висновкових застосуваннях.

b. "Щодо сторони попиту" замовники з малими обчислювальними потужностями не будуть окремо навчати свої великі моделі, а просто оберуть оптимізацію та доопрацювання навколо кількох провідних великих моделей, а ці сценарії природно підходять для розподілених незайнятих обчислювальних ресурсів.

  • Децентралізована власність: технологічне значення блокчейну полягає в тому, що власники ресурсів завжди зберігають контроль над своїми ресурсами, можуть гнучко налаштовувати їх відповідно до потреб і отримувати прибуток.

Дані

Дані є основою штучного інтелекту. Якщо немає даних, обчислення, як плаваючі водорості, абсолютно марні, а зв'язок між даними та моделлю подібний до відомої приказки "Сміття на вході, сміття на виході". Кількість даних та якість вводу визначають якість виходу остаточної моделі. Для навчання сучасних моделей ШІ дані визначають мовні здібності моделі, здатність до розуміння, а також цінності та гуманістичні прояви. Наразі проблеми потреби в даних для ШІ зосереджені на чотирьох основних аспектах:

  • Голод даних: навчання AI-моделей залежить від великої кількості даних. Відкриті дані показують, що OpenAI навчила GPT-4 з параметрами на трильйонному рівні.

  • Якість даних: з розвитком штучного інтелекту і його інтеграцією в різні галузі, актуальність даних, різноманітність даних, спеціалізація вертикальних даних, а також нові джерела даних, такі як емоції з соціальних медіа, ставлять нові вимоги до їхньої якості.

  • Проблеми конфіденційності та відповідності: В даний час різні країни та компанії поступово усвідомлюють важливість якісних наборів даних і вводять обмеження на збори даних.

  • Високі витрати на обробку даних: велика кількість даних, складний процес обробки. Відкриті дані показують, що більше 30% витрат на НДДКР в AI-компаніях ідуть на збір і обробку базових даних.

Наразі рішення web3 втілені в чотирьох основних аспектах:

  1. Збір даних: можливість безкоштовно надавати зібрані дані з реального світу швидко вичерпується, витрати AI-компаній на дані зростають з кожним роком. Але водночас ці витрати не повертаються до справжніх постачальників даних, платформу повністю насолоджуються створенням вартості, яку приносять дані, як, наприклад, одна платформа отримала загальний дохід у 203 мільйони доларів США завдяки укладенню угоди про ліцензування даних з AI-компанією.

Дати можливість справжнім користувачам брати участь у створенні цінності, що виникає з даних, а також отримувати більш приватні та цінні дані від користувачів за допомогою розподілених мереж і механізмів стимулювання з низькими витратами - це бачення Web3.

  • Grass є децентралізованим шаром даних і мережею, користувачі можуть запустити вузли Grass, надаючи невикористовувану пропускну здатність і релейний трафік для збору реальних даних з усього інтернету та отримання токенів у винагороду;

  • Vana впроваджує унікальну концепцію ліквідності даних )DLP(, де користувачі можуть завантажувати свої приватні дані ), такі як історія покупок, звички перегляду, активність у соціальних мережах тощо ( до певного DLP і гнучко вибирати, чи надавати ці дані для використання конкретним третім сторонам;

  • У PublicAI користувачі можуть використовувати )Web3 як категорійний тег у соціальних мережах та @PublicAI для збору даних.

  1. Попередня обробка даних: під час обробки даних в AI, оскільки зібрані дані зазвичай є шумними та містять помилки, їх необхідно очистити та перетворити в придатний формат перед навчанням моделі, що включає стандартизацію, фільтрацію та обробку відсутніх значень, повторюючи ці завдання. Цей етап є одним з небагатьох ручних етапів в AI-індустрії, що призвело до виникнення професії спеціаліста з маркування даних. Оскільки вимоги моделей до якості даних зростають, поріг входу для спеціалістів з маркування даних також підвищується, і це завдання природним чином підходить для децентралізованих механізмів заохочення Web3.
  • Наразі Grass та OpenLayer обидва розглядають можливість додавання ключового етапу маркування даних.

  • Synesis запропонував концепцію «Train2earn», підкреслюючи якість даних, користувачі можуть отримувати винагороду за надання аннотованих даних, коментарів або інших форм внеску.

  • Проект маркування даних Sapien перетворює завдання маркування на гру та дозволяє користувачам ставити бали, щоб заробити більше балів.

  1. Приватність та безпека даних: необхідно прояснити, що приватність та безпека даних – це два різні поняття. Приватність даних стосується обробки чутливих даних, тоді як безпека даних захищає інформацію про дані від несанкціонованого доступу, знищення та крадіжки. Таким чином, переваги технологій приватності Web3 та потенційні сфери їх застосування проявляються в двох аспектах: #AI或#1( навчання чутливих даних; )2( співпраця з даними: кілька власників даних можуть спільно брати участь у навчанні ШІ, не ділячись своїми оригінальними даними.

Серед поширених технологій конфіденційності у Web3 наразі є:

  • Достовірне виконуване середовище)TEE(, наприклад, Super Protocol;

  • Повна гомоморфна криптографія )FHE(, наприклад, BasedAI, Fhenix.io або Inco Network;

  • Технологія нульових знань )zk(, така як Reclaim Protocol, використовує технологію zkTLS для генерації доказів нульового знання для трафіку HTTPS, що дозволяє користувачам безпечно імпортувати активність, репутаційні та ідентифікаційні дані з зовнішніх сайтів, не розкриваючи чутливу інформацію.

Проте, наразі ця сфера все ще перебуває на ранній стадії, більшість проектів ще в процесі дослідження, одним із сучасних викликів є надто високі витрати на обчислення, деякі приклади:

  • zkML фреймворк EZKL потребує близько 80 хвилин, щоб згенерувати доказ для моделі 1M-nanoGPT.

  • Згідно з даними Modulus Labs, витрати zkML перевищують чисті обчислення більш ніж у 1000 разів.

  1. Зберігання даних: Після отримання даних, необхідно мати місце для зберігання даних в ланцюгу, а також LLM, створених за допомогою цих даних. У центрі уваги питання доступності даних )DA(, до оновлення Danksharding в Ethereum, його пропускна здатність становила 0,08 МБ. Тим часом, навчання AI-моделей і реальний інференс зазвичай вимагають пропускної здатності даних від 50 до 100 ГБ на секунду. Така різниця в порядках величини ставить існуючий ланцюг у складне становище.
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • 4
  • Поділіться
Прокоментувати
0/400
DeFiDoctorvip
· 5год тому
Стандартизована перевірка процесів показала, що ці угоди AI+Web3 повинні спостерігатися протягом трьох місяців для оцінки стабільності коду.
Переглянути оригіналвідповісти на0
wrekt_but_learningvip
· 19год тому
Ведмежий ринок також не прокинувся.
Переглянути оригіналвідповісти на0
WenAirdropvip
· 19год тому
gpt сильніше людини, це для нас занадто несправедливо
Переглянути оригіналвідповісти на0
BearMarketBuyervip
· 19год тому
Посмажили на самоті, дивіться AI
Переглянути оригіналвідповісти на0
  • Закріпити