Виклики розвитку Web3 AI: проблеми з високорівневою семантичною узгодженістю та механізмом уваги

robot
Генерація анотацій у процесі

Напрямки розвитку та виклики Web3 AI

Акції NVIDIA знову досягли рекорду, прогрес мультимодальних моделей загострив технологічний бар'єр Web2 AI. Від семантичного вирівнювання до візуального розуміння, від високоразмірних вбудувань до злиття ознак, складні моделі об'єднують різні модальності вираження з безпрецедентною швидкістю, будуючи дедалі закриту AI-територію. Ринок акцій США також висловив оптимізм на практиці, незалежно від того, чи це акції, пов'язані з криптовалютою, чи акції AI, всі вони показали невелику бичачу тенденцію.

Однак, ця хвиля, здається, не має нічого спільного з світом криптовалют. Нещодавні спроби Web3 AI, особливо в дослідженнях в напрямку Agent, мають значні відхилення у напрямку. Спроба зібрати модульну систему в стилі Web2 за допомогою децентралізованої структури є насправді подвійною помилкою технологій та мислення. У сьогоднішньому світі, де модулі сильно взаємопов'язані, розподіл характеристик є надзвичайно нестабільним, а потреба в обчислювальних потужностях дедалі зростає, модульна система в стилі Web3 важко може утриматися на плаву.

Майбутнє Web3 AI не в імітації, а в стратегічному обході. Від семантичного вирівнювання в високих вимірах до інформаційних вузьких місць у механізмі уваги, і до вирівнювання ознак під гетерогенною обчислювальною потужністю, Web3 AI необхідно застосувати тактичну стратегію "села, що оточують місто".

Web3 AI на основі спрощеної багатомодальної моделі, труднощі семантичного вирівнювання призводять до низької продуктивності

У сучасних мультимодальних системах Web2 AI "семантичне вирівнювання" означає відображення інформації з різних модальностей в один і той же семантичний простір, що дозволяє моделі розуміти і порівнювати внутрішній зміст цих різних сигналів. Лише за умови реалізації простору високих вимірів розділення робочих потоків на різні модулі має сенс для зниження витрат і підвищення ефективності. Проте протокол Web3 Agent не може реалізувати простір високих вимірів, оскільки модульність насправді є ілюзією Web3 AI.

Web3 AI вимагає реалізації високорівневого простору, що фактично рівнозначно вимозі до протоколу Agent самостійно розробити всі залучені API інтерфейси, що суперечить його модульній меті. Архітектура високого рівня вимагає єдиного навчання або кооперативної оптимізації від початку до кінця, тоді як концепція "модулі як плагіни" Web3 Agent, навпаки, посилює фрагментацію.

Для реалізації повноцінного інтелектуального агента з бар'єрами в галузі необхідно здійснити кінцеве моделювання, єдине впровадження між модулями, а також систематизовану інженерію для спільного навчання та розгортання. Проте на даний момент на ринку не існує таких проблем, відповідно немає і відповідного попиту.

У низько-вимірному просторі механізм уваги важко точно спроектувати

Високорівневі мультимодальні моделі потребують проектування точних механізмів уваги. Передумовою ефективної роботи механізмів уваги є те, що мультимодальність має високі розміри; у просторі з високими розмірами точний механізм уваги може за найкоротший час знайти найважливішу частину з величезного простору високих вимірів.

Модульна Web3 AI важко реалізувати єдине управління увагою. По-перше, механізм уваги залежить від єдиного простору Query-Key-Value, тоді як незалежні API повертають дані в різних форматах та з різними розподілами, без єдиного шару вбудовування. По-друге, багатоголове увага дозволяє одночасно паралельно звертати увагу на різні джерела інформації на одному і тому ж рівні, тоді як незалежні API часто є лінійними викликами, відсутня паралельна та багатодинамічна важка здатність. Нарешті, справжній механізм уваги буде динамічно розподіляти ваги для кожного елемента на основі загального контексту, тоді як у моделі API модулі можуть бачити тільки свій незалежний контекст під час виклику.

Дискретна модульна збірка призводить до того, що злиття ознак залишаються на поверхневому статичному з'єднанні

Злиття рис можна здійснити на основі вирівнювання та уваги, поєднуючи вектора характеристик, отримані з різних модальностей після обробки, для подальшого використання в нижніх завданнях. Web3 AI, звичайно, залишився на найпростішій стадії з'єднання, оскільки динамічне злиття рис вимагає наявності високорозмірного простору та точного механізму уваги.

Web2 AI схильний до об'єднаного навчання від початку до кінця, тоді як Web3 AI більше покладається на методи складання дискретних модулів. Web2 AI може в реальному часі обчислювати важливість різних ознак на основі контексту та динамічно коригувати стратегії об'єднання, тоді як Web3 AI часто заздалегідь фіксує ваги або використовує прості правила для визначення, чи слід об'єднувати.

Web2 AI відображає всі модальності в тисячах вимірів високовимірного простору, процес злиття включає в себе різні високорівневі взаємодії. На відміну від цього, виходи різних агентів Web3 AI часто містять лише кілька ключових полів або показників, що робить вимірювання характеристик дуже низькими та ускладнює вираження складних міжмодальних зв'язків.

Бар'єри в галузі штучного інтелекту поглиблюються, але болючі моменти ще не з'явилися

Мультимодальна система Web2 AI є надзвичайно великою інженерною справою, яка потребує величезних обсягів даних, потужних обчислювальних ресурсів, сучасних алгоритмів та талановитих фахівців. Така системна робота, що охоплює весь ланцюг та стек, створює значні бар'єри для входження в галузь і формує основну конкурентоспроможність кількох провідних команд.

Web3 AI або будь-який криптовалютний проект, орієнтований на відповідність продукту ринку, повинен застосовувати тактику "села оточують місто". Слід спробувати на малих масштабах у крайових сценаріях, переконавшись у надійності основи, перш ніж чекати на появу основних сценаріїв. Ядро Web3 AI полягає в децентралізації, а його еволюційний шлях проявляється у високій паралельності, низькій зв'язаності та сумісності гетерогенних обчислювальних потужностей.

Наразі бар'єри Web2 AI лише починають формуватися, це рання стадія конкуренції серед провідних компаній. Лише коли вигоди від Web2 AI практично зникнуть, залишені проблеми стануть можливістю для входження Web3 AI. До цього часу нам потрібно уважно розглядати протоколи з потенціалом "сільська місцевість оточує місто", звертаючи увагу на їх здатність постійно ітераційно розвиватися в малих сценах, а також на їх гнучкість для адаптації до різних сценаріїв. Якщо протокол надто залежить від інфраструктури, а мережна архітектура є великою, то ймовірність його вимирання може бути значною.

AGENT-4.47%
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • 7
  • Репост
  • Поділіться
Прокоментувати
0/400
TooScaredToSellvip
· 6год тому
nvda вгору - це правильно.
Переглянути оригіналвідповісти на0
AirdropFatiguevip
· 08-16 07:50
a16z говорить і робити
Переглянути оригіналвідповісти на0
airdrop_whisperervip
· 08-16 07:46
web2 немає шансів, браття, увійти в позицію
Переглянути оригіналвідповісти на0
RektRecoveryvip
· 08-16 07:44
називав цей архітектурний крах місяць тому... web3 + ai = подвійна площа атаки, нульова логіка, чесно кажучи
Переглянути оригіналвідповісти на0
Blockblindvip
· 08-16 07:27
Знову прийшли ті, хто вдає з себе. Булран починається кожного місяця.
Переглянути оригіналвідповісти на0
SleepyValidatorvip
· 08-16 07:26
Слідуйте за братами, щоб прокрутити N-карту.
Переглянути оригіналвідповісти на0
BlindBoxVictimvip
· 08-16 07:25
Знову заплуталися від маркетингового обманщика.
Переглянути оригіналвідповісти на0
  • Закріпити