Le prix de l'action NVIDIA a atteint un nouveau sommet, les avancées des modèles multimodaux approfondissant les barrières technologiques de l'IA Web2. De l'alignement sémantique à la compréhension visuelle, de l'incorporation à haute dimension à la fusion des caractéristiques, des modèles complexes intègrent à une vitesse sans précédent diverses modalités d'expression, construisant un terrain d'IA de plus en plus fermé. Le marché boursier américain a également exprimé son optimisme par des actions concrètes, que ce soit pour les actions liées aux cryptomonnaies ou pour les actions d'IA, toutes ont connu une petite tendance haussière.
Cependant, cette vague semble être sans rapport avec le domaine des cryptomonnaies. Les récentes tentatives de Web3 AI, en particulier dans l'exploration du domaine des Agents, présentent un écart directionnel important. Tenter d'assembler un système modulaire multimodal de style Web2 avec une structure décentralisée représente en réalité un double décalage technologique et de pensée. Dans un contexte où la couplage des modules est extrêmement fort, la distribution des caractéristiques est hautement instable et la demande en puissance de calcul est de plus en plus concentrée, il est difficile pour le modularité multimodale de trouver sa place dans un environnement Web3.
L'avenir de l'IA Web3 ne réside pas dans l'imitation, mais dans des détours stratégiques. De l'alignement sémantique dans des espaces de haute dimension, aux goulets d'étranglement d'information dans les mécanismes d'attention, jusqu'à l'alignement des caractéristiques sous une puissance de calcul hétérogène, l'IA Web3 doit adopter une stratégie tactique de "l'encerclé rural autour de la ville".
Web3 AI basé sur un modèle multimodal aplati, l'alignement sémantique difficile entraîne de faibles performances
Dans les systèmes multimodaux modernes de l'IA Web2, "l'alignement sémantique" fait référence à la cartographie des informations de différentes modalités dans un même espace sémantique, permettant au modèle de comprendre et de comparer les significations sous-jacentes de ces signaux très différents. Ce n'est que dans le cadre de la réalisation d'un espace d'incorporation haute dimension que décomposer le flux de travail en différents modules a un sens en termes de réduction des coûts et d'amélioration de l'efficacité. Cependant, le protocole Web3 Agent ne peut pas réaliser cette haute dimension d'incorporation, car la modularité est en réalité une illusion de l'IA Web3.
Web3 AI exige la réalisation d'un espace multidimensionnel, ce qui équivaut à demander au protocole Agent de développer de manière autonome toutes les interfaces API impliquées, ce qui va à l'encontre de son intention de modularité. L'architecture multidimensionnelle nécessite un entraînement ou une optimisation collaborative de bout en bout, tandis que l'idée de "module égal plugin" du Web3 Agent aggrave plutôt la fragmentation.
Pour réaliser un agent intelligent sur l'ensemble de la chaîne avec des barrières sectorielles, il est nécessaire d'avoir une modélisation conjointe de bout en bout, une intégration unifiée entre les modules, ainsi qu'une ingénierie systématique pour l'entraînement et le déploiement collaboratifs. Cependant, le marché actuel ne présente pas de telles douleurs, et il n'y a donc pas de demande de marché correspondante.
Dans un espace de faible dimension, il est difficile de concevoir avec précision un mécanisme d'attention.
Les modèles multimodaux de haut niveau nécessitent la conception de mécanismes d'attention précis. Le bon fonctionnement des mécanismes d'attention repose sur le fait que les multimodaux possèdent une haute dimension. Dans un espace de haute dimension, un mécanisme d'attention précis peut trouver la partie la plus essentielle dans un vaste espace de haute dimension en un temps record.
La planification de l'attention unifiée est difficile à réaliser avec l'IA Web3 basée sur des modules. Tout d'abord, le mécanisme d'attention dépend d'un espace de Query-Key-Value unifié, tandis que les API indépendantes renvoient chacune des données dans des formats et des distributions différents, sans couche d'intégration unifiée. Ensuite, l'attention multi-tête permet de prêter simultanément attention à différentes sources d'information au même niveau, tandis que les API indépendantes sont souvent appelées de manière linéaire, manquant de capacités parallèles et de pondération dynamique multipath. Enfin, un véritable mécanisme d'attention attribue dynamiquement des poids à chaque élément en fonction du contexte global, tandis que dans le mode API, les modules ne peuvent voir que le contexte indépendant au moment de leur appel.
La modularité discrète entraîne une fusion des caractéristiques qui reste à une simple juxtaposition statique.
La fusion des caractéristiques est une combinaison supplémentaire des vecteurs de caractéristiques obtenus après traitement de différentes modalités, basée sur l'alignement et l'attention, pour une utilisation directe dans les tâches en aval. Web3 AI reste bien sûr à l'étape la plus simple de la concaténation, car la fusion dynamique des caractéristiques nécessite un espace de haute dimension et un mécanisme d'attention précis.
L'IA Web2 a tendance à un entraînement conjoint de bout en bout, tandis que l'IA Web3 adopte davantage une approche de composition de modules discrets. L'IA Web2 est capable de calculer en temps réel les scores d'importance des différentes caractéristiques en fonction du contexte et d'ajuster dynamiquement la stratégie de fusion, tandis que l'IA Web3 fixe souvent les poids à l'avance ou utilise des règles simples pour déterminer s'il faut fusionner.
L'IA Web2 mappe toutes les caractéristiques des modalités dans un espace de haute dimension de milliers de dimensions, le processus de fusion comprenant diverses opérations d'interaction de haut niveau. En revanche, les sorties des différents agents de l'IA Web3 contiennent souvent seulement quelques champs ou indicateurs clés, avec une dimension de caractéristiques très faible, ce qui rend difficile l'expression des relations complexes entre les modalités.
Les barrières dans l'industrie de l'IA se renforcent, mais les points de douleur ne sont pas encore apparus.
Le système multimodal de l'IA Web2 est un projet d'ingénierie extrêmement vaste, nécessitant d'énormes quantités de données, une puissance de calcul puissante, des algorithmes avancés et des talents exceptionnels. Ce travail systémique à l'échelle complète et à l'échelle totale constitue une barrière à l'entrée très forte dans l'industrie et forge également le cœur de la compétitivité des rares équipes de tête.
Les projets de cryptomonnaie visant à s'aligner sur le marché des produits, tels que Web3 AI, doivent adopter la tactique de "l'encerclement des villes par les campagnes". Il est conseillé de tester à petite échelle dans des scénarios périphériques, en s'assurant que les bases sont solides, puis d'attendre l'émergence de scénarios centraux. Le cœur de Web3 AI réside dans la décentralisation, et son chemin d'évolution se traduit par une haute parallélisation, une faible couplage et une compatibilité des puissances de calcul hétérogènes.
Actuellement, les barrières du Web2 AI commencent à peine à se former, c'est une phase précoce de la concurrence entre les grandes entreprises. Ce n'est que lorsque les bénéfices du Web2 AI disparaîtront presque entièrement que les points de douleur laissés derrière seront l'occasion pour le Web3 AI de s'impliquer. Avant cela, nous devons soigneusement identifier les protocoles ayant le potentiel de "encercler les villes depuis la campagne", en nous concentrant sur leur capacité à itérer continuellement dans de petits scénarios et sur leur flexibilité pour s'adapter à différents contextes. Si le protocole lui-même dépend trop des infrastructures et que son architecture réseau est trop complexe, il y a de grandes chances qu'il soit éliminé.
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
21 J'aime
Récompense
21
9
Reposter
Partager
Commentaire
0/400
MemeKingNFT
· Il y a 10h
Gagné à mort, encore des conflits de données. Off-chain, le continent continue de flotter. Attendez patiemment que les marées montent et descendent.
Voir l'originalRépondre0
TooScaredToSell
· Il y a 23h
nvda est en hausse, être haussier est la bonne approche.
Voir l'originalRépondre0
AirdropFatigue
· 08-16 07:50
a16z tient ses promesses
Voir l'originalRépondre0
airdrop_whisperer
· 08-16 07:46
web2 n'est plus un jeu les frères, entrer dans une position
Voir l'originalRépondre0
RektRecovery
· 08-16 07:44
avait prédit cet effondrement architectural il y a des mois... web3 + ia = double de la surface d'attaque, zéro la logique pour être honnête
Voir l'originalRépondre0
Blockblind
· 08-16 07:27
Le x est de retour. Le bull run commence chaque mois.
Voir l'originalRépondre0
SleepyValidator
· 08-16 07:26
J'ai suivi les frères et j'ai pris un N卡.
Voir l'originalRépondre0
BlindBoxVictim
· 08-16 07:25
De nouveau perdu par le héros du marketing qui fait des promesses.
Défis du développement de l'IA Web3 : l'alignement sémantique de haute dimension et le mécanisme d'attention posent problème
Directions et défis du développement de l'IA Web3
Le prix de l'action NVIDIA a atteint un nouveau sommet, les avancées des modèles multimodaux approfondissant les barrières technologiques de l'IA Web2. De l'alignement sémantique à la compréhension visuelle, de l'incorporation à haute dimension à la fusion des caractéristiques, des modèles complexes intègrent à une vitesse sans précédent diverses modalités d'expression, construisant un terrain d'IA de plus en plus fermé. Le marché boursier américain a également exprimé son optimisme par des actions concrètes, que ce soit pour les actions liées aux cryptomonnaies ou pour les actions d'IA, toutes ont connu une petite tendance haussière.
Cependant, cette vague semble être sans rapport avec le domaine des cryptomonnaies. Les récentes tentatives de Web3 AI, en particulier dans l'exploration du domaine des Agents, présentent un écart directionnel important. Tenter d'assembler un système modulaire multimodal de style Web2 avec une structure décentralisée représente en réalité un double décalage technologique et de pensée. Dans un contexte où la couplage des modules est extrêmement fort, la distribution des caractéristiques est hautement instable et la demande en puissance de calcul est de plus en plus concentrée, il est difficile pour le modularité multimodale de trouver sa place dans un environnement Web3.
L'avenir de l'IA Web3 ne réside pas dans l'imitation, mais dans des détours stratégiques. De l'alignement sémantique dans des espaces de haute dimension, aux goulets d'étranglement d'information dans les mécanismes d'attention, jusqu'à l'alignement des caractéristiques sous une puissance de calcul hétérogène, l'IA Web3 doit adopter une stratégie tactique de "l'encerclé rural autour de la ville".
Web3 AI basé sur un modèle multimodal aplati, l'alignement sémantique difficile entraîne de faibles performances
Dans les systèmes multimodaux modernes de l'IA Web2, "l'alignement sémantique" fait référence à la cartographie des informations de différentes modalités dans un même espace sémantique, permettant au modèle de comprendre et de comparer les significations sous-jacentes de ces signaux très différents. Ce n'est que dans le cadre de la réalisation d'un espace d'incorporation haute dimension que décomposer le flux de travail en différents modules a un sens en termes de réduction des coûts et d'amélioration de l'efficacité. Cependant, le protocole Web3 Agent ne peut pas réaliser cette haute dimension d'incorporation, car la modularité est en réalité une illusion de l'IA Web3.
Web3 AI exige la réalisation d'un espace multidimensionnel, ce qui équivaut à demander au protocole Agent de développer de manière autonome toutes les interfaces API impliquées, ce qui va à l'encontre de son intention de modularité. L'architecture multidimensionnelle nécessite un entraînement ou une optimisation collaborative de bout en bout, tandis que l'idée de "module égal plugin" du Web3 Agent aggrave plutôt la fragmentation.
Pour réaliser un agent intelligent sur l'ensemble de la chaîne avec des barrières sectorielles, il est nécessaire d'avoir une modélisation conjointe de bout en bout, une intégration unifiée entre les modules, ainsi qu'une ingénierie systématique pour l'entraînement et le déploiement collaboratifs. Cependant, le marché actuel ne présente pas de telles douleurs, et il n'y a donc pas de demande de marché correspondante.
Dans un espace de faible dimension, il est difficile de concevoir avec précision un mécanisme d'attention.
Les modèles multimodaux de haut niveau nécessitent la conception de mécanismes d'attention précis. Le bon fonctionnement des mécanismes d'attention repose sur le fait que les multimodaux possèdent une haute dimension. Dans un espace de haute dimension, un mécanisme d'attention précis peut trouver la partie la plus essentielle dans un vaste espace de haute dimension en un temps record.
La planification de l'attention unifiée est difficile à réaliser avec l'IA Web3 basée sur des modules. Tout d'abord, le mécanisme d'attention dépend d'un espace de Query-Key-Value unifié, tandis que les API indépendantes renvoient chacune des données dans des formats et des distributions différents, sans couche d'intégration unifiée. Ensuite, l'attention multi-tête permet de prêter simultanément attention à différentes sources d'information au même niveau, tandis que les API indépendantes sont souvent appelées de manière linéaire, manquant de capacités parallèles et de pondération dynamique multipath. Enfin, un véritable mécanisme d'attention attribue dynamiquement des poids à chaque élément en fonction du contexte global, tandis que dans le mode API, les modules ne peuvent voir que le contexte indépendant au moment de leur appel.
La modularité discrète entraîne une fusion des caractéristiques qui reste à une simple juxtaposition statique.
La fusion des caractéristiques est une combinaison supplémentaire des vecteurs de caractéristiques obtenus après traitement de différentes modalités, basée sur l'alignement et l'attention, pour une utilisation directe dans les tâches en aval. Web3 AI reste bien sûr à l'étape la plus simple de la concaténation, car la fusion dynamique des caractéristiques nécessite un espace de haute dimension et un mécanisme d'attention précis.
L'IA Web2 a tendance à un entraînement conjoint de bout en bout, tandis que l'IA Web3 adopte davantage une approche de composition de modules discrets. L'IA Web2 est capable de calculer en temps réel les scores d'importance des différentes caractéristiques en fonction du contexte et d'ajuster dynamiquement la stratégie de fusion, tandis que l'IA Web3 fixe souvent les poids à l'avance ou utilise des règles simples pour déterminer s'il faut fusionner.
L'IA Web2 mappe toutes les caractéristiques des modalités dans un espace de haute dimension de milliers de dimensions, le processus de fusion comprenant diverses opérations d'interaction de haut niveau. En revanche, les sorties des différents agents de l'IA Web3 contiennent souvent seulement quelques champs ou indicateurs clés, avec une dimension de caractéristiques très faible, ce qui rend difficile l'expression des relations complexes entre les modalités.
Les barrières dans l'industrie de l'IA se renforcent, mais les points de douleur ne sont pas encore apparus.
Le système multimodal de l'IA Web2 est un projet d'ingénierie extrêmement vaste, nécessitant d'énormes quantités de données, une puissance de calcul puissante, des algorithmes avancés et des talents exceptionnels. Ce travail systémique à l'échelle complète et à l'échelle totale constitue une barrière à l'entrée très forte dans l'industrie et forge également le cœur de la compétitivité des rares équipes de tête.
Les projets de cryptomonnaie visant à s'aligner sur le marché des produits, tels que Web3 AI, doivent adopter la tactique de "l'encerclement des villes par les campagnes". Il est conseillé de tester à petite échelle dans des scénarios périphériques, en s'assurant que les bases sont solides, puis d'attendre l'émergence de scénarios centraux. Le cœur de Web3 AI réside dans la décentralisation, et son chemin d'évolution se traduit par une haute parallélisation, une faible couplage et une compatibilité des puissances de calcul hétérogènes.
Actuellement, les barrières du Web2 AI commencent à peine à se former, c'est une phase précoce de la concurrence entre les grandes entreprises. Ce n'est que lorsque les bénéfices du Web2 AI disparaîtront presque entièrement que les points de douleur laissés derrière seront l'occasion pour le Web3 AI de s'impliquer. Avant cela, nous devons soigneusement identifier les protocoles ayant le potentiel de "encercler les villes depuis la campagne", en nous concentrant sur leur capacité à itérer continuellement dans de petits scénarios et sur leur flexibilité pour s'adapter à différents contextes. Si le protocole lui-même dépend trop des infrastructures et que son architecture réseau est trop complexe, il y a de grandes chances qu'il soit éliminé.