Tant de multiplicateurs ! C'est génial de voir que Grok2 a été entraîné en utilisant μP.
Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
11 J'aime
Récompense
11
3
Reposter
Partager
Commentaire
0/400
GateUser-26d7f434
· 08-25 07:11
Performance si élevée, ça déchire !
Voir l'originalRépondre0
PrivateKeyParanoia
· 08-25 06:59
Bien qu'il y ait des progrès, cela reste loin de sage.
Tant de multiplicateurs ! C'est génial de voir que Grok2 a été entraîné en utilisant μP.