|
Bonjour,
AMD a lancé aujourd'hui un nouveau pilote KB, qui fera partie du pilote Adrenalin Edition 25.8.1, permettant l'exécution locale de Large Language Models (LLMs) à 128 milliards de paramètres sous Windows à l'aide du processeur Ryzen™ AI Max+ 395 128 Go. Cette avancée inclura la prise en charge de Llama 4 Scout 109B de Meta avec une vision complète et le MCP (Model Context Protocol) via llama.cpp + Vulkan, faisant de ce processeur le tout premier modèle grand public capable d'exécuter un modèle de cette taille.
En réaffectant la mémoire RAM du système, une amélioration de la mémoire graphique variable (VGM) d'AMD met à la disposition de l'iGPU jusqu'à 96 Go de mémoire graphique contiguë et dédiée, permettant ainsi à des modèles à grande échelle (128B en 4 bits ou 32B en FP16) de fonctionner localement sans GPU dédié.
Avec le dernier pilote Adrenalin, AMD propose désormais les fonctionnalités suivantes :
-
Le premier PC IA Windows capable d'exécuter Llama 4 Scout 109B localement avec une vision complète et l'utilisation d'outils.
-
Prise en charge de fenêtres avec 256 000 tokens de contexte pour les documents longs, le raisonnement en plusieurs étapes et les flux de travail d'agents IA.
-
Flexibilité pour exécuter une large gamme de modèles, des assistants légers aux outils avancés pour le codage et les tâches visuelles.
Si vous souhaitez en savoir plus, vous pouvez consulter l’article de blog avec des détails techniques ici, ainsi que l’article de blog FAQ ici.
N'hésitez pas à me contacter si vous avez des questions.
Bien cordialement,
|