Stack technique

ComposantTechnologieJustification
Langage de programmationPythonÉcosystème IA/ML le plus mature
Framework d'entraînementUnsloth / PEFT / MLXAuto-adaptation multi-backend, couvrant GPU NVIDIA, Apple Silicon, CPU
Méthode d'entraînementQLoRA (PEFT)Quantification 4 bits, entraînement sur GPU unique, compatible avec le matériel grand public
Format de modèleSafeTensorsSûr (pas de risque pickle), chargement rapide, standard HuggingFace
Runtime d'inférencellama.cpp / OllamaMulti-plateforme, léger, support des modèles quantifiés
Format de configurationYAMLLisible par l'humain, facile à éditer
Gestion des packagespip / condaÉcosystème standard Python