BLUEPRINT

Stack technique

Composant	Technologie	Justification
Langage de programmation	Python	Écosystème IA/ML le plus mature
Framework d'entraînement	Unsloth / PEFT / MLX	Auto-adaptation multi-backend, couvrant GPU NVIDIA, Apple Silicon, CPU
Méthode d'entraînement	QLoRA (PEFT)	Quantification 4 bits, entraînement sur GPU unique, compatible avec le matériel grand public
Format de modèle	SafeTensors	Sûr (pas de risque pickle), chargement rapide, standard HuggingFace
Runtime d'inférence	llama.cpp / Ollama	Multi-plateforme, léger, support des modèles quantifiés
Format de configuration	YAML	Lisible par l'humain, facile à éditer
Gestion des packages	pip / conda	Écosystème standard Python