Challenge : Le Chaos des Données
L'entreprise gérait un catalogue de 800+ références via des exports Excel manuels, provoquant une désynchronisation critique entre les stocks ERP et la vitrine Web. Ce "blackout" rendait impossible le calcul d'un CA fiable.
Désynchronisation Totale
Bases ERP vs Web divergentes.
Incertitude Financière
Marge et CA non auditables.
1200+ Lignes à auditer
Volume de données hétérogènes.
Méthodologie : L'Approche Algorithmique
Réconciliation (Joins)
Utilisation de jointures complexes (Outer/Inner) pour isoler les 111 produits orphelins.
Détection d'Outliers
Implémentation du Z-Score et de l'Écart Interquartile (IQR) pour traquer les prix aberrants.
Rapports d'Anomalies
Rédaction de 3 rapports (Technique, Business, Erreurs) pour sécuriser l'écosystème.
Preuves Techniques & Impact
Visuel A : Distribution Statistique des Prix (Plotly Express)
Utilisation d'une boîte à moustaches (Boxplot) horizontale pour visualiser la dispersion des tarifs. Cette méthode permet d'identifier graphiquement les « points orphelins » situés au-delà des moustaches, signalant des anomalies de saisie ou des produits hors marché.
Visuel B : Matrice de Corrélation : Stocks, Ventes & Prix
Analyse croisée des variables clés via une Heatmap Seaborn. L'étude révèle une corrélation inverse marquée (-0.52) entre le prix et le volume des ventes, confirmant l'élasticité-prix du catalogue.
Identification d'une corrélation modérée (0.44) entre les quantités en stock et les ventes totales, validant la cohérence globale de l'approvisionnement malgré les anomalies de saisie détectées.
KPIs d'Impact
111
Produits Orphelins Identifiés
-635%
Erreur de Marge Corrigée
100%
Intégrité des Flux Restaurée
15%
Stocks Dormants Détectés
Livrables
Documents d'Audit
Rapport d'audit et notebook de nettoyage Python pour reproduire l'analyse