DATA QUALITY

Bottleneck : Data Audit & Quality Assurance

Sécurisation du Chiffre d'Affaires & Intégrité des Flux

Challenge : Le Chaos des Données

L'entreprise gérait un catalogue de 800+ références via des exports Excel manuels, provoquant une désynchronisation critique entre les stocks ERP et la vitrine Web. Ce "blackout" rendait impossible le calcul d'un CA fiable.

Désynchronisation Totale

Bases ERP vs Web divergentes.

Incertitude Financière

Marge et CA non auditables.

1200+ Lignes à auditer

Volume de données hétérogènes.

Méthodologie : L'Approche Algorithmique

Réconciliation (Joins)

Utilisation de jointures complexes (Outer/Inner) pour isoler les 111 produits orphelins.

Détection d'Outliers

Implémentation du Z-Score et de l'Écart Interquartile (IQR) pour traquer les prix aberrants.

Rapports d'Anomalies

Rédaction de 3 rapports (Technique, Business, Erreurs) pour sécuriser l'écosystème.

Preuves Techniques & Impact

Visuel A : Distribution Statistique des Prix (Plotly Express)

Boxplot Plotly Express - dispersion des tarifs et points orphelins

Utilisation d'une boîte à moustaches (Boxplot) horizontale pour visualiser la dispersion des tarifs. Cette méthode permet d'identifier graphiquement les « points orphelins » situés au-delà des moustaches, signalant des anomalies de saisie ou des produits hors marché.

Visuel B : Matrice de Corrélation : Stocks, Ventes & Prix

Heatmap Seaborn - corrélations stocks, ventes et prix

Analyse croisée des variables clés via une Heatmap Seaborn. L'étude révèle une corrélation inverse marquée (-0.52) entre le prix et le volume des ventes, confirmant l'élasticité-prix du catalogue.

Identification d'une corrélation modérée (0.44) entre les quantités en stock et les ventes totales, validant la cohérence globale de l'approvisionnement malgré les anomalies de saisie détectées.

KPIs d'Impact

111

Produits Orphelins Identifiés

-635%

Erreur de Marge Corrigée

100%

Intégrité des Flux Restaurée

15%

Stocks Dormants Détectés

Livrables

Documents d'Audit

Rapport d'audit et notebook de nettoyage Python pour reproduire l'analyse