Détection des faux billets

Utilisation du Machine Learning pour distinguer les vrais billets des contrefaçons

Dans le cadre de ce projet, j’ai développé un modèle de Machine Learning permettant de détecter les faux billets en euros à partir de caractéristiques physiques et statistiques. Ce projet a été réalisé pour l'Organisation nationale de lutte contre le faux-monnayage (ONCFM) afin d’améliorer l’identification des billets contrefaits et réduire les fraudes financières.

Compétences techniques

  • Étape clé pour comprendre la structure des données : nettoyage, visualisation des distributions et détection des corrélations importantes. Utilisation de pandas, seaborn et matplotlib pour extraire des insights avant la modélisation.

  • Mise en place et entraînement de modèles de classification supervisée (Régression Logistique, Random Forest, KNN) et non supervisée (K-means). Comparaison des performances et ajustement des hyperparamètres pour une meilleure précision.

  • Validation de la performance des modèles avec des métriques avancées : analyse de la matrice de confusion pour identifier les faux positifs/négatifs, calcul de l’AUC-ROC pour mesurer la capacité de discrimination du modèle.

  • Traitement et transformation des données avec pandas et NumPy : gestion des valeurs manquantes, standardisation des variables et préparation des datasets pour l'entraînement des modèles.

  • Création de visualisations percutantes avec matplotlib et seaborn pour illustrer les tendances, corrélations et résultats des modèles. Présentation des insights dans un format clair et compréhensible.

Soft Skills

  • Capacité à structurer un problème et à identifier des tendances clés à partir des données. Approche méthodique pour extraire des insights pertinents et guider la prise de décision.

  • Utilisation de l’analyse de données et du Machine Learning pour répondre à des problématiques concrètes. Capacité à tester différentes approches et optimiser les résultats en fonction des contraintes.

  • Savoir expliquer des concepts complexes à un public non technique. Création de rapports clairs et de visualisations impactantes pour rendre les résultats compréhensibles et actionnables.

  • Collaboration avec différentes parties prenantes, capacité à écouter et à adapter son discours. Partage des connaissances et accompagnement des équipes sur l'utilisation des outils d'analyse.


Outils utilisés pour ce projet

  • Python

    Manipulation des données, analyse exploratoire et modélisation Machine Learning.

    Utilisé pour charger, nettoyer et analyser les données avant d’entraîner les modèles de classification.

    Nettoyage et transformation des données avec Pandas.

    Calcul des statistiques descriptives avec NumPy.

    Modélisation des faux billets avec Scikit-learn (Random Forest, K-means, Régression Logistique).

  • Seaborn & Matplotlib

    Création de visualisations pour comprendre les différences entre vrais et faux billets.

    Utilisé pour explorer les relations entre les variables, notamment avec des scatter plots, boxplots et heatmaps.

    Pairplot pour voir comment se distribuent les caractéristiques entre vrais et faux billets.

    Heatmap de corrélation pour identifier les variables les plus influentes.

    Boxplots pour voir les écarts entre les billets authentiques et contrefaits.

  • Scikit-learn

    Entraînement et évaluation des modèles pour prédire si un billet est authentique ou faux.

    Utilisé pour tester et comparer différents algorithmes de classification.

    Régression logistique pour une première approche simple.

    K-means pour essayer une classification non supervisée.

    La régression logistique qui a obtenu le meilleur score avec une précision de 99 %.

    Évaluation avec la courbe ROC-AUC et matrice de confusion.

Suivant
Suivant

Tableau de bord dynamique avec PowerBI