Contexte
Ce projet m'a permis de me confronter à un challenge de data science sur la fraude, où l'objectif était d'obtenir un benchmark supérieur à 0.14. J'ai utilisé des techniques d'analyse de données et de machine learning pour atteindre cet objectif. Mais j'ai surtout pu progresser sur les algorithmes de gradient boosting. Le challenge est disponible à cette adresse : https://challengedata.ens.fr/participants/challenges/104.
Démarche
- Compréhension des données
- Mise en place de feature engineering
- Choix du modèle de machine learning
- Support de présentation
Outils utilisés
Python
Compétences acquises
- Paramétrage des modèles de boosting.
- Renforcement des connaissances PR_AUC
Exemples de visualisations et livrables
Extrait du support de présentation