Contexte
Ce projet m'a permis de renforcer mes compétences en analyse de données et de découvrire les statistiques inférentielles et tests d'hypothèse.
Selon le type de données, Quantitative, Qualitative, mettre en place le choix du test statistique pour confirmer les hypothèses H0, H1 à l'aide de la p_value.
Ce projet m'a permis de comprendre la analyse statistique, et de vérifier leur mise en application par des exemples concrets selon différents type de données.
Une première approche avant la mise en apprentissage du machine learning
Démarche
- Analyse, nettoyage et agrégation des données de 3 sources
- Création de différents type de graphiques.
- Choix des graphiques pertinants.
- Support de présentation à destination de neophyte en analyse statistiques.
Outils utilisés
Python, librairie Statistique scypy, mise en graphique avec Seaborn et Matplotlib
Compétences acquises
- Choix des tests statistiques avec Chi-2, fisher, Pearson, Spearman, Anova, Kruskal-Wallis, Shapiro-Wilk.
- Utilisation de la courbe de lorenz
- Analyse de la distribution des données
- Choix des graphiques adaptés selon le type de données
- Mise en application des bibliothèques scipy.stats.
- Vulgarisation des analyses de données.
Exemples de visualisations
Extrait du support de présentation
Graphique de l'analyse
Graphique de l'analyse
Graphique de l'analyse
Graphique de l'analyse
Graphique de l'analyse
Graphique de l'analyse
Graphique de l'analyse
Graphique de l'analyse