Qu'est-ce que je vais apprendre ?
Les prérequis pour suivre cette formation
Des connaissances dans le langage de programmation Python sont nécessaires
Des connaissances de base en mathématiques sont recommandées
Certains des projets que nous allons coder ensemble
Nous utiliserons différentes librairies de manière à analyser statistiquement les survivants du Titanic ! Qui avait le meilleur taux de survie parmi les passagers ?
Description
La science des données (ou data science) est un domaine interdisciplinaire qui consiste à combiner des statistiques, du développement d’algorithmes et de l’apprentissage automatique (machine learning) dans le but créer de nouvelles connaissances sur base de données. La data science est une discipline qui se concentre sur l'analyse de données et sur la création d'informations exploitables à partir de données brutes. Le machine learning, quant à lui, est une branche de l'intelligence artificielle qui permet aux machines d'apprendre à partir des données.
En combinant la data science et le machine learning, les data scientists peuvent créer des modèles prédictifs sophistiqués et des analyses exploratoires pour extraire des informations utiles à partir des données. Les entreprises peuvent ensuite utiliser ces informations pour prendre des décisions stratégiques et pour améliorer leurs résultats !
Python est l'un des langages de programmation les plus populaires pour faire de la data science et du machine learning en raison de sa flexibilité, de sa grande communauté de développeurs et de ses librairies robustes. Les librairies Python les plus populaires pour la data science et le machine learning sont Numpy, Pandas, Matplotlib, Seaborn et Scikit-Learn mais il en existe bien d'autres également.
En savoir plus
Également inclus dans la formation

Numpy
NumPy (Numerical Python) est la bibliothèque la plus populaire de calcul scientifique en Python.
Lire plus

Pandas
Pandas est une librairie spécifiquement conçue pour traiter et analyser des données.
Lire plus

Scikit-Learn
Scikit-Learn est LA librairie de référence en Python pour faire du machine learning.
Lire plus
