1. Lab « 2 » :
1. Quelles sont les différentes bibliothèques requises pour machine Learning
?
Il existe plusieurs bibliothèques nécessaires pour le machine Learning. Voici
quelques-unes des plus courantes :
Numpy : est une bibliothèque Python qui est utilisée pour les calculs mathématiques.
Elle fournit des structures de données pour les tableaux multidimensionnels et des
fonctions pour effectuer des opérations mathématiques sur ces tableaux.
Pandas : est une bibliothèque Python qui est utilisée pour la manipulation de
données. Elle fournit des structures de données pour les tableaux de données,
appelés DataFrames, et des fonctions pour effectuer des opérations sur ces tableaux.
Matplotlib : Matplotlib est une bibliothèque Python qui est utilisée pour la
visualisation de données. Elle fournit des fonctions pour créer des graphiques et des
visualisations à partir de données.
Scikit-learn : est une bibliothèque Python qui est utilisée pour le machine learning.
Elle fournit des outils pour la classification, la régression, le clustering, la sélection de
modèles, la validation de modèles, etc.
TensorFlow : est une bibliothèque open source pour l'apprentissage automatique
développée par Google. Elle fournit des outils pour la création de modèles
d'apprentissage automatique et des fonctions pour l'entraînement de ces modèles.
Keras : est une bibliothèque open source pour l'apprentissage automatique qui est
conçue pour être facile à utiliser et à comprendre. Elle fournit des outils pour la
création de modèles d'apprentissage automatique et des fonctions pour
l'entraînement de ces modèles.
PyTorch : est une bibliothèque open source pour l'apprentissage automatique
développée par Facebook. Elle fournit des outils pour la création de modèles
d'apprentissage automatique et des fonctions pour l'entraînement de ces modèles.
2. Quelles sont les fonctionnalités de chaque bibliothèque ?
Voici les principales fonctionnalités offertes par chacune des bibliothèques
mentionnées précédemment :
Numpy :
Manipulation de tableaux multidimensionnels
2. Calculs mathématiques sur ces tableaux
Génération de nombres aléatoires
Transformation de tableaux
Pandas :
Manipulation de données tabulaires avec les DataFrames
Traitement des valeurs manquantes
Agrégation et fusion de données
Filtrage et tri de données
Opérations de groupement
Matplotlib :
Création de graphiques en 2D et 3D
Tracé de courbes, histogrammes, nuages de points, etc.
Personnalisation de la présentation des graphiques
Création d'animations
Scikit-learn :
Classification, régression et clustering
Sélection de modèles
Validation de modèles
Traitement des données
Réduction de dimensions
TensorFlow :
Création de modèles d'apprentissage automatique
Définition de graphes de calcul
Entraînement de modèles sur des données
Inférence sur des données inconnues
Déploiement de modèles
Keras :
Création de modèles d'apprentissage automatique
Définition de réseaux de neurones
Entraînement de modèles sur des données
Inférence sur des données inconnues
Déploiement de modèles
PyTorch :
Création de modèles d'apprentissage automatique
Définition de réseaux de neurones
3. Entraînement de modèles sur des données
Inférence sur des données inconnues
Déploiement de modèles
3. QQOQCP:
NumPy :
Quoi :Numpy est une bibliothèque Python pour le calcul scientifique avec prise en
charge de tableaux et matrices multidimensionnels.
Qui :NumPy est développé par la communauté open source.
Où : NumPy peut être installé sur n'importe quel système qui prend en charge
Python.
Quand : La première version de NumPy a été publiée en 2006 et depuis lors, il a été
régulièrement mis à jour et amélioré.
Pourquoi : NumPy est utilisé pour des calculs mathématiques, scientifiques et
d'analyse de données efficaces et rapides en utilisant des tableaux et des matrices
multidimensionnels.
Pandas :
Quoi : Pandas est une bibliothèque Python pour la manipulation et l'analyse des
données.
Qui : Pandas a été développé par Wes McKinney en 2008 et est maintenu par la
communauté open source.
Où :Pandas peut être installé sur n'importe quel système qui prend en charge Python.
Quand :La première version de Pandas a été publiée en 2008 et depuis lors, il a été
régulièrement mis à jour et amélioré.
Pourquoi : Pandas est utilisé pour manipuler et analyser les données en utilisant des
structures de données flexibles et puissantes, telles que les DataFrames.
Matplotlib :
Quoi : Matplotlib est une bibliothèque Python pour la création de graphiques et de
visualisations de données.
Qui : Matplotlib a été créé par John D. Hunter et est maintenant maintenu par la
communauté open source.
4. Où : Matplotlib peut être installé sur n'importe quel système qui prend en charge
Python.
Quand : La première version de Matplotlib a été publiée en 2003 et depuis lors, il a
été régulièrement mis à jour et amélioré.
Pourquoi : Matplotlib est utilisé pour créer des graphiques de qualité professionnelle
pour les publications scientifiques et les présentations.
Seaborn :
Quoi : Seaborn est une bibliothèque Python pour la visualisation de données basée
sur Matplotlib.
Qui : Seaborn a été créé par Michael Waskom et est maintenant maintenu par la
communauté open source.
Où : Seaborn peut être installé sur n'importe quel système qui prend en charge
Python.
Quand : La première version de Seaborn a été publiée en 2012 et depuis lors, il a été
régulièrement mis à jour et amélioré.
Pourquoi : Seaborn est utilisé pour créer des visualisations de données complexes et
est particulièrement utile pour les analyses statistiques.
Scikit-learn :
Quoi : Scikit-learn est une bibliothèque Python pour l'apprentissage automatique et
l'exploration de données.
Qui : Scikit-learn est maintenu par la communauté open source.
Où : Scikit-learn peut être installé sur n'importe quel système qui prend en charge
Python.
Quand : La première version de Scikit-learn a été publiée en 2007 et depuis lors, il a
été régulièrement mis à jour et amélioré.
Pourquoi : Scikit-learn est utilisé pour l'apprentissage automatique, y compris la
classification, la régression, le clustering et la réduction de dimensionnalité.