Il y a forcément une formation faite pour vous


- Catalogue
- Méthodes statistiques
- Data Mining - Analyses multivariées - Machine Learning
- Machine Learning & Méthodes statistiques appliquées aux processus de classification
Machine Learning & Méthodes statistiques appliquées aux processus de classification Mixte : présentiel / à distance
Dernière mise à jour : 07/01/2025
- Inscription
- Public visé
- Prérequis
- Objectifs de la formation
- Contenu de la formation
- Compétences acquises à l'issue de la formation
- Modalités pédagogiques
- Moyens et supports pédagogiques
- Modalités d'évaluation et de suivi
- Profil du formateur
- Informations sur l'accessibilité
M'inscrire à la formation
Public visé
- Toute personne souhaitant comprendre le contexte d'utilisation, les concepts, et la mise en œuvre des méthodes de classements et de prédiction d'une variable qualitative.
Prérequis
- Il est nécessaire que les participants aient des connaissances sur les outils statistiques de base : corrélation, écart-type, variance, intervalles de confiance, tests d'hypothèses.
- Dans le cas où la formation serait effectuée avec le logiciel R, une connaissance de base de ce logiciel est préconisée.
Objectifs de la formation
A l'issue de cette formation, l'apprenant sera capable de :
- Maîtriser le vocabulaire spécifique aux méthodes d'apprentissage à finalité de classement
- Identifier le contexte et les conditions d'application des méthodes d'apprentissage supervisé et non supervisé
- Connaître les objectifs et les différences entre les méthodes de classement
- Décrire la méthodologie inhérente à ces méthodes
- Mettre en œuvre et interpréter les résultats des méthodes d'apprentissage supervisé
- Connaître les principaux indicateurs de cohérence liés aux méthodes d'apprentissage
- Maitriser les paramètres permettant d'estimer la qualité de ces analyses
Contenu de la formation

VOLET 1 : LES ALGORITHMES
Généralités sur les différentes méthodes d'apprentissage supervisé
- Différences entre méthodes supervisées et non supervisées
- Objectifs de l'apprentissage supervisé
- Objectifs de description
- Objectifs de prédiction
- Structure des jeux de données
- Présentation générale de l'éventail des méthodes
La méthode knn
- Principe de la méthode des plus proches voisins
- Algorithme de calcul
- Distances entre individus
- Choix des proximités
- Définition du paramètre k
La régression logistique
- Variable explicative et variable expliquée (continue / binaire)
- Différences entre la régression linéaire classique et la régression logistique
- Variables explicatives qualitatives, variables explicatives quantitatives
- Objectifs de la régression logistique
- Définition du modèle Logit (courbe sigmoïde)
- Conditions d'utilisation à respecter
- Estimation et interprétation des coefficients du modèle
- Test de significativité du modèle (validation du modèle)
- Tests d'apport d'une variable (test de Wald, tests sur les rapports de vraisemblance)
- Interprétation du Khi² de Wald
- Odds-ratios
- Parallèle odds ratios et risques relatifs
- Mise en œuvre et analyse des résultats d'un modèle de régression logistique multiple
- Estimation et interprétation des coefficients du modèle multiple
L'analyse factorielle discriminante
- Structure du jeu de données et contexte d'application
- Objectifs détaillés de l'AFD
- Notions de classement et de discrimination
- Méthodologie de l'AFD
- Comparaison avec l'ACP
- Interprétation des sorties logiciel : cercle factoriels, corrélations variables x axes
- Qualité de l'AFD (de la discrimination obtenue)
- Tests univariés et multivariés (lambda de Wilks)
- Graphique des individus
- Matrice de confusion (et éventuellement courbe ROC)
- Les confusions et erreurs à ne pas commettre
Les supports vecteurs machines (SVM)
- Démarche des svm
- Notions de marge
- Séparation linéaire
- Séparation non linéaire
- Fonction noyau
Les arbres de décision
- Structure du jeu de données
- Principes, vocabulaire et objectifs
- Notion d'échantillon d'apprentissage, de validation et de test
- Comparaison de méthodes de type régression linéaire / logistique aux arbres de décision
- Principe de la segmentation selon le type de variable : Arbre de régression ou arbre de classification
- Définir les conditions d'arrêt de construction d'un arbre : Notion de pré-élagage
- Définition des groupes après construction de l'arbre
- Indicateurs de qualité
- Comparaison d'arbre de décision selon un certain type d'algorithme : CHAID vs CART
- Avantages et inconvénients : limites des arbres de décision
- Mise en œuvre et interprétation des résultats obtenus après application d'une analyse par arbre de décision
De l'arbre à la foret - Random Forest
- Pourquoi avoir recourt aux forêts aléatoires ?
- Principes et objectifs
- Instabilité de l'arbre
- Notion de Bagging
- Les erreurs liées à l'échantillonnage (Out-Of-Bag)
- Prédiction avec un algorithme de Forêt aléatoire : Les paramètres
- Evaluer l'importance des variables
- Notion d'importance
- Comportement de l'importance
- Lien entre diversité des arbres et l'importance
- Influence des paramètres
- Sélection de variables
- Généralités et principes de la sélection
- Procédure de sélection
- Les paramètres de sélection
- Validation
VOLET 2 : VALIDATIONS DES METHODES, MESURE DES PERFORMANCES
- Partitionnement des données disponibles
- Jeu d'entrainement
- Jeu de validation
- Tests sur le jeu d'entrainement
- Tests sur le jeu de validation
- La validation croisée
- Leave one out
- K fold
- Leave v out
- Compromise biais / variance
- Mesures des performances des classifications
- Matrices de confusions
- Courbe Roc
- Aire sous la courbe (AUC)
- Sensibilité & spécificité
Compétences acquises à l'issue de la formation
- Identifier le contexte et les conditions dapplication des méthodes dapprentissage supervisé et non supervisé
- Maîtriser le vocabulaire spécifique aux méthodes dapprentissage à finalité de classement
- Connaître les objectifs et les différences entre les méthodes de classement
- Décrire la méthodologie inhérente à ces méthodes
- Mettre en uvre et interpréter les résultats des méthodes dapprentissage supervisé
- Connaître les principaux indicateurs de cohérence liés aux méthodes dapprentissage
- Maitriser les paramètres permettant destimer la qualité de ces analyses
Modalités pédagogiques
- Explications théoriques suivies de pratiques guidées puis de mises en autonomie.
- Exercices autonomes et réguliers pour assurer l'assimilation
Moyens et supports pédagogiques
Votre formation a lieu en présentiel :
- 1 vidéoprojecteur par salle
- 1 ordinateur
Votre formation se déroule à distance avec :
- 1 ordinateur
- 1 connexion Internet
- 1 adresse e-mail valide
- 1 équipement audio (micro et enceintes ou casque)
- 1 Webcam (facultatif – dans l'idéal)
- 1 deuxième écran (facultatif – dans l'idéal)
Votre formation se déroule sur notre plate-forme de formation avec :
- 1 ordinateur
- 1 connexion Internet
- 1 adresse e-mail valide
- 1 équipement audio (micro et enceintes ou casque - facultatif)
Support stagiaire :
À l'issue de la formation, les exercices et travaux pratiques réalisés, leurs corrigés ainsi qu'un support de cours dématérialisé sera fourni à chaque stagiaire par e-mail ou via la plate-forme FOAD.
Modalités d'évaluation et de suivi
Profil du formateur
Chacun de nos formateurs a bénéficié d'une formation spécifique à l'animation de classe virtuelle et à l'utilisation des solutions de formation à distance du Groupe ARKESYS.
Informations sur l'accessibilité
-
Catégorie :
Méthodes statistiques
Sous-Catégorie : Data Mining - Analyses multivariées - Machine Learning - Durée : 28h
-
Prix : 3 000 € Net de taxePrix INTRA : 6 200 € Net de taxe
Télécharger le programme
Prochaines Sessions
- Aucune formation INTER-ENTREPRISE n'est programmée pour le moment. Contactez-nous via le formulaire ou par téléphone au 04.37.24.36.78 afin de connaitre les dates possibles ou les autres modalités d'inscription.
Dans la même catégorie
- Analyses multivariées, classification (ACP, AFC, ACM, CAH, k-means, AFD) Présentiel / à distance
- Découverte - Analyses factorielles multidimensionnelles - ACP & AFC Présentiel / à distance
- IA Comprendre un algorithme utilisé en IA type reconnaissance d'image avec Excel Présentiel / à distance
- Initiation au Text Mining Présentiel / à distance
- MACHINE LEARNING & STATISTIQUES Erreur des modèles - Sous et sur ajustement Présentiel / à distance
Notre nouveau catalogue est en cours de déploiement. Aussi, pour connaître tous nos indicateurs, veuillez nous contacter directement.
Catalogue de formation propulsé par Dendreo,
logiciel de gestion pour les OF