Il y a forcément une formation faite pour vous


- Catalogue
- Logiciels statistiques
- XlStat
- XLSTAT Analyses multivariées, classification et PLS (ACP, CAH, K-MEANS, AFD, PLS)
XLSTAT Analyses multivariées, classification et PLS (ACP, CAH, K-MEANS, AFD, PLS) Mixte : présentiel / à distance
Dernière mise à jour : 07/01/2025
- Inscription
- Public visé
- Prérequis
- Objectifs de la formation
- Contenu de la formation
- Compétences acquises à l'issue de la formation
- Modalités pédagogiques
- Moyens et supports pédagogiques
- Modalités d'évaluation et de suivi
- Profil du formateur
- Informations sur l'accessibilité
M'inscrire à la formation
Public visé
- Toute personne souhaitant comprendre et mettre en œuvre les procédures d'analyses factorielles multivariées en intégrant la régression PLS avec mise en application sous XlStat
Prérequis
- Il est nécessaire que les participants aient de bonnes connaissances sur les outils statistiques de base : corrélation, écart-type, variance, intervalles de confiance, tests d'hypothèses.
Objectifs de la formation
A l'issue de cette formation, l'apprenant sera capable avec XlStat :
- Identifier quelle méthode d'analyse multivariée ou de classification utiliser selon le contexte
- Décrire les concepts mathématiques inhérents à ces méthodes
- Mettre en œuvre les analyses suivantes : ACP, CAH, K-MEANS, AFD, PLS
- Maitriser les coefficients et les paramètres permettant d'estimer la qualité des analyses statistiques ci-dessus
- Expliquer la différence entre les notions de contribution et de cosinus carré
- Identifier les contextes d'utilisation des différentes versions de la régression PLS
- Comprendre les concepts mathématiques inhérents à la régression PLS
- Interpréter les résultats et les graphiques qui découlent des analyses
Contenu de la formation

Prise en main de l'interface d'XlStat
- Généralités et interface utilisateur
- Interface de base
- Rappel sur quelques outils Excel nécessaires à la manipulation d'XlStat.
- Activation, chargement et fermeture d'XlStat
- Gestion et organisation des données
- L'interface XlStat
- Menus et barre d'outils
- Principes de paramétrage des boîtes de dialogue
- Gestion des classeurs et des feuilles Excel
- Paramétrage de base de l'outil
- Présentations des différentes analyses statistiques disponibles
- Complémentarités entre Excel et XlStat
- Outils XlStat non statistiques
- Repérage de données selon critères
- Différents types de fonctionnalités de préparation des données
- Regroupement des données en classes
- Transformation de données
- Outils complémentaires aux graphiques (étiquettes, axes, facteur de zoom…)
- Codage de données
Généralités sur les différentes méthodes d'analyses multidimensionnelles
- Limites des statistiques classiques
- Champs d'application des différentes méthodes d'analyses multidimensionnelles
- Introduction sur le data mining - Les objectifs
- Objectifs de description
- Objectifs de prédiction
- Structure des jeux de données
- Présentation de l'éventail des méthodes
- Analyse en composantes principales
- Analyse factorielle des correspondances simples et multiples
- Analyse factorielle discriminante
- Méthodes de classification : classification ascendante hiérarchique, k-means
- Régressions PLS et PLS-DA
- Principes généraux des différentes méthodes - Notions de :
- Distance,
- Inertie et variance
- Axes factoriels
- Variables latentes
Notions de corrélation
- Définition du coefficient de corrélation
- Interprétation de la valeur du coefficient de corrélation
- Les confusions : corrélation, causalité, pente…
- Les différents coefficients de corrélation
- Coefficient de Pearson
- Coefficient de Spearman
Mise en œuvre d'une Analyse en Composante principales (ACP)
- Structure du jeu de données et contexte d'application
- Objectifs détaillés de l'ACP
- Choix des axes de représentation (choix du nombre de composantes principales)
- Interprétation des sorties graphiques : cercle factoriel et graphique des individus
- Interprétation des axes factoriels
- Contribution des individus et des variables aux axes
- Qualité de représentation des individus et des variables sur les axes : les cosinus carrés
- Les différentes ACP :
- ACP normée et non normée
- ACP non paramétrique
- Positionnement d'une variable illustrative catégorielle
- Les confusions et erreurs à ne pas commettre
- Présentation rapide des Analyses des correspondances simple et multiple si souhaité
- Différences entre ACP et AFC
Mise en œuvre d'une classification par une classification ascendante hiérarchique (CAH)
- Présentation des objectifs de la classification ascendante hiérarchique
- Structure du jeu de données
- Choix de la distance
- Choix du linkage (saut, critère de « rapprochement » entre les classes) : méthode de Ward…
- Lecture d'un dendrogramme
- Choix du nombre de classes
- Classification sur les individus
- Classification sur les variables
- Interprétation des sorties logiciel
Mise en œuvre d'une classification par une k-means
- Présentation des objectifs de la méthode des k-means
- Avantages et inconvénients de la CAH et des k-means
- Détermination des clusters
- Présentation des différentes versions de l'algorithme
- Utilisation de la k-means en complément de l'ACP
- Classification sur grand jeu de données
- Conseils de mise en œuvre
- Interprétation des sorties logiciel
Mise en œuvre d'une analyse factorielle fiscriminante (AFD)
- Structure du jeu de données et contexte d'application
- Objectifs détaillés de l'AFD
- Notions de classement et de discrimination
- Méthodologie de l'AFD
- Comparaison avec l'ACP
- Interprétation des sorties logiciel : cercle factoriels, corrélations variables x axes
- Qualité de l'AFD (de la discrimination obtenue)
- Tests univariés et multivariés (lambda de Wilks)
- Graphique des individus
- Matrice de confusion (et éventuellement courbe ROC)
- Les confusions et erreurs à ne pas commettre
Mise en œuvre d'une analyse discriminante PLS (PLS-DA)
- Problématique :
- Des multi colinéarités
- Des petits échantillons
- Présentation de la PCR (Principal Component Regression)
- Méthodologie générale de PLS
- Présentation des différentes versions de la régression PLS
- Structure du jeu de données et contexte d'application de la PLS-DA
- Objectifs détaillés de la PLS-DA
- Choix du nombre de composante de la PLS : critère du Q carré
- Interprétation des sorties logiciel : cercle factoriels, corrélations variables x axes
- Importance des variables pour la discrimination des groupes : les VIP
- Qualité de la PLS-DA
- Indicateurs Q carrés et R carrés
- Matrice de confusion
- Les confusions et erreurs à ne pas commettre
Mise en œuvre d'une régression PLS
- Contexte et objectifs
- Présentation des différentes méthodes de régression sur des données colinéaires : PCR, régression de Ridge et PLS
- Principes et concepts mathématiques inhérents à la PCR et la régression PLS
- Présentation des différentes versions de la régression PLS
- Mise en œuvre et interprétation des résultats : graphiques, coefficients du modèle…
- Choix du nombre de composantes (validation croisée)
- Composantes et coefficients de régression
- Qualité d'ajustement, qualité de prédiction
- Coefficients Q² et R²
- Importance des variables explicatives pour la prédiction
- Coefficients normalisés
- VIP
- Sélection de variables
Compétences acquises à l'issue de la formation
- Identifier quelle méthode danalyse multivariée ou de classification utiliser selon le contexte
- Décrire les concepts mathématiques inhérents à ces méthodes
- Maitriser les coefficients et les paramètres permettant destimer la qualité des analyses statistiques ci-dessus
- Expliquer la différence entre les notions de contribution et de cosinus carré
- Mettre en uvre les analyses suivantes : ACP, CAH, K-MEANS, AFD, PLS
- Identifier les contextes dutilisation des différentes versions de la régression PLS
- Comprendre les concepts mathématiques inhérents à la régression PLS
- Interpréter les résultats et les graphiques qui découlent des analyses
Modalités pédagogiques
- Explications théoriques suivies de pratiques guidées puis de mises en autonomie.
- Exercices autonomes et réguliers pour assurer l'assimilation
Moyens et supports pédagogiques
Votre formation a lieu en présentiel :
- 1 vidéoprojecteur par salle
- 1 ordinateur
Votre formation se déroule à distance avec :
- 1 ordinateur
- 1 connexion Internet
- 1 adresse e-mail valide
- 1 équipement audio (micro et enceintes ou casque)
- 1 Webcam (facultatif – dans l'idéal)
- 1 deuxième écran (facultatif – dans l'idéal)
Votre formation se déroule sur notre plate-forme de formation avec :
- 1 ordinateur
- 1 connexion Internet
- 1 adresse e-mail valide
- 1 équipement audio (micro et enceintes ou casque - facultatif)
Support stagiaire :
À l'issue de la formation, les exercices et travaux pratiques réalisés, leurs corrigés ainsi qu'un support de cours dématérialisé sera fourni à chaque stagiaire par e-mail ou via la plate-forme FOAD.
Modalités d'évaluation et de suivi
Profil du formateur
Chacun de nos formateurs a bénéficié d'une formation spécifique à l'animation de classe virtuelle et à l'utilisation des solutions de formation à distance du Groupe ARKESYS.
Informations sur l'accessibilité
-
Catégorie :
Logiciels statistiques
Sous-Catégorie : XlStat - Durée : 28h
-
Prix : 3 000 € Net de taxePrix INTRA : 6 200 € Net de taxe
Télécharger le programme
Prochaines Sessions
- Aucune formation INTER-ENTREPRISE n'est programmée pour le moment. Contactez-nous via le formulaire ou par téléphone au 04.37.24.36.78 afin de connaitre les dates possibles ou les autres modalités d'inscription.
Dans la même catégorie
- XLSTAT Anova et régression (régression simple) Présentiel / à distance
- XLSTAT Notions fondamentales, Tests d’hypothèses et Traitement des petits échantillons Présentiel / à distance
Notre nouveau catalogue est en cours de déploiement. Aussi, pour connaître tous nos indicateurs, veuillez nous contacter directement.
Catalogue de formation propulsé par Dendreo,
logiciel de gestion pour les OF