Il y a forcément une formation faite pour vous


- Catalogue
- Méthodes statistiques
- Data Mining - Analyses multivariées - Machine Learning
- Initiation au Text Mining
Initiation au Text Mining Mixte : présentiel / à distance
Dernière mise à jour : 07/01/2025
- Inscription
- Public visé
- Prérequis
- Objectifs de la formation
- Contenu de la formation
- Compétences acquises à l'issue de la formation
- Modalités pédagogiques
- Moyens et supports pédagogiques
- Modalités d'évaluation et de suivi
- Profil du formateur
- Informations sur l'accessibilité
M'inscrire à la formation
Public visé
- Toute personne souhaitant découvrir le Text mining et sa mise en application sous R
Prérequis
- L'apprenant devra avoir des notions de bases en statistique (statistique descriptive, estimation), en Data Mining (apprentissage supervisé, non supervisé, ACP) ainsi que des notions de R.
Objectifs de la formation
A l'issue de cette formation, l'apprenant sera capable de :
- Importer une base de données textuelles sous R
- Représenter les données textuelles sous un format approprié
- Préparer les données en effectuant les principaux pré-traitements spécifiques aux données textuelles
- Visualiser les données textuelles
- Effectuer une recherche d'informations
- Effectuer une classification de documents (apprentissage supervisé)
- Extraire des thématiques d'une base de données textuelles (apprentissage non supervisé)
Contenu de la formation

Introduction au Text Mining
- Contexte
- Exemple de données
- Application du Text Mining
Particularité des données textuelles
- Multiplicité des représentations
- Fléau de la dimension
- Subjectivité des données
Représentations des données textuelles
- Sac de mots
- Vectorisation
Pré-traitements
- Tokenization
- Nettoyage (majuscule, nombre, ponctuations…)
- Stopwords
- Stemming
Visualisation
- Histogramme
- Nuage de mots
Recherche d'informations
- Comparaison de textes
- Pondération des termes (TF-IDF…)
- Text ranking
Application du text mining
- Recherche d'information
- Classification de documents
- Analyse de sentiments
- Classification de documents
- Extraction de thématiques avec le modèle LDA
Compétences acquises à l'issue de la formation
- Importer une base de données textuelles sous R
- Représenter les données textuelles sous un format approprié
- Préparer les données en effectuant les principaux pré-traitements spécifiques aux données textuelles
- Visualiser les données textuelles
- Effectuer une recherche dinformations
- Effectuer une classification de documents (apprentissage supervisé)
- Extraire des thématiques dune base de données textuelles (apprentissage non supervisé)
Modalités pédagogiques
- Explications théoriques suivies de pratiques guidées puis de mises en autonomie.
- Exercices autonomes et réguliers pour assurer l'assimilation
Moyens et supports pédagogiques
Votre formation a lieu en présentiel :
- 1 vidéoprojecteur par salle
- 1 ordinateur
Votre formation se déroule à distance avec :
- 1 ordinateur
- 1 connexion Internet
- 1 adresse e-mail valide
- 1 équipement audio (micro et enceintes ou casque)
- 1 Webcam (facultatif – dans l'idéal)
- 1 deuxième écran (facultatif – dans l'idéal)
Votre formation se déroule sur notre plate-forme de formation avec :
- 1 ordinateur
- 1 connexion Internet
- 1 adresse e-mail valide
- 1 équipement audio (micro et enceintes ou casque - facultatif)
Support stagiaire :
À l'issue de la formation, les exercices et travaux pratiques réalisés, leurs corrigés ainsi qu'un support de cours dématérialisé sera fourni à chaque stagiaire par e-mail ou via la plate-forme FOAD.
Modalités d'évaluation et de suivi
Profil du formateur
Chacun de nos formateurs a bénéficié d'une formation spécifique à l'animation de classe virtuelle et à l'utilisation des solutions de formation à distance du Groupe ARKESYS.
Informations sur l'accessibilité
-
Catégorie :
Méthodes statistiques
Sous-Catégorie : Data Mining - Analyses multivariées - Machine Learning - Durée : 14h
-
Prix : 1 500 € HTPrix INTRA : 3 100 € Net de taxe
Télécharger le programme
Session sélectionnée
-
09/10/25
→
10/10/25
Lyon - 8 places restantes -
Détails :
09/10/25 : 9:00 → 12:30 13:30 → 17:00 10/10/25 : 9:00 → 12:30 13:30 → 17:00
Prochaines Sessions
-
09/10/25
→
10/10/25
Lyon - 8 places restantes -
09/10/25
→
10/10/25
Classe virtuelle 8 places restantes
Dans la même catégorie
- Analyses multivariées, classification (ACP, AFC, ACM, CAH, k-means, AFD) Présentiel / à distance
- Découverte - Analyses factorielles multidimensionnelles - ACP & AFC Présentiel / à distance
- IA Comprendre un algorithme utilisé en IA type reconnaissance d'image avec Excel Présentiel / à distance
- Machine Learning & Méthodes statistiques appliquées aux processus de classification Présentiel / à distance
- MACHINE LEARNING & STATISTIQUES Erreur des modèles - Sous et sur ajustement Présentiel / à distance
Notre nouveau catalogue est en cours de déploiement. Aussi, pour connaître tous nos indicateurs, veuillez nous contacter directement.
Catalogue de formation propulsé par Dendreo,
logiciel de gestion pour les OF