Formations au coeur des technologies

Essayer, tester, échanger les bonnes pratiques, partager les retours d'expériences, ...
toutes nos formations sont disponibles à distance (classes virtuelles) et en centre de formation (présentiel), au choix.
Vous pouvez même changer de modalité en cours de formation, si vous avez des contraintes : par exemple, commencer en présentiel et continuer les jours suivants à distance.
Les outils pédagogiques et l'infrastructure de travaux pratiques mis à disposition sont accessibles depuis nos locaux, ou depuis votre entreprise ou votre lieu de télétravail, à volonté
N'hésitez pas à tester nos formations et nos serious games !

Formation : IA - langage : NLP, traduction, analyse

Durée2 jours
Code coursIA051
Inscription

Public:

toute personne intéressée par le NLP: Ingénieurs, Analystes, Data Scientists, Data Analysts, Data Steward, Développeurs...

Objectifs:

Comprendre les principes du NLP.Savoir les mettre en oeuvre avec Python.

Connaissances préalables nécessaires:

Connaissances de base de Python et du deep learning.

Déroulé pédagogique


NLP Introduction
Durée : 1h30
Méthodes pédagogiques : exposé/échanges
Matériels et moyens : video-projecteur en présentiel, tableau partagé en classe virtuelle
Objectifs : comprendre le langage humain, et savoir générer des réponses
Différentes étapes : reconnaissance de caractères, ou de la voix, conversion des données en texte,
décomposition en éléments de phrase, nettoyage des données, traitement de l'ambiguité d'un mot,
reconnaissance d'une entité nommée (NEM), traitement des multiples références pour une entité,
extraction des informations subjectives, etc ...
Les outils de NLP et historique :
outils statistiques, de machine learning, de deep learning,
Watson NLU, Python et le NLTK.
Applications actuelles : solutions de détection de spam, traduction automatique, assistants virtuels, chatbots, analyses d'opinions, de sentiments, etc ...
Python et le NLTK
Durée : 3h
Méthodes pédagogiques : alternance de théorie et de travaux pratiques
Matériels et moyens : vidéo-projecteur en présentiel, tableau partagé en classe virtuelle, infrastructure distribuée serveurs Linux
Introduction : plate-formes supportées, versions de Python,
Présentation des textes et modèles fournis avec le NLTK
Atelier : installation du package NLTK et des datasets


Traitements de textes
Durée : 2h30
Méthodes pédagogiques : alternance de théorie et de travaux pratiques
Matériels et moyens : vidéo-projecteur en présentiel, tableau partagé en classe virtuelle, infrastructure distribuée serveurs Linux
Etude des différentes fonctions fournies par le NLTK.
Découpage d'un texte en mots ou en phrases,avec nltk.tokenize(),
nettoyage de textes avec le filtrage de mots,
stemming avec nltk.stem, alertes sur les risques d'un mauvais usage,
étiquetage des différentes parties d'un texte avec nltk.pos-tag(),
lemmatisation, pour identifier les formes canoniques des mots,
identification de phrases avec le chunking
Atelier : réalisation d'exemples sur des datasets simples


Analyses de textes
Durée : 2h30
Méthodes pédagogiques : alternance de théorie et de travaux pratiques
Matériels et moyens : vidéo-projecteur en présentiel, tableau partagé en classe virtuelle, infrastructure distribuée serveurs Linux
Description de nltk.ne_chunk() pour la reconnaissance d'identités nommées,
Présentation des fonctions concordance(), dispersion_plot(), FreqDist
Atelier : Import de corpus de textes, analyse, mise en évidence de l'utilisation de termes caractéristiques


Etude de cas
Durée : 2h30
Méthodes pédagogiques : alternance de théorie et de travaux pratiques
Matériels et moyens : vidéo-projecteur en présentiel, tableau partagé en classe virtuelle, infrastructure distribuée serveurs Linux
Analyse de sentiments avec nltk.sentiment
Présentation des fonctions disponibles
Atelier : mise en oeuvre sur un corpus. Utilisation de polarity.scores()


Intégration de scikit-learn
Durée : 2h30
Méthodes pédagogiques : alternance de théorie et de travaux pratiques
Matériels et moyens : vidéo-projecteur en présentiel, tableau partagé en classe virtuelle, infrastructure distribuée serveurs Linux
Import des algorithmes de classification de scikit-learn
Atelier : exemple d'utilisation des aglorithmes de scikit-learn depuis nltk



Retour au descriptif
Modalités et délais d'accès
Méthodes mobilisées

Pythagore-F.D.

01 55 33 52 10
pfd@pythagore-fd.fr
Calendrier
Code cours : IA051

Contenu de la formation
IA - langage : NLP, traduction, analyse:

Accès à la liste des cours



Vous pouvez bien entendu composer votre programme personnel à partir de nos descriptifs de cours


Version du document : Ra08
Date de mise à jour du document : 2024/11/08