Formations au coeur des technologies

Essayer, tester, échanger les bonnes pratiques, partager les retours d'expériences, ...
toutes nos formations sont disponibles à distance (classes virtuelles) et en centre de formation (présentiel), au choix.
Vous pouvez même changer de modalité en cours de formation, si vous avez des contraintes : par exemple, commencer en présentiel et continuer les jours suivants à distance.
Les outils pédagogiques et l'infrastructure de travaux pratiques mis à disposition sont accessibles depuis nos locaux, ou depuis votre entreprise ou votre lieu de télétravail, à volonté
N'hésitez pas à tester nos formations et nos serious games !

Formation : IA - analyse, génération de sons : WaveNet, AWS Transcribe

Durée2 jours
Code coursIA050
Dates10 au 11 décembre

(cliquez sur une date pour vous inscrire)

Public:

Développeurs, data-scientists, chefs de projet, et toute personne souhaitant connaître les possibilités de l'IA pour l'analyse, la détection, ou la génération de sons.

Objectifs:

Comprendre les principes de fonctionnement, et savoir quels sont les outils existants pour le traitement ou la génération de sons.

Connaissances préalables nécessaires:

Connaissances de base du machine learning.

Déroulé pédagogique


Introduction
Durée : 2h
Méthodes pédagogiques : exposé/échanges
Matériels et moyens : video-projecteur en présentiel, tableau partagé en classe virtuelle
Définition d'un son, bases de traitement de signal numérique
Différents types de son : voix, musique, bruits (industriels, d'ambiance, ..)
Technologies mise en oeuvre : traitement du signal, machine learning, deep learning (réseaux de neurones)
Intervention de l'IA à différentes étapes du processus de traitement du son :
enregistrement, filtrage, montage, tri d'enregistrements, analyse, génération, etc ...
Applications
Durée : 2h
Méthodes pédagogiques : exposé/échanges
Matériels et moyens : video-projecteur en présentiel, tableau partagé en classe virtuelle
Traitement de la voix, reconnaissance vocale, compréhension et analyse de discours ou de commandes vocales, traductions, retranscriptions, domaine médical, etc ...
Analyse de musiques (classement, proposition, reconnaissance style, compositeurs, etc ..)
Détection de bruits, filtrage, sécurité, suppression de bruits (amélioration productions musicales)
Analyse et séparation de sources sonores
Génération de musique, synthèse vocale
Outils
Durée : 4h
Méthodes pédagogiques : alternance de théorie et de travaux pratiques
Matériels et moyens : vidéo-projecteur en présentiel, tableau partagé en classe virtuelle, infrastructure distribuée serveurs Linux
MetaVoice : modification de la voix
WellSaid,Play.ht : transformation de texte en audio
Séparation de pistes audio : AudioStrip
Synthèse vocale : wavenet
Audio et vidéo : Sonix, NVIDIA Jarvis, IBM Watson,
Traitement d'enregistrements audio : Amazon Transcribe (retranscription en texte, analyse de contenu, statistiques de mots clés, reconnaissance d'interlocuteur, ...)
Atelier : démonstration de 'Text to Speech' d'IBM Watson


Retranscription de discours en temps réel avec Amazon Transcribe
IA génératives
Durée : 4h
Méthodes pédagogiques : alternance de théorie et de travaux pratiques
Matériels et moyens : vidéo-projecteur en présentiel, tableau partagé en classe virtuelle, infrastructure distribuée serveurs Linux
Principe de fonctionnement
GAN (Generativ Adversarial Network)
Exemples: MusicLM, Boomy, Mubert, Soundraw, Beatoven, ..
Google MusicLM : génération de musique à partir d"une description en texte
Mubert : génération de musique libre de droits,
description en texte, choix du style, ..
Atelier : création de morceaux de musique avec Mubert


Evolutions
Durée : 2h
Méthodes pédagogiques : exposé/échanges
Matériels et moyens : video-projecteur en présentiel, tableau partagé en classe virtuelle
Limites : problèmes éthiques, détournement de voix, clônage de voix,
Sources : données utilisées en apprentissage
Aspects juridiques, droits d'auteurs, liens avec l'industrie musicale

Retour au descriptif
Modalités et délais d'accès
Méthodes mobilisées

Pythagore-F.D.

01 55 33 52 10
pfd@pythagore-fd.fr
Calendrier
Code cours : IA050

Contenu de la formation
IA - analyse, génération de sons : WaveNet, AWS Transcribe:

Accès à la liste des cours



Vous pouvez bien entendu composer votre programme personnel à partir de nos descriptifs de cours


Version du document : Ra08
Date de mise à jour du document : 2024/11/08