Développeurs, data-scientists, chefs de projet, et toute personne souhaitant connaître les possibilités de l'IA pour l'analyse, la détection, ou la génération de sons.
Comprendre les principes de fonctionnement, et savoir quels sont les outils existants pour le traitement ou la génération de sons.
Connaissances de base du machine learning.
|
| Introduction |
Durée : 2h Méthodes pédagogiques : exposé/échanges Matériels et moyens : video-projecteur en présentiel, tableau partagé en classe virtuelle | Définition d'un son, bases de traitement de signal numérique Différents types de son : voix, musique, bruits (industriels, d'ambiance, ..) Technologies mise en oeuvre : traitement du signal, machine learning, deep learning (réseaux de neurones) Intervention de l'IA à différentes étapes du processus de traitement du son : enregistrement, filtrage, montage, tri d'enregistrements, analyse, génération, etc ...
|
|
| Applications |
Durée : 2h Méthodes pédagogiques : exposé/échanges Matériels et moyens : video-projecteur en présentiel, tableau partagé en classe virtuelle | Traitement de la voix, reconnaissance vocale, compréhension et analyse de discours ou de commandes vocales, traductions, retranscriptions, domaine médical, etc ... Analyse de musiques (classement, proposition, reconnaissance style, compositeurs, etc ..) Détection de bruits, filtrage, sécurité, suppression de bruits (amélioration productions musicales) Analyse et séparation de sources sonores Génération de musique, synthèse vocale
|
|
| Outils |
Durée : 4h Méthodes pédagogiques : alternance de théorie et de travaux pratiques Matériels et moyens : vidéo-projecteur en présentiel, tableau partagé en classe virtuelle, infrastructure distribuée serveurs Linux | MetaVoice : modification de la voix WellSaid,Play.ht : transformation de texte en audio Séparation de pistes audio : AudioStrip Synthèse vocale : wavenet Audio et vidéo : Sonix, NVIDIA Jarvis, IBM Watson, Traitement d'enregistrements audio : Amazon Transcribe (retranscription en texte, analyse de contenu, statistiques de mots clés, reconnaissance d'interlocuteur, ...)Atelier : démonstration de 'Text to Speech' d'IBM Watson
Retranscription de discours en temps réel avec Amazon Transcribe
|
|
| IA génératives |
Durée : 4h Méthodes pédagogiques : alternance de théorie et de travaux pratiques Matériels et moyens : vidéo-projecteur en présentiel, tableau partagé en classe virtuelle, infrastructure distribuée serveurs Linux | Principe de fonctionnement GAN (Generativ Adversarial Network) Exemples: MusicLM, Boomy, Mubert, Soundraw, Beatoven, .. Google MusicLM : génération de musique à partir d"une description en texte Mubert : génération de musique libre de droits, description en texte, choix du style, ..Atelier : création de morceaux de musique avec Mubert
|
|
| Evolutions |
Durée : 2h Méthodes pédagogiques : exposé/échanges Matériels et moyens : video-projecteur en présentiel, tableau partagé en classe virtuelle | Limites : problèmes éthiques, détournement de voix, clônage de voix, Sources : données utilisées en apprentissage Aspects juridiques, droits d'auteurs, liens avec l'industrie musicale
|