Les données non structurées issues du langage sont omniprésentes en entreprise (mails, appels téléphoniques, visio, réunions, avis, commentaires, etc.) mais ne sont que rarement utilisées. Les progrès en deep learning ont permis de rendre plus accessible l'exploitation des données voix et texte. A travers la construction de modèles de langage conversationnel (ChatGPT), considérés comme révolutionnaires, de nombreux secteurs sont amenés à repenser et intensifier l'usage des modèles de langage.
Cette formation prépare les data scientists à maîtriser les données texte et voix, au sein d'un contexte technologique innovant et en particulier au cours d'un projet d'Intelligence Artificielle.
A travers des exercices, vous apprendrez à structurer et créer des modèles de machine learning sur ces données du langage. A la fin de la session, vous disposerez d'une compréhension solide du potentiel et de l'état de l'art en Natural Language Processing (NLP) et en Speech Processing. Vous comprendrez également les architectures "Transformers" à la base de nombreux progrès récents et notamment des modèles de type ChatGPT. Les mises en pratique vous permettront d'être indépendant pour déployer et créer de la valeur sur ces données, et devenir un expert du traitement automatique du langage écrit et parlé.