Techdays 2012 - Tout sur Microsoft Speech

27
palais des congrès Paris 7, 8 et 9 février 2012

description

Les slides de la session techdays 2012 "Tout sur Microsoft Speech"

Transcript of Techdays 2012 - Tout sur Microsoft Speech

Page 1: Techdays 2012 - Tout sur Microsoft Speech

palais des congrès Paris

7, 8 et 9 février 2012

Page 2: Techdays 2012 - Tout sur Microsoft Speech

Tout sur Microsoft Speech8 février 2012 – 17h30

Sébastien PutierConsultant / FormateurWinwise

Nicolas CalviMVP Surface, Consultant / FormateurWinwise

Page 3: Techdays 2012 - Tout sur Microsoft Speech

Winwise en chiffres : 9,5 M€, 70 collaborateurs, 800 clients qui nous font confiance.

Winwise a été créé en 1996 autour de 2 métiers:- La Formation, centre agréé Microsoft- Le Conseil

Et 3 types d’intervention chez nos clients:- L’expertise- L’accompagnement- La réalisation de projets aux forfaits

Nos clients sont de tout secteur d’activité et sollicitent nos 5 domaines de compétences:- Interfaces Riches et Naturelles- Architecture- Collaboratif- Business Intelligence et Data Management- Infrastructure

Tous nos collaborateurs sont certifiés sur les nouvelles technologies Microsoft.

Page 4: Techdays 2012 - Tout sur Microsoft Speech

Sommaire

Introduction à SpeechSpeech c’est quoi ?Survol du FrameworkLes modes d’utilisations

Reconnaissance vocaleMode reconnaissance automatique (Dictée)Mode reconnaissance par grammaire

Synthèse vocaleKinect

Page 5: Techdays 2012 - Tout sur Microsoft Speech

INTRODUCTION

Page 6: Techdays 2012 - Tout sur Microsoft Speech

La solution de synthèse et reconnaissance vocale de Microsoft

En évolution constante depuis la première release (1995)

Intégré à tous les Windows depuis Windows 95

Integré au framework .Net depuis la release du Framework .Net 3.0

Speech, c’est quoi ?

Page 7: Techdays 2012 - Tout sur Microsoft Speech

Une interface NUI (Natural User Interface)

Utilisé pour la commande d’interface à la voix

Très utile pour des interfaces à destination de personnes à mobilité réduite.

Ne nécessite pas d’apprentissage pour fonctionner, mais il est vivement conseillé pour une meilleure reconnaissance.

Speech, c’est quoi ?

Page 8: Techdays 2012 - Tout sur Microsoft Speech

A la base vient de la « SAPI ».

Disponible avec l’assembly « System.Speech.dll » :Synthèse vocale : « System.Speech.Synthesis »Reconnaissance vocale : « System.Speech.Recognition »

Un pack par langue à télécharger

Existe aussi en version Serveur : « Microsoft.Speech », qui peut être récupéré au travers d’un SDK gratuit et ne possède pas exactement les même fonctionnalités.

Survol du Framework

Page 9: Techdays 2012 - Tout sur Microsoft Speech

La reconnaissance vocaleEn mode dictée pour convertir un discours en donnéesEn mode grammaire pour détecter des mots précis

Les modes d’utilisation

La synthèse vocalePermet de faire parler son ordinateurModulable grâce à des fichiers de configuration

Page 10: Techdays 2012 - Tout sur Microsoft Speech

RECONNAISSANCE VOCALE

Page 11: Techdays 2012 - Tout sur Microsoft Speech

Point d’entrée : Classe « SpeechRecognitionEngine »

Moteur alimenté par des grammairesObjets de type « Grammar »

Moteur configuré pour une langue à la fois

Plus efficace avec le langage naturel « Ouvrier » au lieu de « Péon »

Reconnaissance vocale

Page 12: Techdays 2012 - Tout sur Microsoft Speech

Permet la transcription de la voix en données

Chaîne de caractères

Utilisation d’une « grammaire de dictée »Objet « DictationGrammar »

Exemple d’utilisationTraduire à la volée un discours en utilisant « Microsoft Translation »

Mode reconnaissance automatique (Dictée)

Page 13: Techdays 2012 - Tout sur Microsoft Speech

Pour scruter certains mots ou expressions

Une grammaire, c’est :Un ensemble de règles définissant quoi reconnaîtreUn tag permettant d’identifier la règle reconnue

On crée une grammaire :En lisant un fichier SML (Semantic Markup Language)A partir d’un objet GrammarBuilder

Mode reconnaissance par grammaire

Page 14: Techdays 2012 - Tout sur Microsoft Speech

GrammarEquivalent en code managé du fichier SMLDéfinit les mots à détecter

GrammarBuilderConstruit des objets « Grammar »Permet de générer du SML

Mode reconnaissance par grammaire

Page 15: Techdays 2012 - Tout sur Microsoft Speech

Exemple de fichier SML

Mode reconnaissance par grammaire

Page 16: Techdays 2012 - Tout sur Microsoft Speech

DEMO

Page 17: Techdays 2012 - Tout sur Microsoft Speech

SYNTHESE VOCALE

Page 18: Techdays 2012 - Tout sur Microsoft Speech

Transformer une donnée texte en flux sonore compréhensible

Point d’entréeClasse « System.Speech.Synthesis.SpeechSynthetizer »

Trois types d’input possiblesTexte brutFichier ou texte SSMLPrompt / PromptBuilder

La synthèse vocale

Page 19: Techdays 2012 - Tout sur Microsoft Speech

SSML = Speech Synthesis Markup LanguageStandard pour la synthèse vocaleBasé sur XMLSpécification disponible sur le site du W3C

http://www.w3.org/TR/speech-synthesis/

Permet d’améliorer la qualité du rendu de la synthèseSimple : Une quinzaine de balises

<say-as><emphasis><break>…

SSML en bref

Page 20: Techdays 2012 - Tout sur Microsoft Speech

Exemple de Fichier SSML

Page 21: Techdays 2012 - Tout sur Microsoft Speech

Prompt Equivalent .Net du fichier SSML

PromptBuilderConstruit des objets PromptPermet de générer du SSML

Prompt & PromptBuilder

Page 22: Techdays 2012 - Tout sur Microsoft Speech

DEMO

Page 23: Techdays 2012 - Tout sur Microsoft Speech

KINECT

Page 24: Techdays 2012 - Tout sur Microsoft Speech

Repérage spatial des sources audio

Atténuation native du bruit ambiant

Le SDK Kinect inclue le SDK Microsoft Speech

Kinect

Page 25: Techdays 2012 - Tout sur Microsoft Speech

DEMO

Page 26: Techdays 2012 - Tout sur Microsoft Speech

Sébastien Putier Blog : http://sputier.wordpress.com Email : [email protected]

Nicolas Calvi Blog : http://blog.nicolascalvi.com/ Facebook : Black Blog Twitter : @nicolascalvi Email : [email protected]

Contacts

Page 27: Techdays 2012 - Tout sur Microsoft Speech

Chaque semaine, les DevCampsALM, Azure, Windows Phone, HTML5, OpenDatahttp://msdn.microsoft.com/fr-fr/devcamp

Téléchargement, ressources et toolkits : RdV sur MSDNhttp://msdn.microsoft.com/fr-fr/

Les offres à connaître90 jours d’essai gratuit de Windows Azure www.windowsazure.fr

Jusqu’à 35% de réduction sur Visual Studio Pro, avec l’abonnement MSDN www.visualstudio.fr

Pour aller plus loin

10 février 2012

Live Meeting

Open Data - Développer des applications riches avec le protocole Open Data

16 février 2012

Live Meeting

Azure series - Développer des applications sociales sur la plateforme Windows Azure

17 février 2012

Live Meeting

Comprendre le canvas avec Galactic et la librairie three.js

21 février 2012

Live Meeting

La production automatisée de code avec CodeFluent Entities

2 mars 2012

Live Meeting

Comprendre et mettre en oeuvre le toolkit Azure pour Windows Phone 7, iOS et Android

6 mars 2012

Live Meeting

Nuget et ALM

9 mars 2012

Live Meeting

Kinect - Bien gérer la vie de son capteur

13 mars 2012

Live Meeting

Sharepoint series - Automatisation des tests

14 mars 2012

Live Meeting

TFS Health Check - vérifier la bonne santé de votre plateforme de développement

15 mars 2012

Live Meeting

Azure series - Développer pour les téléphones, les tablettes et le cloud avec Visual Studio 2010

16 mars 2012

Live Meeting

Applications METRO design - Désossage en règle d'un template METRO javascript

20 mars 2012

Live Meeting

Retour d'expérience LightSwitch, Optimisation de l'accès aux données, Intégration Silverlight

23 mars 2012

Live Meeting

OAuth - la clé de l'utilisation des réseaux sociaux dans votre application

Prochaines sessions des Dev Camps