Une administration qui répond sans faute à ses usagers.
Une administration qui répond sans faute à ses usagers.
Microsoft vient de mettre à disposition de ses clients une mise à jour gratuite permettant de conformer le vérificateur orthographique des programmes de la suite logicielle Office 2003 (Word, Outlook, PowerPoint…) à la nouvelle orthographe française. Interview de Thierry Fontenelle, l’un des spécialistes du traitement automatique du langage qui veillent à améliorer les outils de vérification linguistique proposés dans nos outils.
Pourquoi une firme telle que Microsoft investit-elle dans les outils linguistiques? Et de quels outils linguistiques parle-t-on ?
Les utilisateurs des outils de Microsoft créent, éditent, diffusent et lisent des textes tant dans leur langue maternelle que dans d’autres langues. Il est donc naturel de leur offrir des outils les aidant à améliorer la qualité linguistique de ces textes et à comprendre les documents qu’ils reçoivent. Un groupe comme le mien, le Speech & Natural Language group, est principalement chargé du développement de divers outils de vérification linguistique comme par exemple, pour le français, le correcteur orthographique ou le correcteur grammatical. Nous sommes quelques dizaines de linguistes et d’informaticiens provenant du monde entier et nous tentons de percer les secrets du langage dit « naturel », par opposition aux langues artificielles utilisées par les programmeurs. Nous collaborons également avec d’autres équipes comme l’International Proofing Tools team basée à Dublin et d’autres groupes d’Office ou d’Encarta.
Ces outils évoluent-ils ?
Oui, ils évoluent tout simplement parce que la langue elle-même évolue, de même que la technologie. Nous avons sorti il y a quelques mois un nouveau correcteur grammatical français, ainsi qu’un tout nouveau correcteur orthographique pour la suite Microsoft Office 2003 (ils sont inclus dans le Service Pack 2 d’Office 2003 et donc librement téléchargeables via le centre de téléchargement d’Office). Ces nouveaux outils tiennent compte des recommandations orthographiques de l’Académie française et du Conseil Supérieur de la Langue Française, mais aussi de l’évolution de la langue en matière de féminisation de noms de métiers (il reconnaît donc des mots comme professeure, députée, écrivaine ou sénatrice). Sans parler bien sûr de néologismes tels que blog ou blogosphère ou webcam.
En quoi nos outils se distinguent-ils de ceux de nos concurrents ?
S’agissant du correcteur orthographique, nous avons probablement un des dictionnaires les plus complets qui existent. Certains mettent parfois en doute la nécessité d’inclure des noms propres dans ces correcteurs. Nos synergies avec nos collègues d’Encarta nous ont permis d’améliorer la couverture de nos dictionnaires en incluant des bases de données de termes géographiques (noms de provinces, de rivières, de villes…) ou de personnages célèbres. On ne peut bien sûr pas inclure tous les noms propres (ce n’est pas désirable), mais nos utilisateurs comptent sur nos outils pour corriger leurs erreurs et leur suggérer la bonne orthographe en cas d’erreur. Que l’on soit enseignant, journaliste, étudiant, fonctionnaire, secrétaire ou homme d’affaires, on attend du correcteur de Microsoft qu’il nous signale que Sarkozy s’écrit avec un –y et pas un –i, que de Villepin s’écrit avec –pin et pas –pain, que Bolkestein est l’orthographe correcte et pas [Bolkenstein]. De la même façon, nos utilisateurs attendent de nos outils qu’ils soulignent des erreurs aussi fréquentes que [portes-documents], [lances-missiles] ou [tires-laits] (puisque porte, lance et tire sont invariables dans ce genre de construction).
Je me dois également de souligner qu’un label de qualité nous a été récemment décerné par le site http://www.orthographe-recommandee.info/ émanant du groupe de modernisation de la langue française, ce qui confirme la qualité de nos nouveaux outils.
Nous offrons également des outils de plus en plus performants au niveau de la correction grammaticale, qui souligne les fautes en vert. Ainsi, la nouvelle version du correcteur grammatical français est beaucoup plus performante et identifie de nombreuses erreurs extrêmement fréquentes, notamment en matière d’accord du participe passé, d’infinitif ou d’utilisation du trait d’union, pour ne citer que quelques exemples. Nous sommes ainsi en mesure de repérer des phrases fautives telles que les suivantes et de proposer les formes correctes (que l’utilisateur peut voir en cliquant avec le bouton droit de la souris sur les mots soulignés en vert):
J’ai [télécharger] la mise à jour. (-> téléchargé)
Tu viens [joué] avec moi ? (-> jouer)
[Donnez lui] 10 euros. (-> Donnez-lui)
Il travaille [a] Paris depuis trois ans. (-> à)
Il est [dores] et déjà satisfait. (-> d’ores)
Les outils linguistiques que nous offrons se limitent-ils à ces deux correcteurs ?
Non, loin de là. Nous offrons également des dictionnaires de synonymes, ainsi que des outils de césure automatique. Depuis la version d’Office 2003, le dictionnaire monolingue français d’Encarta est également accessible directement depuis Office Word : vous pouvez ainsi consulter cette ressource très précieuse (des dizaines de milliers de définitions et d’exemples) en cliquant sur un mot avec le bouton droit de la souris et en choisissant la fonction « rechercher ». Il suffit de disposer d’un accès à internet et la consultation est instantanée, les définitions apparaissant dans le volet de référence ! La panoplie des outils inclut également d’autres ressources, comme par exemple le dictionnaire monolingue anglais d’Encarta et toute une gamme de dictionnaires bilingues, très utiles pour comprendre un texte rédigé dans une langue étrangère, par exemple. Ici aussi, il suffit de cliquer sur un mot avec le bouton droit de la souris et de choisir la fonction de traduction.
Tenez-vous compte des suggestions des utilisateurs ? Comment travaillez-vous ?
Oui, bien sûr, nous tenons compte des avis des utilisateurs. Nous respectons les recommandations des autorités linguistiques compétentes (Académie française, Conseil Supérieur de la Langue Française, groupe de modernisation de la langue française…). Nous opérons une veille lexicale, c’est-à-dire que nous utilisons de gros corpus de textes pour détecter des néologismes par exemple ou pour identifier les fautes les plus fréquentes. Nos synergies avec d’autres groupes nous permettent également d’améliorer nos bases de données. Nous sommes aussi en contact avec nos utilisateurs via les forums de discussion, les conférences académiques où l’on nous demande régulièrement de parler de notre technologie linguistique (comme tout récemment lors du congrès TALN 2006 de l’Association pour le Traitement Automatique du Langage), ou même par l’intermédiaire d’un blog où nous tentons de tenir nos utilisateurs au courant des derniers développements dans notre domaine et de leur expliquer pourquoi le développement de ces outils est à la fois passionnant et difficile (http://blogs.msdn.com/CorrecteurOrthographiqueOffice/default.aspx).
Pour plus d’informations, voir aussi : http://office.microsoft.com/fr-fr/assistance/HA011882161036.aspx
Pourquoi une firme telle que Microsoft investit-elle dans les outils linguistiques? Et de quels outils linguistiques parle-t-on ?
Les utilisateurs des outils de Microsoft créent, éditent, diffusent et lisent des textes tant dans leur langue maternelle que dans d’autres langues. Il est donc naturel de leur offrir des outils les aidant à améliorer la qualité linguistique de ces textes et à comprendre les documents qu’ils reçoivent. Un groupe comme le mien, le Speech & Natural Language group, est principalement chargé du développement de divers outils de vérification linguistique comme par exemple, pour le français, le correcteur orthographique ou le correcteur grammatical. Nous sommes quelques dizaines de linguistes et d’informaticiens provenant du monde entier et nous tentons de percer les secrets du langage dit « naturel », par opposition aux langues artificielles utilisées par les programmeurs. Nous collaborons également avec d’autres équipes comme l’International Proofing Tools team basée à Dublin et d’autres groupes d’Office ou d’Encarta.
Ces outils évoluent-ils ?
Oui, ils évoluent tout simplement parce que la langue elle-même évolue, de même que la technologie. Nous avons sorti il y a quelques mois un nouveau correcteur grammatical français, ainsi qu’un tout nouveau correcteur orthographique pour la suite Microsoft Office 2003 (ils sont inclus dans le Service Pack 2 d’Office 2003 et donc librement téléchargeables via le centre de téléchargement d’Office). Ces nouveaux outils tiennent compte des recommandations orthographiques de l’Académie française et du Conseil Supérieur de la Langue Française, mais aussi de l’évolution de la langue en matière de féminisation de noms de métiers (il reconnaît donc des mots comme professeure, députée, écrivaine ou sénatrice). Sans parler bien sûr de néologismes tels que blog ou blogosphère ou webcam.
En quoi nos outils se distinguent-ils de ceux de nos concurrents ?
S’agissant du correcteur orthographique, nous avons probablement un des dictionnaires les plus complets qui existent. Certains mettent parfois en doute la nécessité d’inclure des noms propres dans ces correcteurs. Nos synergies avec nos collègues d’Encarta nous ont permis d’améliorer la couverture de nos dictionnaires en incluant des bases de données de termes géographiques (noms de provinces, de rivières, de villes…) ou de personnages célèbres. On ne peut bien sûr pas inclure tous les noms propres (ce n’est pas désirable), mais nos utilisateurs comptent sur nos outils pour corriger leurs erreurs et leur suggérer la bonne orthographe en cas d’erreur. Que l’on soit enseignant, journaliste, étudiant, fonctionnaire, secrétaire ou homme d’affaires, on attend du correcteur de Microsoft qu’il nous signale que Sarkozy s’écrit avec un –y et pas un –i, que de Villepin s’écrit avec –pin et pas –pain, que Bolkestein est l’orthographe correcte et pas [Bolkenstein]. De la même façon, nos utilisateurs attendent de nos outils qu’ils soulignent des erreurs aussi fréquentes que [portes-documents], [lances-missiles] ou [tires-laits] (puisque porte, lance et tire sont invariables dans ce genre de construction).
Je me dois également de souligner qu’un label de qualité nous a été récemment décerné par le site http://www.orthographe-recommandee.info/ émanant du groupe de modernisation de la langue française, ce qui confirme la qualité de nos nouveaux outils.
Nous offrons également des outils de plus en plus performants au niveau de la correction grammaticale, qui souligne les fautes en vert. Ainsi, la nouvelle version du correcteur grammatical français est beaucoup plus performante et identifie de nombreuses erreurs extrêmement fréquentes, notamment en matière d’accord du participe passé, d’infinitif ou d’utilisation du trait d’union, pour ne citer que quelques exemples. Nous sommes ainsi en mesure de repérer des phrases fautives telles que les suivantes et de proposer les formes correctes (que l’utilisateur peut voir en cliquant avec le bouton droit de la souris sur les mots soulignés en vert):
J’ai [télécharger] la mise à jour. (-> téléchargé)
Tu viens [joué] avec moi ? (-> jouer)
[Donnez lui] 10 euros. (-> Donnez-lui)
Il travaille [a] Paris depuis trois ans. (-> à)
Il est [dores] et déjà satisfait. (-> d’ores)
Les outils linguistiques que nous offrons se limitent-ils à ces deux correcteurs ?
Non, loin de là. Nous offrons également des dictionnaires de synonymes, ainsi que des outils de césure automatique. Depuis la version d’Office 2003, le dictionnaire monolingue français d’Encarta est également accessible directement depuis Office Word : vous pouvez ainsi consulter cette ressource très précieuse (des dizaines de milliers de définitions et d’exemples) en cliquant sur un mot avec le bouton droit de la souris et en choisissant la fonction « rechercher ». Il suffit de disposer d’un accès à internet et la consultation est instantanée, les définitions apparaissant dans le volet de référence ! La panoplie des outils inclut également d’autres ressources, comme par exemple le dictionnaire monolingue anglais d’Encarta et toute une gamme de dictionnaires bilingues, très utiles pour comprendre un texte rédigé dans une langue étrangère, par exemple. Ici aussi, il suffit de cliquer sur un mot avec le bouton droit de la souris et de choisir la fonction de traduction.
Tenez-vous compte des suggestions des utilisateurs ? Comment travaillez-vous ?
Oui, bien sûr, nous tenons compte des avis des utilisateurs. Nous respectons les recommandations des autorités linguistiques compétentes (Académie française, Conseil Supérieur de la Langue Française, groupe de modernisation de la langue française…). Nous opérons une veille lexicale, c’est-à-dire que nous utilisons de gros corpus de textes pour détecter des néologismes par exemple ou pour identifier les fautes les plus fréquentes. Nos synergies avec d’autres groupes nous permettent également d’améliorer nos bases de données. Nous sommes aussi en contact avec nos utilisateurs via les forums de discussion, les conférences académiques où l’on nous demande régulièrement de parler de notre technologie linguistique (comme tout récemment lors du congrès TALN 2006 de l’Association pour le Traitement Automatique du Langage), ou même par l’intermédiaire d’un blog où nous tentons de tenir nos utilisateurs au courant des derniers développements dans notre domaine et de leur expliquer pourquoi le développement de ces outils est à la fois passionnant et difficile (http://blogs.msdn.com/CorrecteurOrthographiqueOffice/default.aspx).
Pour plus d’informations, voir aussi : http://office.microsoft.com/fr-fr/assistance/HA011882161036.aspx
