Traduction Assistée par Ordinateur Généralités

of 38 /38
Traduction Assistée par Ordinateur Généralités UCO - IPLV Dr. Emmanuel Planas [email protected]

Embed Size (px)

description

UCO - IPLV Dr. Emmanuel Planas [email protected] Traduction Assistée par Ordinateur Généralités. Les ressources informatiques pour le traducteur. L’ensemble des éléments informatiques utilisables par les traducteurs s’appellent des « ressources informatiques » Il peut s’agir : - PowerPoint PPT Presentation

Transcript of Traduction Assistée par Ordinateur Généralités

Bureautique pour Traducteur

Traduction Assiste par OrdinateurGnralitsUCO - IPLVDr. Emmanuel [email protected] ressources informatiques pour le traducteurLensemble des lments informatiques utilisables par les traducteurs sappellent des ressources informatiquesIl peut sagir :de logiciels : ex.: lenvironnement de traduction SDL Trados Studiode fichiers sur ordinateurs locaux : ex.: un dictionnaire lectronique sur CDde fichiers en ligne : ex.: le Grand Dictionnaire : http://www.granddictionnaire.comUCO - IPLV - TAO - Initiation - [email protected] de ressources informatiques en TraductionLocauxEn ligneDictionnaires lectroniquesCollins, Harraps, Hachettewww.granddictionnaire.com

Bases de donnes terminologiques fixes ou modifiablesTermium

Multitermwww.btb.termiumplus.gc.ca/www.inventerm.com/

Traduction Assiste par Ordinateur (TAO), Mmoires de traduction.SDL Studio/Trados, Similis, Memo Q, WordFast, www.tsrali.com/query.cgiwww.webitext.com/bin/webitext.cgiAnnuaires InternetXOpen Directory ( http://dmoz.org )

Moteurs de recherche InternetCopernichttp://scholar.google.fr/

Sites Internet ddisXhttp://eur-lex.europa.eu

Portails de TraducteursXwww.proz.com,http://www.translatorscafe.com3UCO - IPLV - TAO - Initiation - [email protected] lectroniquesDfinitionVocabulaire Gnral le plus souventEntres de structure dfinieCaractristiquesNon modifiables sauf exceptionEn gnral non exploitable via un autre logicielExemplesCollins CDCollins on line4UCO - IPLV - TAO - Initiation - [email protected] de donnes terminologiques (BDT)DfinitionSpcifique un domaine ou sous-domaineChaque entre possde une structure fixe Terme source (cible) / dfinition / gloses / exemplesCaractristiquesCertaines BDT sont fixes : elles ne peuvent pas tre modifies, mais seulement consultes. Exemples :Ex.: Termium IPhone ou BlackberryEx.: Termium Plus en ligne : http://www.btb.termiumplus.gc.caEx.: IATE en ligne : http://iate.europa.euDautres sont vendues vides au dpart.Ex. : Multiterm, Term Star5Annuaires et Moteurs InternetUn annuaire Internet est une liste de liens Internet cr par des personnesEx.: http://www.wiwiannuaire.com/sciences/Un moteur de recherche Internet est un rpertoire cr automatiquement par les indexeurs.Ex.: http://www.exalead.fr/search/Logiciels de Traduction Assiste par lOrdinateur(= Environnements de Traduction)Les outils de TAO (ou EnT) sont un exemple de ressources informatiques pour le traducteurIls dsignent un logiciel offrant des outils daide la traduction tels que :Un diteur de traductionUne mmoire de traductionUne base terminologiqueUn correcteur orthographiqueUn systme dAssurance Qualit (QA checking)FranaisAnglaisTraduction Assiste par Ordinateur (TAO)Computer Assisted Translation (CAT)Environnement de Traduction (EnT)Translation environment Tool (TenT)Principe dun TenT (tent)Prsenter le document traduire dans une interface qui reste la mme quelque soit le format de dpart (Word, HTML, InDesign, PPT, Excel, )Offrir des outils de base ddition : correcteur orthographique, mise en page, gestion des lments non textuels (balises HTML)Offrir plusieurs types doutils via diffrentes fentres, sous une interface unique :Base de donnes de phrases : mmoire de traductionBase de donnes de termes : gestion terminologiqueOutils dassurance qualit

UCO - IPLV - TAO - Initiation - [email protected] de traduction (MT)DfinitionListe de phrases et de leur traductionNB : les MT de 2me gnration offrent aussi une liste liste de syntagmes et leurs traductionsEx: [Cette phrase] [est constitue] [de trois syntagmes spars par des crochets]Attention FR: Phrase EN: Sentence ; FR:Syntagme EN: Phrase !Une MT permet de stocker des traductions de phrases et de les rutiliserCaractristiques lorigine un logiciel de mmoire de traduction :Est vide au dpart : il faut la remplir avec ses donnes (ou celles de clients)Quelques sites proposent des mmoires dj constitues9Principe dune Mmoire de Traduction 10Les grandes tapesA : Traduction par un humainB : Alimentation de la mmoire (Alignement)C : Pr-traduction du documentD : Traduction du traducteur en interaction avec la MTCration dune mmoire de traduction (MT)Document source (original)Document cible (traduit)MmoirePhase B Apprentissage des traductions (Alignement ou Interface de traduction)Phase A - Traduction (Le Traducteur traduit)Mmoire de traductionLes donnes traductions dune MT sont dorigine humaineLa MT apprend sa mmoire via le module dalignement ou directement dans linterface de traduction12MT Phase BApprentissage de la traductionLapprentissage est ralis :Soit en utilisant linterface de traduction, en cours de traduction : chaque traduction dun segment, cette traduction est associe au segment de dpart et enregistre dans une mmoireSoit en utilisant un Aligneur : cet outil permet de rcuprer danciennes traductions et den faire une mmoireLapprentissage constitue des Units de Traduction qui sont enregistres dans la mmoire.Chaque Unit de Traduction (FR:UT, EN: TU) est elle-mme constitue :dune partie source contenant la phrase de dpartdune partie cible contenant la traductiondinformations complmentaires : date de cration, langues, non du crateur, nom du client, domaine, sous-domaine,

Fonctionnement de laligneurClose all windowsFermer toutes les fentresMmoireIn order to start the import, choose import in the file menu.Close all windows. Now you canPour dmarrer limport, choisir import dans le menu fichier.Fermer toutes les fentres. Maintenant, vous pouvezAncien texte sourceSegment sourceSegment cibleLaligneur:Dcoupe le texte source en phrasesOn parle de segmentationCela se fait suivant des rgles de segmentationPuis associe une phrase avec sa traduction.On parle d alignement ou appariementLes algorithmes dalignement russissent entre 90% et 99%Il est donc ncessaire de vrifier les alignementsBon savoir : lalignement de textes traduits (on parle de textes parallles) a bien occup les chercheurs en linguistique informatique dans les annes 90. Les mthode dalignement font souvent appel des mathmatiques statistiques complexesUnit de traductionAncien Texte cibleExemple dinterface de validation dalignements

Utilisation de la mmoire de traductionNouveau document sourceNouveau document traduitMmoireD Traduction en interaction dans linterfaceC - Pr-traductionMmoire de traductionUne fois la mmoire de traduction constitue, la MT permet :Une Pr-traduction : la MT remplace automatiquement les phrases qui sont identiquement trouves en mmoire pour lesquelles une traduction existeLa proposition de UT de la mmoire comme de traduction, en interaction dans lditeur de traduction, dans le cas o une phrase similaire sy trouve16Mmoire de TraductionMcanisme de proposition de UTPour proposer des traductions enregistres en mmoire, le logiciel de MT va dabord :segmenter le nouveau texte traduire en segments, suivant des rgles de segmentationMmoireClose all windowsYou will now learn how to create a table. Close all windows. Select new from the file menu,Nouveau texte sourceClose all windowsFermer toutes les fentresProposition de traductionPhrase traduirePuis, chacun des segments traduire est compar la partie source des units de traductionSi une UT correspond au niveau de sa partie source, le logiciel de MT propose alors sa partie cible comme traductionLa correspondance peut se faire de faon approche. Ex.: si 9 des mots sur 10 du segment traduire se retrouvent dans la partie source de lUT, alors la correspondance est dite 90% (NB: dans la ralit, il sagit plutt dun % de caractres).

ComparaisonExemple dinterface de traduction dune MT

Mmoire de Traduction vs Moteur de traduction AutomatiqueUne mmoire de traduction est une collection de traductions effectues au dpart par des traducteurs humainsEx.: Atril Dj Vu, SDL Trados Studio, OmegaTUn moteur de traduction gnre automatiquement des traductions partir dalgorithmes artificielsEx.: Systran, Google Translate, SoftissimoAttention :FR: Mmoire de Traduction (MT) | EN: Translation Memory (TM)FR: Traduction Automatique (TA) | EN : Machine Translation (MT)

Base de donnes terminologiquePrincipePrincipe dun BDTUne Base Terminologique est une collection de termes sources associs leur traduction (termes cibles)Une entre de la base comprend:Le terme sourceLe terme cibleDautres donnes telle que : le domaine, sous-domaine, le genre, la catgorie grammaticale, le concept associ, le nom du crateur, la date de cration, le statut (valid ou pas), .Exemple de BDT

Proposition dun terme (Photo printer imprimante photo), provenant dune base terminologique, dans linterface de traduction de SDL Trados StudioAvantages dune MTSur les documents trs rptitifs, un MT permet de gagner du tempsUne MT assure la cohrence de la traduction et traduisant de la mme faon les phrases identiquesLinterface unique, quelque soit le format des documents traduits, permet dacclrer la traduction

InconvnientsLutilisation de phrases pr-traduites tend appauvrir le styleLes mmoires pouvant provenir dautres traducteurs, il est plus difficile den contrler la qualitLes mmoires, avec lge, ont tendance se polluerNon mises jour, elles peuvent faire rfrence une terminologie obsolteLa segmentation artificielle du texte peut gner la traduction traditionnelle

UCO - IPLV - TAO - Initiation - [email protected] de Traduction Locales> 10%Top fourSDL Studio / TradosWordfastDj VuSDLXCommunesStar TransitMultitransOmega-TMemo QOutils de LocalisationAlchemy Catalyst, AppleTrans , Fusion Translate CMT, Heartsome, LocFactory Editor, Logi-Term, Logi-Trans , Logobit Localizer, MS LocStudio, Multilizer, (SDL) Passolo, Po Edit, RC Win Trans, Tstream Editor Studio, Visual Localize, XL8< 10%AcrossCafetransCats-CradleCBG TranstoolDr EyeEnlasoForeignDeskHeliumIBM Translation Manager(SDL) IdiomiLocalizeKbabelLogoVistaLingoTekLogiTransMS HeliumMetatexisMnemeNo BabelOpen Language toolsProMemoriaSimilisTrAiDTranslation intuitionTrans Web ExpressTransolutionOpen Language ToolsTransware AmbassadorWebBudgetWordFischerHeartsomeModules de mmoires de traduction intgres dans des outils d'dition globaleMadCap, LingoTekhttps://webtranslateit.com/fr25UCO - IPLV - TAO - Initiation - [email protected] de traduction en ligneLocalesEn ligneVides modifiablesGoogleTranslation Kit

WordBeehttp://translate.google.com/toolkit/list?hl=fr#translations/active

http://www.wordbee.com/Default.aspx

contenuTransearch

Linguee

http://www.tsrali.com/query.cgi

http://www.linguee.fr/ contenu modifiableWordfast VLTM

Windi

Lionbridge FreeWay

TAO XTMhttp://www.wordfast.com/products_vltm.html

http://www.windi7.com/index.php

https://freeway.lionbridge.com/

http://www.xtm-intl.com/xtmcloud

26Standardschange de mmoires : TMXTranslation Memory eXchangeOrganisme LISAXMLListe de segments entre balisesPlusieurs versions :1.11.4b : permet le transport de donnes de formatage du document dorigineExemple de fichier TMX Text in bold. Texte en gras.

change de Termes : TBXTerm Base eXchangeOrganisme LISAXMLListe de termes entre balises

Exemple de fichier TBX

Restaurant Menu Items79 the thigh of a frog leg (the foot has beenremoved)

frog legs

cuisses de grenouilles

change de rgles de dcoupage : SRXSegmentation Rules eXchangeOrganisme LISAXMLListe de rgles entre balisesExemple de rgle SRX

^\s*[0-9]+\.\s\n[\.\?!]+\s

XLIFF: format de travaux de traductionXLIFFAssurance QualitAQ/QAModule du logiciel de TA qui permet de sassurer de ce que certaines caractristiques textuels sont bien respectesQuelques exemples:Espaces ou pas aprs les : ou %Elimination des doubles espacesPas de Mr en FR, mais des M.Mise en exposant du lle de MlleUtilisation de guillemets FR ou pasTransfert de balises HTMLFormat des dates..

UCO - IPLV - TAO - Initiation - [email protected] de TraductionRception de fichiersExtraction du texte traduire / filtrage du formatvaluation de la tailleRecherche terminologique prparatoireImport des mmoiresvaluation de la redondanceRpartition du travailPrtraductionTraductionRvisionRelectureIntgration au format initialRelecture sous formatCorrection de la traduction (et boucle)Sauvegarde des mmoires de traductionConsolidation de la terminologie37Terminologie de la TOUnit de TraductionPr-TraductionAlignementditeur de traductionSegmentSegmentationRgle de segmentationSource / cible

CorrespondanceExacteApprocheFuzzy / Exact MatchSeuil de similitudeTermesAssurance Qualit