Le multilinguisme sur le Web Château Royal, Laval 17 octobre 2000 François Yergeau.

Post on 04-Apr-2015

102 views 0 download

Transcript of Le multilinguisme sur le Web Château Royal, Laval 17 octobre 2000 François Yergeau.

Le multilinguisme sur le Web

Château Royal, Laval17 octobre 2000

François Yergeau

2© Alis Technologies 1999-2000. Tous droits réservés

François Yergeau, 17 octobre 2000

Aperçu

Introduction Codage de texte HTML HTTP Planification d'un site mλ Structure de répertoires

3© Alis Technologies 1999-2000. Tous droits réservés

François Yergeau, 17 octobre 2000

Aperçu (suite)

Noms de fichiers Codages des fichiers Images Accessibilité Respect des normes

4© Alis Technologies 1999-2000. Tous droits réservés

François Yergeau, 17 octobre 2000

Caractéristiques du Web

Réseau hétérogène d'ordinateurs, reliés par 3 concepts : hypertexte (HTML) = texte + liens protocole de transport léger (HTTP) adresses universelles (URL)

Fondé sur des normes

5© Alis Technologies 1999-2000. Tous droits réservés

François Yergeau, 17 octobre 2000

Caractéristiques (suite)

Le Web est une grande application d'ampleur mondiale

Toutes les parties doivent fonctionner ensemble

~6000 langues dans le mondeL'application doit être multilingue

6© Alis Technologies 1999-2000. Tous droits réservés

François Yergeau, 17 octobre 2000

Des normes

Normes importantes pour : Interopérabilité minimale Terrain d’entente entre parties Correction (formelle)

Internet : beaucoup de texte codé L’i18n d’Internet est donc en

grande partie une affaire de texte codé

7© Alis Technologies 1999-2000. Tous droits réservés

François Yergeau, 17 octobre 2000

Codage de texte : objets

Texte formé de caractères Caractères doivent être saisis,

transmis, traités et affichés Le texte codé est au centre :

la saisie le produit ; l’affichage le consomme ; le traitement le transforme ; la transmission le déplace.

8© Alis Technologies 1999-2000. Tous droits réservés

François Yergeau, 17 octobre 2000

Qu’est-ce qui peut clocher ?

$B$"$j$,$H$&$4$6$$$^$7$?!#O@J8$r

<h$j$K9T$-$^$7$?!#<+EY$NO@J8(J

Codage mal identifié

9© Alis Technologies 1999-2000. Tous droits réservés

François Yergeau, 17 octobre 2000

Normes de JdC codés

7 bits : ISO 646 (ASCII + variantes) 8 bits :

IBM EBCDIC (plusieurs variantes) Pages de code DOS & Windows ISO 8859-x Série ASMO (arabe) ISCII (écritures indiennes, ×9) JIS X 202 (kanas japanais) ...

10© Alis Technologies 1999-2000. Tous droits réservés

François Yergeau, 17 octobre 2000

Normes de JdC codés

16 bits ou plus : JIS X 0208, 0212 (japonais) KS C 5601 (coréen) GB 2312 (chinois simplifié) Big5 (chinois traditionnel) CNS 11643 (chinois) ISO 10646 (Unicode) ...

11© Alis Technologies 1999-2000. Tous droits réservés

François Yergeau, 17 octobre 2000

Le paramètre « charset » MIME

MIME : Multipurpose Internet Mail Extensions

En-têtes MIME indique format,… Le paramètre « charset »

Indique le codage des caractères Complet des octets aux caractères Utilisé par protocoles pour l’identification

des codages

12© Alis Technologies 1999-2000. Tous droits réservés

François Yergeau, 17 octobre 2000

HTML

HTML 2.0, 3.2 basés sur ISO 8859-1 (Latin 1). « World Wide » ?

En réalité, autres JdC utilisés, pas de standard, problèmes de compatibilité

I18n dans RFC 2070 puis HTML 4.0, basée sur Unicode

14© Alis Technologies 1999-2000. Tous droits réservés

François Yergeau, 17 octobre 2000

Architecture HTTP

Architecture simple requête-réponse

Utilise des mécanismes à la MIME pour étiquetage et éléments de protocole

Comprend la négociation de contenu

15© Alis Technologies 1999-2000. Tous droits réservés

François Yergeau, 17 octobre 2000

HTTP 1.1 - Négociation

Serveur Client

GET <url> HTTP/1.1[ACCEPT_LANGUAGE:fr,nl,ru]

HTTP/1.1 200 Le document suitContent-Type: text/html; charset=ISO-8859-5Content-Language: ru[...]<document>

16© Alis Technologies 1999-2000. Tous droits réservés

François Yergeau, 17 octobre 2000

Préférences linguistiques

17© Alis Technologies 1999-2000. Tous droits réservés

François Yergeau, 17 octobre 2000

Site international

L'accessibilité globale ne rend pas un site international

Un site international a besoin de : TRADUCTION du contenu LOCALISATION du contenu, c.-à-d.

adaptation à la culture du visiteur

18© Alis Technologies 1999-2000. Tous droits réservés

François Yergeau, 17 octobre 2000

Planification

Quelles langues ? Étude de marché ? Site existant : refonte ou ajout

d’une couche linguistique ? Localiser par pays/région ou

essayer de rester culturellement neutre ?

19© Alis Technologies 1999-2000. Tous droits réservés

François Yergeau, 17 octobre 2000

Planification (suite)

Variables : Coût Durée de développement Ressources humaines :

GestionRédaction

TraductionGraphisme

Intégration HTMLWebmestreSoutien clientèleConsultants

20© Alis Technologies 1999-2000. Tous droits réservés

François Yergeau, 17 octobre 2000

Structure

21© Alis Technologies 1999-2000. Tous droits réservés

François Yergeau, 17 octobre 2000

Structure (suite)

Organisation par contenu : Facilite l'administration du site Facilite les mises à jour

Organisation par langues : Semble logique, mais moins

recommandable Force la ségrégation ou la copie d'images

ou autre qui résident dans le répertoire de la page

22© Alis Technologies 1999-2000. Tous droits réservés

François Yergeau, 17 octobre 2000

Noms de fichiers

Insérez code de langue ISO entre nom et extension : index.fr.html

Attention à l'intuition ! Ne traduisez pas ! http://babel.alis.com/

langues/iso639.htm

23© Alis Technologies 1999-2000. Tous droits réservés

François Yergeau, 17 octobre 2000

Négociation de langue

Une telle organisation permet la négociation de langue HTTP

Permet aussi de ne pas tout traduire si désiré, puisqu'il y a repli intelligent : si pas xx, alors yy, sinon zz, sinon langue par défaut

24© Alis Technologies 1999-2000. Tous droits réservés

François Yergeau, 17 octobre 2000

Seul mécanisme ou supplément à la négociation

Choix à faire : Sur chaque page (site à encadrés) Sur page d'accueil (interdit la

navigation) Mélange

Sélecteurs de langue

25© Alis Technologies 1999-2000. Tous droits réservés

François Yergeau, 17 octobre 2000

Sélecteurs de langue

Drapeaux Liste(sites distribués)

Erreur !Boutons

26© Alis Technologies 1999-2000. Tous droits réservés

François Yergeau, 17 octobre 2000

Images textuelles

Sélecteurs de langue

27© Alis Technologies 1999-2000. Tous droits réservés

François Yergeau, 17 octobre 2000

Codage des fichiers

Utiliser un JdC approprié normes ISO standards de facto Unicode !

Avec serveur approprié, plusieurs JdC

Il faut identifier le JdC !

28© Alis Technologies 1999-2000. Tous droits réservés

François Yergeau, 17 octobre 2000

Documents auto-étiquetés

<META HTTP-EQUIV="Content-Type"

CONTENT="text/html; charset=UTF-8">

Ne marche pas toujoursTranscodageCodages complexes non-ASCII

29© Alis Technologies 1999-2000. Tous droits réservés

François Yergeau, 17 octobre 2000

Codage des fichiers

Ne pas utiliser d’entités (&eacute;) ou références numériques (&#233;), surtout faussementmauvais affichageproblèmes moteurs de recherchecomplique l’édition

Outils multilingues plus agiles

30© Alis Technologies 1999-2000. Tous droits réservés

François Yergeau, 17 octobre 2000

Balisage de langue

Le balisage de langue aide à: lever les ambiguïtés sur les glyphes contrôler la césure, les guillemets,

l’espacement, les ligatures permettre la synthèse de parole, le

Braille, etc (accessibilité, cf WAI). contrôler la classification, la

recherche et le tri

31© Alis Technologies 1999-2000. Tous droits réservés

François Yergeau, 17 octobre 2000

Balises de langue

La plupart des éléments HTML admettent l’attribut LANG

<span lang="ar"></span>

Valeur de LANG selon RFC 1766: fr ISO 639 en-US ISO 639 + 3166 i-cherokee registre IANA x-machin « expérimental »

32© Alis Technologies 1999-2000. Tous droits réservés

François Yergeau, 17 octobre 2000

Images

Images sont attrayantes, mais...

Traduction + chère, - rapide Éviter pour en-tête et paragraphes Utiliser les CSS

33© Alis Technologies 1999-2000. Tous droits réservés

François Yergeau, 17 octobre 2000

Images : aspects culturels

Adaptation : sens de

lecture

interprétation des couleurs, des symboles

34© Alis Technologies 1999-2000. Tous droits réservés

François Yergeau, 17 octobre 2000

Accessibilité

Le W3C publie des directives pour favoriser l'accès au Web par les handicapés

Obligation légale ? De toute façon, de bon conseil

http://www.w3.org/1999/05/WCAG-RECPressRelease

35© Alis Technologies 1999-2000. Tous droits réservés

François Yergeau, 17 octobre 2000

Respect des normes

Rendez vos pages traitables : indexables par moteurs de

recherche traduisibles par machine utilisables par éditeurs standards

Rendez vos pages durables, ré-utilisables (WAP), accessibles

36© Alis Technologies 1999-2000. Tous droits réservés

François Yergeau, 17 octobre 2000

Respect des normes

Rendez vos pages universelles, indépendantes de : la taille de l'écran la marque ou la version du fureteur

Demandez-vous si ça fonctionne sur divers systèmes

Validez : http://validator.w3.org/

37© Alis Technologies 1999-2000. Tous droits réservés

François Yergeau, 17 octobre 2000

En résumé

Respect des langues

Respect des cultures

Respect des normes

Accessibilité

38© Alis Technologies 1999-2000. Tous droits réservés

François Yergeau, 17 octobre 2000

La première « autoroute » numérique !

Claude Chappe

• Né a Brûlon (200 km de Paris) en 1763

• Créateur du premier réseau télégraphique optique international

Message transmis le 2 mars 1791 sur 16 km:

« L’Assemblée Nationale récompensera les

expériences utiles au public ».

Durée de transmission: 6 minutes 20 secondes

39© Alis Technologies 1999-2000. Tous droits réservés

François Yergeau, 17 octobre 2000

Bruxelles

Une leçon d’histoire...

Amsterdam

ParisMayence

Strasbourg

Lyon

Brest

Bordeaux

Bayonne

Toulon

Venise

En 1852...

• 556 stations• 4800 km• 27 grandes villes

reliées

40© Alis Technologies 1999-2000. Tous droits réservés

François Yergeau, 17 octobre 2000

Q&R