Wiktionnaire:Langues

Consultez la liste des langues pour voir quelles sont les langues définies dans le Wiktionnaire.

Ajouter ou modifier une langue modifier

Pour ajouter ou modifier une langue et son code, il faut simplement le proposer dans la page dédiée.

Gestion des code de langues modifier

Chaque langue est repérée par un code à deux ou trois lettres (en fonction des codes BCP 47 utilisés). Ce code sert pour :

  • Repérer le nom de la langue (le modèle {{nom langue|xx}} renvoie le nom de la langue) ;
  • Introduire les mots appartenant à cette langue (dans les modèles de type {{langue|xx}}) ;
  • Catégoriser les mots (par exemple dans les catégories Prononciations manquantes ou Étymologies manquantes) ;
  • Se repérer dans les traductions (dans les modèles du type {{trad|xx|mot}}).
  • Pour une autre recherche mentionnant une liste de synonymes et la classification en tant que langue, macrolangue ou langue collective, sous forme de table triée et mise à jour selon les modèles existants et normalisés, voir aussi :
    • Wiktionnaire:BCP 47 pour la liste complète des codes langues normalisés enregistrés dans la base de données IANA des labels et sous-labels d’identification des langues, régions, écritures, variantes et leurs alias, avec leur nom en anglais (plus de 7500). La source IANA est normative et stable (mais y vérifier que le code n’a pas été rendu désuet ou défini avec un alias vers un code préféré : ne pas utiliser ces codes mais les codes de remplacement indiqués).
    • Wiktionnaire:ISO 639-1 pour la liste complète (informative) des codes de langues individuelles (ou macrolangues ou collections) les plus courantes, normalisés à deux lettres (certains sont désuets ou instables).
    • Wiktionnaire:ISO 639-2 pour la liste complète (informative) des codes de langues individuelles (ou macrolangues ou collections) les plus courantes, normalisés à trois lettres uniquement (ceux pour lesquels existent des codes langue à deux lettres ne sont pas listés ; certains sont désuets ou instables).
    • Wiktionnaire:ISO 639-3 pour la liste partielle des autres (nombreux !) codes de langues (ou macrolangues) les plus courantes, normalisés à trois lettres uniquement définis par un modèle dans le Wiktionnaire (tous ne sont pas définis : il y en aurait près de 7000 ; certains sont désuets ou instables).
    • Wiktionnaire:Vérification des modèles pour les langues pour la page de travail sur les codes langues à classer (y compris les variétés dialectales et codes spéciaux) et contrôler.
Pour chaque langue, ce sont les mêmes lettres qui servent dans tous les cas.

Les deux tableaux suivants indiquent, pour chaque langue, son nom et son code. Le premier est classé par ordre alphabétique des noms français des langues, le deuxième par ordre alphabétique des codes. Voir aussi cette liste qui fait un lien vers les noms des langues.

À classer modifier

Les éléments de la liste ci-dessous ne sont pas forcément des langues, mais peuvent être des dialectes, parlers, etc.

Suppléments extraits des locales codées dans le dépôt Unicode CLDR modifier

CLDR a opté pour diverses simplifications dans les noms de locales (par rapport aux anciennes désignations issues de l’ISO 639-1 ou ISO 639-2), mais en accord avec les normes plus récentes (maintenant référencées par BCP 47 dont la mise à jour a été finalisée et publiée dans RFC 5645[1] et RFC 5646[2] (en plus de RFC 4647[3] qui est conservé), et qui référence en plus ISO 639-3, ISO 639-5, ainsi que ISO 15924 pour les codes d’écritures, ISO 3166-1 pour les codes de pays ou territoires codés sur deux lettres, et UN M.49 pour les régions continentales codées sur 3 chiffres, et enfin le registre IANA des labels de langue comme seule source normative de tous les codes recommandés (cette source se substitue à toutes les autres références, qui deviennent maintenant informatives, même si elles sont à l’origine des codes initialement inscrits dans le registre IANA).

  • La suppression des adjectifs « autre(s) » ou « divers », selon la classification des familles de langues ISO 639-5 qui a rendu ces codes inclusifs et non exclusifs. C’est aussi le cas pour BCP 47 : bien qu’elle privilégie toujours les codes de l’ISO 639-1, avant ceux de l’ISO 639-2 et de l’ISO 639-3 ou l’ISO 639-5 (pour les trois derniers, ce sont en fait les mêmes codes à trois lettres pour les collections de langues, devenues des familles inclusives de langues dans ISO 639-5), elle les traite selon la sémantique révisée.
  • Il a aussi opté pour la suppression entre parenthèses de dates : les adjectifs vieux, ancien, moyen sont utilisés à la place.
  • De la même façon il a opté pour la suppression des pluriels pour les familles de langues, mais il conserve le préfixe « langue » pour éviter toute confusion (car certaines familles et langues individuelles sont homonymes). Le terme « langue » n’est pas nécessaire pour les familles de langues créoles (il a été supprimé aussi dans l’ISO 639) ; le préfixe « langue » lui-même ne sera totalement supprimé qu’une fois la classification des types de codes langue (issue de l’ISO 639-3) intégrée au dépôt (il faudra une révision du modèle de données et du modèle de traitement et d’héritage des locales).
  • Enfin il a opté pour la suppression des parenthèses pour les dénominations spéciales et collections de langues, et les synonymes possibles ne sont plus entre parenthèses mais délimités par des points-virgules (et qui vont être migrés vers une table séparée, optionnelle et seulement informative, des synonymes) : cela simplifie l’affichage des listes de noms de langues.

Locales codées d modifier

  • {{de-AT}} : allemand autrichien
  • {{de-CH}} : allemand de Suisse

Locales codées e modifier

  • {{en-AU}} : anglais australien
  • {{en-BZ}} : anglais bélizéen
  • {{en-CA}} : anglais canadien
  • {{en-CB}} : anglais caraïbe
  • {{en-GB}} : anglais britannique
  • {{en-IE}} : anglais irlandais
  • {{en-JM}} : anglais jamaïcain
  • {{en-PH}} : anglais philippin
  • {{en-TT}} : anglais trinidadais
  • {{en-US}} : anglais américain
  • {{en-ZA}} : anglais sud-africain
  • {{en-ZW}} : anglais zimbabwéen
  • {{es-419}} : espagnol latino-américain
  • {{es-ES}} : espagnol ibérique
  • {{es-GT}} : espagnol du Guatemala

Locales codées f modifier

  • {{fr-FR}} : français de France
  • {{fr-BE}} : français de Belgique
  • {{fr-CA}} : français canadien
  • {{fr-QC}} : français québécois
  • {{fr-CH}} : français de Suisse

Locales codées n modifier

  • {{nl-BE}} : néerlandais de Belgique

Locales codées p modifier

  • {{pt-BR}} : portugais brésilien
  • {{pt-PT}} : portugais ibérique

Locales codées r modifier

  • {{root}} : racine – (code spécial interne pour CLDR)

Divergences d’Unicode CLDR (qui utilise normalement des codes dont la référence est BCP 47) modifier

  • {{bh}} : bihari (éviter dans le Wiktionnaire : c’est le nom collectif d’une famille de langues)
  • {{bho}} : bhojpuri vs {{bh}} : langues biharies
  • {{bin}} : bini vs {{bin}} : édo
  • {{cel}} : (autre langue celtique) vs {{cel}} : langues celtiques (pas de vraie divergence, expressions synonymes ; attention ce code ne désigne pas une langue mais une famille de langues différentes)
  • {{cpe}} : (autre langue créole ou pidgin anglais) vs {{cpe}} : créoles et pidgins basés sur l’anglais (pas de vraie divergence, expressions synonymes ; attention ce code ne désigne pas une langue mais une famille de langues différentes)
  • {{cu}} : slavon d’église vs {{cu}} : vieux slave (pas de vraie divergence, expressions synonymes)
  • {{del}} : delaware vs {{del}} : langues delaware
  • {{gsw}} : alémanique vs {{gsw}} : alémanique et {{als}} : albanais tosk
  • {{mni}} : manipuri, manipourî, meitei vs {{bpy}} : manipourî de Bishnupriya (pas de vraie divergence, expressions synonymes)
  • {{rm}} : rhéto-roman vs {{rm}} : romanche (pas de vraie divergence, expressions encore considérées comme synonymes)
  • {{sai}} : (autre langue amérindienne du Sud ; autre langue indienne d’Amérique du Sud) vs {{sai}} : langues sud-amérindiennes (pas de vraie divergence, expressions synonymes ; attention ce code ne désigne pas une langue mais une famille de langues différentes)
  • {{smi}} : (autre langue samie) vs {{smi}} : langues sames (pas de vraie divergence, expressions synonymes ; attention ce code ne désigne pas une langue mais une famille de langues différentes)
Notes
  1. On utilise à priori sur le Wiktionnaire les mêmes références à BCP 47 (qui référence les divers volets de ISO 639, en fixant des priorités mais en assurant la stabilité des codes). Toutefois, la source Unicode fiable reste la version anglaise et il peut subsister des désaccords de traduction. La source ISO 639-3 est encore récente et peut encore contenir des confusions. Il convient de revérifier ces codes dans les deux sources pour savoir comment le conflit a été résolu, puis alors de corriger dans le Wiktionnaire.
  2. Certains noms ont plusieurs synonymes définis dans ISO 639, toutefois, le nom préférable n’est pas toujours clairement identifié ; Unicode CLDR a choisi de ne garder à terme qu’un seul de ces noms (et de lister séparément les synonymes éventuels). Toutefois Unicode CLDR ne peut être une référence que pour sa version anglaise, en attendant que la liste des noms français soient normalisés soit par Unicode CLDR soit par ISO 639 ou un organisme de normalisation lié à l’ISO comme l’IETF (pour BCP 47). La liste des noms de langues en français sur Unicode CLDR subira encore des corrections au fur et à mesure de l’avancement des discussions entre son comité technique (et ses traducteurs volontaires votants) et le comité technique de l’ISO.

Voir aussi modifier

Linguistique modifier

  • Listes sur le Wiktionnaire :
    • Wiktionnaire:BCP 47 : index général des sous-labels d’identification des langues pour BCP 47 ({{RFC|4647}}, {{RFC|5645}}, {{RFC|5646}}) : noms en anglais uniquement mais contient tous les labels, y compris les labels hérités de l’ancien registre IANA et les labels composés (à mettre à jour en priorité selon la source normative)
    • Wiktionnaire:ISO 639-1 : table triable de tous les codes ISO 639-1 pour les langues, macrolangues et collections les plus fréquentes (informatif)
    • Wiktionnaire:ISO 639-2 : table triable de tous les codes ISO 639-2 sans code ISO 639-1 équivalent, pour les autres langues, macro langues et collections usuelles (informatif)
    • Wiktionnaire:ISO 639-3 : table triable de tous les codes ISO 639-3 sans code ISO 639-1 ou ISO 639-2 équivalent, pour les autres langues plus rares (informatif)
    • Wiktionnaire:ISO 639-5 : table triable de tous les codes ISO 639-5 pour les familles de langue sans code ISO 639-1 ou ISO 639-2 équivalent (informatif)
  • Source normative (en anglais) de codification des langues, dans la série BCP 47 de l’IETF :
    • RFC 4647[4] : notice d’utilisation des labels de codification pour l’identification des langues (à consulter avant toute chose)
    • RFC 5646[5] : description complète des labels de codification et d’identification des langues, leur syntaxe, leur interprétation et leurs autres propriétés
    • RFC 5645[6] : description du registre IANA des labels et sous-labels de codification et d’identification des langues, et politique d'assignation de nouveaux codes
      • Registre IANA officiel de tous les sous-labels de codification des langues et collections de langues (avec leur nom descriptif informatif en anglais)
  • Autres sites informatifs à consulter pour les noms de langues et leur classification :
    • Référentiel des codes et noms de langues en français de la Bibliothèque Nationale de France, pour les noms en français et synonymes de très nombreuses langues (à partir de leur code alpha-3 de la norme ISO 639-3 ou d’autres normes bibliothécaires INTERMARC).
      On y voit toute une liste de noms en français et synonymes : à ce jour c’est la seule référence à peu près complète pour les codes alpha-3 avec tous ceux de l’ISO 639-2 et une grande partie de ceux de l’ISO 639-3 (norme dans laquelle il manque encore une liste de noms en français, hormis ceux déjà normalisés dans les volets 639-1 et 639-2), mais attention les codes peuvent être différents dans l’ISO 639-3 (à rechercher : la mise à jour des normes INTERMARC mentionnant les noms français).
    • ISO 639-3/MA (SIL.org) — liste officielle des codes ISO 639-3 (donne aussi les équivalents ISO 639-2 et -1).
      Le site SIL définissait auparavant ses propres codes, basés sur les travaux de The Ethnologue, et dont certains étaient différents de ceux finalement retenus dans la norme ISO 639-3. Tous les codes ont été convertis. Les anciens codes SIL sont désuets.
      Utiliser le code ISO 639-1 ou -2, s’il existe.
    • Ethnologue 16 — 6909 langues répertoriées en anglais : donne des informations de classification et des synonymes usuels non recommandés (pour cause possible d’homonymies ou d’ambiguïté)
    • Ethnologue 15 — Ancienne édition, 7299 langues répertoriées en anglais.
      Ceci n’est pas le ISO 639-3 officiel, le site utilisait auparavant les anciens codes SIL (en majuscules) et utilise désormais la norme ISO 639-3. Attention certains codes existent encore et correspondaient à la dernière édition publiée de son rapport sur les langues du monde. Depuis la parution de la nouvelle édition, ces anciens codes sont définitivement abandonnés au profit de l’ISO 639-3: ils ont pu être modifiés dans la norme ISO 639-3 depuis son adoption et notamment des langues régionales ont pu être fusionnées ou subdivisées dans la norme ISO 639-3.
    • Code des langues ISO 639-1, -2, -3 et -5 sur Wikipédia
  • Sites informatifs à consulter pour les listes traduites de noms de langues, écritures, pays, et autres données de localisation :