« Wiktionnaire:Critères d’acceptabilité des entrées » : différence entre les versions

Contenu supprimé Contenu ajouté
→‎Quelles langues sont acceptées ? : remise du texte qui avait fait l'objet d'une décision collective
Ligne 45 :
 
=== Quelles langues sont acceptées ? ===
 
Conformément à la mission du projet (tous les mots de toutes les langues), toutes les langues, vivantes ou mortes, sont acceptées, sans exception, y compris les langues construites quand elles peuvent réellement être considérées comme de vraies langues. Les critères suivants visent simplement à vérifier qu’une langue existe effectivement avant de l’introduire dans le Wiktionnaire.
 
Toutes les langues reconnues internationalement comme des langues ont leur place dans le Wiktionnaire. Le critère est l’existence :
*# d’un code ISO-639 (sauf les codes de « macrolangues ») (voir [[:Wiktionnaire:ISO 639-1]], [[:Wiktionnaire:ISO 639-2]] et [[:Wiktionnaire:ISO 639-3]]). Toutefois, sauf les codesmots dehypothétiques «n’étant groupespas deacceptés, languescela »n’a etpas lesde codessens «pour spéciauxles » (pseudo-langues) oudont «aucun privésmot »n’est (pourconnu. desCes langues nonconstituent humaines, ou non encore officiellement reconnues et codées dansdonc une norme internationale)exception.
*# ou d’un code langue de la fondation WikiMedia (codes utilisés pour les liens interwikis : certains de ces codes informels peuvent faire (ou ont déjà fait) l’objet d’une migration vers un code standard s’ils entrent en conflit avec des codes ISO 639, et utilisera alors le nouveau code standard).
 
Les langues n’ayant encore ni code ISO 639 ni code Wikimédia doivent impérativement faire l’objet d’une discussion et d’une décision préalable à leur introduction, ceci afin de vérifier qu’elles peuvent effectivement être considérées comme des langues existantes. Les critères principaux à prendre en compte sont les suivants (non cumulatifs, un seul suffisant pour accepter la langue) :
* existence (actuelle ou passée) de personnes ayant cette langue comme langue maternelle ;
* existence d’écoles ayant enseigné cette langue ;
Ligne 58 ⟶ 59 :
* langue faisant l’objet d’un article dans au moins deux des dix plus grosses Wikipédias, sans que l’existence de ces articles y soit contestée.
 
Si une langue a déjà un code, mais qu’on estime, après discussion, qu’il est bon d’accorder à plusieurs des variantes/dialectes de la langue leurs propres noms de langues et leurs propres sections (les variantes étant suffisamment différentes et inintelligibles entre elles pour penser que des codes séparés seront créés tôt ou tard), alorsces variantes pourront être acceptées en tant que langues séparées. Malgré tout, les sections dans la langue disposant du code devront être conservées, et de nouveaux mots pourront être créés dans cette langue par ceux qui le :désirent.
==== Typologie des codes langues standards et codification de nouvelles langues ====
# Les « '''collections''' » de langues codées dans ISO 639 sont toutes classées dans [[:Wiktionnaire:ISO 639-5]] en tant que familles inclusives, mais certaines ont des codes équivalents dans ISO 639-2, soit en tant que « groupes inclusifs » quand ils sont identiques dans ISO 639-5, soit comme « groupes résiduels » destinés à rassembler pour ISO 639-2 toutes les langues d’une famille qui n’ont pas un autre code langue ou de groupe de langues plus précis codé dans ISO 639-2). Les codes de groupes de langues résiduels utilisés selon ISO 639-2 sont essentiellement destinés à la classification bibliographique, mais ne permettent pas de distinguer toutes les langues intelligibles entre elles. Les codes de familles de langues ISO 639-5 (tous inclusifs) ne peuvent servir qu’à une catégorisation des langues ou macrolangues, mais la liste complète des langues individuelles ou macro-langues incluses dans chaque famille est encore mal connue, ce qui rend les définitions de termes qui se rapporteraient à ces familles complètement erronées. De plus de nombreuses familles de langues ne sont pas encore codées dans ISO 639-5. Il n'est donc pas encore possible de les utliser de façon fiable pour classer les termes selon leurs étymologies.
# Les codes de « '''macro-langues''' » sont acceptés pour les définitions de termes, sous certaines réserves (par exemple le chinois codé <tt>zh</tt> ou l’arabe codé <tt>ar</tt>) mais peuvent être ambigus pour définir certains termes, et on devra alors séparer les définitions en utilisant un des codes plus précis parmi les « langues individuelles » regroupées dans la même « macro-langue » (consulter la page [[:Wiktionnaire:ISO 639-2]] pour le détail des correspondances). Les différences entre elles peuvent n’exister que dans leur forme orale (par exemple la prononciation) mais pas la forme écrite de ces langues (cas fréquents dans les langues individuelles du chinois ou de l’arabe), mais il reste préférable de les distinguer quand même pour distinguer les prononciations (et assez souvent les usages), mais pour les usages communs la macro-langue pourra être utilisée pour éviter de répéter les mêmes prononciations, définitions et usages dans les exemples de citations.
# Quand une langue individuelle ou une macro-langue dispose de plusieurs codes selon ISO 639, le standard Internet BCP 47 est utilisé pour déterminer le code à utiliser en priorité (les autres codes sont traités alors comme des codes valides et synonymes, mais non recommandés ; le registre IANA des codes langues pour BCP 47 contient une liste exhaustive des codes reconnus et recommandés pour les langues, macro-langues et familles de langues, ainsi que des codes qui ne sont plus recommandés mais pour lesquels il mentionne éventuellement un code préféré). Toutes les langues individuelles ou macro-langues codées dans ISO 639-1 ou ISO 639-2 disposent aujourd’hui d’un code reconnu par le Wiktionnaire, mais pas encore toutes les langues codées seulement dans ISO 639-3 (ces langues codées sont très nombreuses, plus de 7000, dont un grand nombre de langues anciennes ou parlées par une petite minorité ou lues par des linguistes spécialistes).
# Toutefois, les '''langues hypothétiques''' (seulement reconstruites par déductions ou analogies sémantiques et par similitudes lexicales) n’étant pas acceptés, cela n’a pas de sens pour les langues dont aucun mot n’est précisément connu par une forme écrite (cas de toute « proto-langue », souvent très ancienne, qui est à la racine d’une famille entière de langues mais qui ne dispose d’aucun autre code langue que celui de la famille de langues dont elle est la base). Ces proto-langues supposées constituent donc une exception : '''leurs « mots » hypothétiques ne disposent pas de leur propre article dans le Wiktionnaire mais sont listés dans une annexe''' (ces proto-langues sont mentionnées uniquement dans les étymologies probables de mots dans des langues dont on ne dispose d’aucune trace écrite attestée). Voir le détail sur la page [[Aide:Formes reconstruites]].
 
La page [[Wiktionnaire:BCP 47]] contient un compte-rendu des codes (et sous-codes) standards définis pour de très nombreuses langues et leurs principales variantes : bien qu’étant toutes définies dans le standard Internet, toutes ne disposent pas encore d’un code utilisable dans le Wiktionnaire ; cette table de codification, issue du registre IANA associé mais plus facile à lire, contient une liste assez exhaustive de codes langues avec leurs noms en anglais (mais pas de leurs traductions en français comme dans les normes ISO dont ils sont issus), mais elle peut encore omettre certains codes ajoutés plus récemment dans le registre IANA (essentiellement ceux provenant du registre ISO 639-3 officiel) et de nouvelles recommandations d’utilisation d’autres codes « préférés » ; pour ces raisons la table mentionne la date de dernière modification de chaque entrée.
 
Si vous ne trouvez pas la langue cherchée avec son nom en français dans les pages [[Wiktionnaire:ISO 639-1]] ou [[Wiktionnaire:ISO 639-2]] (la page [[Wiktionnaire:ISO 639-3]] ne contient qu’une partie non exhaustive des très nombreux codes de la norme ISO 639-3), ni dans les tableaux de codes et sous-codes pour BCP 47, veuillez consulter le registre IANA.
 
La nouvelle '''[[meta:Language committee/fr|Commission des langues Wikimedia]]''' a créé un espace d’échange international communautaire, approprié pour la codification de nouvelles langues à supporter pour les projets Wikimedia — les propositions de codification doivent toutes être compatibles avec le standard BCP 47, en utilisant autant que possible un sous-code d’extension privée d’un autre code standard d’une langue, macrolangue ou famille de langues, même si la langue à coder ne dispose pas encore de code ISO 639, afin d’éviter tout conflit ultérieur : '''ne surtout pas''' utiliser un code langue inventé à 2 ou 3 lettres, il sera tôt ou tard en conflit avec une autre langue déjà codifiée (si ce n’est pas déjà le cas).
 
Ce comité est également responsable d’organiser les migrations de codes pour les anciens codes de langues restants pour les projets Wikimédia et qui ne sont pas conformes au standard Internet BCP 47.
 
==== Codification des variétés dialectales d’une même langue ====
Si une langue a déjà un code, mais qu’on estime, après discussion, qu’il est bon d’accorder à plusieurs des variantes/dialectes de la langue leurs propres noms de langues et leurs propres sections (les variantes étant suffisamment différentes et inintelligibles entre elles pour penser que des codes séparés seront créés tôt ou tard), alors :
* ces variantes pourront être acceptées en tant que langues séparées ;
* ces variantes devraient être proposées avec un code compatible avec le standard BCP 47, après avoir consulté le registre IANA associé ;
* ces variantes ne peuvent pas être codées avec une extension sur 2 lettres, réservées aux codes pays, ni 3 lettres, réservées aux variantes standards, ni 4 lettres, réservées aux codes de systèmes d’écriture, et au delà des variantes standards peuvent déjà exister dans le registre IANA où il serait souhaitable d’en demander la réservation avant de les utiliser ;
* sinon on codera ces variantes avec un code d’extension privé totalement conforme à BCP 47, tel que <tt>be-x-old</tt> propre aux projets Wikimedia).
 
Malgré tout, les sections dans la langue disposant de leur propre code individuel devront être conservées, et de nouveaux mots pourront être créés dans la nouvelle variante codée, par ceux qui le désirent.
 
Le nom utilisé en interne pour une langue est toujours le nom le plus couramment utilisé en français, dans son orthographe la plus usuelle, sauf cas de force majeure (deux langues différentes portant le même nom, par exemple). Si aucun nom n’est couramment utilisé, ou si plusieurs noms sont très couramment utilisés, c’est si possible le nom privilégié par les organismes officiels ou les organismes de standardisation qui est préféré. ''(texte adopté par décision collective : voir [[Wiktionnaire:Wikidémie/juillet 2009#Critères d'acceptation des langues (vote)|Wikidémie, en juillet 2009]], et [[Aide:Modèle#Modèles nom de langueMod.C3.A8les_nom_de_langue|aide à l’ajout de langue]])''. Ce qui n’empêche pas l’existence de plusieurs entrées précisant les différentes orthographes.
==== Noms des langues mentionnés dans le Wiktionnaire ====
Le nom utilisé en interne pour une langue est toujours le nom le plus couramment utilisé en français, dans son orthographe la plus usuelle, sauf cas de force majeure (deux langues différentes portant le même nom, par exemple). Si aucun nom n’est couramment utilisé, ou si plusieurs noms sont très couramment utilisés, c’est si possible le nom privilégié par les organismes officiels ou les organismes de standardisation qui est préféré. ''(texte adopté par décision collective : voir [[Wiktionnaire:Wikidémie/juillet 2009#Critères d'acceptation des langues (vote)|Wikidémie, en juillet 2009]], et [[Aide:Modèle#Modèles nom de langue|aide à l’ajout de langue]])''. Ce qui n’empêche pas l’existence de plusieurs entrées précisant les différentes orthographes.
 
=== Quand un mot fait-il partie d’une langue ? ===