Wiktionnaire:Actualités/075-juin-2021

Actualités du Wiktionnaire

Numéro 75 — juin 2021

Wiktionnaire:Actualités est un journal mensuel sur le Wiktionnaire, les dictionnaires et les mots. Il est publié en ligne depuis avril 2015. Son écriture est ouverte à toutes les bonnes volontés. Vous pouvez recevoir un avis lors de la publication des prochains numéros, consulter les anciens numéros et participer au brouillon de la prochaine édition. Vous pouvez lire aussi les Regards sur l’actualité de la Wikimedia. Pour les commentaires, critiques ou suggestions, voir la page de discussion.

Mars.

Surface de Nili Fossae sur Mars, photographié par la NASA dans le cadre de la mission Mars Reconnaissance Orbiter (cliquez pour voir la photographie en entier).

Brèves d’ici

  • Les ateliers mensuels Wiki Kouman ont repris et ont pu se tenir dans les villes de Ndjamena et Moundou le 5 juin, portant principalement sur deux langues : l’arabe tchadien et le ngambay. Quelques photos ont été publiées sur la page Facebook du groupe.
  • Le Wiktionnaire et les projets frères ont été présentés les 3-4 juin au colloque en ligne ContribuLing organisé conjointement par l’INALCO, Wikimédia France, la BULAC et l’UQAM afin d’échanger sur les outils numériques collaboratifs pour aider à la description des langues peu documentées. Lyokoï et Poslovitch ont présenté le Wiktionnaire tandis que WikiLucas00 et Adélaïde Calais de Wikimédia France ont présenté Lingua Libre (en français et en anglais). Reda Kerbouche a présenté l’expérience du Wiktionnaire en tacawit et VIGNERON a présenté la partie lexicographique de Wikidata.
  • Les 24-25 juin a eu lieu une autre rencontre en ligne, la conférence Arctic Knot (nom en 2021 de la conférence Celtic Knot). Multilingues mais principalement en anglais, les conférences portaient sur les langues autochtones et sous-représentées, leur relation avec et leur place sur l’ensemble des projets dont Wikipédia, Wikisource, Wikidata (dont la partie lexicographique) et Abstract Wikipedia, un projet en cours de développement. Les projets Wiktionary n’ont pas été mis à l’honneur, mais l’intérêt de Lingua Libre pour les langues minoritaires a pu être présenté par Adélaïde Calais. Les vidéos sont d’ores et déjà disponibles en ligne, les liens se trouvent dans le programme.
  • De nombreuses discussions collectives au mois de juin, notamment sur la nécessité d’une indication, d’un besoin de références pour les informations étymologies quand bien même elles paraissent évidentes au premier abord. Les indications de construction morphologique peuvent paraître régulières, mais ce n’est pas toujours le cas et de nombreuses irrégularités sont indétectables sans une analyse aussi bien du système actuel que de l’évolution de la langue. Une autre discussion porte sur les analyses linguistiques d’Alpheratz et la manière dont elles s’intègrent avec les autres analyses de la langue. Lmaltier propose également une réflexion sur ce qu’est un wiki pour lui, suscitant de nombreuses réactions critiques.

Jalons

Lingua Libre, l’outil libre d’enregistrement des prononciations et des signes a atteint les 500 000 fichiers audios ! Ceci fait 538 personnes qui ont fait au moins un enregistrement, pour 120 langues différentes. Cela représente près de 1 % du nombre de fichiers dans Wikimedia Commons, qui les stocke. Plus de 75 % des fichiers audios de Wikimedia Commons proviennent de Lingua Libre ! Une grande partie de ces enregistrements sont présentés dans le Wiktionnaire, lorsque les entrées existent, et un script automatisé se charge de les ajouter au fil de l’eau !

Dans le même mois, le projet de données lexicographiques de Wikidata, Lexeme, dépasse les 500 000 entrées, dans 790 langues, ce qui marque une étape dans ce projet qui met en commun un grand nombre d’informations sur les mots de toutes les langues.

Brèves d’ailleurs

  • Une sympathique courte tribune en anglais par Jim Witherell publié sur le site du Sun à propos des fautes d’orthographes relève que l’anglais permet de parler de correction des fautes avec un mot qui a trois variantes orthographiques pour ne rien simplifier : spell check, spell-check et spellcheck
  • Le journal suédois The Local propose des chroniques en anglais sur la langue française, dont une ce mois qui parle de l’expression Eh bé en suggérant d’écouter différentes prononciations dans le Wiktionnaire.
  • Le journal de l’Université de Montréal, UdeMNouvelles, rend compte de la création d’un lexique québécois de l’ébénisterie produit à la demande de professionnels de ce secteur par deux universitaires.


À voir ou écouter

Quelques émissions audio ou vidéo sur la lexicographie, la linguistique et la langue française sorties ou découvertes ce mois-ci.

  • Le Grand reportage du 4 juin sur France Culture était consacré à l’apprentissage des langues régionales en France métropolitaine. Il était question de basque, occitan, breton. L’enseignement immersif des langues régionales a récemment été jugé inconstitutionnel par le Conseil constitutionnel. Les signes diacritiques dans les prénoms (comme le tilde) ont également été déclaré inconstitutionnel.
  • Une liste d’une quarantaine de vidéos traitant du « patois vosgien », une variante du lorrain dans les Hautes-Vosges. Les premières vidéos (certaines sont parfois en doublon) sont issues d’un entretien avec Alain Litaize, dialectologue qui a co-écrit l’Atlas Linguistique de la Lorraine Romane (ALLR) publié en 1979. Il s’est éteint en décembre 2020. Les vidéos qui suivent sont des enregistrements de discussions, d’histoires et de chansons (avec une épinette des Vosges !). À découvrir sur YouTube ou sur une instance Invidious.
Mars.

Dépressions martiennes en 3D, au large du bassin Hellas. Une photographie de l’ESA/Roscosmos/CaSSIS.

Statistiques

Du 20 mai au 20 juin 2021

+ 11 354 entrées et 71 langues modifiées pour atteindre 4 354 272 entrées et 1 217 langues avec au moins cinq entrées.

+ 1 574 entrées en français pour atteindre 394 488 lemmes et 603 491 définitions.

Les trois langues qui ont le plus avancé, outre le français, sont le portugais (+ 3 893 entrées), le same du Nord (+ 3 153 entrées) et l’ arabe (+ 555 entrées).

Les nouvelles langues sont : le birifor du Sud (+1) et l’iceve-maci (+1).

+ 3 120 citations ou exemples en français pour atteindre 481 939.

+ 615 médias d’illustrations (images et vidéos) dans les articles du Wiktionnaire, pour atteindre 54 212.

Du 31 mai au 30 juin 2021

+ 8 657 pages contenant au moins une prononciation (dont 7 471 pour le français) pour atteindre 255 030 pages contenant au moins une prononciation audio pour 130 langues (dont 124 273 pour le français).

3 nouveau thésaurus soit un total de 1 085 thésaurus dans 67 langues dont 792 thésaurus en langue française ! Les nouveaux thésaurus sont l’appareil (en architecture) par Lepticed7, la fouille (en archéologie) par Jpgibert et l’algèbre linéaire en chinois par Popolon.

Wikiscan et Wikistats donnent chaque mois accès à beaucoup de mesures, dont la liste des pages les plus consultées et des pages modifiées par le plus de personnes.

+ 23 mots créés sur les 30 proposés dans les Mots du jour !

La rubrique Wiktionnaire:Questions sur les mots (WT:QM) a enregistré 14 questions en juin contre 24 en juin et 28 en avril.

Dictionnaire du mois

Nouveau dictionnaire illustré Simon, R. Simon, 1937 et 1940.

Si l’on vous demande aujourd’hui qui a fait des dictionnaires de vocabulaire courant en français au XXe siècle, vous répondrez sûrement Larousse et Robert, les deux plus connus. En insistant un peu d’autres noms peuvent ressortir si vous vous êtes intéressé à l’édition de cette période : Hachette (encore relativement connu), l’Académie française (quand même) et puis Quillet, même si cette dernière maison d’édition a surtout produit des ouvrages de plus grande taille. Et pourtant il y a eu bien d’autres maisons d’édition qui ont publié des dictionnaires de français courants durant cette période, on peut trouver Armand Colin (1905) ou Bordas (1972) parmi d’autres… Mais l’on voit que pour ces dernières, les dictionnaires ne sont pas leur type d’ouvrage majoritaire.

C’est dans cette même veine que les éditions R. Simon éditent des dictionnaires de français courant dans les années 1930 et les années 1940. Ces ouvrages peu présents dans les bibliothèques aujourd’hui présentent, pour certaines éditions, l’intérêt d’avoir été éditées et publiées durant la période précédant la Seconde Guerre mondiale et durant cette dernière. Cela jouera sur la qualité de l’édition car si l’édition de 1937 sera un gros ouvrage de 1408 pages, l’édition de 1940 n’en comporte plus que 727. La différence se trouvera aussi sur les illustrations. Car en effet, là où l’édition de 1937 comporte de nombreuses planches en couleurs et des gravures en veux-tu en voilà dans les pages, celle de 1940 n’a plus que 7 planches pleine page.

Réduction du nombre d’auteurs ? Rognage du budget de l’illustration ? Adaptation à des bourses moins pleines ? Nous ne pouvons pas conjecturer car nous n’avons pas trouvé de sources sur le sujet, mais c’est un aspect qui pourrait être creusé, car les éditions de dictionnaire en zone de guerre ont des contraintes qui jouent beaucoup sur les formes que peuvent prendre ces ouvrages. Si vous avez de tels ouvrages, n’hésitez pas à en parler dans cette rubrique pour les prochains numéros !
— une chronique par Lyokoï
Mars.

Trainées noires dans les dunes martiennes au nord d’Utopia Planitia photographiées par la NASA dans le cadre de la mission Mars Reconnaissance Orbiter .

De la neutralité dans les définitions

Un des grands enjeux du Wiktionnaire est de présenter une information neutre, basée sur le consensus entre les participants et participantes du projet. L’espoir du projet est qu’au fil du temps, les regards subjectifs soient tempérés par la multitude et qu’une formulation consensuelle permette de rendre compte du sens des mots sans leur associer de visions spécifiques. Proposons quatre dimensions dans lesquelles les problèmes peuvent se poser : la délimitation du sens, par exemple pour les noms d’animaux flous qui englobent différentes espèces et des variétés régionales ; les différentes connotations qui imprègnent le sens d’un mot selon qui l’emploie ; les formulation qui intègrent des termes qui ne sont pas partagés par l’ensemble des francophones ; l’ordre des définitions.

Ces deux premières difficultés sont bien connues des lexicographes, qui étudient le sens des mots en s’appuyant sur trois disciplines complémentaires, la lexicologie, la sémantique et la sociolinguistique. L’accumulation de connaissance permet de mieux cerner leurs sens et leurs usages et de les décrire en visant la neutralité.

Les deux dernières difficultés proposées, sur les mots utilisés dans les définitions et sur l’ordre des définitions, sont plus spécifiquement rattachées à la dictionnairique, la présentation de l’information après son analyse. Il ne s’agit plus ici seulement de connaissance mais également de pédagogie, de prise en compte des différences culturelles et d’estimation de ce qui est le plus pertinent par rapport au lectorat.

Certains termes caractérisants de la langue sont spécifiques à des aires langagières et ne sont pas partagés par l’ensemble des francophones. Ce sont pourtant des termes utiles pour décrire le sens des mots en usage dans ces régions. Difficile de les identifier et de les utiliser avec parcimonie, et le risque est grand de privilégier l’usage majoritaire au détriment d’une partie du lectorat pour laquelle la formulation paraîtra fausse.

Certaines définitions sont spécifiques à une aire langagière, ce sont des sens régionaux. Ils sont souvent listés à la fin dans les listes de définitions, dans un ordre variable. Faut-il privilégier l’ordre alphabétique de ces aires géographiques ? Les aires comprenant le plus grand nombre de locuteurs et locutrices ? Les aires dans lesquels le sens est le plus proche des sens pour lesquels il n’y a pas d’indication de lieu ? Difficile de proposer un ordre qui demeure neutre tout en racontant l’évolution historique de la langue correctement.

Et lorsque plusieurs sens techniques découlent d’un sens premier sans que l’on puisse déterminer un ordre chronologique dans l’évolution de la langue, l’ordre d’affichage des définitions sera… selon l’ordre d’ajout dans le Wiktionnaire ? Selon l’ordre alphabétique des noms des domaines techniques concernés ? Selon la fréquence estimée dans la langue de ces différents sens ? Au hasard ? Difficile de répondre simplement à cette question de l’ordre qui induit irrémédiablement un manque de neutralité.

Finalement, la neutralité risque d’être mise en défaut à de nombreux niveaux. Les discussions sur ce sujet sont nombreuses au sein du Wiktionnaire et tous ces aspects ne sont pas forcément considérés avec le même intérêt, selon les difficultés qui se présentent et les connaissances des contributeurs et contributrices qui prennent part à ces discussions.
— une chronique par Noé

Les collaborations de la semaine de juin

Ces propositions, affichées sur la page d’accueil, ont été proposées par Lepticed7. Merci de leurs contributions aux personnes qui ont créé les mots ! applau

Semaine 22 (31 avril au 6 juin 2021)

Quelque chose qui envoye du steak, c’est quelque chose cher bien, gavé bien, tip-top. C’est le feu, quoi.

Semaine 23 (7 au 13 juin 2021)

Oignon, pourquoi tu pleures ?! Allez, je m’occupe de l’oignon doux, de l’oignon blanc, de l’oignon rouge, de l’oignon rose, de l’oignon jaune, et même de l’oignon de paille !

Semaine 24 (14 au 20 juin 2021)

Maintenant que les oignons sont prêts, on peut en faire du confit d’oignon, de la confiture d’oignons, de la sauce à l’oignon ou de la tarte à l’oignon.

Semaine 25 (21 au 27 juin 2021)

Alors, tu tires ou tu pointes ? Dans tous les cas, n’oublie pas de ranger tes boules, qu’elles soient en acier, en bois ou en plastique dans ton coffret de boules.

Semaine 26 (28 juin au 4 juillet 2021)

J’ai vu une femme au nez crochu. Elle avait un rire maléfique et tenait une pomme empoisonnée. Se rendait-elle à un cercle de sorcières pour jeter un mauvais sort ?

Semaines suivantes

En juillet, les sorcières s’épilent et jouent aux échecs.
Mars.

Glace sur la surface de Mare Boreum photographié de l’ESA/Roscosmos/CaSSIS.

Anciens numéros