Wiktionnaire:Actualités/060-mars-2020

Actualités du Wiktionnaire

Numéro 60 — mars 2020

Wiktionnaire:Actualités est un journal mensuel sur le Wiktionnaire, les dictionnaires et les mots. Il est publié en ligne depuis avril 2015. Son écriture est ouverte à toutes les bonnes volontés. Vous pouvez recevoir un avis lors de la publication des prochains numéros, consulter les anciens numéros et participer au brouillon de la prochaine édition. Vous pouvez lire aussi les Regards sur l’actualité de la Wikimedia. Pour les commentaires, critiques ou suggestions, voir la page de discussion.

Myxomycètes.

Des œufs de Pâques au chocolat recouvert d’or ? Non, des myxomycètes (cliquez pour voir la photographie en entier) !

Brèves d’ici

  • Le projet WikiKouman vise à ajouter des entrées dans plusieurs langues parlées en Côte d’Ivoire. Plusieurs centaines d’entrées ont déjà été ajoutées ici via ce projet. Pour l’année qui vient Modjou a déposé une nouvelle demande de financement afin de continuer ce travail et l’étendre à de nouvelles langues dont certaines parlées au Tchad. Ce projet ajoutera des entrées en essouma, langue pas encore documentée par les linguistes. Si ce projet aboutit, cela démontrerait l’intérêt du Wiktionnaire pour les linguistes. N’hésitez pas à soutenir ce projet.
  • Le 9 mars, un wiktionnariste participe au Jeu des 1 000 euros, célèbre émission radiophonique française, enregistrée cette fois-ci à Ambrières-les-Vallées. Il se présente en mettant en avant comme loisir sa contribution au Wiktionnaire dans les premières minutes. Il revient sur cette expérience dans la Wikidémie.
  • En ce premier avril 2020, et si la Wikimedia Foundation, qui héberge le Wiktionnaire, changeait de nom pour mettre plus en avant le Wiktionnaire ? C’est le sens d’une très sérieuse proposition sur Meta.


Statistiques

Du 20 février au 1e avril 2020

Statistiques portant sur plus d’un mois.

+ 46 109 entrées et 158 langues modifiées pour atteindre 3 949 554 entrées et 1 160 langues avec au moins cinq entrées.

+ 23 567 entrées en français pour atteindre 382 322 lemmes et 576 874 définitions.

Les trois langues qui ont le plus avancé outre le français sont le same du Nord (+ 14 697 entrées), le kotava (+ 1 885 entrées) et l’italien (+ 1 143 entrées).

+ 6 nouvelles langues pour un total de 4 831 langues : le normand insulaire (+28), le bunan (+2), le solrésol (+1), le créole haïtien (+1), le taïno (+1), le guarani paraguayen (+1).

+ 8 434 citations ou exemples en français pour atteindre ‭422 991.

Plus de 49 135 illustrations. Notons au passage la création d’une nouvelle documentation pour les illustrations : conventions et aide.

+ 4 235 prononciations (dont 698 pour le français) pour atteindre 192 639 prononciations audios pour 119 langues (dont 84 696 pour le français).

+ 180 nouveaux thésaurus pour atteindre 813 thésaurus dans 63 langues (+9) dont 583 thésaurus en langue française ! Les nouveaux thésaurus sont détaillés sur la page du défi du mois, et plus bas dans ce numéro.

Wikiscan et Wikistats donnent chaque mois accès à beaucoup de mesures, dont la liste des pages les plus consultées et des pages modifiées par le plus de personnes.

+ 29 mots créés sur les 31 proposés dans les Mots du jour.

+ 3 domaines sémantiques pour les mots de français, et naissance d’un Projet:Lexiques pour lister ceux peu utilisés ou qui pourraient être créés. Ce mois-ci : l’entreprise, la géomorphologie et la Bible.

La rubrique Wiktionnaire:Questions sur les mots (WT:QM) a enregistré 46 questions en mars contre 35 questions en février et 49 en janvier.

Plusieurs entrées sont proposées comme bonnes entrées : autrice, Canadien français, jumelle, quenelle, radis.

Darmo117 sollicite et obtient les outils d’administrateur, notamment dans l’objectif d’un projet pour clarifier les modules. Projet dont on reparlera dans un prochain numéro !

Brèves d’ailleurs

  • Dans un article publié par The Conversation, Cameron Morin, doctorant en linguistique, propose une brève explication des concepts importants de langue et dialecte.
  • Un article en anglais sur le site de la BBC rapporte différents propos autour de l’inclusion de 29 mots du Nigeria dans le dictionnaire de référence de l’anglais, l’Oxford English Dictionary, notamment une personne qui considère que cet ajout aurait ajouté le pays sur la carte. C’est dire le rôle que certains prêtent aux dictionnaires !
  • L’éditorialiste B.D. McClay a publié l’an dernier une déclaration d’amour aux thésaurus (en anglais) dans lequel elle insiste sur le fait qu’il ne s’agit pas de se pavaner avec les mots les plus précieux mais de favoriser la découverte de nouveaux termes inconnus tout en offrant un accès à un ensemble de termes liés entre eux, ce que les dictionnaires ne font habituellement pas.
  • Le journal hebdomadaire Marianne propose à ses lecteurs une nouvelle rubrique spécialement dédiée aux mots : Le Fou des mots. La parution aura lieu une fois par mois, dans ses pages Culture. Pour ouvrir le bal, le numéro du 6 au 12 mars 2020 propose, sur deux pages, une déclinaison sur la craie : Le goût de la craie, par le poète Olivier Barbarant.
  • Dans un article universitaire publié dans le numéro 96.1 de mars 2020 de la revue Language, Shana Poplack, Suzanne Robillard, Nathalie Dion et John C. Paolillo démontrent que la prononciation n’est pas une mesure fiable de la compétence linguistique, c’est-à-dire qu’elle n’est pas liée à la manière dont les phrases sont construites. Deux articles de presse en français résument cet article, un court et un long.



Rénovation graphique

Après les efforts de M0tty l’an dernier avec les pictogrammes pour les sections des pages, puis la persévérance de Thomas Linard sur l’utilisation d’images vectorielles plutôt que matricielles pour qu’elles s’affichent mieux sur tous les écrans, voici maintenant Koreller qui a rénové les pages d’aide et de conventions grâce à des boîtes colorées et un menu par onglet qui fonctionne mieux sur téléphone mobile. Le changement est nettement visible sur les pages Aide:Sommaire et Wiktionnaire:Conventions ainsi que sur les pages qui y sont liées.

Dans le même temps, petit changement des pictogrammes associés aux thésaurus , catégories et annexes suite à un vote proposé par Noé.

Ces améliorations ont également entrainé une rénovation des Actualités qui sont maintenant responsive, c’est-à-dire qu’elles s’affichent mieux sur mobile, grâce à des boîtes flex. Ceci grâce à Koreller, Darmo117 et Noé. L’avis de publication a également profité de ce soin.

Ces changements ont été mis en place autour du 22 mars, afin de célébrer les 16 ans du Wiktionnaire francophone !

Myxomycète.

Des volutes de fumées ? Du fromage ? Non, un autre myxomycète !

À la forge de l’outillage des contributeurs

La chaleur est insoutenable et pour cause : les soufflets attisent en permanence des flammes ardentes et voraces. Dans cet enfer quotidien, le forgeron achève résolument de frapper un outil au fer encore blanc, qu’il trempe avec vivacité dans un baquet d’eau. Une vapeur âcre et un bruit strident jaillissent du métal torturé. Mais les temps ont changé. L’antre d’un forgeron moderne n’est plus une forge et les outils sont partagés, dispersés aux quatre coins du monde en une fraction de seconde. Le forgeron lui-même n’est plus seul à tenir la boutique.

L’intégralité de notre vie repose sur des outils. Nous mangeons, cuisinons avec des outils. Nous travaillons avec des outils. Nous contribuons avec des outils. Cet outillage est le fruit d’un travail et d’une réflexion très souvent invisibles. D’aucuns considèrent cela comme normal, et ils ont raison : imaginez-vous devoir maîtriser sur le bout des doigts les principes de la thermodynamique si intrinsèquement liés au fonctionnement de votre réfrigérateur ou de votre véhicule, pour pouvoir les utiliser. Mais cette considération ne doit pas interdire une curiosité bienvenue.

Les outils que nous employons au quotidien nous sont utiles : ils ont été conçus pour l’être. Ils répondent à un besoin qui a été formulé, formalisé, étudié, disséqué dans ses moindres détails. Un ordinateur, un système d’exploitation, un éditeur de texte, un navigateur internet ; MediaWiki, un modèle, un gadget, un bot. La comparaison avec les wikis semble forcée : elle ne l’est point. Si le Wiktionnaire n’a pas une équipe dédiée à l’analyse des besoins des contributeurs, cette dernière a pourtant été réalisée au travers des discussions, des prises de décisions, des expérimentations successives. Et si l’outillage, à ce jour, n’est pas parfait, il tendra nécessairement, au fil des expériences et des années, vers la perfection.

C’est pour répondre à un besoin que l’on crée des outils. Ainsi, c’est pour accélérer une tâche bien précise que je me suis consacré à la création d’un prototype. En effet, je contribue principalement dans le domaine, plutôt restreint, des prononciations phonétiques des enregistrements en français listés sur nos pages. C’est une tâche chronophage et fastidieuse que d’écouter et retranscrire le contenu de chaque enregistrement en alphabet phonétique international. Mais il est possible, à l’instar de Lingua Libre, d’accélérer le processus en déléguant une partie des tâches à l’ordinateur.

Ainsi, avec l’aide de Darmo, je suis parvenu à réaliser une première version de mon prototype en une journée. Il s’agit d’un logiciel développé en langage Python avec l’aide des nombreux outils créés par des développeurs de la Fondation pour ce langage. PhiLL (pour Phonetica in Lingua Libre) est ainsi officiellement sur les registres du Wiktionnaire le 28 mars 2020, avec ce diff. Son code source est disponible sur GitHub sous licence GPLv3. Ses fonctionnalités sont pour l’instant limitées, et son interface, austère. Cet outil n’en est qu’à ses balbutiements, comme bien d’autres l’ont été ou le sont toujours. Mais il est intéressant de suivre l’évolution de ces outils, car ils peuvent être amenés à simplifier la manière de laquelle chacun contribue. Et ce, principalement parce qu’il s’agit d’expérimentations. Ce qui en fait la plus inestimable des ressources.
— une chronique par Poslovitch

Restons à la forge

Deux autres développements ont bien avancé ce mois-ci :

Marxav a créé un outil pour évaluer la plausibilité des prononciations indiquées dans les mots français du Wiktionnaire. Il s’est appuyé sur le troisième tableau présenté sur la page d’annexe sur la prononciation du français qui indique les différentes façons possibles d’écrire un son dans un mot français. Les premiers résultats indiquent qu’environ 99 % des prononciations actuelles sont plausibles sur les environ 1,5 million de couples mot-prononciation évalués. Il reste à analyser les environ 15 000 cas estimés comme non plausibles pour estimer si la table de correspondance est à enrichir, et elle le sera sans doute notamment pour les mots contenant des chiffres arabes et romains, ou s’il y a effectivement des prononciations à corriger. Le code et les résultats sont sur ce dépôt de code Github.

Romainbehar quant à lui a écrit un gadget pour aider à créer les pages de flexions de l’italien, CreerFlexionIt, dont le code est adapté d’un gadget existant déjà pour le français depuis 2012, CreerFlexionFr, que l’on doit à ArséniureDeGallium. Et aussi refondu les modèles de flexions pour l’italien, écrits avec les fonctions d’analyse de MediaWiki, en un unique module écrit en Lua. Ces adaptations ont été conçues en concertation avec Otourly qui contribue principalement sur des entrées dans cette langue. La conversation ayant permis d’affiner l’outil est intéressante sur les problèmes qui se sont posés et qui ont pu être résolus.

Les collaborations de la semaine de mars

Ces propositions sont affichées sur la page d’accueil. Ce mois-ci, elles ont été rédigées par Lepticed7 et Noé. Merci de leurs contributions aux personnes qui ont créé les mots ! Félicitations à elles et eux : Dbult, François GOGLINS, Hildepont, Lepticed7, Lyokoï, Noé, Otourly, Pamputt, Poslovitch, Sebleouf applau

Semaine 09 (24 février au 1er mars 2020)

Connaissez-vous ces noms d’outils ? conot (Normandie), drenet (Bretagne), foulangeoir (Loir-et-Cher), morret (Rhône), râtichet (Picardie), trancanart (Gironde).

Semaine 10 (2 au 8 mars 2020)

Semaine 11 (9 au 15 mars 2020)

Dans les dictionnaires traditionnels, on ne trouve que les noms d’activités désignant des hommes. Le Wiktionnaire intègre tous les mots et il en manque encore beaucoup tels que cheffe de famille, héroïne culturelle, anesthésiste-réanimatrice, podcasteuse, écoguerrière, mécatronicienne, directrice générale, kitesurfeuse.

Semaine 12 (16 au 22 mars 2020)

Vous connaissez le cadien ? En voici quelques mots et locutions : barre à maringouins, calabousse, correcter, pistache de terre ou encore propreter.

Semaine 13 (23 au 29 mars 2020)

Fêtons les 16 ans du Wiktionnaire autour d’un plateau de fromage en hommage au projet WikiFromage, en créant brin d’amour, saint-Denis, brie de chèvre, téton de Barbeillon, paillasse beaujolaise !

Semaines suivantes

En avril, des expressions populaires, des grandes villes chinoises, des cucurbitacées, des voûtes et de la motivation !

Collaboration du mois : Défi de création de thésaurus

 
Nombre de thésaurus créés, les 124 français exclu.

La Collaboration du mois vise à la création d’un projet thématique facilitant la rédaction d’un type de contenu. Pour le mois de mars le projet proposé était un défi de création collective de thésaurus. Un thésaurus lexicographique est un ensemble de termes pour parler d’un concept, c’est cadré et expliqué dans une page d’aide.

L’objectif initial était de créer 100 thésaurus de plus de dix mots. Une trentaine de thésaurus existant n’atteignaient pas ce critère et ils ont été pris en compte dans le défi. 31 jours pour créer 100 thésaurus, ce qui impliquait une moyenne d’au moins 3,23 thésaurus par jour. Début mars, il existait déjà 633 thésaurus dans le Wiktionnaire. La première semaine a été plutôt incertaine, le nombre de thésaurus créés oscillant entre 2 et 6. La majorité des thésaurus créés lors de la première semaine l’ont été en français. Un thésaurus en espéranto a été fait. Le dimanche 8 mars a établi le premier record de 7 thésaurus en jour, dont les thésaurus de Lyon et Toulouse.

Puis le monde a été touché par une pandémie dirigée par un roi microscopique. La création de thésaurus a alors pris une autre tournure. Alors qu’il a fallu attendre deux semaines pour atteindre 50 thésaurus, la centaine a été faite le 19, établissant le record du nombre de thésaurus créés en un jour à 20. Les 150 thésaurus sont arrivés le 24 et quatre jours plus tard, les 200 étaient là, avec 26 thésaurus créés en un jour ! À noter que le 29 a également été jour de record, avec le nombre minimal de thésaurus créés, au nombre de 1. Le solitaire du jour est le thésaurus de la quantité. Il faut croire que faire des thésaurus, ça épuise les gens.

Sur les 176 thésaurus créés, 124 sont en français. De nombreuses langues ont été explorées, comme l’italien, le gaélique irlandais ou l’espéranto, mais également le moyen français ou le babar du Sud-Est. Toutes les lettres de l’alphabet ont eu droit à au moins un thésaurus, même les moins fréquentes.

De nombreux domaines ont été explorés, de l’amour aux Wisigoths, en passant par le badminton, le plogging et même le virus ! Ce dernier a été créé lors du Live du Virus ! #1 organisé par Lyokoï. À noter que les contributeurs et contributrices ont décliné le thésaurus en espéranto, en russe et en chinois ! D’autres ont exploré les différents sens de virus, avec des thésaurus sur le virus informatique.

De nombreux contributeurs et contributrices ont participé : Arcuz94, Assassas77, Automatik, Basbu, Basnormand, Braaark, ChoumX, Darkdadaah, Darmo117, Jpgibert, Laurent Jerry, Lepticed7, Lmaltier, Lyokoï, Noé, Otourly, Pamputt, Pom445, Poslovitch, Pyxido, Romainbehar, Sebleouf, Stephane8888, Treehill, Vaulque, VIGNERON, et deux personnes non-inscrites ou non-connectées.

Des personnes se sont même essayé pour la première fois aux thésaurus. Félicitations à Acer11, Briqueloup, Fralambert, Hsarrazin, Justinetto, Kaioken100x, La Kontribuanto, Koreller, Onbec, PikaTaz !
— une chronique par Lepticed7

Des ampoules ? Des bougies ? Non, un myxomycète !

Parentés dans les langues des signes

 
La base de données Glottolog recense 194 langues des signes Justin M. Power, Guido W. Grimm et Johann-Mattis ont publié au début de l’année un article (en anglais) dans lequel ils étudient les liens de parenté entre plusieurs langues des signes. Remonter l’histoire des langues signées est plus difficile que pour les langues parlées du fait qu’il existe très peu de traces écrites. Pour contourner cette difficulté, les trois linguistes se sont intéressés aux alphabets manuels, signes servant à représenter les différentes lettres de l’alphabet dans les langues signées. Cela est très utile, par exemple, pour épeler un nom propre qui n’a pas de signes correspondant dans une langue donnée. Les textes décrivant ces alphabets manuels remontent pour le plus vieux à 1593 avec Refugium Infirmorum publié par Melchor de Yebra. Les chercheurs ont appliqué des méthodes phylogénétiques classiques aux signes manuels pour déduire des liens de parentés entre 76 langues de signes différentes (40 encore utilisées et 36 éteintes). On notera que l’étude concerne principalement les langues des signes ayant une origine européenne.
— Une chronique de Pamputt

À voir ou écouter

Quelques émissions audio ou vidéos sur la lexicographie, la linguistique et la langue française sorties ou découvertes ce mois-ci.

  • L’épisode de mars du podcast Parler comme jamais animé par Laélia Véron nous parle de la voix, pour distinguer ce qui est anatomique et ce qui est sociologique, autour du titre La voix neutre n’existe pas.

Dictionnaire du mois

Œuvre collective, Wikipédia, 2001-, en ligne.

Wikipédia est une encyclopédie, un dictionnaire encyclopédique, et même parfois un peu un dictionnaire. Pourtant une recommandation dit que Wikipédia n’est pas un dictionnaire. Alors, dictionnaire ou non ?

Cet article achève la trilogie des œuvres-hybrides-inachevées-qui-sont-plus-ou-moins-des-dictionnaires, après le Wiktionnaire et le dictionnaire de l’Académie française.

De nombreuses ébauches invitent à douter, telles que câble série, favoris, millésime, solent. La définition serait-elle seulement la fondation de la connaissance encyclopédique ? La cible autour de laquelle rassembler les informations au fil du temps, pour dépasser la description du réel et évoluer vers l’encyclopédisme, ou vers le dictionnaire ?

En 2018, Lyokoï avait proposé une discussion sur les aspects les plus dictionnairiques de Wikipédia, sous le titre impertinent Wikipédia devrait-elle être encore moins un dictionnaire ? et les diapositives sont en ligne. Il s’intéressait notamment aux rapports compliqué de Wikipédia vis-à-vis des langues. Dans la façon de les décrire, d’abord, où il n’y a pas de convention sur les différences entre les langues, les dialectes, les parlers et les idiomes, ce qui induit à mélanger tout ça dans les modèles de palette par exemple la palette Langues d’oïl. Certaines pages de description d’un idiome ne sont qu’une liste de mots et d’expressions, comme celle du Parler lyonnais dont la forme rappelle tout à fait celle du dictionnaire.

En outre, Lyokoï relevait la présence quasi-systématique d’une section étymologie dans beaucoup de pages, principalement pour les prénoms, noms de famille, lieux. La maîtrise des sources étymologiques est très variable, sans documentation dédiée. L’étymologie est le propre d’un dictionnaire, et l’information se trouve souvent doublée entre les deux projets sans que cela ne pose de problème à Wikipédia, qui tire ainsi du côté du dictionnaire.

Par ailleurs, une cinquantaine de pages de Wikipédia sont appelées glossaires et la même quantité sont des lexiques qui sont des listes de termes, normalement des listes de notions et pas du vocabulaire, mais la limite est floue. D’après l’essai de convention sur les glossaires, les termes ne doivent pas être définis comme dans un dictionnaire mais en relation avec le thème. C’est toujours ce qui est fait dans un dictionnaire de spécialité, et de nombreuses définitions techniques sont rédigées ainsi dans le Wiktionnaire également. Sur Wikipédia, ces listes sont des compléments aux catégories, comme le sont les thésaurus et les annexes dans le Wiktionnaire. Certaines ressemblent d’ailleurs beaucoup aux annexes du Wiktionnaire, tel que le glossaire de la couture Elles favorisent la navigation au sein de l’encyclopédie et forment un contenu de nature différent des articles. Un contenu lexical.

Mais peut-être que certaines de ces listes seraient mieux à leur place sur le Wiktionnaire, telle que le lexique du français québécois. Le 10 décembre dernier, Lepticed7 suscitait une discussion animée dans le bistro de Wikipédia à propos de ces listes, revenant sur les frontières entre Wikipédia et le Wiktionnaire et questionnant la tendance à vouloir tout mettre dans Wikipédia plutôt que de répartir les connaissances selon les objectifs des projets. Un débat qui n’a abouti à aucune décision, la limite aux contenus admissibles dans Wikipédia n’étant pas claire.

Finalement, Wikipédia, un dictionnaire ? Des pages demeurent très proches de ce qui forme la base du dictionnaire, mais la plupart s’en éloignent et ce n’est que dans les marges, les bas-côtés de l’encyclopédie que l’on retrouve du vocabulaire et des informations typiques des dictionnaires. La frontière demeurera-t-elle floue ou va-t-elle se clarifier à l’avenir ? Difficile à prévoir.
— une chronique par Noé et Lyokoï

On dirait du vomi de chien et c’est son nom. On l’appelle aussi fleur de tan et c’est, vous vous en doutiez à force, non ? Un autre myxomycète !

Anciens numéros