Wiktionnaire:Actualités/122-mai-2025
Actualités du Wiktionnaire

Wiktionnaire:Actualités est un journal mensuel sur le Wiktionnaire, les dictionnaires, les mots et les langues. Il est publié en ligne depuis avril 2015. Son écriture est ouverte à toutes les bonnes volontés. Vous pouvez consulter les anciens numéros, participer au brouillon de la prochaine édition ou vous inscrire pour recevoir un avis lors de la publication des prochains numéros. Vous pouvez aussi lire le mensuel Regards sur l’actualité du mouvement Wikimédia. Pour les commentaires, critiques ou suggestions, voir en bas de page ainsi que la page de discussion.
Cadodes du sémélé androgyne (Semele androgyna) présentant des fruits immatures, photographiés par H.-U. Küenle à Madère
Brèves d’ici
- Bpierreb a engagé une discussion collective à propos des créations d’entrée débutant par « cancer de… », en cours de création par Bananax47, afin d’évaluer le caractère figé de ces expressions et de déterminer s’il s’agit bien de locutions à même d’être documentées dans le dictionnaire.
- En début de mois, suite à une décision collective, Danÿa a réalisé une maintenance sur le module qui gère les langues dans le Wiktionnaire, sans incidence visible à l’issue de l’opération. Elle sollicite ensuite un statut d’admin d’interface pour son bot afin de réaliser des tâches de maintenance régulières.
- Otourly a ouvert une discussion pour mieux indiquer la provenance des exemples tirés de Wikisource.
- CKali et Destraak ont entrepris un considérable chantier sur les catégories qui réunissent toutes les entrées par langue afin de les inscrire dans une arborescence selon leurs familles de langues. Une classification qui n’est pas si aisée.
- Noé a un doute sur la manière de gérer les entrées pour les mots au pluriel dont on rencontre exceptionnellement un singulier.
- Faisant suite à une idée proposée par Noé en mars, et à un appel à projets de la part de l’association Wikimédia France, plusieurs wiktionnaristes ont organisé une réunion publique afin de préparer une demande de subvention visant à organiser une rencontre entre wiktionnaristes en mars 2026, à l’image de celle qui s’était déroulée l’année dernière pour les 20 ans du Wiktionnaire.
- Si les liens internes dans le Wiktionnaire se font classiquement avec des double-crochets, il n’est pas rare de rencontrer l’usage du modèle {{lien}} indiquant un code de langue. Beaurenard a sollicité l’avis de la communauté sur les différentes façons de faire des liens.
- Rémi Ladusne sollicite des avis car il trouve que l’intitulé « dérivé » pourrait être clarifié, dans les sous-sections des entrées.
- Sayoxime ouvre une discussion sur l’organisation des informations pour le croate, le serbe et le bosniaque.
- DMontagne en résidence questionne sur la mise en italique des titres de pages pour les entrées portant sur des noms scientifiques.
- Lepticed7 propose deux nouveaux gadgets ! Le premier permet d’afficher le voisinage lexical en haut de la page, comme dans un dictionnaire imprimé et le second affiche les thésaurus qui ont un lien vers la page consultée !
- Gadget encore avec Danÿa qui propose un petit gadget pour mieux s’y retrouver dans la liste des gadgets.
- Galex-713 engage une discussion pour recenser les entrées qui décrivent des variantes.
- FRSleipnir propose de mettre davantage en avant les thésaurus.
- 3(MG)² invite à participer à un questionnaire sur la gouvernance de mouvement Wikimedia.
Statistiques
- Du 20 avril au 20 mai 2025
+ 24 386 entrées et 144 langues dont le nombre d’entrées a été modifié, pour atteindre 6 813 280 entrées et 1 504 langues avec au moins cinq entrées.
+ 1 502 entrées en français pour atteindre 435 439 lemmes et 690 609 définitions.
Les cinq langues qui ont le plus avancé, outre le français, sont le finnois (+ 12 342 entrées), l’allemand (+ 4 700 entrées), le kotava (+ 2 491 entrées), l’occitan (+ 753 entrées), et l’italien (+ 536 entrées).
Deux nouvelles langues ont été ajoutées ce mois-ci :
l’od (+12) et l’ifè (+1).
+ 2 961 citations ou exemples en français pour atteindre 682 365 pour les entrées en français, et 329 383 pour les entrées d’autres langues (+1 461).
+ 551 médias d’illustrations (images et vidéos) dans les pages principales du Wiktionnaire, pour atteindre 96 672.
- Du 30 avril au 31 mai 2025
+ 1 119 sections de langue contenant au moins une prononciation audio (dont 35 pour le français) pour atteindre 878 075 sections de langue contenant au moins une prononciation audio pour 185 langues (dont 207 147 pour le français).
+ 5 nouveaux thésaurus ce mois-ci, le total est de 1 590 thésaurus dans 107 langues dont 1 041 thésaurus en langue française. Les nouveaux thésaurus sont l’URSS et le speedrunning en anglais par Sayoxime ; le bouchon de liège par Otourly ; le lin par Assassas77 et le riz par Lepticed7.
+ 5 bonnes entrées pour atteindre 1 615 bonnes entrées (dont 490 en français, 5 de plus : feuillagé, lagopède, molysmologie, ricombre et vérédaire). Au total, 38 langues proposent des bonnes entrées.
Wikiscan et Wikistats donnent chaque mois accès à beaucoup de mesures, dont la liste des pages les plus consultées et des pages modifiées par le plus de personnes.
+ 10 mots créés sur les 34 proposés dans les Mots du jour ! Bravo à Ainoa Luß, Bercours, Bpierreb, Pamputt et une personne non-inscrite ou non-connectée !
Brèves d’ailleurs
- Durant les Journées du logiciel libre, à Lyon, le stand présentant les projets de la Fondation Wikimédia a fortement mis en avant le Wiktionnaire à l’aide d’affiches et de l’outil de médiation Les Petites Cartes du Wiktionnaire, facilitant les échanges. Noé a également présenté les incitations éditoriales et en particulier celles qui sont mises en avant sur la page d’accueil du Wiktionnaire. Toutes les présentations sont disponibles en vidéo !
- Clara Cini publie un long dossier sur l’histoire des dictionnaires dans Le Monde.
- Comme chaque année, les prochains millésimes de Larousse et de Robert sont annoncés, avec des communiqués mettant en avant leurs quelques nouveautés. Les listes ont été reproduites dans la Wikidémie afin d’évaluer les entrées manquantes encore au Wiktionnaire et pour observer celles qui sont là depuis longtemps. Karine Mateu consacre quelques minutes au Robert pour Radio-Canada. Ambre Chalumeau l’évoque également sur TMC. Une tribune collective critique la définition de « asexuel » dans la nouvelle édition de Larousse.
- L’unique prototype d’une machine à écrire chinoise avec clavier a été retrouvé en début d’année (anglais), et donné à la bibliothèque de l’université de Stanford. La chaîne YouTube HTX Studio a construit une version modernisée qui en reprend le fonctionnement (mandarin).
- France 24 consacre un article à la calligraphie de l’alphabet latin, le quoc ngu, au Vietnam.
- The Guardian rapporte une étude sur le point-virgule dans la langue anglaise, inventé en 1494 par Alde Manuce, et la baisse de son utilisation du début des années 2000 à aujourd’hui : d’une fois tous les 205 mots, à une fois tous les 390 mots. Seules 11 % des personnes interrogées indiquent l’utiliser régulièrement.
- Baptiste Condominas propose pour RFI un article sur les derniers mots des langues qui disparaissent.
- Une famille de Tobique lance un dictionnaire pour sauvegarder la langue wolastoqey, précisément la variante dialectale « wolastoqey latuwewakon » de la langue malécite-passamaquoddy nommé ici malécite. Une version en ligne est disponible.
- Valentin Hugues présente dans RFI le taa, une langue possédant un grand nombre de consonnes.
- Aurore Lartigue présente la situation actuelle de la langue bretonne sur RFI.
- Laurier The Fox publie un glossaire illustré autour des termes LGBTQI+.
- La rédaction de L’Internaute évoque un nouvel usage chez les jeunes francophones à transformer try hard en verbe, jusqu’à le prononcer « trallarder » et que les personnes qui essaient beaucoup des « trallardeurs » et « trallardeuses ».
- Annie Desnoyers publie une tribune dans La Presse pour promouvoir la simplification de l’accord du participe passé.
- Nouvelle revue de lexicographie, en accès libre, Words about réunit des articles autour d’un thème. Le premier numéro porte sur la mémoire et un appel a été lancé pour un deuxième numéro sur le changement climatique.
- Marie Steffens et Kaja Dolar ont publié un article universitaire sur les nouveaux mots autour du Covid-19 dans les dictionnaires, évaluant les entrées du Wiktionnaire.
- Le département de dialectologie alsacienne et mosellane de l’université de Strasbourg lance une campagne de collecte de messages en alsacien.
À voir ou écouter
Quelques émissions audio ou vidéo sur la lexicographie, la linguistique et la langue française ou d’autres sorties ou découvertes ce mois-ci.
- Le format audio Aujourd’hui c’est wiki, animé par .Anja. et Poslovitch publie un nouvel épisode dédié au Wiktionnaire, le présentant très bien, en une dizaine de minutes !
- La chaire pour le développement de la recherche sur la culture d’expression française en Amérique du Nord de l’Université Laval met en ligne une série de vidéos de vulgarisation sur démystifier 24 idées reçues en lien avec les francophonies nord-américaines.
- France Culture consacre quelques minutes à l’inexorable déclin des dictionnaires en papier.
- Nathalie Morel propose à Ici Radio France une émission sur le patois normand.
- Julie Neveux intervient sur Radio France pour critiquer l’expression la langue de Molière, saluant au passage la parution du Cahier d’Activité des Linguistes Atterré·es, avec des jeux pour l’été.
- L’émission matinale anglophone Good Mythical Morning joue à un jeu entre les deux animateurs pour deviner le plus vite possible le mot actuel en écoutant les évolutions successives depuis le proto-indo-européen. Une façon sympathique de faire découvrir la linguistique historique !
- Erica Brozovsky, qui anime l’émission anglophone Otherwords propose ce mois-ci une présentation du jargon dans le monde de l’entreprise.
- Rob Watts présente les mots les plus beaux et les plus laids de la langue anglaise.
Des pois de cœur (Cardiospermum halicacabum) pas encore mûrs, photographiés par Buendia22.
Un corpus d’exemples
Les entrées du Wiktionnaire présentent des définitions, ainsi que de nombreuses informations complémentaires, dont des exemples d’usage. Les Actualités du Wiktionnaire de juin 2018 présentaient la difficulté à sélectionner de bons exemples, et annonçait que le chiffre de 350 000 exemples, avec l’objectif de dépasser les 430 000 du Trésor de la langue française. Et c’est chose faite depuis longtemps puisque en comptant toutes les entrées de français dans le Wiktionnaire, on peut dénombrer 682 365 exemples !
Aujourd’hui dans le Wiktionnaire, il y a environ 690 644 entrées pour les mots du français (sans compter les formes fléchies et conjuguées), et parmi elles, 343 944 entrées proposent au moins un exemple d’usage. Ce sont près de 50 % des entrées qui ont au moins un exemple. Ce qui pourrait paraître peu en pourcentage dans l’absolu, mais c’est à appréhender au regard de trois points positifs :
- Rares sont les dictionnaires qui proposent autant d’entrées au total, et autant d’entrées avec des exemples
- Les dictionnaires produits par les linguistes pour des langues non documentées contiennent en général plutôt 10 à 15 % d’exemples
- En 2018, lorsque j’avais parlé des exemples dans les Actualités, le pourcentage était de 36 %, et la progression est donc notable !
Ces exemples sont ajoutés par tout un chacun, représentant une grande diversité de genres, de plumes et d’époques. Contrairement au Trésor de la langue française, qui s’était bâti sur un corpus numérisé, le Wiktionnaire est alimenté par toutes les sources disponibles, imprimées ou non.
Les exemples sont dans les entrées mais ne forment pas un recueil extractible facilement. Il n’est pas possible de rechercher uniquement dans les textes des exemples, ce qui pourrait pourtant conduire à identifier des apparitions de mots non encore documentés. Si un corpus était produit en amont ou à partir du Wiktionnaire, il serait possible de produire des statistiques, d’identifier les périodes chronologiques les plus représentées, les pays de provenance les plus saillants, les genres littéraires les plus lus, les personnes les plus souvent citées ou bien les profils des auteurs et autrices des exemples.
Une sémantisation plus poussée des exemples, c’est-à-dire une connexion avec une base de connaissances liées, comme l’est Wikidata, pourrait même permettre de connaître grâce à des inférences l’âge moyen d’émission des phrases qui sont présentées comme exemples, les métiers les plus représentés, ou bien de projeter sur une carte les lieux de naissance des auteurs et autrices, afin de présenter une cartographie descriptive de ce qui constitue une part majeure du Wiktionnaire.
En tout état de chose, sans cette extraction et sans cette analyse, il n’est possible que de présenter des chiffres et des évaluations floues. Des valorisations des plus beaux, des plus pertinents ou des plus amusants exemples ne peuvent être que le résultat de lectures assidues et hasardeuses, comme le fait la personne derrière le compte @Wikipèlerin sur Instagram.La collaboration du mois de mai
Une nouvelle proposition de Noé pour jouer tous ensemble à améliorer le Wiktionnaire !
Avril
Tout le monde peut ajouter une proposition à la suite de série, à la condition d’améliorer l’entrée correspondante dans le Wiktionnaire avant de l’ajouter. Si c’est une nouvelle entrée, elle pourra être indiquée en gras. Deux parties vont se jouer en même temps, la première uniquement en français, la seconde pour toutes les langues !
Trois petits mots…
Durant tout le mois, les deux listes se sont allongées progressivement, grâce à diverses personnes qui se sont impliquées dans la version en français comme dans la version multilingue !
Pour le français, la liste propose 79 entrées de dictionnaires, dont 60 créations, par 19 personnes différentes : Àncilu, Bananax47, BeatrixBelibaste, CKali, Danÿa, DarkVador79-UA, DMontagne en résidence, EctopiaCordis, Harmonide, Harmonide, Justinetto, Lazulis, Lepticed7, Lyokoï, Noé, Poslovitch, Sayōxime, Unsui, Vaulque
Pour la version multilingue, ce sont 123 entrées, dont 118 créations, par douze personnes différentes : Ainoa Luß, Àncilu, BlueCamille, CKali, Destraak, Harmonide, Lepticed7, Noé, Poslovitch, Sayōxime, Unsui, Vaulque
Ce qui représente tout de même 55 langues différentes : aïnou (du Japon), aléoute, allemand, alutiiq, anglais, asturien, azéri, bengali, coréen, créole haïtien, croate, danois, douala, espagnol, espéranto, estonien, finnois, gallo-italique de Basilicate, gallo-italique de Sicile, gallois, grec, grec ancien, gwich’in, haut tanana, holikachuk, hongrois, inuktitut, inupiaq, islandais, italien, japonais, kalaallisut, koyukon, lojban, lorrain, mwotlap, nahuatl classique, néerlandais, norvégien (bokmål), norvégien (nynorsk), occitan, peul, roumain, russe, same d’Inari, same du Nord, sanskrit, sicilien, siriono, suédois, swahili, tswana, turc, ukrainien, yupik central
Mois suivant
Des fruits de Beli ou coings du Bengale (Aegle marmelos) pas encore mûrs, photographiés par Asit K. Ghosh.
Dictionnaire du mois
- L. Lamotte, Système légal des poids et mesures à l’usage des écoles primaires, des pensions, des institutions et des collèges, Paris, L. Hachette, 1849 (16e éd., 1834), 72 p.
La chronique dictionnairique des Actualités du Wiktionnaire est habituée à une certaine forme d’excentricité. Je ne dérogerai pas à cette règle.
Alors que je me préparais, plein d’entrain, à la rédaction d’une chronique sur le Dictionnaire des injures précédé d’un petit traité d’injurologie de Robert Édouard (1967), me voilà dépité de découvrir qu’un précédent numéro des Actualités, celui de janvier 2017, en avait déjà rendu compte. C’est en allant le ranger dans ma bibliothèque, que je suis retombé sur un petit in-18, usé et bruni par le temps : Système légal des poids et mesures, par un certain M. Lamotte, Inspecteur honoraire de l’instruction publique, et dont vous pouvez retrouver l’édition de 1834 sur Gallica. S’il faut massacrer la définition déjà très… généreuse, de ce qu’est un dictionnaire pour le présenter ici, soit ! car je souhaite absolument que vous preniez quelques minutes pour le feuilleter.
Ce petit fascicule est très clairement destiné à un usage éducatif, et plus particulièrement à un usage par un instituteur. La table des matières révèle ainsi que ce livre comprend la loi du 4 juillet 1837 relative aux poids et mesures (loi qui impose alors le passage au système métrique en France), des « Moyens pratiques pour faciliter l’intelligence du Système légal » et un questionnaire destiné à « constater les progrès » des élèves. Mais ce n’est pas tout : une dizaine de pages d’exercices relatifs aux « rapports des diverses parties du système métrique » à faire pâlir les écoliers siègent au milieu de l’ouvrage (savez-vous d’ailleurs quelle somme en monnaie du système légal porte sur elle une personne qui vous dit porter 2,45 hectogrammes ? [1]). Cela dit, dans l’édition disponible sur Gallica, ce sont plutôt des exercices de « comparaisons des mesures anciennes et nouvelles », témoignage de l’époque où le Système légal était inconnu de la majorité de la population.
Enfin (si vous me permettez le paradoxe), l’ouvrage s’ouvre sur une préface : un « Dialogue entre un instituteur communal et le père d’un de ses élèves », où l’instituteur explique comment les mots des multiples des unités de ce nouveau système sont construits. Il se poursuit par un tableau récapitulatif des nouvelles unités, puis par un bref historique de cet étrange système de mesure (toujours pour la population de l’époque), avant de consacrer une vingtaine de pages aux nouvelles mesures de longueur, de surface, de volume, de poids et de monnaies. Respectivement : le mètre, le mètre carré, le mètre cube, le gramme et le franc. Sans oublier toutefois les mesures agraires (are), de capacité (litre), de bois de chauffage (stère).
Rappelons ainsi que le mètre est le dix-millionième de la distance du pôle à l’équateur et que le franc est une pièce de monnaie d’argent pesant exactement 5 grammes.
Et alors que les élèves planchent sur l’épineuse question de la distance de Paris à l’équateur en kilomètres, sachant que sa latitude est de 48 degrés 50 minutes[2], n’oublions pas que 200 francs étaient nécessaires à l’instituteur ou à l’institutrice pour acheter la collection complète de poids et mesures ajustés avec précision, y compris le célèbre mètre en bois jaune.Les thésaurus de la semaine de mai
Ces nouvelles suggestions hebdomadaires, affichées sur la page d’accueil, ont été proposées par Noé. Les propositions n’ont pas emballées les foules et seul Lepticed7 s’est lancé, sur celui du riz !
Semaine 18 (28 avril au 4 mai 2025)
Semaine 19 (5 au 11 mai 2025)
Semaine 20 (12 au 18 mai 2025)
Semaine 21 (19 au 25 mai 2025)
Semaine 22 (26 mai au 1er juin 2025)
Semaines suivantes
Découverte vidéoludique
- Rundisc, Chants of Sennaar, Focus Entertainment, 2023
Chants of Sennaar est un jeu vidéo d’aventure et de réflexion créé par le studio français Rundisc et édité par Focus Entertainment, sorti en 2023. Vous vous demandez pourquoi je choisis de vous parler d’un jeu vidéo ? C’est une bonne question. La question est plutôt simple : le jeu est incroyable et il parle de langues. Dans Chants of Sennaar, vous incarnez un personnage muet et sans visage qui arrive dans une grande tour où vivent différentes communautés qui parlent des langues différentes. Le problème ? Le lien entre les communautés s’est brisé, chacune parle une langue qui lui est propre et est incomprise des autres. Une sympathique référence au célèbre mythe de la tour de Babel, d’ailleurs construite, selon le mythe, dans la région sud de la Mésopotamie : Sennaar (c’est bien foutu leur histoire quand même).
Et votre rôle dans tout ça ? Permettre aux différentes communautés vivant dans la tour de communiquer et d’échanger à nouveau. Pour ça, vous devrez d’abord apprendre la langue de chaque groupe à travers de la déduction et de l’exploration : ici, vous remarquerez que le glyphe au dessus d’une boutique d’outils signifie… « outil » (très bien foutu là aussi comme système), là, vous trouverez une vieille pierre où sont gravées des histoires dans deux langues différentes, vous permettant, à la façon de Jean-François Champollion et la célèbre pierre de Rosette, de déchiffrer la langue inconnue à partir de celle que vous avez déjà appris. Au fur et à mesure que vous déchiffrer des glyphes, le charabia des différentes personnes que vous croisez devient de plus en plus clair, vous permettant d’en apprendre plus sur leur vision du monde et sur les problèmes qu’elles rencontrent. Enfin, bien que ça ne soit pas explicité dans le jeu, vous pourrez y retrouver différentes caractéristiques des langues : ceux-là ont une langue Sujet-Verbe-Objet, d’autres marquent le pluriel en dupliquant le mot. Ici, la négation est marquée en encadrant la phrase d’un certain glyphe, là, la structure d’une phrase interrogative vous filera un sacré mal de tête. Après avoir découvert et compris les différentes langues, il vous faudra enfin faire la traduction. Celui-là vous parle dans la langue des dévots, l’autre dans la langue des alchimistes, à vous de faire l’interprète, dans les deux sens !
Le jeu a évidemment des limites : avec un système d’un sens par glyphe, et au maximum 50 glyphes par langue, vous ne retrouverez pas toute la richesse des vraies langues. De nombreux aspects des langues restent inexplorés. Ça reste un jeu de puzzle, ayant pour thème les langues. Mais j’ai sincèrement pris beaucoup de plaisir à y jouer, à essayer de comprendre comment chacune des langues fonctionnait, comment les glyphes étaient construits les uns par rapport aux autres, à voir comment, en recréant du lien, les différentes personnes et les différentes communautés se mélangeaient, partageaient leurs cultures. Ça a été une très bonne expérience que je vous recommande très vivement !Les collaborations de la semaine de mai
Ces suggestions, affichées sur la page d’accueil, ont été proposées par Noé et Harmonide. Merci de leurs contributions aux personnes qui ont créé de nouvelles entrées : Bercours, Danÿa, Diligent, Harmonide, FoeNyx, Pamputt et Thomas le numéro 24 !
Semaine 18 (28 avril au 4 mai 2025)

Pour défendre ses droits sur le marché du travail, il est nécessaire de connaître les définitions des termes employés dans le code du travail. Cette semaine, nous nous intéressons aux différents types de licenciement en France. Ainsi, le licenciement pour motif économique, ou licenciement économique, n’engage pas la responsabilité ni la personne du ou de la salariée. Il existe aussi sous la forme du licenciement collectif. Il s’oppose donc au licenciement pour motif personnel, qui peut être :
- un licenciement pour faute, qui se décline en :
- ou un licenciement pour inaptitude.
Mais sauriez-vous reconnaître un licenciement abusif ?
Semaine 19 (5 au 11 mai 2025)

Connaissez-vous la culture moche ? Elle se situe entre l’ère Chavin et l’ère Chimú, entre 100 et 700 de notre ère. C’est une culture précolombienne pré-incaïque aussi appelée Mochica. Leur dieu principal, Ai apaec, est créateur et décapiteur.
Semaine 20 (12 au 18 mai 2025)
Semaine 21 (19 au 25 mai 2025)

Saviez-vous que les microchampignons peuvent provoquer différentes maladies cryptogamiques appelées rouille, nommées selon les plantes atteintes : rouille courbeuse du pin, rouille de la betterave, rouille de l’aubépine, rouille du rosier, rouille grillagée du poirier, rouille vésiculeuse du pin blanc, etc.
Semaine 22 (26 mai au 1er juin 2025)

Cette semaine, c’est la foire à la saucisse ! Cette préparation culinaire porte bien des noms selon la façon dont elle est préparée, et le lieu d’où elle provient : boudin de Louisiane, longanisse, jésus de Morteau, saucisse d’Ajoie, saucisse de Montbéliard, saucisse de vin
Semaines suivantes
Des goyaves-fraises ou goyaves de Chine pas mûres (Psidium cattleianum sabine) photographiées par Damien Boilley.
Réponses aux problèmes proposés par Poslovitch :
Courrier du lectorat
Noé, Wiktionnaire contiendrait 1 729 896 d'appels au modèle, peu importe la langue. Vous avez bien lu : environ 1,75 million d'exemples. Pour la demande de compiler/regrouper les exemples (Un corpus d’exemples), c'est faisable avec un bot bien programmé pour tous les exemples qui ont été inscrits en utilisant modèle:exemple. Il serait possible par la suite de produire des statistiques sur les fréquences des mots. D'autres informations pourraient être extraites, mais j'ignore lesquelles pourraient l'être de façon automatique. Cantons-de-l'Est (discussion) 3 juin 2025 à 05:03 (UTC)
- Oui, je n’ai évoqué que les données pour le français, mais Unsui met à jour chaque mois les chiffres pour l’ensemble des langues. L’usage du modèle exemple est en croissance mais il reste encore des pages qui ne l’utilisent pas et nous n’aurions pas la totalité des exemples. Cela dit, les informations ne sont pas ensuite tout à fait régulière, toutes les références ne sont pas dans le même ordre ni avec la même complétude. Mais il serait sans doute possible de faire de la reconnaissance d’identité nommées, pour retrouver leurs Qid et obtenir davantage d’informations. Mais c’est un traitement technique que je ne saurais pas réaliser. Serait-il possible d’automatiser une mise à disposition du public du corpus d’exemple chaque mois ? C’est une piste intéressante, il me semble 🙂 Noé 3 juin 2025 à 08:00 (UTC)
- Noé, Le nombre de paramètres du modèle:exemple est petit. L'extraction des informations est à ma portée avec l'aide d'un bot. Je suggère de commencer par regrouper sous forme de tableau quelques centaines d'exemples dans une seule page. Si des gens voient qu'il est possible d'extraire une masse d'informations, il y aura probablement des requêtes qui émergeront. Pour les QID, il faudra dresser une liste de correspondances entre les mots et les entrées dans Wikidata. Toutefois, j'ai du mal à imaginer l'intérêt de relier un mot à son QID. Peut-être développer plus cette proposition ?Cantons-de-l'Est (discussion) 3 juin 2025 à 15:43 (UTC)
- Ah, je n’envisageais pas d’alignement entre les mots et les entrées de Wikidata mais entre les noms des auteurs/autrices et les entités de Wikidata, afin d’en inférer le genre, le lieu de naissance, le métier et d’autres informations éventuellement qui permettraient de décrire les personnes dont les exemples sont les plus souvent repris 🙂 Noé 3 juin 2025 à 21:00 (UTC)
- Noé, Le nombre de paramètres du modèle:exemple est petit. L'extraction des informations est à ma portée avec l'aide d'un bot. Je suggère de commencer par regrouper sous forme de tableau quelques centaines d'exemples dans une seule page. Si des gens voient qu'il est possible d'extraire une masse d'informations, il y aura probablement des requêtes qui émergeront. Pour les QID, il faudra dresser une liste de correspondances entre les mots et les entrées dans Wikidata. Toutefois, j'ai du mal à imaginer l'intérêt de relier un mot à son QID. Peut-être développer plus cette proposition ?Cantons-de-l'Est (discussion) 3 juin 2025 à 15:43 (UTC)
Surprenante machine à écrire du chinois ! Merci d'avoir rapporté son existence. Challwa (discussion) 3 juin 2025 à 21:40 (UTC)
Anciens numéros
- 2015 : avril, mai, juin, juillet, août, septembre, octobre, novembre, décembre
- 2016 : janvier, février, mars, avril, mai, juin, juillet, août, septembre, octobre, novembre, décembre
- 2017 : janvier, février, mars, avril, mai, juin, juillet, août, septembre, octobre, novembre, décembre
- 2018 : janvier, février, mars, avril, mai, juin, juillet, août, septembre, octobre, novembre, décembre
- 2019 : janvier, février, mars, avril, mai, juin, juillet, août, septembre, octobre, novembre, décembre
- 2020 : janvier, février, mars, avril, mai, juin, juillet, août, septembre, octobre, novembre, décembre
- 2021 : janvier, février, mars, avril, mai, juin, juillet, août, septembre, octobre, novembre, décembre
- 2022 : janvier, février, mars, avril, mai, juin, juillet, août, septembre, octobre, novembre, décembre
- 2023 : janvier, février, mars, avril, mai, juin, juillet, août, septembre, octobre, novembre, décembre
- 2024 : janvier, février, mars, avril, mai, juin, juillet, août, septembre, octobre, novembre, décembre
- 2025 : janvier, février, mars, avril, mai, brouillon du prochain numéro