Wiktionnaire:Actualités/022-janvier-2017

Wiktionnaire:Actualités est un journal mensuel sur le Wiktionnaire, les dictionnaires et les mots. Il est publié en ligne depuis avril 2015. Son écriture est ouverte à toutes les bonnes volontés. Vous pouvez recevoir un avis lors de la publication des prochains numéros, consulter les anciens numéros et participer au brouillon de la prochaine édition. Vous pouvez lire aussi les Regards sur l’actualité de la Wikimedia. Pour les commentaires, critiques ou suggestions, voir la page de discussion.

Actualités - Numéro 22 - janvier 2017

Brèves

modifier
  • La ville de Washington D.C. aux États-Unis d’Amérique envisage d’ouvrir un musée dédié à la linguistique et aux langues (article en anglais). Il existe déjà un musée dédié aux langues à Paris, Mundolingua ! Ce musée situé 10 Rue Servandoni, 75006 Paris, accueillera d’ailleurs le jeudi 16 février à 19h30 une conférence tout public sur Wiktionnaire : au-delà du dictionnaire présentée par Lyokoï et Noé ! Venez nombreux si vous souhaitez en savoir plus sur le projet et poser des questions à des contributeurs en chair et en os !
  • Dans un article Croyance et scepticisme dans les recherches Google / le biais de confirmation du 26 janvier 2017, Serge Bret-Morel observe les définitions et les liens qui apparaissent aux internautes lorsqu’ils recherchent dans Google les mots astrologie, horoscope et zodiaque. Son regard critique pointe plusieurs pages de Wikipédia ainsi que la définition de zodiaque dans le Wiktionnaire, qu’il qualifie de techniquement erronée.
  • Philippe Blanchet dénonce la glottophobie dans une interview sur Libération, « Rejeter un accent, c’est toucher à l’identité de l’être » affirmation on ne peut plus parlante sur le wiktionnaire où toutes les variétés ont leur place dans la description d’une langue.
  • Pronuncify est un outil développé à partir d’octobre 2015 et dont la version 0.31 est disponible depuis le 28 janvier 2017. Cet outil, s’utilise en ligne de commande, et permet d’enregistrer des prononciations, au format ogg, à partir de listes de mots. Ces nouveaux fichiers peuvent ensuite être directement envoyés sur Wikimedia Commons tout en étant catégorisés. La partie technique ressemble beaucoup à ce qui est développé dans le cadre de Lingua Libre.
  • Le fransin est un projet de transcription phonétique du français simplifié. Les promoteurs de ce projet ont utilisé le Wiktionnaire au cours de leur travail.
  • Le doctorant Kaja Dolar est en train de faire une thèse sur Les dictionnaires collaboratifs en tant qu’objets linguistiques, discursifs et sociaux tandis que Charlotte Siarri-Mesana a soutenu une thèse sur Les mots nouveaux attestés entre 1990 et 2012 dans le Nouveau Petit Robert électronique 2012 qui compare avec le Wiktionnaire. Pour l’instant leurs thèses ne sont pas accessibles mais les Actualités vous tiendront au courant !

Détail d’une photo de Furong, en Chine, proposée par Chensiyuan dans le cadre du Défi photo mensuel de janvier-février.


Statistiques

modifier
 
Poilu étreignant un gros-cul, entrée très enrichie ce mois-ci.
De mi-décembre à mi-janvier (du 23/12/2016 au 20/01/2016)
  • Le français gagne 9 235 entrées. Il est désormais à 337 728 lemmes et 496 018 définitions.
  • Les trois autres langues qui ont le plus avancé sont l’espagnol (+ 2 126 entrées), le same du Nord (+ 2 081 entrées) et le latin (+ 701 entrées).
  • Les nouvelles langues dans le projet sont : l’angevin (+2), le tera (+2), le bukit (+1), le margi (+1), le bakumpai (+1), le peranakan (+1), le kamwe (+1) et le daba (+1)
  • Cette période a vu l’ajout de 16 240 nouvelles entrées pour au moins 83 langues !
  • Les nouveaux codes de langues dans le projet sont : le bakumpai (code : bkr), le sorsoganon du Nord (code : bks), le bukit (code : bve), le boga (code : bvw), le kamwe (code : hig), le tera (code : ttr) et le proto-tchadique central (code : proto-tchadique central).
Autres
  • Il y a 30 647 médias d’illustrations (images et vidéos) dans les articles du Wiktionnaire, soit 302 de plus que le mois dernier.
  • Qualité du Wiktionnaire : les entrées couteau, râteau et gros-cul sont proposées comme étant de bon contenus.
  • Au premier février 2017, le Wiktionnaire propose 257 thésaurus en langue française ! Quatre de plus que le mois dernier et trente-et-un de plus qu’en janvier 2016 !

Thésaurus

modifier

Ce mois-ci, en hommage à Peter Mark Roget, nous allons nous consacrer à un pan du projet qui n’est pas le dictionnaire mais vient l’enrichir progressivement : les thésaurus. Ce terme définit deux objets distincts :

  1. (lexicographie) une liste de mots en rapport avec un concept, qui permettent d’en parler ;
  2. (documentation) une liste normée structurée avec des descripteurs pour favoriser l’indexation de documents.

C’est le premier objet qui se trouve dans le Wiktionnaire, dans des pages débutant par Thésaurus : et souvent suivies de  . Le second sens est cependant plus populaire, notamment dans le domaine de l’informatique et des bibliothèques. Les pages de Thésaurus du Wiktionnaire permettent d’accéder à du vocabulaire nouveau, de retrouver des mots liés, mais aussi de naviguer au sein du contenu du Wiktionnaire d’une manière horizontale, riche et sémantique.

Un bilan sur les thésaurus avait déjà été fait dans les Actualités de janvier 2016, et nous souhaitions refaire une étude un an après.

Nombre de thésaurus cumulé entre 2004 et 2017
50
100
150
200
250
300
2004
2005
2006
2007
2008
2009
2010
2011
2012
2013
2014
2015
2016
2017

Le nombre de thésaurus croit progressivement. L’évolution est quasiment la même que l’année passée sur le nombre de créations (graphe ci-dessus) mais plus importante de près de 25% pour la quantité de données (graphe ci-dessous). Les nouveaux thésaurus sont plus riches et le contenu de l’ensemble des thésaurus a gagné en volume. Ceci est lié à plusieurs facteurs. Le premier est l’ajout pour chaque thésaurus d’un lien depuis Wikipédia, dans le bloc de liens Autres projets qui a donné une visibilité supplémentaire aux thésaurus et a attiré la curiosité des contributeurs à Wikipédia. La création lors d’évènements publics a également motivé de nouvelles personnes à participer aux thésaurus, comme le thésaurus sur le handisport associé à une session de contribution collaborative sur les Jeux Paralympiques. Enfin, la dynamique des LexiSessions dont les Actualités se font écho chaque mois a permis la création de nombreux nouveaux thésaurus, et l’implication de nouvelles personnes dans l’amélioration de ceux-ci. Les créations entraînent souvent des nouvelles personnes à s’intéresser à ce type de contenu et à enrichir les autres thésaurus, durant plusieurs mois après leurs créations. Le nombre de personnes ayant contribué à des thésaurus n’est pas évaluable dans l’immédiat, car l’outil statistique ne considère pas encore les thésaurus comme une partie distincte du Wiktionnaire, mais nous en reparlerons certainement l’année prochaine !

Évolution du poids global des thésaurus en français de 2004 à 2017
100 000
200 000
300 000
400 000
500 000
600 000
700 000
800 000
900 000
2004
2005
2006
2007
2008
2009
2010
2011
2012
2013
2014
2015
2016
2017
Comparaison avec les autres wiktionnaires

Mis à part la version anglophone, les autres projets ont commencé à développer ce type de contenu durant l’année écoulée, sous l’impulsion des LexiSessions. Il existe une tradition anglophone des ouvrages de thésaurus bien plus importante qu’en France, et les Wikisaurus ont pu s’appuyer sur de nombreux ouvrages libres de droit et sur une quantité plus importante de contributeurs. Il existe actuellement 1 506 thésaurus sur la version anglophone du Wiktionnaire, sensiblement la même quantité que ce que nous avions noté dans les Actualités de 2015. La progression semble donc être similaire, même si nous avons manqué de temps pour produire une courbe comme pour le français ci-dessus. Notons enfin que les thésaurus dans d’autres langues dans le Wiktionnaire anglophone sont bien moins développés et que le Wikisaurus du chat est un peu perdu parmi tous les animaux ne parlant pas sa langue ! A bientôt sur un thésaurus, ou à l’année prochaine pour un nouveau bilan ! — chronique par Noé

Le dico du mois

modifier
Robert Édouard, Dictionnaire des injures, précédé d’un petit traité d’injurologie, Claude Tchou éditeur, 1967

1967, la France s’ennuie ; l’on sait depuis avec quel succès. Malgré cela, et peut-être pour tromper cet ennui, le sulfureux éditeur Claude Tchou publie un dictionnaire bien particulier : "Le Dictionnaire des injures, précédé d’un petit traité d'injurologie", de l’énigmatique Robert Édouard[1], dont c’est la seule œuvre. L’auteur précise qu’il a voulu rédiger un "Dictionnaire de Injures en Usage" et non le "Panthéon des Injures de la Littérature Française". L’ouvrage se présente sous la forme d’un volume relié de 610 pages, illustré de dessins et de photos en noir & blanc ; il se divise en trois parties :

  • la troisième partie, qui justifie l’ouvrage, est un catalogue alphabétique de mots vedettes d’injures du français courant, de A bas ! à Zut !. Chaque mot vedette renvoie à une ou plusieurs injures et aux moyens d’y rétorquer, et s’y côtoient des injures aux registres aussi divers que "Face de Nœud" ou "Belzébuth". Il est réputé contenir 9300 injures ;
  • pour précéder ce catalogue, l’auteur a dressé un répertoire analogique d’injures, divisé en quatre tombereaux[2] : l’Homme, la Nature, la Société, les Mœurs, et qui, sur 30 pages, liste des séries d’injures en rapport avec ces 4 occurrences et leurs sous-classes ;
  • pour précéder le tout, en première partie, un traité d’injurologie, premier du genre en français, qui, en 20 chapitres et 290 pages, étudie l’injure, de sa naissance à sa disparition, dans ses aspects historiques, sociaux, économiques, sanitaires, phonologiques, etc. Il constate que l’injure meurt en passant dans la littérature et il interroge même la pertinence d’un dictionnaire d’injures qui peut devenir un tombeau d’injures[3]. Dans le dernier chapitre, il s’inquiète de l’avenir de l’injure, qu’il voit dépérir, et propose à la jeunesse[4], qui en a la ressource, de renouveler l’injure ; il propose même la création d’un Institut des Hautes Études Injurologiques, dont il détaille le programme.
    Ce texte semble être le texte fondateur de l’injurologie qui, depuis, bien que confidentielle, est devenue l’objet d’étude d’éminents scientifiques.

L’ouvrage de 1967 a connu plusieurs rééditions : Le Dictionnaire seul, en 1979, chez Tchou, puis en 1983, chez Sand & Tchou ; enfin en 2004, une réédition du Dictionnaire et du Traité, en deux volumes séparés, aux éditions 10/18, sous la direction éditoriale de Michel Carrassou. — chronique par François GOGLINS

Notes
  1. La notice BNF de Robert Édouard est bien maigre [1], comme s’il s’agissait d’un pseudonyme de circonstance.
  2. Ce jeu de mots avec l’expression Tombereau d’injures est de l’auteur même.
  3. Le jeu de mots est du rédacteur de cette notice, l’auteur parle de cimetière.
  4. Il s’agit bien de la jeunesse de 1967, qui depuis a pris 50 ans et qui n’a rien foutu pour sauver l’injure, ces grosses feignasses de soixante-huitards.

« Le train de tes insultes roule sur les rails de mon indifférence. » - citation illustrative tirée du film La Classe américaine. La photo est proposée par Kora27 dans le cadre du Défi photo mensuel de janvier.

 

LexiSession sur la voiture et le véhicule

modifier

Impulsé par le Fantastique Groupe d’utilisateur de Wiktionnaire, les LexiSessions visent à proposer des thèmes mensuels pour dynamiser l’ensemble des Wiktionnaires simultanément. La sixième LexiSession portait sur le thème de l’automobile et des véhicules et a permis la création du thésaurus de l’automobile en français   et du thésaurus du véhicule en français   !

Mais aussi les illustrations des entrées suivantes : taxi, limousine, voiture-bar,banquette, bolide, auto-école, levier de vitesse, coffre de toit.

Les participations sur les autres Wiktionnaires sont difficiles à mesurer car les communautés sont très diverses et les retours peu nombreux. Pour autant, les LexiSessions ne s’arrêtent pas et le thème de février sera la fièvre !

En vidéo

modifier

Cette rubrique vous propose de faire une revue des vidéos sur la linguistique et la langue française du mois, n’hésitez pas à ajouter les vidéos et les chaînes que vous trouvez !

Les mots du mois

modifier

Un peu plus de statistiques avec trois catégories différentes !

Pages les plus augmentées (les cinq par Classiccardinal)
  1. gros-cul
  2. gros cul
  3. crépitophile
  4. panivore
  5. hydroprêtre

→ voir La liste complète

Pages les plus consultées
  1. avoir maille à partir
  2. golden shower
  3. encaustique
  4. BDSM
  5. nymphomane

→ voir La liste complète

Pages modifiées par le plus de personnes
  1. budgétivore (11)
  2. planetă super-locuibilă
  3. amour
  4. planeta superhabitable
  5. pute

→ voir La liste complète

Nouvelle année, nouveaux projets : bienvenue à la rubrique jeux !

Nous vous proposons d’essayer bouche cousue, une variante du jeu télévisé Motus (et l’occasion d’un jeu de mot de qualité discutable). Il s'agit de découvrir un mot avec comme seule information le nombre de lettres bien placées.Il y a deux modes : un mode aléatoire, où vous devrez trouver des mots français de 6 ou 7 lettres issus du Wiktionnaire ; et un mode "mot de la semaine", où votre performance sera enregistrée. S’il y a lieu d’être, nous ferons un petit palmarès des joueurs du mois dans le prochain numéro ! Si vous avez des retours à faire, vous pouvez contacter DaraDaraDara qui l’a réalisé avec l’aide de la communauté.

Détail d’une photo d’une petite gare, proposée par Tulumnes dans le cadre du Défi photo de janvier.

Curiosité

modifier

Peut-être connaissez-vous la légende concernant les cents mots utilisés par les esquimaux pour désigner la neige. Légende tellement courante qu’elle a donnée lieu à une page sur Wikipédia retraçant l’histoire de l’idée reçue. Il faut d’abord remarquer que la notion de mot n’est pas du tout évidente quand il s’agit de langues polysynthétiques. Sur une racine donnée, il est possible d’ajouter des suffixes en très grand nombres afin de former ce qui, par exemple en français, constituerait pour le moins une proposition sinon une phrase entière. Ainsi un mot inuit pourrait être "neige molle tombée récemment mais devenue dure maintenant".

Ensuite, il est normal que les sujets d’attention primordiaux ou l’activité principale d’un peuple se retrouvent dans son vocabulaire. Les touaregs ont beaucoup de mots relatifs aux dromadaires, de même les lapons au sujet des rennes (allant même jusqu’à donner un nom différent à chaque semaine de l’année pour indiquer la date de naissance des animaux de leur cheptel). À chaque peuple donc sa préoccupation. N’avons-nous pas nous-mêmes plus de cent synonymes pour le mot pénis ?

Contours de neige et glace proposé par Kristian Pikner dans le cadre du Défi photo mensuel de janvier (drone).

Même en ce qui concerne le mot neige, nous avons, comme le fait remarquer le site monsu.desiderio, « […] des racines aussi variées que neige, pleige, congère, avalanche, lavanche ou lavange, blizzard, poudrerie, bourrasque, flocon, fondrière, giboulée, névé ou niévé, gel, regel, glace, cristal... Des adjectifs pour désigner la neige : poudreuse, sèche, fondue, compacte... Des dérivés savants : nivéal, nivôse, niviforme, nives. Des mots composés : boule de neige, bonhomme de neige, pelotes de neige, chasse-neige, tourmentes de neige, fonte des neiges. Des dérivés : neigeux, enneigé, enneigement, déneiger. Des verbes régionaux : nèvoler (Savoie), pelucher (Lyon), pleiger (Suisse). »

Cependant, on peut signaler une constante dans les langues inuites et yupikes, c’est l’existence de deux mots différents pour “neige tombée” et “neige tombante”. Ainsi on a respectivement :

Cette distinction n’est déjà plus présente en aléoute où qaniix, pourtant de même étymologie, désigne aussi bien la neige tombée que la neige tombante. — chronique par Unsui


Nouvelle tâche récurrente

modifier

Ce mois-ci, la Catégorie : Singuliers manquants en français a été créée pour détecter et compléter les mots dont seule la flexion plurielle avait été publiée. N’hésitez pas à nous aider à la vider !

Anciens numéros

modifier