Wiktionnaire:Actualités/020-novembre-2016

Wiktionnaire:Actualités est un journal mensuel sur le Wiktionnaire, les dictionnaires et les mots. Il est publié en ligne depuis avril 2015. Son écriture est ouverte à toutes les bonnes volontés. Vous pouvez recevoir un avis lors de la publication des prochains numéros, consulter les anciens numéros et participer au brouillon de la prochaine édition. Vous pouvez lire aussi les Regards sur l’actualité de la Wikimedia. Pour les commentaires, critiques ou suggestions, voir la page de discussion.

Actualités - Numéro 20 - novembre 2016

Brèves modifier

  • Le projet Lingua Libre développé grâce au soutien de l’association Wikimédia France, est en phase de test et il avance bien. Il permettra de faciliter l’enregistrement de mots, notamment pour les langues régionales de France, en aidant à la catégorisation des fichiers.
  • Dans cet article du New York Times (en anglais), on apprend que le taa aussi connu sous le nom de ǃxóõ, une langue khoïsane parlée au Botswana et en Namibie, est la langue possédant le plus de sons différents. Les études indiquent que cette langue comprend entre 100 et 164 consonnes et 44 voyelles différentes. Ces chiffres sont à comparer aux 45 sons tout compris de l’anglais.

Détail d’une photo de diorite orbiculaire proposée par Emmanuel Douzery dans le cadre du Défi photo mensuel de novembre-décembre.

Statistiques modifier

De mi-octobre à mi-novembre (du 20/10/2016 au 20/11/2016) (Attention deux mises à jour de statistiques sont accumulées)
  • Le français gagne 17 218 entrées. Il est désormais à 334 854 lemmes et 491 739 définitions.
  • Les trois autres langues qui ont le plus avancé sont le same du Nord (+ 4 506 entrées), l’italien (+ 2 692 entrées) et le suédois (+ 237 entrées).
  • Les nouvelles langues dans le projet sont : le lese (+1), le mangbutu (+1) et le ndo (+1).
  • Cette période a vu l’enrichissement de 25 973 pages pour au moins 74 langues !
  • Les nouveaux codes de langues dans le projet sont : le mangbutu (code : mdk), le nawdm (code : nmz) et le ndo (code : ndp). À noter que le code gsw-fr désigne désormais l’alémanique alsacien (au lieu de seulement alsacien) et le code gsw-ch désignant le suisse allemand a été supprimé car il ne désignait pas une langue.
Autres
  • Il y a 30 011 médias d’illustrations (images et vidéos) dans les articles du Wiktionnaire, soit 374 de plus que le mois dernier.
  • Qualité du Wiktionnaire : les entrées morse, pâquerette et chat sont proposées comme étant des bons contenus.
  • Le projet wikiwtics propose en alpha (donc c’est bloqué sur le 19 novembre 2016) de voir les statistiques de vues des projets wikimédias. Il est intéressant de voir que les wiktionnaires cumulent 3 427 008 vues ce jour-là, dont 705 552 pour la version anglophone et 327 378 pour la version francophone qui est la deuxième la plus visitée. Il faut noter que le plus petit score est 53 pour le wiktionnaire en sindhi (144e position), et ce n’est pas rien, une cinquantaine de vues par jour pour une langue venant du Pakistan. Par comparaison, les wikipédias font 499 444 987 vues dont 11 876 905 pour la version en langue française (et 5 201 pour la version en sindhi).
  • Le Wiktionnaire propose maintenant 250 thésaurus en langue française ! On en reparlera dans les Actualités de Janvier 2017, un an après un premier bilan sur le sujet.

Quantité concrète modifier

 
Le gâteau pour célébrer les trois millions de pages dans le Wiktionnaire francophone.

Alors que les contributeurs au Wiktionnaire francophone célébraient l’existence de plus de trois millions de pages, le Wiktionnaire anglophone notait de son côté qu’ils venaient d’atteindre les cinq millions de pages, sans fioritures. Mais qu’est-ce que ça veut dire exactement, cette quantité ? Depuis un an et demi, les Actualités du Wiktionnaire font état des statistiques du nombre d’entrées, sans mentionner le chiffre qui est indiqué en haut de la page d’accueil. D’une part, car plusieurs mots peuvent être définis sur une seule page, lorsqu’ils sont de langues étrangères, ce qui signifie qu’il y a déjà plus de trois millions d’entrées dans le Wiktionnaire. Il y avait ainsi au 20 novembre 3 192 351 entrées. Le compte du nombre de pages est cependant automatiquement réalisé par le logiciel MediaWiki et mis à jour en temps réel.

La quantité de page ne dit rien de la qualité de celles-ci. Avoir des milliers de pages vides, c’est facile, il suffit de développer un logiciel qui créé des entrées sans même les définir, en ajoutant à tour de bras des formes conjuguées de verbes ou des pluriels de noms dont on ne définit pas le sens. Ce n’est pas la stratégie qu’adopte le Wiktionnaire francophone, en privilégiant l’ajout qualitatif. Les contributeurs et contributrices ont fait évoluer leurs compétences au fur et à mesure du temps et quelques ajouts logiciels permettent la création d’ébauches de qualité croissante. Il est de plus en plus courant de voir une page être créée avec immédiatement la prononciation en alphabet phonétique, une catégorisation précise, un ou deux exemples tirés d’œuvres citées correctement, une illustration et des traductions. Lorsque ce n’est pas le cas, la vigilance des relecteurs qui patrouillent l’ensemble du contenu modifié permet ces ajouts dans de nombreux cas. Ces considérations ne peuvent cependant pas être chiffrées ni présentées sous forme de statistiques, ce qui rend leur perception difficile pour les personnes ne passant qu’occasionnellement sur le Wiktionnaire.

Par ailleurs, nous le disions, les contributeurs francophones ont souhaité organiser une petite fête avec un gâteau, ce qui a été remarqué par les contributeurs anglophones. Il est encore rare que les personnes contribuant aux Wiktionnaires se rencontrent hors d’internet pour échanger sur leurs pratiques et leurs activités. Ils sont le plus souvent attirés par un ou deux aspects dans la contributions et peuvent prendre plaisir à contribuer pendant des années sans avoir rencontré les autres personnes œuvrant de manière parallèle à la leur. Il y a évidemment un problème de distance, qui rend souvent les rencontres difficiles. A Lyon, il existe depuis maintenant un an et demi une rencontre mensuelle chaque premier jeudi du mois, qui attire de plus en plus de monde. Le jeudi 1e décembre, une activité spéciale est même proposée, visant à illustrer des mots du Wiktionnaire. A cette occasion, une dizaine de mots ont été illustrés et cela a montré l’apport potentiel du multimodal pour la définition des termes.


Le dico du mois modifier

Halina Lewicka, Krzysztof Bogacki, Dictionnaire sémantique et syntaxique des verbes français, Państwowe Wydawnictwo Naukowe, 1983

Ce mois-ci, nous vous présentons brièvement un dictionnaire spécialisé sur les verbes du français ! Un ouvrage spécialisé qui cherche à définir les verbes en présentant de très nombreuses attestations pour délimiter les sens précis qu’ont chaque verbe, selon les contextes. La deuxième partie reprend les mêmes verbes et décrit leurs usages, sans entrer dans le détail sur les cooccurrences verbales. Malgré ses 733 pages, cet ouvrage précieux se concentre sur 574 verbes. La complexité de la langue a requis une étude approfondie par une équipe entière de chercheurs : Krzysztof Bogacki, Graz̍yna Bogusɬawska, Alina Kreisberg, Halina Lewicka, Maria Lozińska, Monika Thieme, Leszek Wójcik et Teresa Zielińska. Comme leurs noms l’indiquent, il s’agit d’une équipe de recherche polonaise, et des traductions sont indiquées dans cette langue. L’originalité de cet ouvrage est la description du sens d’un mot de manière identique à la description d’une phrase grâce à l’utilisation d’une représentation basée sur la logique formelle combinée à l’utilisation d’un nombre réduit d’unités de sens. C’est donc une ressource précieuse, mais difficile d’accès.

Détail d’une photo d’un clinochlore, proposée par SKas dans le cadre du Défi photo mensuel de novembre.

 

LexiSession sur le vin modifier

Impulsé par le Fantastique Groupe d’utilisateur de Wiktionnaire, les LexiSessions visent à proposer des thèmes mensuels pour dynamiser l’ensemble des Wiktionnaires simultanément. La quatrième LexiSession portait sur le thème du vin et a permis la création du thésaurus du vin en français   et du thésaurus du vin en breton   !

Mais aussi les créations des entrées suivantes : auxerrois, chambolle-musigny, faugères,madiran, minervois, montrachet, passetoutgrain, persistance aromatique interne, pinot gris, pommard, vin doux naturel.

Et l’amélioration des entrées suivantes : assemblage, bouche, élevage, longueur, nez, nouveau, typicité, vert.

Les participations sur les autres Wiktionnaires sont difficiles à mesurer car les communautés sont très diverses et les retours peu nombreux. Pour autant, les LexiSessions ne s’arrêtent pas et le thème de décembre sera le cadeau !

En vidéo modifier

Cette rubrique vous propose de faire une revue des vidéos sur la linguistique et la langue française du mois, n’hésitez pas à ajouter les vidéos et les chaînes que vous trouvez !

Les mots du mois qui précède modifier

 

Les statistiques permettent de connaître les mots modifiés par le plus de monde au cours d’un mois. Voici donc les mots les plus modifiés d’octobre 2016 ! En exposant, le nombre de participants différents :

  1. Français de souche6 (suite à une deuxième procédure de suppression de la page)
  2. pute6 (sans aucune différence, donc seulement du vandalisme)
  3. bite5 (idem que ci-dessus)
  4. feu5 (en lien avec le thésaurus)
  5. la roter4 (création par Rama et enrichissement collectif dans la foulée)
  6. patronnier-gradeur4 (création par Trace et enrichissement collectif dans la foulée)
  7. kinoïste4 (créé par Basnormand suite à une suggestion d’un visiteur anonyme)
  8. kara-gueuz4 (création par Webamri et enrichissement collectif dans la foulée)
  9. chacaliser4 (création par Tchang75 et enrichissement collectif dans la foulée)
  10. Thésaurus sur le feu4 (création par Noé et enrichissement collectif dans la foulée)

Ce mois-ci, ce sont surtout des nouveautés qui ont inspiré les enrichissements du Wiktionnaire, et des créations par des contributeurs très variés !

Curiosité modifier

Connaissez-vous ces figures de style : le lipogramme et les vers holorimes ?

Le lipogramme est un texte dont on a volontairement exclu certaines lettres de l’alphabet. Un des lipogrammes le plus connu est le roman de Georges Perec, La disparition écrit sans la lettre e.

Quant aux vers holorimes, ce sont des poèmes où chaque vers est un homophone du précédent. Un distique connu, attribué souvent à Victor Hugo mais en fait d’Henri Monnier est le suivant :

(La reine dit à Gall : "Beau moine rose et gras,
Jusqu'où peux-tu marcher, me tenant dans tes bras "?)
Gall, amant de la reine, alla, tour magnanime,
Galamment de l’arène à la tour Magne, à Nîmes.

Et quand l’humour d’Alphonse Allais s’en mêle cela donne :

Ah ! Vois au pont du Loing, de là, vogue en mer, Dante !
Hâve oiseau, pondu loin de la vogue ennuyeuse.

doté de ce savoureux commentaire de l’auteur : « La rime n’est pas très riche, mais j’aime mieux cela que de sombrer dans la trivialité. »

Détail d’une photo du phare de l’Hospic dans la baie de Paimpol, en Bretagne, proposée par Poncetdespontets dans le cadre du Défi photo mensuel de novembre.

Anciens numéros modifier