Wiktionnaire:Actualités/088-juillet-2022
Actualités du Wiktionnaire
Wiktionnaire:Actualités est un journal mensuel sur le Wiktionnaire, les dictionnaires et les mots. Il est publié en ligne depuis avril 2015. Son écriture est ouverte à toutes les bonnes volontés. Vous pouvez recevoir un avis lors de la publication des prochains numéros, consulter les anciens numéros et participer au brouillon de la prochaine édition. Vous pouvez lire aussi les Regards sur l’actualité de la Wikimedia. Pour les commentaires, critiques ou suggestions, voir la page de discussion.
Brèves d’ici
- Une discussion dans la Wikidémie présente la difficulté à informer sur la diversité des accents des personnes parlant la langue française de par le monde, en commençant par la diversité en France avec la prononciation méridionale, mal documentée. Le biais est renforcé par la prononciation prototypique représentée avant une définition.
- Une discussion dans la Wikidémie est proposée sur les lexiques spécialisés de la foresterie et de la sylviculture, afin de mieux en cerner les différences. Si vous avez des expertises en ces domaines, n’hésitez pas à venir aider, car pour l’instant on n’est pas sorti du bois.
- Une discussion a également cours sur les catégories créées pour les toponymes dans de nombreuses langues. Parfois débutées avec seulement un faible nombre de lieux, elles permettent d’organiser un futur contenu à documenter.
Statistiques
- Du 20 juin au 20 juillet 2022
+ 26 741 entrées et 109 langues modifiées pour atteindre 4 642 859 entrées et 1 303 langues avec au moins cinq entrées.
+ 1 977 entrées en français pour atteindre 401 703 lemmes et 620 858 définitions.
Les cinq langues qui ont le plus avancé, outre le français, sont le portugais (+ 8 963 entrées), l’allemand (+ 5 231 entrées), l’ukrainien (+ 4 045 entrées), le same du Nord (+ 3 975 entrées) et l’occitan (+ 384 entrées).
Une nouvelle langue : le yemba (4 nouvelles entrées).
+ 4 334 citations ou exemples en français pour atteindre 529 189.
+ 337 médias d’illustrations (images et vidéos) dans les pages principales du Wiktionnaire, pour atteindre 61 620.
- Du 30 juin au 31 juillet 2022
+ 4 773 sections de langue contenant au moins une prononciation audio (dont 20 pour le français) pour atteindre 366 541 sections de langue contenant au moins une prononciation audio pour 142 langues (dont 136 146 pour le français).
+ 1 nouveau thésaurus ce mois-ci, pour un total de 1 109 thésaurus dans 69 langues dont 811 thésaurus en langue française. Le nouveau thésaurus est autour de Mithra, créé par Don-vip.
Wikiscan et Wikistats donnent chaque mois accès à beaucoup de mesures, dont la liste des pages les plus consultées et des pages modifiées par le plus de personnes.
Deux nouveaux contenus de bonne qualité : caméléon, marron
+ 9 mots créés sur les 36 proposés dans les Mots du jour ! Merci à Bpierreb, Destraak, Muertomega et Pamputt.
Brèves d’ailleurs
- Le quotidien français Le Monde consacre une série d’articles à la pierre de Rosette. L’un d’entre eux est consacré au déchiffrement des langues disparues. Le spécialiste du méroïtique Claude Rilly, professeur à l’École pratique des hautes études et directeur de recherche au CNRS, y évoque l’approche philologique, utilisant grammaire et sémantique pour découvrir le sens des mots. Mais aussi l’approche comparative, qui va chercher des idiomes apparentés à la langue à traduire : ainsi le méroïtique serait apparenté avec plusieurs langues parlées dans l’actuel Soudan, au Tchad et en Érythrée. Parmi les langues qui restent à déchiffrer, le gaulois et l’étrusque !
- Le dictionnaire québécois Usito change de logo, pour intégrer de manière plus visible le sigle de l’université qui porte le projet.
- C’est un grand événement : le Centre National de la Recherche Scientifique (CNRS), organisme public français, lance, via son projet BigScience, un grand modèle de langue entraîné de manière ouverte et transparente. Bloom, son traducteur automatique, est déjà en ligne !
- Le Haut Conseil de la langue arabe annonce la publication d’un dictionnaire national de la terminologie de la pêche et de l’aquaculture. Cette ressource spécialisée, pour l’arabe, annonce plus de 3 000 entrées.
- Les mises à jour des ordinateurs, téléphones et autres machines connectées concernent également les émojis disponibles, avec des mises à jour annuelles pour inclure de nouvelles possibilités. La prochaine mise à jour, qui devrait être largement diffusée à partir de la fin de 2022, a été annoncée par Emojipedia, le site de référence pour les émojis. Cette liste devrait être intégrée à Unicode 15.0. Une liste des demandes acceptées et refusées pour future intégration dans Unicode est maintenue, ainsi qu’une procédure pour proposer de nouveaux émojis à intégrer dans Unicode.
- Bérangère Lepetit propose un article dans Le Progrès, d’accès payant, sur l’expression ça passe crème.
- La France et l’Espagne ne sont pas les seuls pays à disposer d’une Académie de la langue. Tal Schneider présente l’activité de l’Académie de langue hébraïque dans The Times of Israël.
- Le Dictionnaire électronique des synonymes, outil porté par l’université de Caen-Normandie, propose une lettre d’information dont le numéro 17 vient de paraître. Un paragraphe évoque la difficulté à intégrer les noms au masculin et au féminin. Une nouvelle interface de consultation plus moderne est également proposée en version beta.
- Jean-Benoît Nadeau propose à l’Actualité un article critique contre l’Académie française et ses méthodes de travail. Rappelons à ce sujet l’offre de recrutement pour participer à la rédaction du Dictionnaire, publiée il y a quelques années, qui précisait qu’aucune compétence en linguistique ni en lexicographie n’était requise.
- William Audureau décrit pour Le Monde le rapport des dictionnaires avec la créativité lexicale marginale en présentant les argots des banlieues et les quelques ressources qui les décrivent, dont le Wiktionnaire.
À voir ou écouter
Quelques émissions audio ou vidéo sur la lexicographie, la linguistique et la langue française sorties ou découvertes ce mois-ci.
- Draz Detailing présente dans une série de vidéos le lexique du detailing.
Les collaborations de la semaine de juillet
Ces suggestions, affichées sur la page d’accueil, ont été proposées par Noé. Merci de leurs contributions aux personnes qui ont créé ces nouvelles entrées : Ainoa Luß, Basnormand, Bpierreb, Daradaradara, Muertomega, Pamputt
Semaine 26 (27 juin au 3 juillet 2022)
Semaine 27 (4 au 10 juillet 2022)
Salut ! Intéressons-nous aux ports ! Selon leurs usages, on peut distinguer : port de pêche, port de commerce, port militaire, port à sec, port de marée, port refuge.
Semaine 28 (11 au 17 juillet 2022)
Pour recouvrir vos jambes, êtes-vous plutôt bootcut, capri, palazzo, pantalon cargo ou pantalon cigarette ? En peau de velours ou en croûte de cuir ?
Semaine 29 (18 au 24 juillet 2022)
Semaine 30 (25 au 31 juillet 2022)
Semaines suivantes
Vers une prononciation plus multimodale
En requêtant les 4 mots comment se prononce bagagiste, le moteur de recherche de Google retourne non seulement un fichier contenant le mot audio, mais aussi une représentation textuelle ba·ga·jist. Cette représentation textuelle utilise des lettres alphabétiques usuelles (ainsi que le · pour séparer les différentes syllabes). Ainsi, la description phonémique est compréhensible par tous, et non pas seulement par ceux qui maitrisent l’alphabet phonétique international.
Cette idée avait également été discutée en détails par plusieurs Wiktionnaristes (ex: discussion 2020). Il est intéressant de constater que la solution envisagée était similaire, exceptée sur deux aspects : concernant les e caducs (i.e. le son [ə]), Google les affiche systématiquement (ex : événement) ; concernant les voyelles nasales (c’est-à-dire les 4 sons [ɑ̃], [ɛ̃], [ɔ̃], [œ̃]), Google retourne le même résultat pour latin et latine tandis que le Wiktionnaire prévoyait un affichage différencié pour supprimer toute ambiguïté (ex : ici).
Une limitation d’envergure du service de Google est qu’il n'offre pas de résultat pour les noms propres, ni pour les mots peu utilisés ou très récents (ex : Ploubezre, ischio ou légiolecte), ce qui est probablement dû à l’absence du mot (ou de sa prononciation) dans leur dictionnaire partenaire (principalement les Éditions Le Robert pour les mots en français — il a été question de ce sujet dans les Actualités d’octobre 2018).
Mais cette limitation est compensée par le fait que le service existe aussi pour quelques autres langues, telles que l’anglais (ex : how to pronounce clever), depuis fin 2018, et l’espagnol (ex : como se pronuncia mesa), ce qui est pratique si vous apprenez une de ces langues. Cerise sur le gâteau, pour l’anglais et l’espagnol, Google tire parti de la multimodalité du Web en ajoutant aussi une animation visuelle du mouvement des lèvres, pour une encore meilleure description de la prononciation.Cryptolecte
Dans l’étude des formes de parler, plusieurs mots en -lecte peuvent être rencontrés, qui correspondent à des manières de caractériser des usages : idiolecte, sociolecte, technolecte, géolecte, dialecte, cryptolecte
Le premier mot, idiolecte, correspond au lexique d’une personne, à l’ensemble des termes et structures de paroles qu’elle pourra mobiliser pour communiquer. Fluctuant au cours de la vie, l’idiolecte est bien difficile à étudier, car des termes peuvent être connus mais peu utilisés, ou même compris mais jamais repris.
Ce vocabulaire varie ensuite selon les moments d’échange, le cadre de communication, les personnes impliquées. On parlera de sociolecte pour les usages propres à un groupe, qui peut être une bande d’amis, une famille ou tout autre collectif. C’est ce qu’on appelle aussi les argots. S’il se trouve lié à une activité professionnelle, il s’agira d’un technolecte, s’il se trouve lié à un espace géographique spécifique, on parlera de géolecte. Dans un dictionnaire, l’indication du trait technolectal d’un usage (aussi appelé jargon ou vocabulaire de spécialité) se fait par la mention d’un domaine sémantique, tandis que les marques géolectales sont celles des régionalismes, ou aires d’usage. Tout cela apparaît dans les indications en début de définition.
Lorsqu’une partie d’une communauté langagière partage de nombreux traits de langue, tant au niveau du lexique que de la prononciation, prosodie et grammaire, il pourra être considéré que cela forme un dialecte spécifique. Un état de la langue qui n’est pas pleinement intercompréhensible avec les autres usages. Le terme de dialecte ne désigne pas des langues sans documentation ou sans reconnaissance, mais une forme d’une langue, précisée par une analyse. Bien souvent, les études linguistiques décrivent un continuum dialectal, une progression dans les changements qui font que d’un extrême à l’autre, il n’y a pas intercompréhension, mais que de villages à villages, il y a une forme de continuité qui permet la compréhension. Cette analyse dialectale est difficile à indiquer dans un dictionnaire, car elle peut être controversée. Par exemple, on admet sans mal que la langue portugaise dispose de dialectes, a minima entre le portugais du Portugal et le portugais du Brésil, ou que la langue occitane ait des dialectes, mais c’est bien moins admis pour la langue française.
Enfin, le concept de cryptolecte est celui qui me semble le plus délicat pour le travail lexicographique. Un cryptolecte est un usage qui est partagé au sein d’un groupe afin de ne pas être compris des personnes extérieures au groupe. C’est une partie de l’argot qui n’est pas expliquée aux béotiens, qui permet de s’en moquer ou de lui cacher des informations. Un des plus connus est peut-être le louchébem, langue des bouchers parisiens, qui disposaient d’un technolecte propre à leur activité, ainsi que de termes permettant d’escroquer les clients en s’indiquant d’en mettre plus ou moins, selon la tête du client. Certains usages des jeunes fonctionnent également selon ce principe, pour n’être point compris des adultes. Dans un dictionnaire, faut-il décrire ces termes, lorsqu’ils ont pu être saisis au vol ? Dévoiler ce qui devait rester caché ? Leur présence pourraient se révéler une trahison du ou de la lexicographe, qui gâche ainsi leur emploi secret. Est-ce ainsi forcer une évolution plus rapide de la langue, qui cherchera à se renouveler pour demeurer efficace ?
Faut-il documenter ces termes ou sont-ils privés ? C’est un questionnement éthique qui me semble intéressant à avoir à chaque rencontre, plutôt que de manière générale, car les limites à la diffusion des termes ne sont jamais les mêmes. Par exemple, un terme du parler des jeunes qui apparaîtrait dans un morceau de rap à large diffusion perdrait de son mystère sans que ce soit du fait des lexicographes. S’intéressant aux traces, ils et elles peuvent ainsi documenter bien des usages, sans s’immiscer dans les usages locaux et confidentiels.
Courrier du lectorat
La chronique sur les lectes m'a beaucoup intéressé, pour deux raisons. J'ignorais les cryptolectes en tant que phénomène répandu. J'ai beaucoup de difficultés à croire que la langue française ne comporte aucun dialecte, alors que la francophonie n'est pas limitée à un seul territoire. Cantons-de-l'Est (discussion) 1 août 2022 à 23:25 (UTC)
- Merci pour ce retour ! J’ai pris cet exemple à dessein, c’est curieux pour le français de ne pas considérer de dialectes. Mais un dialecte n’est pas juste un géolecte, la dimension géographique n’est pas la seule à considérer. Dans certaines analyses, le nouchi ou le camfranglais sont considérés comme des dialectes, mais ce n’est pas indiqué comme ça sur Wikipédia par exemple Noé 2 août 2022 à 16:34 (UTC)
Anciens numéros
- 2015 : avril, mai, juin, juillet, août, septembre, octobre, novembre, décembre
- 2016 : janvier, février, mars, avril, mai, juin, juillet, août, septembre, octobre, novembre, décembre
- 2017 : janvier, février, mars, avril, mai, juin, juillet, août, septembre, octobre, novembre, décembre
- 2018 : janvier, février, mars, avril, mai, juin, juillet, août, septembre, octobre, novembre, décembre
- 2019 : janvier, février, mars, avril, mai, juin, juillet, août, septembre, octobre, novembre, décembre
- 2020 : janvier, février, mars, avril, mai, juin, juillet, août, septembre, octobre, novembre, décembre
- 2021 : janvier, février, mars, avril, mai, juin, juillet, août, septembre, octobre, novembre, décembre
- 2022 : janvier, février, mars, avril, mai, juin, juillet, août, septembre, octobre, novembre, décembre
- 2023 : janvier, février, mars, avril, mai, juin, juillet, août, septembre, octobre, novembre, décembre
- 2024 : janvier, février, mars, avril, mai, juin, juillet, août, septembre, octobre, novembre, brouillon du prochain numéro