Discussion Wiktionnaire:Actualités/Bilan/2015

Dernier commentaire : il y a 8 ans par Lmaltier dans le sujet Travail inédit

Conjugaisons modifier

pourquoi ne pas faire de même ici ? Parce que les pages sont déjà assez lentes à charger, et que chez nous on peut lancer des recherches cantonnées aux annexes de conjugaison. JackPotte ($) 30 juillet 2015 à 13:40 (UTC)Répondre

J’enlève la remarque de la page ? --— Lyokoï (Parlons  ) 30 juillet 2015 à 14:39 (UTC)Répondre

Points forts modifier

Dans les points forts, je trouve que la bonne ambiance (en général) qui règne ici n’est pas assez mise en valeur : je trouve que sur le Wiktionnaire, le climat est généralement serein. Bien sûr, il y a quelques prises de bec et quelques coups de gueule de temps à autres, mais c’est rare et la plupart du temps, quand un contributeur attaque une contribution, l’auteur de cette dernière ne le prend pas personnellement et accepte la critique ou y répond sur le fond. Dans beaucoup d’autres endroits (sur Internet ou ailleurs), on rêverait d’avoir aussi rarement des problèmes d’ego. — Eiku en exil 6 septembre 2015 à 20:44 (UTC)Répondre

Redondance modifier

La redondance d'information lors de variantes orthographique pose problème : en quoi ? Le fait que colour n’ait pas le même avancement que color est normal, de même que colour n’a pas le même avancement que n’importe quelle autre page du projet. Il est normal que le contenu soit différent entre les deux pages, même si certains des renseignements peuvent être communs. Je suis persuadé qu’au contraire, l’indépendance des pages est un gros point fort du projet (par rapport à Wikipédia par exemple) : il suffit de garantir que chaque page individuelle ne soit pas dégradée pour garantir que le projet dans son ensemble ne pourra que progresser. Lmaltier (discussion) 7 septembre 2015 à 20:26 (UTC)Répondre

Selon moi, ce n’est pas la redondance en soi qui pose problème, c’est la duplication de certains efforts associée à cette redondance (on en a déjà souvent parlé : ce serait bien que lorsqu’on fait des changements sur une page, on puisse les répercuter sur une autre page lorsque c’est pertinent). Cela dit, je suis d’accord avec toi : l’indépendance des pages est aussi vrai un point fort car elle permet d’augmenter la pertinence des informations de chaque page.
Parmi les choses que je n’aime pas sur le Wiktionnaire (ou sur tout dictionnaire) figurent au contraire les définitions-renvois (par exemple, nettoyage défini comme action de nettoyer, génial si on ne sait pas ce que veut dire nettoyer), une pratique souvent justifiée par la lutte contre la redondance. Selon moi, cette redondance-là est au contraire une grande force (et c’est l’une des choses que j’apprécie beaucoup chez notre concurrent le Robert) : le lecteur est renseigné sur la page qu’il est venu consulter, et non après avoir lu trois ou quatre autres pages (ou, pire, jamais car parfois, les imprécisions des renvois successifs finissent par faire que la page que l’on consulte n’a plus rien à voir avec le sens du mot que l’on était venu chercher). Dans son état actuel, je pense que le Wiktionnaire est seulement à mi-chemin : ça pourrait être cité comme une des faiblesses. — Eiku en exil 7 septembre 2015 à 21:01 (UTC)Répondre
Attention, vous avez le droit de reformuler hein ! J’essaie de faire le bilan des discussions importantes qui sont faites sur le projet. On a longuement parlé et proposé quelque chose sur cette redondance, alors pour moi il était important que ce soit mentionné. Mais n’hésitez pas à clarifier, il n’y a pas de limite de taille sur la page du bilan. --— Lyokoï (Parlons  ) 8 septembre 2015 à 09:10 (UTC)Répondre
Pour revenir dans le débat sur la redondance, OmegaWiki est un projet qui cherche à éliminer la redondance. Je trouve le système d’OmegaWiki très intelligent, mais sa sophistication le rend inutilisable par la grande majorité des gens : c’est devenu un projet élitiste par nature. Je préfère pour ça le Wiktionnaire et ses défauts (manque de microstructure, duplication des efforts). Comme les deux projets sont libres et utilisent (pour autant que je me souvienne) la même licence, on peut de toute façon faire passer des contenus de l’un à l’autre : ils ne se font pas vraiment concurrence (sauf éventuellement sur le temps-contributeur). Ce serait dommage de transformer le Wiktionnaire en OmegaWiki puisqu’OmegaWiki existe déjà. — Eiku en exil 8 septembre 2015 à 21:22 (UTC)Répondre
Non seulement Omegawiki est incompréhensible pour les utilisateurs, mais il est aussi incompréhensible pour les contributeurs. Il en a très peu : nous sommes le 10 septembre 18:56, et je viens d’aller voir les dernières contributions OmegaWiki :
  • le 10 : 0 contribution
  • le 9 : 1 contribution
  • le 8 : 0 contribution
  • le 7 : 0 contribution
  • le 6 : 0 contribution
  • le 5 : 0 contribution
  • le 4 : 2 contributions
Sur les 30 derniers jours, il y a 44 opérations seulement (contributions et autres), un peu plus d’une par jour en moyenne.
Il y a d’autres problèmes fondamentaux :
  • l’idée était de créer un wiki unique pour les contributeurs du monde entier, quelle que soit leur langue, et ça ne pourra jamais fonctionner. Quand chacun emploie sa langue, on ne peut pas discuter. Il y a donc aussi un caractère élitiste de ce point de vue : en pratique, seuls les anglophones peuvent participer. Sur leur Meta:International Beer Parlour (leur Wikidémie), il y a quelques messages, mais tous en anglais.
  • les utilisateurs IP ne peuvent pas corriger ou modifier, seulement ajouter.
  • on ne peut pas créer de compte soi-même, il faut en faire la demande. Et qui plus est, il y a un genre de captcha dans le formulaire de demande : il m’a été demandé de saisir combien font 29+1. Quand on veut des bonnes volontés, on ne leur accumule pas des bâtons dans les roues comme ça, ce n’est pas un signe d’intelligence.
Devant cet échec patent, ses promoteurs ont tenté de proposer un genre de fusion des wiktionnaires pour un faire un projet dans le même esprit qu’Omegawiki, en le gérant dans le cadre de la Fondation. J’espère bien que cette idée ne sera jamais adoptée, car les mêmes causes produisent les mêmes effets, et ce serait la mort des projets qui s’y prêteraient. Lmaltier (discussion) 10 septembre 2015 à 17:17 (UTC)Répondre

Commentaires modifier

Selon la tendance lourde que j'observe dans le Web, le Wiktionnaire manque d'illustrations. Difficile pour des concepts ou des verbes, mais plus facile pour des noms d'objets ou d'êtres vivants.

Je lis « La lente montée en qualité ». J'ai lu les trois critères de qualité. Y a-t-il un autre endroit où ces critères sont mentionnés, sauf dans la page de la Catégorie:Articles de qualité ?

Le Wiktionnaire est dans une situation inconfortable si je puis dire : il maintient un immense corpus d'information, mais il n'y a aucune façon humainement raisonnable de valider complètement son contenu. Pour lui donner une plus grande légitimité, il faut recourir à des études statistiques. Sa situation n'est pas unique, mais s'il veut se démarquer, il faut engager des efforts conséquents pour valider son contenu.

Lorsque je compare au dico du CNRTL, je sais que le Wiktionnaire a moins bonne réputation tout simplement parce que sa rédaction n'est pas supervisée par des professionnels et que cet ouvrage profite d'une « profondeur » historique conséquente. S'il veut se démarquer, le Wiktionnaire doit offrir ce que d'autres n'offrent pas : un moteur de recherche survitaminé, des tonnes d'hyperliens, une grammaire organisée et facile à consulter, des antonymes/paronymes/synonymes. Les tableaux de conjugaison sont un plus, mais le conjugueur du Figaro est tout aussi agréable à utliser.

Un service que pourrait mettre en place la communauté (je rêve) : un correcteur grammatical. Mais encore une fois, un site Web l'offre déjà gratuitement : Google. Par exemple, essayez J'ai rêvé à tout ces moutons. Puisque je rêve, je ne peux m'empêcher de penser au logiciel Antidote qui représente (selon moi) le summum du produit grammatical : correcteur grammatical, conseils de rédaction, dicos, etc. Il se vend une centaine de dollars canadiens, mais si un produit semblable était gratuit, les internautes se presseraient aux portes du site Web qui offrirait gratuitement un produit semblable.

Cantons-de-l'Est (discussion) 8 septembre 2015 à 20:06 (UTC)Répondre

Je suis globalement d’accord avec tout ce que tu dis. Par contre, il me paraît illusoire de penser qu’un projet libre puisse atteindre le niveau d’Antidote, à moins justement qu’une très importante communauté de programmeurs et de linguistes s’y investisse à 100% (ce qui ne me paraît pas probable). Autre possibilité : que Druide informatique libère Antidote, mais pour ça, il faudrait qu’elle y trouve un intérêt, donc il faudrait trouver un modèle économique plus rentable que son modèle actuel. Selon moi, à moins qu’elle soit au bord de la faillite (comme NaN avec Blender), c’est un peu la quadrature du cercle.
Concernant la réputation du Wiktionnaire, je ne suis pas inquiet : pour moi, l’objectif principal doit être de rendre service aux personnes qui ont des problèmes ou des questions de langue. S’il rend beaucoup service, sa réputation devrait naturellement s’améliorer. En tout cas, même si ça fait énormément plaisir de voir des linguistes s’intéresser à notre travail, cette reconnaissance-là n’est pas indispensable à ma motivation.
Sur la question connexe de la validation du contenu, j’ai toujours peur qu’en voulant produire des contenus plus fiables, on se mette à appliquer la règle « pas de travail inédit » sur le Wiktionnaire. Comme nous en avons déjà discuté en Wikidémie, une grande partie de la richesse du Wiktionnaire vient du travail inédit. Note : la règle est déjà appliquée aux étymologies (qui doivent donc être sourcées) et c’est une très bonne chose, mais si on se mettait à le faire pour les définitions, plus personne ne contribuerait. Je suis par contre favorables à des mécanismes de validation de la qualité des articles (un peu comme la patrouille), seulement, comment désigne-t-on les personnes qui valident ? Si c’est uniquement par élection / cooptation ou par un système purement comptable (compteur de modifs), autant garder le statu quo qui fonctionne bien la majeure partie du temps. Si par contre on décide de faire appel à des professionnels bénévoles (il y en a quelques-uns parmi les contributeurs), et donc de donner à leurs avis (sur les contenus) une priorité sur celui des autres contributeurs, c’est plus crédible, mais là encore, je me demande si les débats que ça provoquerait et les inconvénients que ça pourrait poser en vaudraient la peine. — Eiku en exil 8 septembre 2015 à 21:09 (UTC)Répondre
Sur la validation du contenu, j’avais proposé une prise de décision sur le thème, mais elle n’a pas été mise en application. Si ça t’intéresse, tu peux jeter un œil à mes réflexions sur l’évaluation qualitative.
Sur le correcteur grammatical, je suis au regret de venir limiter tes ardeurs. Un dictionnaire ne permet pas de parler une langue étrangère, car il n’intègre pas les règles qui modifient les mots (les flexions et désinences verbales) et n’indique rien sur la syntaxe (l’ordre des mots). Les règles forment la grammaire d’une langue, qui n’apparaissent pas dans un dictionnaire et sont rarement consensuelles entre les chercheurs qui s’intéressent au sujet, selon leurs méthodes d’analyse. Pour l’ordre des mots, il faudrait étiqueter chaque mot et créer des unités supérieures (chunk) pour indiquer les relations entre les mots, ce qui serait un tout autre travail d’ampleur. Je ne vois pas très bien comment cela pourrait s’intégrer dans le projet du Wiktionnaire. Pour explorer en profondeur le sujet, je ne peux qu’indiquer une thèse sur le sujet qui a été soutenue fin 2014 par Agnès Souque, à Grenoble, mais elle n’est pas encore disponible en ligne. J’avais suivis un cours avec elle, quand elle travaillait principalement sur le correcteur grammatical d’OpenOffice, et c’était pas trivial et les résultats étaient loin d’être excellents, malgré un étiquetage précis. Cela dit, il y a surement eut de l’amélioration depuis. Pour finir sur une note un peu plus positif : son travail est peut-être disponible quelque part sous une forme ouverte qui permette son intégration au Wiktionnaire. Mais je ne vois pas du tout comment ces données pourraient être intégrées. Si plusieurs personnes se montrent intéressées, nous pourrions poursuivre la discussion sur ce sujet.
Pour les images, je suis bien d’accord avec toi, même si ça ne me semble pas prioritaire, c’est un gros avantage du projet   Eölen 9 septembre 2015 à 02:49 (UTC)Répondre
Je viens de recevoir une infolettre sur Usito, un dico made in Québec dont la consultation est payante, même si sa rédaction est assurée grâce à des subventions du gouvernement du Québec. L'infolettre de septembre 2015 renvoie à quelques mots ajoutés : anéchoïque, anesthésiologiste, caloporteur, conventum, graines germées, notairesse, quadriporteur et tomber dans l’œil de quelqu’un. Il n'y a rien de remarquable, sauf la présentation léchée. Le Wiktionnaire, gratuit, a de beaux jours devant lui. Dans un autre ordre d'idées, j'ai indiqué l'existence du Wiktionnaire à des collègues qui enseignent le français. Au moins deux sur cinq ne le connaissaient pas et pourtant, nous consultons tous le Web, à tous les jours. Cantons-de-l'Est (discussion) 10 septembre 2015 à 15:29 (UTC)Répondre

Travail inédit modifier

Pour ce qui est du travail inédit, je pense que la règle s’applique totalement ici, et est la même dans son principe que celle de Wikipédia. Pour moi, l’idée de base sur Wikipédia est d’interdire deux choses : 1. les affirmations invérifiables (et non évidentes) : elles doivent toujours être appuyées par des références. 2. les sujets qui n’existaient pas avant (par exemple, un théorème mathématique qu’on vient de trouver et de démontrer). Il est bien évident que le travail de rédaction n’est pas interdit : au contraire, pour respecter les règles du droit d’auteur, il est le plus souvent obligatoire. Ici, c’est la même chose, les références étant : 1. les ouvrages de références, articles, etc. sur les mots 2. tous les textes de façon générale, grâce à leur emploi des mots. Les sujets qui n’existent pas sont ici les mots qui n’existent pas et que le contributeur vient de créer, puisque nos sujets sont les mots. La seule différence pourrait être les sources secondaires obligatoires, en ce sens que tous les textes sont exploitables, pas seulement les dictionnaires. Mais sur Wikipédia aussi, on a le droit d’utiliser autre chose que les encyclopédies comme références. Qu’est-ce qu'une source primaire et une source secondaire pour nous ? On pourrait très bien dire que le premier emploi du mot est une source primaire et que tous les autres emplois (par d’autres que le créateur) sont les sources secondaires. Lmaltier (discussion) 10 septembre 2015 à 16:51 (UTC)Répondre

Non, c'est la même erreur que sur Wikipédia, on est en train de confondre vérifiabilité (qui est un impératif) et référence documentaire (qui n'est qu'un plus). Et on finit par protéger religieusement des erreurs, parce qu'elles sont documentées, et que le raisonnement montrant leur incohérence serait du travail inédit. Je recopie régulièrement des étymologies de caractères chinois d'après Wieger, qui est l'unique référence systématique dans ce domaine, mais quand ces étymologie sont incohérentes par rapport aux caractères oraculaires (qui n'avaient pas été découverts à son époque) je n'hésite pas à le signaler, je ne m'imagine pas laisser le lecteur devant une erreur manifeste (cf , , , 𩰪...). Le caractère oraculaire est évidemment documenté, mais personne ne prend la peine de corriger une source datant d'un siècle, donc il n'y aura jamais de référence permettant une mise à jour systématique de Wieger...
Typiquement, ce n'est pas gênant en soi qu'un collaborateur introduise une série sur le vocabulaire du patois berrichon, à partir du moment où c'est vérifiable (par sondage, recoupement partiel, cohérence avec des patois voisins, enquête sur place,...).
Et même si tout n'est pas vérifiable ainsi, à partir du moment où cette source (mamie berrichonne internaute?) donne régulièrement du contenu cohérent, non polémique et (au moins en partie) vérifiable, l'intervenant doit même être acceptée comme une source linguistique à part entière - avec son droit à l'erreur : il vaut mieux dans ce cas conserver l'information quitte à l'affiner dans les cas où on dispose d'autres sources permettant de traiter l'erreur, plutôt que de supprimer des apports qui peuvent parfois être des témoignages précieux parce que justement « inédits » dans le sens où ils n'ont jamais été documentés, sur la base de critères purement formels et procéduraux.
Les sources sur les vocabulaires marginaux peuvent être datées, et une langue évolue de manière vivante : exiger des sources rigidement interdirait de capturer ces évolutions.
J'imagine qu'un plaisantin voulant documenter une langue imaginaire (le bas-urupailly) serait par ailleurs rapidement détecté, c'est une autre question.
Micheletb (discussion) 13 septembre 2015 à 05:59 (UTC)Répondre
Non à quoi ? Je suis bien d’accord qu'il ne faut pas protéger religieusement des erreurs sous prétexte qu’elles sont documentées, et qu’il serait idiot de refuser le raisonnement montrant leur incohérence sous prétexte que ce serait du travail inédit : c’est de la même nature que le travail de rédaction, qui oblige aussi à réfléchir. Par ailleurs je considère que, pour le Wiktionnaire, tous les textes, écrits ou oraux, sont des références car ils emploient les mots. Lmaltier (discussion) 13 septembre 2015 à 10:53 (UTC)Répondre
Retour à la page du projet « Actualités/Bilan/2015 ».