« Projet:Wiktionnariste en résidence » : différence entre les versions

Contenu supprimé Contenu ajouté
relecture et quelques précisions supplémentaires
Ligne 1 :
== 2019-2020 ==
=== Contexte ===
Le '''Dictionnaire des francophones''' est un outil en ligne conçu par [[Utilisateur:Noé|Noé]] qui permet la consultation de plusieurs ressources lexicographiques libres. Il est financé par la [http://www.culture.gouv.fr/Thematiques/Langue-francaise-et-langues-de-France/Actualites/Un-dictionnaire-numerique-et-collaboratif-pour-illustrer-et-faire-vivre-la-richesse-du-francais-dans-le-monde Délégation générale à la langue française et aux langues de France], réalisé au sein de l’[https://2if.universite-lyon.fr/dictionnaire-des-francophones--84089.kjsp Institut international pour la Francophonie], à Lyon et conçu par [[Utilisateur:Noé|Noé]]. Un conseil scientifique veille sur ce projet. Il est, présidé par Bernard Cerquiglini. [[Utilisateur:Lyokoï|Lyokoï]] en est membre.
 
Cet outil intègre les entrées de français du Wiktionnaire ainsi que d’autres ressources sous licence libre. Une version de démonstration sera consultable à l’automne, qui permettra de parcourir les entrées du Wiktionnaire et celles de l’''Inventaire des particularités lexicales du français en Afrique noire'', un ouvrage libéré dans le cadre de ce projet. La première version complète sortira autour du 20 mars 2020, avec d’autres ressources et la possibilité de contribuer. Les apports dans le Dictionnaire des francophones seront complémentaires à la rédaction du Wiktionnaire. La zone dans laquelle est utilisée une définition ajoutée est une information primordiale qui sera collectée alors qu’elle ne l’est pas dans le Wiktionnaire. L’effort principal portera sur les usages du français hors de la France, ce qui n’est pas le contenu le plus développé dans le Wiktionnaire. Les définitions seront liées entre elles (mot A sens 1 avec mot B sens 2) plutôt que les mots entre eux (mot A avec mot B comme dans le Wiktionnaire). La spécificité technique du projet est l’utilisation d’une base RDF et d’une [https://docs.google.com/presentation/d/1JpC3KveTS_5gwvjRCcreezOX8II_Lt1qGGF9FInbF30/edit?usp=sharing ontologie] qui permettentpermettront l’utilisationde d’unfaire moteurdes derequêtes rechercheélaborées, à facette pour un meilleur filtragel’instar des informationsrequêtes (pardans exempleWikidata. : biologie + Sénégal + avec au moins un hyponyme).
 
LesLe données reprisescontenu du Wiktionnaire ne sontn’est pas homogèneshomogène, ce qui est normal car il s’agit d’un projet collaboratif qui évolue depuis [https://fr.wiktionary.org/wiki/Wiktionnaire:Communiqu%C3%A9s_de_presse/15_ans?useskin=timeless plus de quinze ans] en impliquant de très nombreuses personnes rédigeant différemmentchacune à sa manière. Le nettoyage de modèles obsolète, la documentation des modèles utilisés et la rédaction de pages d’explications supplémentaires dans le Wiktionnaire pourraient être réalisés dans le cadre de ce projet, via un dispositif de ''Wiktionnariste en résidence'' (s’inscrivant dans la tradition des [[w:Wikimédien en résidence|Wikimédiens en résidence]]). L’association Wikimédia France est prête à cofinancer cette mission, à hauteur de 15 000 euros. La DGLFLF serait prête à verser la même somme.
 
=== Feuille de route ===
Ligne 12 :
 
; Dans le Wiktionnaire
* Régulariser, organiser et documenter l’usage des étiquettes de [[Projet:Informations lexicographiques|étiquettes de marques d’usage]] qui se trouvent au début des définitions. Ces étiquettes sont aujourd’hui mal documentées et utilisées de manière hasardeuse selon les contributeurs. Ce travail de rationnalisation permettra de mieux relier entre elles les définitions au sein des pages et de mieux décrire les sens. Certaines étiquettes pourront être supprimées (ex : "suite" {{M|suite}}) et d’autres mieux présentées au lectorat en les rangeant par type de marques, et rendues plus accessibles et plus compréhensibles pour les contributeurs (comme fait par exemple avec la création de {{Catégorie|Modèles de fréquence|m=1}}.
* Corriger les modèles désuets ambigus, notamment {{M|mplur}}, {{M|fplur}}, le paramètre équiv dans les modèles de genre, etc. Certaines décisions collectives prises dans le Wiktionnaire n’ont pas données lieu à des transformations, car les chantiers étaient trop importants. Une vérification humaine est presque toujours nécessaire pour s’assurer de lever l’ambiguïté convenablement.
* Clarifier l’inventaire des [[Projet:Informations lexicographiques/Domaines|domaines]] et nettoyer les alias inutiles tel que {{M|éleva}} (pour élevage), {{M|text}} (pour textile), {{M|écol}} (pour écologie), {{M|théât}} (pour théâtre), etc. Cette tâche implique la rédaction et l’organisation d’une discussion pour arriver à une décision validée par la communauté. La réalisation pourra être demandée à un dompteur de bot qui le réalisera automatiquement.
* Créer les domaines identifiés comme manquants à partir des entrées existantes ou en créant de nouvelles entrées. Ajouter par exemple les domaines suivants : électromagnétisme, pharmacie, broderie, électroacoustique, sport de cible, travail du cuir, orfèvrerie, marionnette, etc.
* Enrichir les [[Projet:Informations lexicographiques/Glossaires|glossaires]] et renforcer leur organisation en ajoutant des liens entre les glossaires et les domaines.
* Augmenter le nombre de définitions marquées géographiquement, grâce aux ressources libérées, par l’ajout de marques et par l’ajout de nouvelles définitions.
* Vérifier les définitions commençant par ''Variante de…'' ou ''Synonyme de…'', et rédiger des définitions puis mettre le contenu de la ligne dans une section dédiée aux synonymes.
* Proposer et mettre en place le modèle {{M|cas}} permettant de mieux indiquer cette information grammaticale. Cette tâche pourra être réalisée par bot.
 
; À l’Institut international pour la Francophonie
Ligne 25 :
* Enrichir Wikipédia avec les ouvrages de référence possédés par l’Institut international pour la Francophonie, ou auprès des personnalités de passage.
* Participer à la numérisation d’ouvrages au sein de Wikisource (identification de référence, pilotage d’ateliers de contribution).
* Documenter et proposer des comptes-rendus d’activité trimestriellestrimestriels pour valoriser ce statut original.
 
=== Bénéfices ===
Ligne 31 :
Ces réalisations amélioreront le Wiktionnaire, faciliteront la contribution et la réutilisation des données. S’il est indéniable que les contributeurs et contributrices de longue date se sont formés à divers aspects de la rédaction de dictionnaire (rédaction de définition, choix des exemples, alphabet phonétique international, flexions, etc.), il est tout aussi frappant de voir que les termes spécialisés de la lexicographie sont repris mais mal maîtrisés (populaire est par exemple fréquent alors qu’il est désuet dans les dictionnaires imprimés). Les documenter et en faciliter l’usage permettra aux personnes qui contribuent d’acquérir leur maîtrise et de les utiliser à bon escient, facilitant par là même leur compréhension par le lectorat.
 
Les tâches proposées visent à des contributions spécialisées en lexicographie d’une part et dans une visée francophone d’autre part. Elles visent à réduire la complexité du Wiktionnaire et à enrichir le contenu. Il n’y aura pas d’introduction de termes techniques supplémentaires ou de balises supplémentaires. Ce chantier a déjà été bienest délimité dans la page [[Projet:Informations lexicographiques]].
 
==== Pour la personne en résidence ====
Il pourrait s’agir d’une personne connaissant déjà bien le Wiktionnaire, ou alors d’une personne connaissant déjà bien la lexicographie. Selon le profil, les bénéfices ne seront pas de la même ampleur.
* Être formée en lexicographie, c’est-à-dire d’avoir une vision plus méthodique de la manière dont les réseauxmots depeuvent sensêtre sont structuréesdécrits.
* Mieux comprendre les relations entre les définitions et la manière dont le vocabulaire peut être organisé et présenté dans un dictionnaire.
* Participer à une expérience collective de création d’un outil numérique commun.
Ligne 44 :
Les corrections apportées dans le cadre de cette résidence amélioreront le contenu qui pourra être affiché au sein du ''Dictionnaire des francophones''. Actuellement, de nombreuses pages vont présenter des scories dues à des irrégularités de présentation au sein du Wiktionnaire. Faire le traitement au sein du Wiktionnaire plutôt que sur les données récupérées permettra d’alléger le temps de traitement et de suivre les mises à jour de la base de données du Wiktionnaire.
 
Le ''Dictionnaire des francophones'' tire profit gratuitement de données de grande qualité provenant du Wiktionnaire. Cette résidence est un moyen de [[donner le change]], de [[renvoyer l’ascenseur]]. C’est aussi un très bon moyen pour améliorer des données qui figureront dans le ''Dictionnaire des francophones'' plus proprement.
 
==== Pour les partenaires à ce projet ====
Investir dans ceCe projet, c’estva permettre une amélioration qualitative de la description de la langue française tout en favorisant le développement d’un contenu francophone, prenant en compte la diversité de la langue. Proposer une organisation plus claire du contenu du Wiktionnaire bénéficiera à une audience très large, de par le lectorat conséquent du Wiktionnaire lui-même mais aussi par une réemploi des données dans le ''Dictionnaire des francophones'' qui sera plus cohérent et uniforme. Harmoniser les données facilitera leur compréhension par le lectorat mais aussi leur enrichissement par les locuteurs et locutrices.
 
=== Informations pratiques ===