Utilisateur:Psychoslave/propositions

Cette page sert de lieu de tampon à des idées qui peut-être un jour pourrait faire l’objet d’une discussion au sein du Wiktionnaire. Elle permet garder des idées de côté lorsqu’elles sont relatives au Wiktionnaire, d’en développer les propos, d’en améliorer la forme etc.

Il s’agit d’une page personnelle, les sections ci-dessous ne sont en aucun cas des lieux propices pour engager aux discussions. En clair, merci de ne pas répondre ci-dessous comme si cette page était un espace de discussion. Ceci étant, cette page reste pleinement ouverte à l’esprit wikimédien : n’hésitez pas à modifier le fond ou la forme des propos. Dans le doute, passer par la page de discussion est préférable à l’absence totale de contribution. Chacun est libre de recopier ces sections dans un espace plus propice aux discussions si cela est jugé pertinent.

Création automatisé d’articles à partir des attestations modifier

Il serait relativement aisé de créer de nombreuses attestations de manière automatiser, en exploitant l’immensité des ressources à disposition. Même en se limitant aux contenus déjà validé de Wikisource par exemple, il est à gager que la quantité d’exemples qui pourraient être extraient et ajoutés au Wiktionnaire serait fort conséquente.

Plusieurs sujets émergent spontanément :

  • faut-il créer des articles pour les mots ainsi repérés, quand ils n’existent pas encore en sachant que
    • la définition sémantique sera nécessairement manquante (peut-être un jour y-aura-il moyen d’utiliser des solutions IA pour générer des propositions de définitions marquées comme « à vérifier »)
    • la classe grammaticale est inférable avec un taux d’erreur acceptable si des outils suffisamment élaborés tels qu’il en existe sur le marché sont employés

Il restera toujours des difficultés conséquentes à extraire tous les termes depuis des textes bruts. Les limites de ce qui peut être extrait de manière strictement automatisée, tout au moins trivialement :

  • difficulté, somme toute encore assez basse, d’évaluer le fait qu’une majuscule initiale est constitutive de la graphie (exemple, tous les substantifs en allemand) ou « accidentel » (mot apparaissant au début d’une phrase en français)
  • le mot (ou la lexie) s’avère être une locution ou une forme quelconque de fait linguistique énoncé du manière autre qu’une suite de signes graphiques strictement délimitée par des blancs
  • de façon général, les cas où l’extraction de l’information nécessite une interprétation de la sémantique, voir de la pragmatique

Modèle d’extraction des données d’un article modifier

L’idée à développer ici vise à fournir un modèle qui permette des appels comme {{extrait|entrée=mot|langue=français|description=Nom commun|filtre=Par ellipse|exclure=attestations}}.

Utilisation d’une solution de discussion instantanée libre modifier

À développer : l’utilisation d’outils non-libre comme Discord pour une dimension aussi importante que les échanges instantanés entre utilisataires pose la difficulté du maintien de la communauté à l’aide d’outils en phase avec les valeurs qui l’anime.

Générer une ancre pour chaque définition modifier

Tout au moins celles fournissant une caractérisation en entête (linguistique, par extension, etc). Pour rendre éviter les conflits d’ancres homonymes, un paramètre num pourra être adjoint comme pour les sections avec le modèle {{S}}.

Espace de nom pour des recueils d’attestation plus exhaustifs modifier

Au sein des articles, il est actuellement convenu de ne pas mettre plus de 5 attestations par définition. Même si le Wiktionnaire n’a pas de problème de place en terme de stockage, ne pas poser de limites sur ce nombre d’attestation pourrait en effet rapidement gonfler cette partie des articles de façon contre-productive à une consultation visant la lecture du lectorat usuel. Cependant ce faisant le Wiktionnaire se prive de s’enrichir d’informations lexicographiquement pertinentes, et potentiellement utiles pour des cas plus spécifiques.

Pour permettre cette enrichissement sans nuire à la qualité éditoriale des pages de l’espace principale, il peut être envisagé de créer un espace de nom Attestation. Une autre approche possible serait de créer un espace de nom Recueil de citations, de manière à ne pas forcément employer une citation comme source d’attestation d’un unique terme, ou d’éviter les doublons de citation pour des termes distincts. L’acceptation de cette espace de nom et de la modalité à éventuellement retenir serait un premier point à débattre.

Dans un second temps, il pourra être débattu des modalités d’implémentation de cette espace de nom.

Il pourra aussi être discuté des éventuels liens faits avec l’espace principale. Par exemple au-delà de cinq attestations, la liste pourrait avoir une invitation D’avantage d’attestations pertinentes pour cette définition ont été collectés, elles sont consultables sur une page dédiée. Ou les pages concernés pourraient être listé dans la section Voir aussi, ou une nouvelle section Attestations