Wiktionnaire:Entraide/février 2023


Page mensuelle des appels à l’aide en février 2023. Page précédente : janvier 2023Page suivante : mars 2023Modifier ce cadre




dictionnaire de rimes modifier

Bonjour ! Je voudrais développer un dictionnaire de rimes françaises sur Word, en VBA, pour pouvoir l’appeler directement depuis le texte en cours. Mais il me faut au préalable trouver une base de données des mots. Y a-t-il un moyen pour utiliser celle du Wiktionnaire ? Soit en y accédant en ligne, soit en la téléchargeant ? Merci d’avance. Cordialement, Pjouv

  @Pjouv : Il est possible d’exploiter les données du Wiktionnaire en téléchargeant un dump : voir https://dumps.wikimedia.org/ (vous pouvez télécharger régulièrement pour mettre à jour les données : il y a un nouveau dump au minimum tous les mois). Mais il faut mentionner clairement que les données utilisées viennent d’ici (comment ? il faut voir : tout dépend de l’outil développé). Pour plus de détails sur les licences, voir CreativeCommons : https://creativecommons.org/licenses/by-sa/3.0/deed.fr et GFDL : https://www.gnu.org/licenses/fdl-1.3.html
Il faut aussi noter que tous les mots n’ont pas de prononciation indiquée, il y en a qui manquent. Mais il suffit de les rajouter si on le remarque (et si on connaît la prononciation). Lmaltier (discussion) 24 février 2023 à 16:58 (UTC)[répondre]
Merci infiniment pour votre réponse rapide.
J’ai cependant un peu l’impression d’avoir ouvert la boîte de pandore, et de ne pas m’y retrouver !… Puis-je vous demander votre aide encore une fois ?
En fait, je ne cherche pas une copie de la base de données complète avec les définitions, les exemples, etc., mais seulement des entrées, les mots avec – idéalement – leurs inflexions (masculin et féminin, singulier et pluriel…).
Si le fichier est en texte seul, XML, ou SQL, je devrais pouvoir m’y retrouver.
Pouvez-vous me dire quelle est l’option que je dois choisir et m’en donner le lien ?
Merci encore. Pjouv (discussion) 24 février 2023 à 18:00 (UTC)[répondre]
  @Pjouv : J’ai donné ci-dessus le lien permettant de récupérer le dump en XML : https://dumps.wikimedia.org/. Il y aura tout, y compris les définitions, etc. mais il suffit d’en extraire ce dont on a besoin (essentiellement mots, en se limitant aux mots français + leur prononciation, je suppose). Tous les mots n’ont pas une prononciation indiquée, ça se complétera petit à petit… La plupart des flexions sont présentes, avec leur propre page, mais il peut bien sûr en manquer, nous ne serons jamais complet… Lmaltier (discussion) 25 février 2023 à 07:51 (UTC)[répondre]
Un grand merci pour votre aide et votre disponibilité ! Pjouv (discussion) 26 février 2023 à 08:45 (UTC)[répondre]