Wiktionnaire:Bots/Requêtes
Page annuelle des requêtes aux robots de Page précédente : 2024 — Page suivante : 2026 — Modifier ce cadre
Cette page a pour but de lister les requêtes adressées aux bots : merci de n’y proposer que celles qui sont certaines de faire l’unanimité, autrement il est préférable de demander un consensus sur la Wikidémie, puis d’y déposer {{botreq}} une fois la décision prise.
Pour les importations et exportations de masse, voir Wiktionnaire:Transferts.
À l’attention des personnes traitant les requêtes : il est fortement conseillé d’activer le gadget « Gestionnaire des requêtes aux bots » dans vos préférences (section « Pour les développeur·euses »). Il permet de modifier le statut d’une requête avec un simple bouton, sans devoir modifier soi-même le code de la page.
![]() Si votre message n’apparaît pas, |
Archives |
État des requêtes |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
Voir aussi :
- Wikipédia:Bot/Requêtes sur l’encyclopédie Wikipédia
- Wikilivres:Requêtes aux bots dans la bibliothèque Wikilivres
- Wikiversité:Requêtes aux bots sur Wikiversité
- Wikinews:Bot/Requêtes sur Wikinews
- Wikisource:Livres disponibles en mode page/Autres dans la bibliothèque Wikisource
- Commons:Bots/Work requests sur Commons
Remplacement de l’API non standard \ʣ, ʤ, ʥ, ʦ, ʧ, ʨ\
modifier
Les symboles API \ʣ, ʤ, ʥ, ʦ, ʧ, ʨ\ ont été retiré de l’alphabet phonétique international en 1989, lors d’une décision durant la conférence de Kiel (voir w:Histoire de l'alphabet phonétique international). Les combinaisons de symboles \dz, dʒ, dʑ, ts, tʃ, tɕ\, ou les formes \d͡z, d͡ʒ, d͡ʑ, t͡s, t͡ʃ, t͡ɕ\ ou \d͜z, d͜ʒ, d͜ʑ, t͜s, t͜ʃ, t͜ɕ\ s’il y a ambigüité, sont utilisées à leur place. Ceci est cohérent avec d’autres consonnes qui n’on pas de symble soudé, par exemple \kx\ (aussi transcrit \k͡x\ ou \k͜x\). De plus, il semble y avoir des erreurs, faisant la confusion entre la combinaison de symboles avec le tirant suscrit et le symbole soudé avec une brève inversée, par exemple pieniądze#Polonais \pʲjɛ̇̃ˈɲɔ̃nʣ̑ɛ\, ablaktować#Polonais \ablakˈtɔvaʨ̑\. Les pages Annexe:Prononciation/allemand, Annexe:Prononciation/bulgare Annexe:Prononciation/cantonais et Annexe:Prononciation/chinois, Annexe:Prononciation/corse, Annexe:Prononciation/espéranto, Annexe:Prononciation/grec, Annexe:Prononciation/hongrois, Annexe:Prononciation/ido, Annexe:Prononciation/italien, Annexe:Prononciation/mongol, Annexe:Prononciation/roumain, Annexe:Prononciation/russe, Annexe:Prononciation/turc utilisent le tirant suscrit, tandis que les pages Annexe:Prononciation/anglais, Annexe:Prononciation/dévanâgarî (pour le hindi), Annexe:Prononciation/japonais n’utilisent pas de tirant suscrit ou souscrit. Pour les autres langues, il n’y a pas d’Annexe:Prononciation donc c’est à choisir et pour le vietnamien, Annexe:Prononciation/vietnamien n’a pas de \tɕ\ ou \t͡ɕ\ donc ce n’est pas clair comment corriger les quelques cas avec \ʨ\. Bien que la forme sans tirant soit à préférer quand il n’y a pas d’ambigüité, c’est peut être plus cohérent de toujours mettre le tirant suscrit. --Moyogo (discuter) 21 septembre 2020 à 19:29 (UTC)
- Je pourrai m'y pencher ce soir. À noter que pour l'espéranto, le tirant suscrit est nécessaire. Lepticed7 (À l’immortalité !) 22 septembre 2020 à 07:47 (UTC)
@Moyogo : Est-il possible que tu fasses un liste des transformations pour chaque langue ? Merci. Lepticed7 (À l’immortalité !) 13 novembre 2020 à 10:06 (UTC)
@Lepticed7 : On devrait pouvoir utiliser les translations suivantes :
- Pour les langues avec le tirant des les annexes Prononciation (de, bg, zh, co, eo, el, hu, io, it, mn, ro, ru, tr) :
- ʣ, ʤ, ʥ, ʦ, ʧ, ʨ → d͡z, d͡ʒ, d͡ʑ, t͡s, t͡ʃ, t͡ɕ
- Pour les langues sans le tirant des les annexes Pronociation (en, hi, ja) ou sans cet annexe (vi) :
- ʣ, ʤ, ʥ, ʦ, ʧ, ʨ → dz, dʒ, dʑ, ts, tʃ, tɕ
- --Moyogo (discuter) 13 novembre 2020 à 11:24 (UTC)
@Moyogo : Salut, j’ai commencé à traiter la requête. J’ai remarqué que certaines pages n’étaient pas traitées car tu n’as rien spécifié à leur propos. Que faire quand le code de langue est yue ou fro ? Lepticed7 (À l’immortalité !) 16 décembre 2020 à 15:18 (UTC)
En cours, LeptiBot
(d · c) dressé par Lepticed7
(d) travaille. Lepticed7 (À l’immortalité !) 16 décembre 2020 à 15:18 (UTC)
@Lepticed7 : Pour le cantonais yue, l’Annexe:Prononciation/cantonais utilise t͡s, donc je pense avec le tirant suscrit. Pour l’ancien français, l’Annexe:Prononciation/ancien français utilise ts, dz, tʃ, dʒ, donc je pense sans le tirant suscrit. :-) --Moyogo (discuter) 16 décembre 2020 à 15:29 (UTC)
- Ok, je referrais la requête avec le dump du 20 décembre. Merci :) Lepticed7 (À l’immortalité !) 16 décembre 2020 à 15:33 (UTC)
Remplacement de caractères API
modifier
Suite au travail de Maëlan, il faudrait faire les remplacements suivants par bot :
- ε -> ɛ
dans
{{pron}}
- ɜ -> ɛ
dans ligne de forme et modèles d’accord
- c -> k
dans
{{pron}}
- ã -> ɑ̃
- õ -> ɔ̃
- ʀ -> ʁ
dans ligne de forme et modèles d’accord
- r -> ʁ
- ǝ -> ə
dans
{{pron}}
- é -> e
dans
{{pron}}
- ẽ -> ɛ̃
- µ -> ɥ (U+00B5, symbole micro)
dans
{{pron}}
- μ -> ɥ (U+03BC, lettre grecque mu)
dans
{{pron}}
- : -> ː
dans
{{pron}}
- ʰ -> ʔ
dans ligne de forme et modèles d’accord
Ces modifications doivent avoir lieu uniquement pour le français et que pour les prononciations indiquées dans le modèle {{pron}}
. Dans l'idéal, les modifications devraient également être faites dans les modèles de boites de flexions.
Pour le « h », je ne sais pas trop par quoi le remplacer. Il y a d'autres caractères mais commencer par ceux-ci feraient déjà un bon ménage. Pamputt [Discuter] 29 août 2023 à 09:26 (UTC)
- Bonjour ! Merci pour la proposition. Sur le détail :
- il faut aussi r -> ʁ. C’est de loin l’erreur la plus courante (2000 occurrences dans mon programme, mais à cause d’une omission de ma part mon programme ne les signalait pas).
- « ɪ » est à conserver, je suppose. C’est un son du français canadien.
- Pour « h » je ne sais pas, c’est aussi un son légitime en français, bien que rare. Il faudrait se limiter aux « h » en début de mot (suspects de devoir être convertis en (h aspiré)) et vérifier manuellement.
- pour « V, c, é, è » ce n’est peut-être pas pertinent : d’un côté un grand nombre de ces occurrences ne sont pas dues à une confusion de caractère Unicode mais à une graphie écrite à la place d’une prononciation, à corriger manuellement ; mais d’un autre côté, je crois qu’on a déjà traité la majeure partie de ces erreurs, et que ce qui reste peut effectivement être substitué automatiquement.
- pour « V » c’est inutile, il n’y avait qu’une seule occurrence.
- Maëlan (discussion) 29 août 2023 à 11:31 (UTC)
- Il y aurait aussi μ -> ɥ (où la lettre grecque mu a été utilisée à tort) ; il n’y avait que deux occurrences, que j’ai déjà corrigées, mais ça peut être utile de garder ça en mémoire à l’avenir. Maëlan (discussion) 29 août 2023 à 11:34 (UTC)
- J’ai mis la liste à jour. Pamputt [Discuter] 29 août 2023 à 11:43 (UTC)
- Argh, je viens de voir qu’il y a en fait deux points de code qui produisent le même symbole : µ (U+00B5, le symbole micro, qu’on a le malheur de trouver sur les claviers AZERTY) et μ (U+03BC, la lettre grecque). Je viens de mettre à jour la liste. Maëlan (discussion) 29 août 2023 à 15:37 (UTC)
- Salut @Maëlan et @Pamputt. Je serai quand même plus serein si la commu validait tous ces changements avant de lancer le bot. Et je veux bien l’avis de @Darmo117 sur l’API. À+, Lepticed7 (À l’immortalité !) 30 août 2023 à 11:10 (UTC)
- Salut, les substitutions proposées me paraissent sensées. Par contre, je ne suis pas si certaine du remplacement systématique de ã et ẽ, ces phonèmes pourraient être présents dans certains termes régionaux. Darmo (Viendez parler !) 30 août 2023 à 11:16 (UTC)
- J’ai ajouté : -> ː et ʰ -> ʔ. Dans les 2 cas il n’y a qu’une dizaine d’occurrences, à moins qu’on les ait déjà toutes corrigées à la main. Maëlan (discussion) 30 août 2023 à 11:23 (UTC)
- Salut, les substitutions proposées me paraissent sensées. Par contre, je ne suis pas si certaine du remplacement systématique de ã et ẽ, ces phonèmes pourraient être présents dans certains termes régionaux. Darmo (Viendez parler !) 30 août 2023 à 11:16 (UTC)
- Salut @Maëlan et @Pamputt. Je serai quand même plus serein si la commu validait tous ces changements avant de lancer le bot. Et je veux bien l’avis de @Darmo117 sur l’API. À+, Lepticed7 (À l’immortalité !) 30 août 2023 à 11:10 (UTC)
- Argh, je viens de voir qu’il y a en fait deux points de code qui produisent le même symbole : µ (U+00B5, le symbole micro, qu’on a le malheur de trouver sur les claviers AZERTY) et μ (U+03BC, la lettre grecque). Je viens de mettre à jour la liste. Maëlan (discussion) 29 août 2023 à 15:37 (UTC)
- J’ai mis la liste à jour. Pamputt [Discuter] 29 août 2023 à 11:43 (UTC)
- Il y aurait aussi μ -> ɥ (où la lettre grecque mu a été utilisée à tort) ; il n’y avait que deux occurrences, que j’ai déjà corrigées, mais ça peut être utile de garder ça en mémoire à l’avenir. Maëlan (discussion) 29 août 2023 à 11:34 (UTC)
En cours, LeptiBot
(d · c) dressé par Lepticed7
(d) travaille.. J’ai pris en charge toutes les transformations, sauf les deux soulevées par Darmo117. Si jamais il fallait le refaire, voici la regex pour la recherche dans AWB :
\{\{pron\|[^|]*[εɜcʀrǝéµμ:ʰ][^|]*\|fr}}
. Lepticed7 (À l’immortalité !) 7 septembre 2023 à 16:32 (UTC)
- Correction de mon message précédent. J’ai décidé de prendre en charge les remplacements suivants : ε, c, ǝ, é, µ, μ et :. Pour les autres, qui sont des symboles API, j’aimerai un peu plus de certitude. En effet, certains de ces symboles sont utilisés dans les étymologies. Ou dans des prononciations de français régionaux. Voici quelques exemples : son (dans un exemple), chaise (dans l’étymologie), tablier (dans la section prononciation). Si vous me confirmez que ça doit être fait, je restreindrais aux occurrences du modèle {{pron}} présentes sur la ligne de forme. Lepticed7 (À l’immortalité !) 7 septembre 2023 à 17:03 (UTC)
Terminé, LeptiBot
(d · c) dressé par Lepticed7
(d) a terminé son travail. Pour la première partie du moins. Lepticed7 (À l’immortalité !) 7 septembre 2023 à 17:03 (UTC)
- J’avais seulement vérifié l’usage de ces caractères dans
{{pron}}
et dans les modèles d’accord sur la ligne de forme. Ailleurs je ne garantis rien. En regardant, effectivement certaines occurrences sont légitimes :- ɜ : en ligne de forme, parfois mis à tort à la place de ɛ, mais parfois utilisé légitimement dans des anglicismes, où il peut être remplacé par ə (schwa) ; peu d’occurrences, je vais le faire à la main.
- ʰ : en ligne de forme, souvent mis à la place d’un h aspiré, mais l’utilisation dans la section Prononciation de tablier est correcte ; peu d’occurrences en ligne de forme, corrigées manuellement.
- ʀ : en ligne de forme, toujours mis à tort à la place de ʁ,
sauf éventuellement pour roy des rois où ça pourrait être une prononciation historique (je n’en sais rien).
- Je n’ai pas trouvé le caractère suspect dans son ? Maëlan (discussion) 7 septembre 2023 à 17:23 (UTC)
- Pour son, c’est le dernier exemple du nom 1. Lepticed7 (À l’immortalité !) 7 septembre 2023 à 17:28 (UTC)
- J’avais seulement vérifié l’usage de ces caractères dans
Nouvelle syntaxe modèle pron pour variantes
modifier
Bonjour ! À la suite de la prise de décision concernant la gestion de prononciations alternatives dans le modèle pron, qui a déjà abouti au changement de syntaxe du modèle, il faudrait désormais s'attaquer à généraliser ce changement sur les nombreuses entrées qui utilisent l'ancienne syntaxe (à base de <small>ou</small>
).
Un des problèmes est justement que cette utilisation n'est pas standardisée, il faut donc s'attendre à trouver des cas particuliers. Àncilu (d · c · b) m'a aussi fait remarquer certains cas dans lesquels il y a bien plus d'une variante utilisée, par exemple sur noon.
Merci par avance à la personne qui prendra l'initiative de réaliser ce gros travail avec son bot ! — WikiLucas (🖋️) 14 juillet 2024 à 20:54 (UTC)
- Salut @WikiLucas00. J’ai commencé le travail. Sais-tu quelles langues ont des modèles de région, qui viennent mettre le bazar ? Lepticed7 (À l’immortalité !) 2 avril 2025 à 17:47 (UTC)
- Pour évacuer, dans un premier temps, les cas très simples, je me contente de remplacer les cas qui correspondent à cette regex
{{pron\|([^}]+)\|([^|}]+)}}\s*<small>ou<\/small>\s{{pron\|([^}]+)\|\2}}$
, c’est-à-dire les cas où il y a deux modèles de prononciation sans aucune indication autour (ni référence, ni régionalisation, ni truc après). Lepticed7 (À l’immortalité !) 2 avril 2025 à 17:54 (UTC)En cours, LeptiBot
(d · c) dressé par Lepticed7
(d) travaille. 30k pages vont être traitées, sur les 36k pages identifiées. Lepticed7 (À l’immortalité !) 2 avril 2025 à 17:59 (UTC)
- 30k pages ont été traitées. Je traiterai le reste avec le nouveau dump à la fin du mois. Lepticed7 (À l’immortalité !) 4 avril 2025 à 18:17 (UTC)
- J’ai trouvé de quoi traiter 11k pages en plus, il y a des chevauchements, mais ça permettra de réduire un peu plus le volume à traiter à la fin du mois. Lepticed7 (À l’immortalité !) 4 avril 2025 à 18:41 (UTC)
- J’ai traité les nouveaux cas selon la même regex. Je me suis également rendu compte qu’il y a environ 4000 cas où le mot « ou » n’est pas encadré par les balises small. Je suis en train de les traiter. Lepticed7 (À l’immortalité !) 21 avril 2025 à 12:00 (UTC)
- J’ai traité ces cas. D’après cette requête, il reste un peu plus de 5000 cas à traiter. Lepticed7 (À l’immortalité !) 23 avril 2025 à 10:19 (UTC)
- Correction : il y en a beaucoup plus, les résultats ne sont que partiels. Avec AWB, j’ai trouvé près de 30k cas où il n’y a pas de « ou » : soit une espace, soit une virgule. Lepticed7 (À l’immortalité !) 23 avril 2025 à 10:23 (UTC)
- J’ai fait une requête simple : les pages dans lesquelles il y a une ligne qui contient deux fois le modèle pron. Il y a 288k résultats. La requête reste très brute, je ne filtre pas si ça apparait sur la ligne de forme ou ailleurs (par exemple dans l’étymologie), mais ça donne un ordre de grandeur. Lepticed7 (À l’immortalité !) 23 avril 2025 à 10:30 (UTC)
- Correction : il y en a beaucoup plus, les résultats ne sont que partiels. Avec AWB, j’ai trouvé près de 30k cas où il n’y a pas de « ou » : soit une espace, soit une virgule. Lepticed7 (À l’immortalité !) 23 avril 2025 à 10:23 (UTC)
- J’ai traité ces cas. D’après cette requête, il reste un peu plus de 5000 cas à traiter. Lepticed7 (À l’immortalité !) 23 avril 2025 à 10:19 (UTC)
- J’ai traité les nouveaux cas selon la même regex. Je me suis également rendu compte qu’il y a environ 4000 cas où le mot « ou » n’est pas encadré par les balises small. Je suis en train de les traiter. Lepticed7 (À l’immortalité !) 21 avril 2025 à 12:00 (UTC)
- J’ai trouvé de quoi traiter 11k pages en plus, il y a des chevauchements, mais ça permettra de réduire un peu plus le volume à traiter à la fin du mois. Lepticed7 (À l’immortalité !) 4 avril 2025 à 18:41 (UTC)
- 30k pages ont été traitées. Je traiterai le reste avec le nouveau dump à la fin du mois. Lepticed7 (À l’immortalité !) 4 avril 2025 à 18:17 (UTC)
- Pour évacuer, dans un premier temps, les cas très simples, je me contente de remplacer les cas qui correspondent à cette regex
Flexions en français
modifier
Bonjour, serait-il possible de corriger pour les flexions en français les choses suivantes :
- Enlever le gras
- Éventuellement corriger les italiques
- Exemples :
# Pluriel de '''[[post-natal]]'''. {{Fait}}
# ''Pluriel de'' '''[[post-natal]]'''.
# '''Pluriel de''' ''[[post-natal]]''.
# Masculin pluriel de '''[[post-natal]]'''.
# ''Masculin pluriel de'' '''[[post-natal]]'''.
# '''Masculin pluriel de''' ''[[post-natal]]''.
# Féminin singulier de '''[[post-natal]]'''.
# ''Féminin singulier de'' '''[[post-natal]]'''.
# '''Féminin singulier de''' ''[[post-natal]]''.
# Féminin pluriel de '''[[post-natal]]'''.
# ''Féminin pluriel de'' '''[[post-natal]]'''.
# '''Féminin pluriel de''' ''[[post-natal]]''.
Doivent devenir
# ''Pluriel de'' [[post-natal]].
# ''Masculin pluriel de'' [[post-natal]].
# ''Féminin singulier de'' [[post-natal]].
# ''Féminin pluriel de'' [[post-natal]].
Sayōximethey/he (discussion) 13 avril 2025 à 11:58 (UTC)
- Une requête similaire ayant traité, les dumps ne sont plus utilisables jusqu’à leur régénération. Je traiterai la requête à la fin du mois. Lepticed7 (À l’immortalité !) 13 avril 2025 à 13:07 (UTC)
- @Sayoxime J’ai traité le premier cas. Je n’ai trouvé aucun exemple pour les onze autres cas. Donc à moins que tu en ais, je clos. Lepticed7 (À l’immortalité !) 23 avril 2025 à 10:41 (UTC)