Dump incrémental modifier

Dump complet modifier

  • https://dumps.wikimedia.org/frwiktionary/
    • Articles, templates, media/file descriptions, and primary meta-pages.
      • Exemple : frwiktionary-20221101-pages-articles.xml.bz2 484.6 MB (compressé), 4.9 GB (décompressé).
      • Téléchargement : wget https://dumps.wikimedia.org/frwiktionary/20221101/frwiktionary-20221101-pages-articles.xml.bz2
      • Extraction : bzip2 -dk *pages-articles.xml.bz2
        • -d --decompress
        • -k --keep (conserver le fichier compressé)

Grammalecte modifier

  • Interface en ligne de commande grammalecte-cli, testé avec une distribution Linux.
  • https://grammalecte.net/index.html
  • Téléchargement section CLI & Serveur
  • python3 grammalecte-cli.py -owe -ff 20221103-def.txt
    • -owe, --only_when_errors ; Afficher seulement les résultats avec des erreurs.
    • -ff (Fichier entrant, 20221103-def.txt, UTF-8 requis) et crée un fichier de résultats (*.res.txt)
    • 20221103-def.txt ; Extraction des définitions du Wiktionnaire (dump incrémental).
  • Pour l'instant, recherche Accord de genre erroné dans *.res.txt.

Dumps complets - tests modifier

2023-11-14 modifier

Genre en double modifier

{{m}} {{m}}
 2023-11-14 ; 3 corrections
 2021-11-01 ; 1 correction
{{f}} {{f}}
 2023-11-14 ; 5 corrections
 2021-11-01 ; 1 correction

Wikilien vers flexion modifier

  • Habituellement vers le lemme
  • Corrections : (plusieurs autres restent à faire)
  • Exemple d'erreurs corrigées :
  1. achromatiques
  2. acronymes
  3. adversaires ; (2)
  4. atomes
  5. comédiens
  6. convulsions
  7. électrons ; (2)
  8. [[empreintes]] [[digitales]] > [[empreinte digitale|empreintes digitales]] ; (2)
  9. gonades ; (2)
  10. lentilles
  11. pulsations

Ligne avec [Catégorie: ne terminant pas par "]]" modifier

grep "^\[\[Catégorie:" *.xml | sed 's#</text>$##g' | grep -v "]] *" | grep -v "]]$" | grep -v "</noinclude>$"
2023-11-14 ; 7 corrections (il en reste)
2021-11-01 ; 5 corrections

Ajout de la [[Catégorie:Noms multigenres en français]] modifier

  1. acétate
  2. adi
  3. arénaire
  4. armadille
  5. brandebourg
  6. brie
  7. cagna
  8. camme
  9. câpre
  10. carnasse
  11. carnauba
  12. catin
  13. caustique
  14. chalcide
  15. champagne
  16. charleston
  17. chitte
  18. chlorite
  19. chnek
  20. transat
  21. tétragone
  22. vulnéraire

Parenthèses modifier

Liste des ")" dans les titres d'articles incluant la chimie et des redirections (251 résultats)
Dump 2021-10-20
  1. (
  2. (+)-
  3. (-)-
  4. (−)-
  5. 1,1,1-Trichlor-2,2-bis-(4-chlorophenyl)ethan
  6. 1,1,1-trichlor-2,2-bis(p-chlorofenyl)ethan
  7. 1,1,1-trichloro-2,2-bis(4-chlorophenyl)ethane
  8. 1,1,1-trichloro-2,2-bis(p-chlorofenyl)etán
  9. 1,1,1-trichloro-2,2-di(4-chlorophenyl)ethane
  10. 1,1,1-tricloro-2,2-bis(4-clorofenil)
  11. 1,1,1-tricloro-2,2-bis(4-clorofenil)-etano
  12. 1,1,1-tricloro-2,2-bis(p-clorofenil)etano
  13. 1,1,1-triklor-2,2-di(4-klorbensen)etan
  14. 1,1,1-trikloro-2,2,-bis(4-klorofenüül)etaan
  15. 1,1,1-trikloro-2,2-di(p-klorofenil)etan
  16. 1,1-bis(4-klorofenüül)-2,2,2-trikloroetaan
  17. (11E)-octadeceenzuur
  18. (11E)-octadecenoic acid
  19. (11E)-octadekeenihappo
  20. (11E)-oktadekenoinska kiselina
  21. (11Z)-eicoseenzuur
  22. (11Z)-eicosenoic acid
  23. (11Z)-eikoseenihappo
  24. (11Z)-eikozenoinska kiselina
  25. (11Z)-icoseenzuur
  26. (11Z)-icosenoic acid
  27. (11Z)-ikozenoinska kiselina
  28. 1,2 bis-(3-méthoxycarbonyl-2-thiouréido) benzène
  29. (13Z)-docosenoic acid
  30. (13Z)-dokoseenihappo
  31. (13Z)-dokozenoinska kiselina
  32. (13Z)-eicosanoic acid
  33. (13Z)-eikoseenihappo
  34. (15Z)-tetracosenoic acid
  35. (15Z)-tetrakoseenihappo
  36. (15Z)-tetrakozenoinska kiselina
  37. (15Z)-тетракозеновая кислота
  38. 2,2-iminodi(ethylamine)
  39. 2,2'-iminodi(éthylamine)
  40. 2,2’-iminodi(éthylamine)
  41. 2,3-bis(nitrooxy)propyl nitrate
  42. (2S)
  43. (2s)
  44. 4,4'-(2,2,2-trichloroethaan-1,1-diyl)bis(chloorbenzeen)
  45. 4,4’-(2,2,2-trichloroethaan-1,1-diyl)bis(chloorbenzeen)
  46. (4Z,7Z,10Z,13Z,16Z,19Z)-docosahexaeenzuur
  47. (4Z,7Z,10Z,13Z,16Z,19Z)-docosahexaenoic acid
  48. (4Z,7Z,10Z,13Z,16Z,19Z)-docosahexaensyre
  49. (4Z,7Z,10Z,13Z,16Z,19Z)-dokosaheksaeenihappo
  50. (4Z,7Z,10Z,13Z,16Z,19Z)-dokosaheksaeno rugštis
  51. (4Z,7Z,10Z,13Z,16Z,19Z)-dokozaheksaenoinska kiselina
  52. (5R,6S)-7,8-didehydro-4,5-époxy-3-méthoxy-N-méthylmorphinan-6-ol
  53. (5S,6E,8Z,11Z,14Z)hidroksikozatetraenoinska kiselina
  54. (5S,6E,8Z,11Z,14Z)hydroxyicosatetraenoic acid
  55. (5Z,8Z,11Z,14Z,17Z)-5,8,11,14,17-eikozapentaénsav
  56. (5Z,8Z,11Z,14Z,17Z)-eicosapentaeenzuur
  57. (5Z,8Z,11Z,14Z,17Z)-icosapentaenoic acid
  58. (5Z,8Z,11Z,14Z,17Z)-icosapentaensyre
  59. (5Z,8Z,11Z,14Z,17Z)-ikozapentaenoinska kiselina
  60. (5Z,8Z,11Z,14Z)-5,8,11,14-eicosatetraenoic acid
  61. (5Z,8Z,11Z,14Z)-eicosatetraenoic acid
  62. (5Z,8Z,11Z,14Z)-eicosatetraenoico
  63. (5Z,8Z,11Z,14Z)-eikozatetraenojska kislina
  64. (5Z,8Z,11Z,14Z)-icosatetraenoic acid
  65. (5Z,8Z,11Z,14Z)-ikosatetraenoinska kiselina
  66. (5Z,8Z,11Z)-eicosatrienoic acid
  67. (5Z,8Z,11Z)-eikosatrieenihappo
  68. (5Z,8Z,11Z)-eikozatrienoinska kiselina
  69. (5Z,9Z,12Z)-octadecatrienoic acid
  70. (5Z,9Z,12Z)-oktadekatrieenihappo
  71. (6E,8Z,11Z,14Z)-5-гидропероксиэйкоза-6,8,11,14-тетраеновая кислота
  72. (6Z,9Z,12Z,15Z)-octadecatetraenoic acid
  73. (6Z,9Z,12Z,15Z)-oktadekatetraeenihappo
  74. (6Z,9Z,12Z)-octadeca-6,9,12-trieenzuur
  75. (6Z,9Z,12Z)-octadecatrieenzuur
  76. (6Z)-hexadecenoic acid
  77. (6Z)-octadecenoic acid
  78. 7-(2-octyl-1-cyclopropenyl)heptanoic acid
  79. 7-(2-Octylcyclopropen-1-yl)heptansäure
  80. (7R,11R)-3,7,11,15-tetramethylhexadecaanzuur
  81. (7R,11R)-3,7,11,15-tetramethylhexadecanoic acid
  82. (7R,11R)-3,7,11,15-Tetramethylhexadecansäure
  83. (8E,10E,12E)-octadecatrienoic acid
  84. (8E,10E,12Z)-octadecatrienoic acid
  85. (8E,10E,12Z)-oktadekatrieenihappo
  86. (8Z,10E,12Z)-octadecatrienoic acid
  87. (8Z,10E,12Z)-oktadekatrieenihappo
  88. (9E,11E,13E)-octadecatrienoic acid
  89. (9E,11E,13Z)-octadecatrienoic acid
  90. (9E,11E,13Z)-oktadekatrieenihappo
  91. (9E,12E)-octadecadienoic acid
  92. (9E)-octadecenoic acid
  93. (9E)-octadecensyra
  94. (9E)-octadekeenihappo
  95. (9E)-oktadekenoinska kiselina
  96. (9Z,11E,13E,15Z)-octadecatetraenoic acid
  97. (9Z,11E,13E)-octadecatrienoic acid
  98. (9Z,11E,13E)-oktadekatrieenihappo
  99. (9Z,11E)-octadecadienoic acid
  100. (9Z,11E)-oktadekadieenihappo
  101. (9Z,12Z,15Z)-octadecatrieenzuur
  102. (9Z,12Z,15Z)-octadecatrienoic acid
  103. (9Z,12Z,15Z)-octadecatriensyre
  104. (9Z,12Z,15Z)-oktadeka-9,12,15-trieenihappo
  105. (9Z,12Z,15Z)-oktadeka-9,12,15-trienoiska kiselina
  106. (9Z,12Z,15Z)-oktadekatrienoiska kiselina
  107. (9Z,12Z)-octadecadienoic acid
  108. (9Z,12Z)-oktadekadieenihappo
  109. (9Z)-hekaadecenoinska kiselina
  110. (9Z)-hexadeceenihappo
  111. (9Z)-hexadeceenzuur
  112. (9Z)-octadeceenzuur
  113. (9Z)-octadecenoic acid
  114. (9Z)-oktadecenoinska kiselina
  115. (9Z)-oktadecénsav
  116. (9Z)-oktadekensyra
  117. (9Z)-tetradecenoic acid
  118. (9Z)-tetradekeenihappo
  119. àcid (9Z)-hexadecenoic
  120. acide (13Z)-icosénoïque
  121. acide (5S,6E,8Z,11Z,14Z)hydroxyicosatétraénoïque
  122. acide (5Z,8Z,11Z,14Z)-eicosatétraénoïque
  123. acide (5Z,9Z,12Z)-octadécatriénoïque
  124. acide 7-(2-octylcyclopropén-1-yl)heptanoïque
  125. acide (8E,10E,12E)-octadécatriénoïque
  126. acide (8E,10E,12Z)-octadécatriénoïque
  127. acide (8Z,10E,12Z)-octadécatriénoïque
  128. acide (8Z,11Z,14Z,17Z)-eicosatétraénoïque
  129. acide (9E,11E,13E)-octadécatriénoïque
  130. acide (9E,11E,13Z)-octadécatriénoïque
  131. acide (9Z,11E,13E,15Z)-octadécatétraénoïque
  132. acide (9Z,11E,13E)-octadécatriénoïque
  133. acide (9Z)-octadécén-12-ynoïque
  134. acido (13Z)-docosenoico
  135. ácido (13Z)-docosenoico
  136. ácido (4Z,7Z,10Z,13Z,16Z,19Z)-docosa-hexaenoico
  137. ácido (4Z,7Z,10Z,13Z,16Z,19Z)-docosahexaenoico
  138. acido (5Z,8Z,11Z,14Z,17Z)-eicosapentenoico
  139. ácido (5Z,8Z,11Z,14Z,17Z)-icosapentaenóico
  140. ácido (6Z,9Z,12Z,15Z)-octadecatetraenoico
  141. acido (6Z,9Z,12Z)-ottadecatrienoico
  142. ácido (6Z)-hexadecenoico
  143. ácido (9E)-octadecenoico
  144. ácido (9Z,12Z,15Z)-octadecatrienoico
  145. ácido (9Z,12Z,15Z)-octadecatrienóico
  146. ácido (9Z)-hexadecenoico
  147. ácido (9Z)-octadecenoico
  148. ácido (9Z)-octadecenóico
  149. ácido (9Z)-tetradecenoico
  150. aïnou (Japon)
  151. (all-cis)-eicosapentaeenzuur
  152. (all-cis)-Octadeca-9,12,15-triensäure
  153. Aluminium(III)-oxid
  154. aluminium(III) oxide
  155. aluminium(II) oxide
  156. Aluminium(I)-oxid
  157. aluminium(I) oxide
  158. (+)-amphétamine
  159. (−)-amphétamine
  160. Antimon(III)-sulfid
  161. antimony(III) sulfide
  162. ardennite-(As)
  163. ardennite-(As)s
  164. asam (4Z,7Z,10Z,13Z,16Z,19Z)-dokosahéksaénoat
  165. awa (môn-khmer)
  166. azido (9Z)-oktadezenoiko
  167. B(a)P
  168. bassa (Cameroun)
  169. bété (Côte d’Ivoire)
  170. biélorusse (tarashkevitsa)
  171. Bis(2-aminoethyl)amin
  172. Bis(2-aminoethyl)amine
  173. bis(2-amino-ethyl)amine
  174. Bis(2-aminoethyl)aminen
  175. Bis(2-aminoethyl)amins
  176. Capt(N)
  177. Château-Chinon (Ville)
  178. (cis,cis)-Octadeca-9,12-diensäure
  179. Cocos (Keeling) Islands
  180. coréen (hanja)
  181. digallane(6)
  182. digallano(6)
  183. djuga(l)-
  184. djuka(r)-
  185. Essigsäure-(2-methylpropyl)ester
  186. henge (å)
  187. hexadécahydrocyclopenta(a)phénanthrène
  188. hidroksi(okso)metana
  189. hidrudo de plomo(IV)
  190. hydroxy(oxo)methane
  191. Îles Cocos (Keeling)
  192. îles Cocos (Keeling)
  193. indium(III) hydride
  194. isopropyl-N (3 chlorophényl) carbamate
  195. Kókusz (Keeling)-szigetek
  196. kwas (13Z)–dokozenowy
  197. kwas (15Z)-tetrakozenowy
  198. kwas (5Z,8Z,11Z,14Z)-ejkozatetraenowy
  199. kwas (6Z,9Z,12Z)-oktadekatrienowy
  200. kwas (9Z,12Z,15Z)-oktadekatrienowy
  201. kwas (9Z,12Z)-oktadekadienowy
  202. kwas (9Z)-heksadekenowy
  203. kwas (9Z)-oktadekenowy
  204. kwas (all-Z)-4,7,10,13,16,19-dokozaheksaenowy
  205. kwas (all-Z)-5,8,11,14-ejkozatetraenowy
  206. kwas (Z,Z,Z)-6,9,12-oktadekatrienowy
  207. kyselina (13Z)-dokosenová
  208. kyselina (9Z,11E,13E)-oktadekatrienová
  209. kyselina (cis,cis)-oktadeka-9,12-dienová
  210. lead(IV) hydride
  211. luo (Cameroun)
  212. luo (Kenya, Tanzanie)
  213. maria (Inde)
  214. mende (Papouasie-Nouvelle-Guinée)
  215. mono (République démocratique du Congo)
  216. N-(2-aminoetyyli)etaani-1,2-diamiini
  217. N-(4-hidroxifenil)etanamida
  218. N-(4-hydroxyphényl)éthanamide
  219. N-(4-idrossifenil)acetammide
  220. norvégien (bokmål)
  221. norvégien (nynorsk)
  222. oxyde d'aluminium(I)
  223. oxyde d’aluminium(I)
  224. oxyde d'aluminium(II)
  225. oxyde d’aluminium(II)
  226. oxyde d'aluminium(III)
  227. oxyde d’aluminium(III)
  228. plutonium(2+) hydride
  229. plutonium(II) hydride
  230. poly(chlorure de vinyle)
  231. poly(téréphtalate de butylène)
  232. poly(téréphtalate d’éthylène)
  233. (R)-acétate de sec-butyle
  234. (R)-amphetamine
  235. (R)-amphétamine
  236. (R)-sec-butyl acetate
  237. sabueso español (typo grande)
  238. (S)-acétate de sec-butyle
  239. (S)-amphétamine
  240. (S)-sec-butyl acetate
  241. un(e)
  242. uroporphyrine III-Cu(II)
  243. waray (Philippines)
  244. Ynysow Cocos (Keeling)
  245. (Z8/E8)-12 Ac
  246. (Z)-tetrakoz-15-enoinska kiselina
  247. (Z,Z)-9,12-octadecadiëenzuur
  248. λοπαδοτεμαχοσελαχογαλεο(...)πτερυγών
  249. τη(ν)
  250. түймедейді түйедей ету (қылу)
  251. 科科斯(基林)群岛
Traductions avec des parenthèses (autres que relativement à la chimie)
Nombre de résultats = Nombre d'entrées en français
Total = 45
anglais (14 résultats)
Dump du 2021-10-20
  1. avoir une peur bleue ; be (turn) white as a sheet
  2. bombyx chinois du chêne ; Chinese (Oak) Tussah Moth
  3. Bryoria fremontii ; wila (lichen)
  4. de même que ; just as . . ., so do(es) . . .
  5. dénuer ; to strip (of)
  6. grébifoulque ; sungrebe (Heliornis), finfoot (Heliopais, Podica)
  7. indisposer ; make (someone) feel ill
  8. modène anglais ; modena (UK)
  9. noctuelle de la tomate ; Old World (African) bollworm
  10. Pâque ; Easter (3)
  11. piloter ; fly (a plane or a drone)
  12. prendre congé ; take leave)
  13. prendre garde ; be on guard (against)
  14. tarlouze ; nancy (boy)
catalan (12 résultats)
Dump du 2021-10-20
  1. à dessein ; (fet) exprés
  2. crochet ; ganxo (cop de puny)
  3. étal ; taula (de vendre)
  4. étioler ; esllanguir (una planta)
  5. exprès ; (fet) exprés
  6. faner ; marcir(-se), pansir(-se)
  7. peu ou prou ; almanco (régionalisme)
  8. pince-sans-rire ; (d'humor) càustic, (d'humor) irònic, (d'humor) sarcàstic
  9. pression ; canya (de cervesa)
  10. rire à gorge déployée ; alçar (grans) rialles
  11. ruée ; allau (de persones)
  12. télé-poubelle ; telefem (valencià)
espagnol (2 résultats)
Dump du 2021-10-20
  1. antibrouillard ; (faro) antiniebla
  2. olibrius ; (tipo) estrambótico
italien (1 résultat)
Dump du 2021-10-20
  1. marquer ; fare segno (di), lasciare un segno (di)
néerlandais (16 résultats)
Dump du 2021-10-20
  1. accueillant ; (iets goed of slecht) opnemen
  2. blottir ; zich vlijen (tegen)
  3. combler ; (op)(aan)vullen
  4. dégorgement ; ontstoppen (afvoer), het uitlopen van de kleuren (kleding)
  5. douer ; voorzien (van)
  6. égratigner ; enigermate krenken (door kritiek of spot)
  7. essor ; de bloei (fig.)
  8. évidage ; (het) uithollen
  9. forfait ; vast(gesteld) bedrag
  10. galop d’essai ; (het) proefdraaien
  11. parangon ; para(n)gon
  12. petit coin ; kamer (nummer) honderd
  13. peuple ; (ge)peupel
  14. phalange ; (strijd)schaar
  15. procès verbal de recette ; proces-verbaal van (voorlopige) oplevering
  16. volet ; (onder)deel

Pluriels 1 modifier

grep "\[\[[a-z][a-z]*s]]s " *.xml

2024-03-16 ; 1 correction
2021-10-20 ; erreurs corrigées 4/4
# [[adverbes]]s
# [[français]]s
# [[locutions]]s
# [[moyens]]s

Pluriels 2 modifier

grep -o "\[\[[a-z][a-z]*s]]s[a-z]*" *.xml | sort | uniq -c | sort -nr
   
   2023-11-14 ; 0 résultat
   2022-11-01
   
    446 [[gras]]se
    100 [[bas]]se
     82 [[épais]]se
     63 [[gros]]se
     48 [[gros]]ses
     20 [[épais]]ses
     18 [[bas]]ses
      8 [[gras]]ses
      1 [[multimédias]]s = corrigé
      1 [[métis]]ses
      1 [[métis]]se
      1 [[gros]]sière
      1 [[bros]]ser -> Wiktionnaire:Questions_sur_les_mots ; exclure ces sections prochain dump
      1 [[adjectifs]]s = déjà corrigé
     

Dates modifier

grep -io "[0-9]* janvier [0-9]*" *.xml | sed 's/^ //g' | sort | uniq -c | sort -nr

20221101 ; 1 erreur corrigée
Erreurs corrigées après vérification de la source (anciens dumps) :
# janvier 19912
# 252 janvier 2017
# 4 avril 202
# 10 avril 20120
# 10 mai 20035
# 7 juin 20212
* (plusieurs dates restent à revoir)

Mots inconnus modifier

Corrections :
duffixe = suffixe

Dump incrémental - tests modifier

Mots en français absents du Wiktionnaire ; à ajouter peut-être modifier

  1. acanthoptère
  2. anti-braconnage
  3. antibraconnage
  4. apraclonidine
  5. bouteillée
  6. bronchopneumopathie chronique obstructive
  7. clonidine ; clonidine sur l’encyclopédie Wikipédia  
  8. costiforme
  9. dicophile
  10. diosmétine ; diosmétine sur l’encyclopédie Wikipédia  
  11. diplobacille
  12. embarroqué
  13. énergiculture
  14. galette pacaude
  15. inaniméité
  16. magnétoception
  17. mycobionte
  18. naphtolate
  19. pailletage
  20. pansémite
  21. radioélectronique

insource:// + dumps modifier

3 apostrophes modifier

insource:/’’’/ [1]
2021-10-30 ; 5 erreurs corrigées

aaa modifier

bbb
insource:/bbb/ [2]
2022-11-04 ; 14 résultats (tous faux positifs)
2021-11-01 ; 11 résultats (tous faux positifs)
ccc
insource:/ccc/ -insource:/cccccc/ -insource:/\|ccc/ [3]
2021-11-01 ; 26 résultats (dont plusieurs faux positifs)
* Corrigées :
# acccessibilitat (catalan)
# Acccusatif (x 4)
# Bocccace
# Éd. de Bocccard
# racccordement
# tocccata
ddd
insource:/ddd/ -insource:/\|ddd/ -insource:/www.dddllf.com/ -insource:/\/ddd\// [4]
2022-11-04 ; 14 résultats (0 erreur)
2021-11-01 ; 22 résultats (dont plusieurs faux positifs)
* Corrigées :
# middden (néerlandais)
ggg
insource:/ggg/ [5]
2022-11-04 ; 6 résultats (0 erreur)
2021-11-01 ; 7 résultats (1 erreur)
jjj
insource:/jjj/ [6]
 2022-11-04 ; 2 résultats (0 erreur)
 2021-11-01 ; 3 résultats (1 erreur)
* Corrigées :
# hjjj (vandalisme)
kkk
insource:/kkk/ -insource:/\|kkk/ [7]
2021-11-01 ; 7 résultats (à revoir - contient quelques erreurs)
nnn
insource:/nnn/ [8]
2022-11-04 ; 77 résultats (5 corrections) (à revoir - contient quelques erreurs)
2021-11-01 ; 113 résultats

Orthographe modifier

paage
insource:/paage/ -insource:/paage\#fro/ -insource:/paage]]/ - insource:/ne paage/
2024-03-16 ; 0
édtion
insource:/édtion/
2024-03-16 ; 0 résultat
2021-11-01 ; 41 résultats
mnt
insource:/mnt/ -insource:/\|umnt/ [9]
2022-11-04 ; 34 résultats (à revoir - contient quelques erreurs)
2021-11-01
* Résultats : 37
* Corrections : 2
# maquerellemnt
# Probableemnt

Genre (M/F) modifier

un personne
insource:/un personne/ -insource:/un personnel/ [10]
2022-11-04 ; 14 résultats (12 corrections, 1 à faire, 1 faux positif)
une homme
insource:/ une homme/ [11]
2021-11-01
* Résultats : 2
* Corrections : 1
  • À revoir :
  1. encombrant ; Avoir une homme dans les pieds (citation à vérifier)

Pluriels avec 'les' modifier

Rechercher d'abord dans un dump puis avec insource://
Exemples d'erreurs trouvées :
1 résultat ; 1 correction
insource:/ les câblage /
insource:/ les combinaison /
insource:/ les construction /
insource:/ les croyance /
insource:/ les dictionnaire /
insource:/ les distance /
insource:/ les district /
insource:/ les établissement /
insource:/ les zone /
Plus d'une correction :
insource:/ les main / ; (2)
insource:/ les service / ; (2)

Pluriels avec 'des' modifier

Rechercher d'abord dans un dump puis avec insource://
Exemples d'erreurs trouvées :
1 résultat ; 1 correction
insource:/ des adjectif /
insource:/ des approvisionnement /
insource:/ des armature /
insource:/ des bosse /
insource:/ des chariot /
insource:/ des charrue /
insource:/ des chorégraphie /
insource:/ des mur /
Plus d'une correction :
insource:/ des membre / ; (2)

Pluriels (autres) modifier

Accents manquants modifier

Corrections :
n'etait

Accents en trop modifier

Accents (autres) modifier

Étymologie modifier

insource:/latin \{\{étyl\|la/
du latin latin
Du bas latin latin
bas-latin latin
2023-11-14 ; 1 résultat  ; 1 correction
2022-11-04 ; 2 résultats ; 2 corrections
2021-11-02 ; 6 résultats ; 6 corrections
insource:/français \{\{étyl\|fr/
français français
Résumé de modification : {{S|étymologie}} ; correction orthographique ; français français > français
2022-11-04 ; 2 résultats (1 correction, 1 à corriger)
2021-11-03 ; 3 résultats ; 3 corrections
insource:/anglais \{\{étyl\|en/
anglais anglais
Résumé de modification : {{S|étymologie}} ; correction orthographique ; anglais anglais > anglais
2021-11-03 ; 2 résultats ; 2 corrections
insource:/de l'\{\{étyl\|ang\|/
Résumé de modification : de l'vieil anglais > du vieil anglais
2022-11-04 ; 0 résultat
insource:/l'\{\{étyl\|enm\|/
Résumé de modification : de l'moyen anglais > du moyen anglais
2022-11-04 ; 0 résultat

* À faire : autres langues

Apostrophe typo vers apostrophe droite ]]’' --> ]]'' modifier

insource:/]]’'/ -intitle:tester
Résumé de modification : Apostrophe typo vers apostrophe droite ]]’' --> ]]
2024-03-16 ; 4 corrections
2022-11-04 * Résultats : 5, 4 corrigés, 1 faux positif
2022-07-21 * Résultats : 5, 4 corrigés, 1 faux positif
2021-11-04 * Résultats : 10

Titre de niveau 2 vers Titre de niveau 3 modifier

anagrammes

insource:/== \{\{S\|anagrammes}} ==/ -insource:/=== \{\{S\|anagrammes}} ===/
Résumé de modification : == {{S|anagrammes}} == -> === {{S|anagrammes}} ===
2022-11-04 ; 1 résultat (1 corrigé) Note : Erreur = trop long
2021-11-06 ; 2 résultats (2 corrections)

==== ==== > ==== modifier

insource:/==== ====/
Résumé de modification : ==== (x 2) en fin de ligne
2023-11-14 ; 0 résultat
2021-11-06 ; 2 résultats (2 corrections)

insource:/=== ===/ modifier

insource:/=== ===/
2023-11-14 ; 0 résultat
2022-07-21 ; 1 résultat (1 correction)

Erreur modèle exemple |source| plutôt que |source= modifier

-intitle:source insource:/\|source\|/ -insource:/\{\{lien\|source\|/ -insource/{{composé de\|source\|/
2023-11-14 ; 21 corrections

']' de trop modifier

insource:/]]]/ -insource:/]]]]/
2024-03-16 ; 1 correction
2023-11-14 ; 28 corrections

'[' de trop modifier

insource:/\[\[\[/ -insource:/\[\[\[\[/
2023-11-14 ; 9 corrections

checkwiki modifier

2023-11-01 modifier

Petscan modifier

Fréquence des caractères dans les entrées en italien modifier

italien.txt
  Catégorie : italien sur petscan.
  126 389 entrées (2023-05-11) petscan
  126 048 entrées (2023-04-20) https://fr.wiktionary.org/wiki/Wiktionnaire:Statistiques

Ébauche du Module:anagrammes/it modifier

 -- List of characters to keep unchanged, empty for Italian
 keep = {},
 -- Table of character transformations, meant for characters without diacritics (ligatures, etc.)
 mappings = {
   ["ʿ"] = "",
   ["ª"] = "a",
   ["α"] = "a", -- Alpha grec
   ["æ"] = "ae",
   ["β"] = "b", -- Bêta grec
   ["ə"] = "e", -- schwa, e culbuté
   ["ɜ"] = "e",
   ["γ"] = "g", -- Gamma grec
   ["ħ"] = "h", -- Lettre minuscule latine h barré horizontalement.
   ["º"] = "o",
   ["ø"] = "o",
   ["œ"] = "oe",
Avec notes (à conserver sur la page utilisateur)
   ["ʿ"] = "",                  (7 entrées) aš-Šammāʿiyah, al-ʿAyūn Sidi Mallūk...
   ["ª"] = "a",                 (2 entrées) , 
   ["α"] = "a", -- Alpha grec  (10 entrées) acido α-linolenico, raggio α
   ["æ"] = "ae",                (4 entrées) Fær Øer, Ægir...
   ["β"] = "b", -- Bêta grec   (10 entrées) decadimenti β, radiazioni β...
   ["ə"] = "e", -- e culbuté   (10 entrées) ləi, benvenutə...
   ["ɜ"] = "e",                 (2 entrées) benvenutɜ, ...
   ["γ"] = "g", -- Gamma grec  (13 entrées) particella γ, fotone γ...
   ["ħ"] = "h", -- h barré      (2 entrées) għana, fil-Għoli (Catégorie:ħ_en_italien)
   ["º"] = "o",                (10 entrées) , 
   ["ø"] = "o"                  (3 entrées) Isole Fær Øer, Fær Øer
   ["œ"] = "oe",                (1 entrée)  trompe-l’œil
   Caractères non convertis par le module en français : ª, ð, ħ, ə, ɜ, α
Cas à revoir :
  ["ð"] (Lettre minuscule latine ed) ; 1 entrée Angrboða


Avec A-Z a-z modifier

grep -o . italien.txt | sort | uniq -c | sort -nr
160630 a
157566 i
132171 e
125680 o
106705 t
 93895 r
 88306 n
 70203 s
 65884 c
 58578 l
 42489 m
 32889 p
 31981 d
 29571 g
 28086 u
 23848 b
 22125 z
 20484
 17583 f
 16622 v
  8512 h
  2024 à
  1871 q
  1809 S
  1575 C
  1339 A
  1310 -
  1203 M
  1110 B
  1082 k
   984 P
   877 ò
   796 L
   785 T
   778 ’
   681 y
   674 G
   627 R
   613 V
   466 F
   418 E
   402 O
   376 x
   372 D
   364 I
   359 N
   346 w
   292 j
   242 é
   183 Z
   166 è
   159 K
   150 H
   116 U
   107 J
    87 ì
    75 Q
    73 ù
    50 Y
    47 ī
    47 ,
    44 ā
    43 W
    43 1
    25 ū
    23 2
    22 ï
    19 š
    18 É
    18 â
    18 0
    15 Ò
    14 4
    13 γ
    13 9
    12 6
    11 3
    10 β
    10 α
    10 ö
    10 º
    10 č
    10 5
     9 ç
     9 &
     8 ü
     8 á
     7 ʿ
     7 X
     7 í
     7 8
     7 7
     7 ̨
     6 ë
     6 ä
     6 )
     6 (
     5 û
     5 ş
     5 ô
     5 ê
     4 ţ
     4 Š
     4 ó
     4 î
     3 ú
     3 ṣ
     3 Ş
     3 Ø
     3 ñ
     3 È
     3 æ
     3 /
     3 .
     2 ž
     2 ṭ
     2 Î
     2 ẖ
     2 ħ
     2 ġ
     2 ɜ
     2 ə
     2 ã
     2 Â
     2 ª
     2 !
     1 ż
     1 Ţ
     1 ř
     1 œ
     1 ō
     1 ḥ
     1 Ḥ
     1 ḩ
     1 ð
     1 Č
     1 ć
     1 Æ
     1 Ā
     1 Á
     1 ̱
     1 »
     1 «
     1 *
     1 '

Sans A-Z a-z et 0-9 ; (incomplet - brouillon) modifier

grep -o . italien | tr A-Z a-z | sed -e 's/[a-z0-9]//g' | sort | uniq -c | sort -nr
1336701 Lettres et chiffres
  20484 Espaces
  1310 -
   778 ’
    47 ,
    18 É
    15 Ò
    13 γ
    10 β
    10 α
     9 &
     7 ʿ
     7 ̨
     6 )
     6 (
     4 Š
     3 Ş
     3 Ø
     3 È
     3 /
     3 .
     2 ž
     2 Î
     2 Â
     2 !
     1 ż
     1 Ţ
     1 Ḥ
     1 Č
     1 Æ
     1 Ā
     1 Á
     1 ̱
     1 »
     1 «
     1 *
     1 '

Traductions modifier

Traductions modifier