Wiktionnaire:Bots/Statut/FtiercelBot

  • Nom du propriétaire : Ftiercel
  • But du bot : mettre à jour les liens interwiki dans les sections de traduction et dédoublonner les traductions
  • Script utilisé : getall.pl, tranInter.py, tranInter_doubleTracker.py
  • Déjà présent sur, avec statut de bot : nulle part
  • Déjà présent sur, sans statut de bot : nulle part
  • Remarques : Bonjour, je suis Fabrice TIERCELIN. Je suis consultant en informatique depuis presque un an. J'ai eu l'occasion d'éditer (manuellement) plusieurs centaines d'articles sur le wiktionnaire ainsi que plusieurs articles sur des wikipedias. J'ai installé un wiki pour ma société et déjà signalé un bug dans le logiciel MediaWiki. J'ai à plusieurs reprises utilisé des compilateurs de compilateur (Lex et Yacc, antlr, JavaCC...). De plus, je suis actuellement en mission à EDF sur le site RetD de Clamart sur une application en Python :)
  • Date et heure : 28 juillet 2007 à 18:47 (UTC)

Le vote est ouvert à tous ceux qui ont au moins 100 modifications sur le Wiktionnaire francophone au moment du début du vote. Il est rappelé aux votants que le seul avantage du statut de bot est de ne pas apparaître dans la page Modifications récentes. Si le rapport Pour/Contre est supérieur (ou égal) à 75%, la requête est acceptée, le bot flag est demandé aux administrateurs. Le vote dure 7 jours.

Pour Pour

Apparemment (tu me dis si je me trompe), ton script est basé sur ce que j'avais codé pour KipBot (), et que j'avais testé sur beaucoup d'articles (donc, il fonctionne, mais je n'ai plus le temps de le lancer maintenant) et tu l'as amélioré, donc ça devrait marcher encore mieux ! Alors pour :-) Kipmaster 30 juillet 2007 à 12:42 (UTC)

Contre Contre

Neutre Neutre

Discussion Discussion

Cela ne va pas être facile à écrire et à tester... Lmaltier 30 juillet 2007 à 16:36 (UTC) J'ai omis la procédure pour moi parce que j'avais oublié cette page. Désolé. Lmaltier 30 juillet 2007 à 16:37 (UTC)

Le script est effectivement optimisé.
  • L'ensemble des mots de tous les wiktionnaires ne sont plus chargés en une seule liste :
lst[n] = "en:word"
mais classé selon leur langue :
lst["en"][n] = "word"
ainsi, quand on recherche si un mot est présent dans une langue, la recherche ne s'effectue qu'entre les mots de la langue :
if (word in lst[lang]):
ce qui va beaucoup plus vite.
  • J'ai aussi précompilé certains parsers en début de programme une fois pour toute :
oldLinkCompiler = re.compile("\[\[(.*?)\]\]")
D'après python.org, cette opération est coûteuse, donc mieux vaut la faire une seule fois. Ftiercel 30 juillet 2007 à 16:10 (UTC)

Résultats Résultat

J'ai mis le statut de bot. Kipmaster 3 aout 2007 à 07:30 (UTC)