Utilisateur:PamputtBot/fix-LLbot-doublon.py

Ce programme python s’appuie sur Pywikibot. Il lit le fichier texte créé par find-LLbot-doublon.cpp, récupère le contenu de chaque page contenue dans ce fichier texte et supprime toutes les prononciations qui apparaissent plus d’une fois.

Pour exécuter:

python3 core/pwb.py fix-LLbot-doublon.py
import pywikibot
import re

site = pywikibot.Site('fr','wiktionary')

f = open("double_llbot.txt", "r")

for line in f.readlines():
    items = line.split("\t")
    
    titre = items[0]
    titre = titre[titre.find("[[")+2:titre.find("]]")]

    page = pywikibot.Page(site, titre)
    wikitext = page.text
    ini_wikitext = wikitext
    new_wikitext = ""

    for audio in items[1:]:
        print(f"Traitement de {titre}, {audio}")
        new_wikitext = ""
        first = True
        for line in wikitext.split('\n'):
            if audio.strip() in line:
                if first:
                    first = False
                    new_wikitext += line + "\n"
                else:
                    pass
                
            else:
                new_wikitext += line + "\n"
        wikitext = new_wikitext
                
    if ini_wikitext == new_wikitext:
        continue
    
    page.text = new_wikitext
    #print(new_wikitext)
    page.save(summary="Suppression des prononciations en double", botflag=True)

f.close()