Projet:Communes de France
Cette page a pour objet d’analyser l'état du corpus des entrées du Wiktionnaire au 28 septembre 2023 dans deux thématiques : les communes de France et leurs gentilés associés, d’en déduire un plan d'action et de le mettre en oeuvre.
Complément : Entrées absentes au 1er octobre 2023.
Communes de France
modifierCorpus d’entrées
modifierLe corpus actuel du Wiktionnaire contient, selon une analyse sommaire, les communes existantes et les anciennes communes composant des communes nouvelles créées après 2016. Ce corpus est très loin d’être exhaustif.
Au 1er janvier 2023, selon l'état du Code officiel géographique affiche pour la France entière :
- 34945 communes (COM) ;
- 2081 communes déléguées (COMD) ;
- 492 communes associées (COMA) ;
- les anciennes communes (ni COMD ni COMA) ne sont pas décomptées dans le COG.
Communes en vigueur au 1er janvier 2023 en France métropolitaine
modifier111 des communes (COM) n’ont pas d’entrée dans le Wiktionnaire. Il s’agit de : Nivigne et Suran - Culoz-Béon - Plateau d’Hauteville - Groslée-Saint-Benoit - Bazoches-et-Saint-Thibaut - Bernoy-le-Château - Saint-Christophe-en-Bourbonnais - Saint-Julien-d’Intres - Saint-Laurent-les-Bains-Laval-d’Aurelle - Montgailhard - Moulins-en-Bessin - Thury-Harcourt-le-Hom - Bors (Canton de Tude-et-Lavalette) - Bors (Canton de Charente-Sud) - Lignières-Ambleville - Mansle-les-Fontaines - Mosnac-Saint-Simeux - Val-d’Auge - Saint-Pierre-La-Noue - Montaignac-sur-Doustre - Sarroux - Saint Julien - Collonges-et-Premières - Les Monts-Ronds - Saint-Jean-de-Galaure - Les Monts du Roumois - Val d’Orger - Nassandres sur Risle - Les Trois Lacs - Verneuil d’Avre et d’Iton - Sylvains-Lès-Moulins - Vald’Yerre - Saint-Eloy - Lasserrade - Villefranche-d’Astarac - Cadillac-sur-Garonne - Mesnil-Roc’h - Sougeal - Coteaux-sur-Loire - Monestier-du-Percy - Le Percy - Ruy-Montceau - Saint Antoine l’Abbaye - Valzin en Petite Montagne - Coteaux du Lizon - Septmoncel les Molunes - Saugnac-et-Muret - Le Gault-du-Perche - Oucques La Nouvelle - Caloire - Grandchamp-des-Fontaines - Quiers-sur-Bezonde - Castelnau Montratier-Sainte Alauzie - Montgaillard-en-Albret - Peyre en Aubrac - Mont Lozère et Goulet - Massegros Causses Gorges - Saint Bonnet-Laval - Gorges du Tarn Causses - Orée d’Anjou - Ombrée d’Anjou - Segré-en-Anjou Bleu - Juvigny les Vallées - Tourneville-sur-Mer - Remilly Les Marais - Tessy-Bocage - Cœur-de-la-Vallée - Colombey les Deux Églises - Val-du-Maine - Blandouet-Saint Jean - Arrancy-sur-Crusnes - L’Isle-en-Rigault - Saulmory-Villefranche - Val d’Oust - Saint-Gérand-Croixanvec - Varize-Vaudoncourt - Château-Chinon (Campagne) - Vaux d’Amognes - Les Hauts-Talican - La Corne-en-Vexin - La Ferté Macé - Montreuil-sur-Mer - Montaigut-en-Combraille - Chambaron sur Morge - Castillon (Canton d’Arthez-de-Béarn) - Castillon (Canton de Lembeye) - Ance Féas - Labatut-Figuières - Beyrède-Jumet-Camous - Targasonne - Val-de-Moder - Bonnay-Saint-Ythaire - La Vineuse sur Fregande - Val-d’Étangson - Roëzé-sur-Sarthe - Saint-Paterne-Le Chevain - Val-d’Arc - Saint François Longchamp - Epagny Metz-Tessy - Sevrier - Vers-sur-Selle - Lacapelle-Escroux - Bouloc-en-Quercy - L’Aiguillon-la-Presqu’île - Aubigny-Les Clouzeaux - Rives-d’Autise - Terval - Beaumont Saint-Cyr - Champigny en Rochereau - Deux Rivières - Guillon-Terre-Plaine - Les Hauts de Forterre.
Il s’agit dans la quasi-totalité des cas de communes nouvelles, excepté pour :
- Saint-Eloy, qui a une entrée à Saint-Éloy, en tant que commune française du département du Finistère. Mais le nom officiel est bien sans le signe diacritique, les deux graphies étant acceptées.
- Lasserrade, qui a une entrée à Lasserade, le nom officiel jusqu’en 2020.
- Villefranche-d’Astarac, qui a une entrée à Villefranche, ancien nom jusqu’en 2023 (voir ici).
- Grandchamp-des-Fontaines a une entrée à Grandchamps-des-Fontaines, ancien nom jusqu’en 2023
- Montaigut-en-Combraille a une entrée à Montaigut, ancien nom jusqu’en 2023
- Quiers-sur-Bezonde a une entrée à Quiers-sur-Bézonde, ancien nom jusqu’en 2023
- Villefranche-d’Astarac a une entrée à Villefranche, ancien nom jusqu’en 2023
- Monestier-du-Percy a une entrée à Le Monestier-du-Percy, ancien nom jusqu’en 2023
- Lacapelle-Escroux a une entrée à Escroux, ancien nom jusqu’en 2023
- Le Percy a une entrée à Percy, ancien nom jusqu’en 2023
Communes déléguées en vigueur au 1er janvier 2023
modifierLa totalité des communes déléguées ont une entrée (hormis Notre-Dame-de-Briançon), mais aucune de ces entrées ne comporte d'acception en tant que commune déléguée.
Communes associées en vigueur au 1er janvier 2023
modifierLa totalité des communes associées ont une entrée, mais aucune de ces entrées ne comporte d'acception en tant que commune associée.
Anciennes communes (antérieures à 1970)
modifierAucune des anciennes communes disparues avant 1970 ne figure dans le corpus. Le nombre n'a pas été évalué, mais avoisine plusieurs dizaines de milliers.
Ces anciennes communes sont caractérisées :
Soit par un changement de nom :
Soit par une réunion à une autre commune :
- Abense-de-Bas est une ancienne commune créée en 1793, réunie en 1842, à Viodos-Abense-de-Bas, dans le département des Pyrénées-Atlantiques
Noter que l’entrée de certaines très anciennes communes disparues avant la création de certains départements peut nécessiter une adaptation du texte. Par exemple :
- L'Abadie est une ancienne commune créée en 1793, réunie avant 1806, (avec Causse-Vieil) à Parisot, située dans l’actuel département de Tarn-et-Garonne (créé en 1808).
Anciennes communes avec un nom révolutionnaire
modifierPlus de 3000 communes ou villages ont changé de nom pendant la Révolution. Certaines ont en outre eu plusieurs noms révolutionaires. Sauf erreur, il semble que ces noms ne figurent actuellement pas dans le Wiktionnaire.
Prononciation
modifierLors d'une première phase, la prononciation API ne sera pas ajoutée. Lors d'une phase ultérieure, cette prononciation pourra être ajoutée par récupération sur Wikipédia, si celle-ci existe tout au moins. Ultérieurement encore, un fichier audio de prononciation pourra être importé depuis Lingua Libre, si celui-ci est créé.
Descriptif
modifierLa quasi-totalité des descriptifs a la forme suivante :
La seule source indiquée est celle du site habitants.fr avec l'affichage du modèle {{mercihabitants}} La raison en est simple : ces entrées (communes et gentilés associés) ont été importées par le bot LmaltierBot pour les communes dont le gentilé était connu au moment de l'importation.
Cette source pose un problème car le site ne différencie pas les communes des communes déléguées ou communes associées ou anciennes communes.
Étymologie
modifierCette partie est à hauts risques, car souvent elle ne peut pas se résumer à une simple phrase et plusieurs interprétations peuvent différer selon les auteurs.
En fait cette section est rarissimement renseignée. Le problème est que quand elle est rensiegnée, elle n'est que rarement sourcée.
Holonymes
modifierUn holonyme est un terme lié à un autre par une relation d’holonymie, c’est-à-dire de tout à partie. Une commune étant une division du territoire national, il paraît logique de présenter les territoires qui l'englobent, à l'instar de ce qui est fait pour les entrées correspondant à un département où le nom de la région est indiqué en tant qu'holonyme. Il s'agit en particulier de :
- le canton ;
- l'arrondissement dans lequel est incluse la commune ;
- le département ;
- la région (noter que pour les entrées différentes des communes, comme les départements ou les arrondissements, les noms des régions sont ceux des régions antérieurement à la réforme de 2016, qu'il y aura donc lieu de corriger) ;
- le pays.
Cette information sur les holonymes ne figure a priori jamais.
Notes :
|
Méronymes
modifierUn méronyme est un terme lié à un autre par une relation de partie à tout.
Pour une commune, peuvent être considérés comme méronymes :
- les communes déléguées ;
- les communes associées (noter l'absence d'entrée pour la commune associée) ;
- les anciennes communes dont la commune est issue par fusion (qui ne sont ni des communes déléguées, ni des communes associées) ;
- les quartiers.
Cette information ne figure a priori jamais.
Hyponymes
modifierIl semble que dans certains cas (voir Bordeaux), le terme hyponyme soit employé pour désigner une forme ancienne de nom. Il n'est pas évident que ce soit la bonne terminologie.
Dérivés
modifierCette section apparaît dans certains articles. Risques : la liste peut être longue!
Illustrations
modifierCes entrées sont parfois illustrées par le panneau d’entrée d’agglomération (EB10).
- Pertinence du panneau : on peut s’interroger de la pertinence d'une telle image.
- Taille des images : elle est souvent inscrite dans le dur avec une valeur en pixels variable selon les illustrations. Il est souhaitable d’en tenir au mode vignette ou avec un upright=1.2
ou par l'image de la mairie (exemple : Aast).
Une illustration pertinente serait une carte synthétique représentant le commune au sein du département (puisque c'est le coeur de la définition), comme c'est le cas pour les départements (exemple : Loiret). Pb .... ces cartes n'existent actuellement pas sur Commons! (sur Wikipédia, il s'agit de cartes interactives et non statiques).
Sources
modifierUn très grand nombre de communes utilise comme source le site habitants.fr via le modèle {{mercihabitants}}. Autant cette source est admissible pour attester le gentilé de la commune ou division, autant elle ne l’est pas pour sourcer le statut de la division (commune ou ancienne commune), pour la bonne et simple raison que ce site ne fait pas la différence entre commune, commune nouvelle, commune déléguée ou commune associée et donc entre commune et ancienne commune.
D'autres sources spécifique speuvent être utilisées comme le Dictionnaire toponymique des communes du Béarn dans Aast. Le pb est que la page n'est pas indiquée.
Au-delà des dictionnaires toponymiques, les principales sources admissibles pour sourcer les définitions sont celles issues :
- de l'Insee (pour les communes du COG et celles qui ont changé de nom après 1943)
- de l'EHESS, pour les communes antérieures à 1943 (antérieures à 2006 en fait, mais la période 1943-2006 recoupe celle de l’Insee.
Anagrammes
modifierCette section utilise :
- soit un modèle avec les noms en dur qui a priori a été créé par un bot.
- soit le Modèle:voir anagrammes, qui semble être la meilleure solution et renvoie vers un modèle spécifique d'anagrammes.
Section Voir aussi
modifierCette section n'est pas toujours présente. Quand elle est présente, on peut avoir la présence de l'entrée sur Wikipédia et cemlle sur Vikidia, avec les modèles suivants :
- {{WP}}
- {{Vikidia}}
Noter que mettre systématiquement le modèle de Vikidia peut poser un problème. En effet de très nombreuses communes ne sont pas encore créées. Par exemple pour les 546 communes des Pyrénées-Atlantiques (au 1er janvier 2023), seulement 15 sont présentes.
Catégories
modifierCatégories actuelles
modifierLes catégories actuelles (au 1er octobre 2023) des divisions géographiques sont générées par le modèle:localités, avec comme seul paramètre optionnel la valeur "de France'. Outre le fait que ce terme est très générique, puisqu'il regroupe tous les lieux habités, à savoir villes, petites villes, hameaux, bourgs, villages, lieux-dits, écarts, etc, sans qu'un périmètre formel ne soit défini, il faut noter que :
- le territoire de ces lieux n'est formellement pas défini avec le mot localité qui a tendance à couvrir uniquement les zones habitées en agglomération ou en habitat dispersé. Les seuls zonages officiels sont ceux définis par le COG (communes, communes déléguées, communes associées, cantons et pseudo-cantons, arrondissements, arrondissements municipaux, départements, régions, collectivités territoriales à statut particulier, collectivités d'outre-mer et leurs divisions) ;
- il existe des communes sans habitant, comme Beaumont-en-Verdunois ou Bezonvaux, qui ne sont donc formellement pas des localités.
Catégories générées par modèles
modifierIl existe 4 paramètres optionnels, ce qui permettrait d'augmenter le nombre de catégories (canton de ..., arrondissement de ..., etc).
Catégories explicites
modifierIl existe également des catégories ajoutées explicitement dans le corps de l'article, comme :
Typographie
modifierApostrophe
modifierLe Wiktionnaire préconise dans les titres et textes l'apostrophe courbe dite typographique (« ’ ») et non l’apostrophe droite dite dactylographique (« ' ») (voir ici). Cette convention est exactement inverse à celle de Wikipédia qui préconise dans les titres l’apostrophe droite (voir ici).
Ceci est particulièrement ennuyeux car toutes les bases de données officielles (de l'Insee en particulier, mais pas que) sont rédigées avec l'apostrophe droite.
- Une analyse brute à partir de ces bases peut renvoyer des faux-négatifs de présence d'entrée, si la redirection n'est pas mise en place ;
- Un traitement brut à partir de ces bases pourrait soit désorganiser le Wiktionnaire en écrasant des redirections, soit être inopérante.
Conclusion :
- les bases (supports de futurs traitements) comportant des apostrophes droites devront être corrigées avec des apostrophes courbes ;
- des redirections devront être créées pour toutes les nouvelles entrées comportant des apostrophes droites.
Gentilés et adjectifs liés à des communes
modifierCorpus de gentilés liés à des communes de France
modifierStatistiques
modifier- 30 588 communes de France métropolitaine comprend au moins un gentilé associé. Chaque gentilé pouvant admettre soit plusieurs entrées indépendantes de radicaux différents, soit plusieurs formes fléchies (masculin, féminin, pluriels).
- sur les 34 816 communes en vigueur au 1er janvier 2023 en France métropolitaine et les 101 départements, 3 330 communes ou départements ont au moins un gentilé n'entrant pas dans le corpus ci-dessus de 30 689 communes. Cette liste étant relativement importante, ne sera pas affichée ici.
Potentiel d'entrées
modifierSuivant les formes fléchies possibles, on peut estimer le potentiel de nouvelles entrées entre 18 000 et 20 000.
Corpus d'adjectifs liés à des communes de France
modifierIl s'agit a priori du même potentiel, si on utilise la même source de habitants.fr. L'idéal étant d'accéder à une source relevant des médias traditionnels.
Localités de France différentes des communes
modifierDe nombreuses localités ne sont pas catégorisées en communes. Il s'agit notamment des lieux-dits, hameaux, écarts et de toutes les attestations anciennes des communes actuelles.
- le Dicotopo, la ressource incontournable pour les attestations historiques (lire en ligne).
Le Dictionnaire topographique de la France recense les noms de lieux attestés sur le territoire français ainsi que les formes anciennes (latines et autres) qu'ils ont revêtues au cours des siècles. Il réunit en une base de données unique l'ensemble des dictionnaires départementaux publiés depuis le XIXème siècle ou demeurés inédits.
Sont recensés 42 départements, 511 944 lieux et 1 207 647 formes anciennes. Précision : une même entrée peut désigner bien entendu plusieurs lieux. Par exemple Paradis désigne 271 lieux différents.
Plus de détails : Projet:Communes de France/Section Toponymie sur l’encyclopédie Wikipédia
Cantons
modifierLes cantons étant des holonymes des communes, il est essentiel de traiter les cantons avant les communes.
Il existe 2054 cantons en France au 1er janvier 2023 (suite à la réforme de 2016). Sur ces 2055 cantons :
- 1225 ont un libellé dont l'entrée existe dans le Wiktionnaire, mais dont l'acception en tant que canton est absente ;
- 829 ont un libellé dont l'entrée n'existe pas dans le Wiktionnaire, et qu'il convient donc de créer.
Noter que toutes les catégories associées aux cantons sont dès lors à créer. Voir liste sur cette page.
Arrondissements
modifierDénomination
modifierNoter une erreur de terminologie. Le terme arrondissement départemental n'a pas lieu d'être. Il s'agit d'une tautologie, car par définition un arrondissement est une circonscription administrative d'un département, qui héberge donc des services de l'État (voir ici). Il y a donc redondance. Le nom correct est bien arrondissement, simplement, dans le droit français en tout cas.
Un arrondissement municipal est par contre spécifique aux villes de Paris, Lyon, et Marseille et héberge des services municipaux (voir ici).
Il y a donc lieu de :
- renommer l'article, mais aussi corriger tous les articles qui comportent écrit en dur le terme "arrondissement départemental" (nombre non évalué). Ce n'est pas au Wiktionnaire de créer l'usage ;
- créer l'article arrondissement municipal.
Holonymes
modifierLes arrondissements étant des holonymes des communes, il est essentiel de traiter les arrondissements avant les communes.
Il existe 332 arrondissements en France au 1er janvier 2023. Sur ces 332 arrondissements :
- 324 ont un libellé dont l'entrée existe dans le Wiktionnaire, mais dont l'acception en tant qu'arrondissement est absente ;
- 8 ont un libellé dont l'entrée n'existe pas dans le Wiktionnaire, et qu'il convient donc de créer.
Modèles
modifierDivisions
modifierCommune | Commune | Gien |
Commune nouvelle | Nivigne et Suran | |
Commune avec nouveau nom | Lasserrade | |
Ancienne commune devenue commune déléguée | Chavannes-sur-Suran | |
Ancienne commune | Abense-de-Bas | |
Canton | Gien |
Gentilés et adjectifs
modifierType | Masculin singulier | Féminin singulier | Féminin pluriel |
---|---|---|---|
Gentilé | Tronquois | Tronquoise | Tronquoises |
Adjectif | tronquois | tronquoise | tronquoises |
Plan d'actions
modifierCatégories
modifierCréation de nouvelles catégories de communes, cantons, arrondissements (voir ici)
Communes
modifierEntrées nouvelles
modifier- Ajout des 111 communes en vigueur au 1er janvier 2023 et absentes du Wiktionnaire, sans les étymologies.
- Pour chaque nouvelle entrée, le bot de traitement doit être en capacité de détecter si un modèle d'anagrammes existe (par exemple comme Modèle:anagrammes/fr/aelnors pour Orléans, voir Catégorie:Modèles d’anagramme en français) et dans l'affirmative, modifier le modèle en question et y ajouter la nouvelle entrée en clair. Dans le cas où il n'existe pas de modèle d'anagramme, il ne sera pas recherché s'il existe un anagramme isolé dans le corpus du Wiktionnaire.
Corrections d'entrées existantes
modifier- Pour toutes les anciennes communes, remplacer commune par ancienne commune (lorsque la mention ne figure pas).
- Pour toutes les communes du corpus, ajouter
- une source (Insee après 1943 et EHESS avant) ;
- les holonymes et méronymes ;
- les étymologies ;
- le lien vers l'article de Wikipédia (lorsque celui-ci ne figure pas dans l'article).
Gentilés et adjectifs
modifier- Ajout des gentilés et adjectifs correspondant aux 111 nouvelles communes entrées dans le Wiktionnaire.
- création de toutes les entrées correspondant à des gentilés ou adjectifs liés aux 3 330 communes identifiées comme n'en ayant pas dans le Wiktionnaire (et figurant dans le site habitants.fr)