« Wiktionnaire:Actualités/043-octobre-2018 » : différence entre les versions

Contenu supprimé Contenu ajouté
maj
màj des stats et un dictionnaire du mois un peu particulier
Ligne 22 :
* Le linguiste Frédéric Landragin et l’astrophysicien {{w|Roland Lehoucq}} étaient les invités de ''[https://www.franceculture.fr/emissions/la-methode-scientifique/la-methode-scientifique-du-vendredi-19-octobre-2018 La Méthode scientifique]'' du 19 octobre pour parler, dans la deuxième partie de l’émission (à partir de 24 min 40 s), de [[xénolinguistique]], ou ''Comment parler à un alien ?''.
 
== Un travail de bot ==
 
En [[Wiktionnaire:Wikidémie/juillet_2014#De_l'usage_des_bots|juillet 2014]], une discussion sur les bots (ou programmes informatiques exécutant des tâches automatisées) avait conduit au développement d’un [[Utilisateur:Pamputt/articles sans intervention humaine|programme]] permettant d’identifier tous les articles faits avec l’aide d'un ou plusieurs robots sans relecture ultérieure. À l’époque, 185 454 articles avaient cette caractéristique.
 
Pour obtenir ce chiffre le programme analyse le fichier d’historique du Wiktionnaire (toutes les versions des différentes pages) qui pèse plus de 50 Gio. Il recherche plus spécifiquement le nom des contributeurs de chaque version. Si le nom de l’utilisateur contient « bot » ou « Bot » alors le programme considère que le contributeur est un bot. Si la page n’a été modifiée que par des comptes de bots alors elle est ajoutée à la liste.
 
Une nouvelle analyse sur les données du Wiktionnaire publiée au début du mois d’octobre 2018 donne un total de 170 389 articles (la liste complète est disponible [[Utilisateur:Pamputt/articles sans intervention humaine|ici]], [[Utilisateur:Pamputt/articles sans intervention humaine 2|2]], [[Utilisateur:Pamputt/articles sans intervention humaine 3|3]], [[Utilisateur:Pamputt/articles sans intervention humaine 4|4]]), soit un peu plus de 15 000 articles qui ont depuis, été modifiés par au moins un compte « humain ».
 
[[Utilisateur:PamputtBot/cree par PiedBot.cpp|Par la suite]], des bandeaux ont été ajoutés sur les articles créés par {{u-|PiedBot}} (un bot qui a importé beaucoup de contenu, dans différentes langues, en 2006 mais aussi pas mal d’erreurs) et qui n’ont été modifiés ensuite que par des bots afin d’inviter les contributeurs à relire et « valider » ces articles. Tous les articles en attente de relecture sont classés par langue dans la catégorie [[:Catégorie:Pages à vérifier car créées automatiquement|Pages à vérifier car créées automatiquement]].</translate><br /> <span style="float:right;"><translate>— une chronique par [[Utilisateur:Pamputt|Pamputt]]</translate></span>
 
<translate>
== Statistiques ==
 
; Du 20 septembre au 20 octobre 2018</translate><br />
[[File:Circle-icons-arrow-up.svg|22px|link=Wiktionnaire:Statistiques]]<translate> '''+ [[Wiktionnaire:Statistiques|{{formatnum:18410}}]]''' entrées et '''{{formatnum:146}}''' langues modifiées pour atteindre '''{{formatnum:3557137}}''' entrées et '''{{formatnum:1083}}''' langues avec au moins cinq entrées.</translate>
Ligne 29 ⟶ 41 :
<br />
[[File:Circle-icons-quote.svg|22px|link=Wiktionnaire:Statistiques-cita]]<translate> '''+ [[Wiktionnaire:Statistiques-cita|{{formatnum:3937}}]]''' citations ou exemples en français pour atteindre '''{{formatnum:362472}}'''.</translate>
<!--
<br />
[[File:Circle-icons-speaker.svg|22px|link=Wiktionnaire:Prononciation]]<translate> '''+ [[:Catégorie:Prononciations audio|{{formatnum:5202718}}]]''' prononciations (dont {{formatnum:1381842}} pour le français) pour atteindre, au 27 septembreoctobre, '''{{formatnum:101450104168}}''' prononciations audios pour '''100''' langues (dont '''{{formatnum:2336025202}}''' pour le français).</translate>
-->
<br />
[[File:Circle-icons-camera.svg|22px|link=Aide:Règles d’utilisation des images]]<translate> '''+ [[:Catégorie:Pages à illustrer|{{formatnum:294}}]]''' médias d’illustrations (images et vidéos) dans les articles du Wiktionnaire, pour atteindre '''{{formatnum:39228}}'''. </translate>
<br /><!--
[[Fichier:Treasurchest.svg|22px|link=Wiktionnaire:Thésaurus]] <translate>'''+ [[:Catégorie:Thésaurus par langue|810]]''' thésaurus pour atteindre '''519529 thésaurus dans 55 langues''' dont '''353''' [[:Catégorie:Thésaurus en français|thésaurus en langue française]] ! Les nouveaux thésaurus sont sur l’la [[Thésaurus:osrencontre/français‎|osrencontre]] (par VaulqueNoé, Lyokoï, Cbyd, Jpgibert, Pamputt et Automatik), la [[Thésaurus:surditévache/français‎|surditévache]] (par CbydNoé et DaraDaraDara), l’la [[Thésaurus:exilgrève/français‎|exilgrève en italien]] (par Noé), lela [[Thésaurus:parasitepause/français‎|parasitepause]], lale [[Thésaurus:migrationdimanche/français‎|migrationdimanche]], (parle Noé)[[Thésaurus:peuple/français‎|peuple]], etle [[Thésaurus:éthiqueneuf/français‎|éthiqueneuf]], (parle Psychoslave[[Thésaurus:cube/français‎|cube]], et Noé). Création de la pagele [[ProjetThésaurus:six/français‎|six]], l’[[Thésaurus:érosion/français‎|érosion]] pour(les accueillirsept unepar liste de suggestion de termes qui pourraient donner lieu à la création de nouveaux thésaurusStephane8888).</translate>
-->
<br />
[[File:Circle-icons-typography-ar.svg|22px|link=Wiktionnaire:Liste des langues]]<translate> '''+ [[Wiktionnaire:Statistiques|41]]''' nouvelles langues pour un total de '''{{formatnum:4543}}''' langues : le pongu (+3), le lonwolwol (+2), le pini (+2), le kwang (+1), le koiwat (+1), le mae (+1), le kir-balar (+1), le nonuya (+1), le nyigina (+1), le e’ñepa (+1), le pana (Burkina Faso) (+1), le pa’a (+1), le larike-wakasihu (+1), le phai (+1), le poyanáwa (+1), le quechua de Santiago del Estero (+1), le riang (Inde) (+1), le ritarungo (+1), le sos kundi (+1), le seke (Népal) (+1), le simte (+1), le sokoro (+1), le sepa (Indonésie) (+1), le sengo (+1), le sawknah (+1), le tagdal (+1), le tiranige diga (+1), le taruma (+1), le temiar (+1), le tayart tamajeq (+1), le tilung (+1), le boikin (+1), le telefon (+1), le teluti (+1), le temoq (+1), le temuan (+1), le tasawaq (+1), l’usui (+1), le burui (+1), le chimakum (+1), le yoy (+1)</translate>
<br />
[[File:Circle-icons-bar-chart.svg|22px|link=Wiktionnaire:Liste des langues]]<translate> Les trois langues qui ont le plus avancé après le français sont le [[suédois]] ('''+ {{formatnum:10141}}''' entrées), le [[same du Nord]] ('''+ {{formatnum:2579}}''' entrées) et le [[gallo]] ('''+ {{formatnum:519}}''' entrées).
 
; Consultation et contribution</translate>
[[File:Circle-icons-trends.svg|22px|link=http://frwiktionary.wikiscan.org/]]<translate> Les [<tvar|stat>http://frwiktionary.wikiscan.org/date/201809/pages</> outils de statistiques externes] donnent chaque mois la liste des [<tvar|hits>http://frwiktionary.wikiscan.org/?menu=dates&filter=main&sort=hits&date=201810&list=pages</> pages les plus consultées] et des [<tvar|users>http://frwiktionary.wikiscan.org/?menu=dates&filter=main&sort=users&date=201810&list=pages</> pages modifiées par le plus de personnes].</translate>
Ligne 59 ⟶ 69 :
 
== Consultation ==
 
L’outil d’[https://tools.wmflabs.org/pageviews Analyse des pages vues] permet en quelques clics de savoir combien de personnes lisent chaque numéro des Actualités du Wiktionnaire. Sur les 18 derniers mois, la moyenne est à 286 personnes, contre 616 pour les [[w:Wikipédia:Regards sur l'actualité de la Wikimedia|Regards sur l’actualité de la Wikimedia]]. De belles moyennes pour de la wikipresse qui n’est diffusée que par le bouche à oreille !
</translate>
<div width="60 %">[[Fichier:Consultation par numéro Actualités du Wiktionnaire et RAW avril 2017 à septembre 2018.png|100%|centré|Consultation par numéro des Actualités du Wiktionnaire et du RAW d’avril 2017 à septembre 2018]]</div>
 
<div style="float:right; width: 33%; padding-left: 1em; margin-left: 2em; margin-bottom: 4em; text-align: justify;vertical-align:top; font-size:1em;">
Ligne 99 ⟶ 110 :
 
 
== UnDictionnaire travaildu de botmois ==
En [[Wiktionnaire:Wikidémie/juillet_2014#De_l'usage_des_bots|juillet 2014]], une discussion sur les bots (ou programmes informatiques exécutant des tâches automatisées) avait conduit au développement d’un [[Utilisateur:Pamputt/articles sans intervention humaine|programme]] permettant d’identifier tous les articles faits avec l’aide d'un ou plusieurs robots sans relecture ultérieure. À l’époque, 185 454 articles avaient cette caractéristique.
 
; Le dictionnaire de Google ?
Pour obtenir ce chiffre le programme analyse le fichier d’historique du Wiktionnaire (toutes les versions des différentes pages) qui pèse plus de 50 Gio. Il recherche plus spécifiquement le nom des contributeurs de chaque version. Si le nom de l’utilisateur contient « bot » ou « Bot » alors le programme considère que le contributeur est un bot. Si la page n’a été modifiée que par des comptes de bots alors elle est ajoutée à la liste.
 
Une nouvelle analyse sur les données du Wiktionnaire publiée au début du mois d’octobre 2018 donne un total de 170 389 articles (la liste complète est disponible [[Utilisateur:Pamputt/articles sans intervention humaine|ici]], [[Utilisateur:Pamputt/articles sans intervention humaine 2|2]], [[Utilisateur:Pamputt/articles sans intervention humaine 3|3]], [[Utilisateur:Pamputt/articles sans intervention humaine 4|4]]), soit un peu plus de 15 000 articles qui ont depuis, été modifiés par au moins un compte « humain ».
 
[[Utilisateur:PamputtBot/cree par PiedBot.cpp|Par la suite]], des bandeaux ont été ajoutés sur les articles créés par {{u-|PiedBot}} (un bot qui a importé beaucoup de contenu, dans différentes langues, en 2006 mais aussi pas mal d’erreurs) et qui n’ont été modifiés ensuite que par des bots afin d’inviter les contributeurs à relire et « valider » ces articles. Tous les articles en attente de relecture sont classés par langue dans la catégorie [[:Catégorie:Pages à vérifier car créées automatiquement|Pages à vérifier car créées automatiquement]].
 
== Dictionnaire du mois ==
 
Avez-vous déjà recherché une définition dans le moteur de recherche Google ? Vous aurez parfois le plaisir de voir un extrait de la définition donnée dans le Wiktionnaire, parfois un extrait de Wikipédia et parfois des ''Extraits optimisés par Google''. Mais d’où viennent-ils ? À l’occasion du colloque universitaire ''Dictionnaires et culture numérique dans l’espace francophone'', Nathalie Gasiglia, de l’Université de Lille 3, a présenté sa recherche afin de découvrir d’où venaient ces informations. Pour cela, elle a tenté d’identifier la structure des entrées, la façon dont étaient données les informations grammaticales et sur l’usage des mots. L’usage des listes numérotées et des listes à point n’est pas uniforme et on sent qu’une simplification a été faite depuis le matériaux d’origine. Sa recherche l’a amenée à identifier l’origine comme étant le dictionnaire ''Dixel'' édité par Le Robert. Cependant, certaines listes de synonymes proviendrait plutôt du ''Robert illustré'' coédité avec Diagonal.
;
 
Ces deux ouvrages sont repris mais la numérotation en chiffre romain est gommée, ce qui entraîne des décalages bizarres dans les numérotations et la source n’en est mentionnée nulle part. Ces informations ne font donc pas une très bonne publicité pour un ouvrage dont la consultation en ligne est payante. Situation curieuse donc que celle d’un maison d’édition qui permet à une entreprise de diffuser secrètement au grand public une information qui est par ailleurs vendue. On imagine que l’accord commercial entre les deux entreprises est suffisamment attrayant pour que les éditions [[w:Dictionnaires Le Robert|Dictionnaires Le Robert]] s’y retrouvent. </translate><span style="float:right"><translate>— une chronique par [[Utilisateur:Noé|Noé]]</translate></span>
</translate><br /> <span style="float:right;"><translate>— une chronique par …</translate></span>
 
<!--