Discussion Wiktionnaire:Statistiques/Archive 2006

Dernier commentaire : il y a 17 ans par Lmaltier dans le sujet Pourcentage

Il pourrait être intéressant de connaitre aussi le nombre d'article qui possèdent une image illustrative ou une prononciation sonore (ou juste API). - Dakdada (discuter) 16 décembre 2005 à 12:08 (UTC)Répondre

Arg pour API ça aurait été plus facile sans la ligne *{{API}} : // vide ---moyogo 16 décembre 2005 à 12:58 (UTC)Répondre
pour API, j'ai déjà une expression régulière, je crois qu'en gros, il suffit de matcher /\* *\{\{API\}\} *: *\/.+\// . Euh, de mémoire, maintenant, il faut vérifier que ça marche hein ;-)

Caractères modifier

Est-ce qu'on inclu aussi les {{-car-}} dans les stats ? J'ai l'impression qu'ils n'y sont pas actuellement. Aussi, faut-il renommer -car- en =car= ? --Utilisateur:Kipmaster 16 décembre 2005 à 13:15 (UTC)Répondre

« car » est le code d'une langue du Venezuela. ---moyogo 16 décembre 2005 à 13:17 (UTC)Répondre
Zuteuh ! --Utilisateur:Kipmaster 16 décembre 2005 à 13:25 (UTC)Répondre

Stats wiki par wiki modifier

Je propose de mettre à jour régulièrement les statistiques wiki par wiki, comme par exemple tous les 1ers du mois comme aujourd'hui. Kwak, le 2006-02-01 @625

En fait, on met à jour les statistiques dès qu'on peut, c'est-à-dire à chaque fois qu'un nouveau dump est disponible. Le dernier dump disponible était celui du 13 décembre jusqu'à hier (31 janvier, nouveau dump !), on devrait donc pouvoir calculer enfin des nouvelle stats Kipmaster 1 février 2006 à 14:13 (UTC)Répondre
Ces statistiques ne semblent pas correspondre au 31 janvier. Par exemple, Madagasikara existe depuis le 2 janvier, et pourtant le malgache est encore indiqué comme langue orpheline. Ou alors, y a-t-il un autre problème ? Lmaltier 18 février 2006 à 16:40 (UTC)Répondre

Stats...nom,verbe... modifier

Je me demandais seulement d'où venaient les chiffres pour les statistiques des colonnes de noms, verbes, adv, etc. Et pourquoi lorsque l'on additionne tout ces chiffres on arrive à 60 000 définitions tandis qu'il existe 180 000 définitions dans le wikitionnaire au complet.  LINCHER  (PSSST)  6 mars 2006 à 01:34 (UTC)Répondre

Je pense que tu as oublié d'aditionner les 90 000 noms communs ;-). Par contre, on reste toujours en dessous des 180 000 alors qu'on devrait dépasser ce chiffre. Il manque les locutions peut-être ? Kipmaster 6 mars 2006 à 08:18 (UTC)Répondre
En fait, je crois que bcp de gens ont ajoutés des articles sans y ajouter de catégorie et puisque la page Special:Uncategorizedpages est rempli de sinogramme non-catégorisé, on remarque que c'est ce qui se passe. En plus, le « cutoff » de cette page spéciale est de 400 seulement alors pour faire le ménage dans cette page c'est pas long et dieu sait qu'il doit y en avoir plus que 400 articles non-catégorisés.  LINCHER  (PSSST)  6 mars 2006 à 18:01 (UTC)Répondre
Un petit compte dans le dernier dump me donne : 3060 articles sans catégories. Voir Utilisateur:Darkdadaah/Pages sans catégorie pour ces pages. - Dakdada (discuter) 6 mars 2006 à 18:18 (UTC)Répondre

Problèmes dans les stats modifier

Je vois deux problèmes :

  • problème d'ordre : par exemple, l'espéranto devrait être mieux placé. Ce classement est-il fait automatiquement.
  • problème de chiffres : par exemple, le polonais est mentionné pour un seul article, alors qu'il y en a en réalité beaucoup.

Il serait bien de voir d'où ça vient... Lmaltier 15 avril 2006 à 13:33 (UTC)Répondre

Le polonais apparait en double en fait... Kipmaster 15 avril 2006 à 14:12 (UTC)Répondre
les langues sont classées par taille du contenu et non par nombre d'articles. Pour des raisons basement techniques la somme de la taille des deux périodes comparées est prises en compte. Ainsi l'hébreu est surclassé du fait que les articles comprennent beaucoup de ref et l'esperanto est sous classé du fait de la concision des articles.
Lorsqu'il apparait qu'une langue est présente deux fois, cela signifie en général qu'il y a deux codes de langues actifs. C'est ainsi le cas actuellement pour {{kin}} et {{rw}} qui se transforme en kinyarwanda et kinyarwanda. Cela peut être dû à une erreur ou à une recodification du code langue. LBO disc 22 mai 2006 à 08:10 (UTC)Répondre

Pourcentage modifier

Je pense qu'il serait intéressant de savoir quelle proportion (en pourcents) des articles les langues occupent. C'est possible de le faire au prochaines statistiques ? :-) (un petit résumé en début ou en fin de tableau suffirait) - Dakdada (discuter) 7 juillet 2006 à 19:46 (UTC)Répondre

Oui, ça serait bien, pour avoir une idée sans faire le calcul. Lmaltier 22 juillet 2006 à 16:38 (UTC)Répondre

les proportions en nombre d'article ou en nombre d'octet ? Kipmaster 23 décembre 2006 à 15:29 (UTC)Répondre
Hum les deux je pense :) - Dakdada (discuter) 23 décembre 2006 à 16:02 (UTC)Répondre
C'est certainement possible. On peut aussi envisager une refonte complète des stats. Cela fait plus d'un an que la structue n'a pas changé. LBO disc 23 décembre 2006 à 16:42 (UTC)Répondre
On pourrait en profiter pour ajouter un classement alphabétique par langue (pour que ceux qui s'intéressent à une langue puissent savoir facilement dans quelle mesure le Wiktionnaire a déjà traité cette langue). Lmaltier 23 décembre 2006 à 16:59 (UTC)Répondre

Codes langues modifier

J'ai changé le code div en code dv (code ISO en 2 lettres). On peut aussi rajouter le code pag (pangasinan). Lmaltier 22 juillet 2006 à 16:37 (UTC)Répondre

Niçois modifier

Le Niçois manque à votre liste. Vousavez le ligure, le piémontais, le catalan, le maltais, je pense donc que le niçois, qui est une langue d'oc à part entière a sa place sur cette liste. - (IP)

Ne figurent dans les statistiques que les langues qui ont des mots décrits dans le Wiktionnaire... Par ailleurs, contrairement au ligure, au piémontais, etc., le niçois n'a pas de code attribué par l'ISO (parce que considéré comme faisant partie de l'occitan). Ceci dit, cela ne me choquerait pas, personnellement, de créer un code du style oc-nic pour le niçois, mais il faut d'abord vérifier si les mots occitans déjà créés forment une catégorie cohérent : Catégorie:occitan. Peut-être y a-t-il des mots spécifiquement niçois parmi eux ? Lmaltier 22 décembre 2006 à 18:22 (UTC)Répondre
Retour à la page du projet « Statistiques/Archive 2006 ».