Discussion Wiktionnaire:Transferts/Dico FJ

Dernier commentaire : il y a 16 ans par Ftiercel dans le sujet Dictionnaire français-japonais sur le wiktionaire

Dictionnaire français-japonais sur le wiktionaire modifier

dico.fj.free.fr a réalisé un dictionnaire français-japonais qui serait librement utilisable et qui contiendrait 15 000 entrées (le wiktionaire japonais en compte 19 639). Le projet est téléchargeable et semble intéressant à importer sur le wiktionaire. Il y a 4 types d'ajout possible :

  • Rajouter des traductions à des articles de mot français sur le wiktio français (ça va encore)
  • Ajouter des articles de mots japonais sur le wiktio français (quand il n'existe pas encore, ça va, sinon, c'est déjà plus dur)
  • Ajouter des articles de mots japonais contenant la traduction française sur le wiktio japonais (là, ça nécessite une excellente coordination avec nos homologues japonais)
  • Ajouter des articles de mots français sur le wiktio japonais.

Je pense que ce sont les deux premiers qui sont les plus faciles à envisager.

Ce que je peux apporter :

  • J'ai déjà réalisé plusieurs ajouts automatiques sur le wiktionaire en python.
  • J'ai étudié le japonais pendant un an et demi. C'est très peu mais ça aide à comprendre ce que l'on fait.

Il y a-t-il des gens qui ont d'avantage de connaissance en japonais ? Il y a-t-il des gens pour contribuer à l'importation automatique ?

NB : le projet est basé sur un projet de dictionnaire en anglais et un dictionnaire allemand. Ceci peut aussi être intéressant. Ftiercel 25 septembre 2007 à 20:30 (UTC)Répondre

Je veux bien apporter mon aide, mais je ne pense pas avoir un meilleur niveau en japonais que toi. Duarna 28 septembre 2007 à 11:20 (UTC)Répondre
Bon, pour ma part, j'ai regardé le contenu du dictionnaire version ASCII. Je vais me renseigner auprès du projet pour savoir comment lire le contenu au mieux. Ftiercel 29 septembre 2007 à 09:48 (UTC)Répondre
J'ai pris contact avec la communauté du projet. Le fichier le plus adéquate pour l'import semble être celui-ci. Il est en unicode. Son format est décrit ici. Comme on peut constater, le japonais est la langue pivot : il n'y a que le japonais en langue de départ et le français est toujours en langue d'arrivée. Il semble beaucoup plus facile de commencer par les articles japonais que des traductions de mots français. Ensuite, le plus facile est peut-être de d'abord créer les articles nouveaux et d'ensuite fusionner les articles qui existaient déjà. (à voir)
Les définitions contiennent des marquages décrits ici. Je pense que le premier travail consistera à faire correspondre ces marquages avec les titres (nom commun, verbe...) présent sur le wiktionaire.
Il y a deux façons de procéder :
* Créer un bot capable de prendre en entrée n'importe quelle ligne du fichier et de générer le code de l'article automatiquement.
inconvénient : le bot doit être assez intelligent pour comprendre n'importe quelle ligne
* Créer un bot par type de mot comme décrit ici et transférer ainsi le contenu du fichier type par type.
inconvénient : nécéssité de maintenir une liste précise de l'état de chaque entrée (fusionné/pas fusionné, créé/pas créé)

Pour ma part, je proposerais de créer une page dédiée à ce transfert (ex. Wiktionnaire:Importation de dico fj). Je pense que ça sera nécessaire. Ftiercel 30 septembre 2007 à 07:52 (UTC)Répondre
Merci pour ton message Ftiercel, si vous caler ou si vous avez besoin d'aider faites signe. Pour l'instant, j'ai suffisamment de travailler avec les articles français. LBO disc 30 septembre 2007 à 11:10 (UTC)Répondre
Quelqu’un travaille-t-il encore à cet import? LBO disc 10 décembre 2007 à 19:50 (UTC)Répondre
Je crois que non. Duarna 11 décembre 2007 à 15:14 (UTC)Répondre
Actuellement, je suis pris par d'autres tâches plus longues que prévues. Ftiercel 1 janvier 2008 à 20:19 (UTC)Répondre
Je viens de voir le nombre d'articles japonais sur le wiktionaire et je vois qu'il y en a à peu près autant que pour l'import. Cet import ne semble pas si intérressant que ça. Pour ma part, je ne vais pas y participer. Ftiercel 18 janvier 2008 à 05:24 (UTC)Répondre
Tu considère qu'il y a 16 487 articles japonais ? Pour ma part je considère qu'il faut enlever les ébauches (principalement des kanjis sans définition) 12 868 pages ce qui fait donc 3 619 vrais articles contre 17 591 dans le fichier que tu voulais importer. À l'occasion de cette import, je pensais aussi qu'il aurait été intéressant d'ajouter avec un bot les homophones, réorganiser les modèles. Duarna 18 janvier 2008 à 11:59 (UTC)Répondre
OK. Pour l'instant, je suis toujours sur un projet précédent. Je devrais finir dans une semaine. Ftiercel 19 janvier 2008 à 05:51 (UTC)Répondre
Retour à la page du projet « Transferts/Dico FJ ».