Convention:arabe/Translittération

Avertissement : La translittération est une facilité pour ceux qui ne lisent pas l'arabe, ou pour la rédaction des articles du Wiktionnaire. Si vous pratiquez ou étudiez l'arabe, il est préférable de le faire avec l'alphabet arabe : ceux qui tentent d’apprendre l’arabe sur une base translittérée échouent généralement, parce qu'ils auront une pratique insuffisante de la lecture et de l'écriture. Cet apprentissage est d'autant plus facile et nécessaire que l'écriture arabe est phonétique (contrairement au français ou à l'anglais). Bon, « presque » phonétique, mais les quelques irrégularités (alef muet, lettres solaires, etc.) sont entièrement régulières.

Pour la prononciation de l'arabe standard, voir Annexe:Prononciation/arabe.

Remarques sur la translittération

modifier
Bien des systèmes ont été inventés par les Européens pour reproduire la prononciation et l'orthographe arabe. Il en est de plus compliqués que l'alphabet lui-même, et surtout beaucoup moins exacts. Sans entrer ici dans aucun détail à cet égard, nous dirons qu'à cause de l'impossibilité de représenter aux yeux des sons que l'oreille n'a pas encore retenus, le moins défectueux de tous les systèmes, et par conséquent celui qui doit être préféré, c'est le plus simple, qui reproduit autant que possible la prononciation, tout en conservant si on le veut toutes les particularités de l'orthographe et les traces de l'étymologie.
Le système adopté par la Commission scientifique de l'Algérie remplit ces conditions, et l'on peut l'appliquer pour l'impression dans tous les pays. Nous l'emploierons dans cet ouvrage. Il repose sur ce principe :
  • Les caractères arabes ont, pour la plupart, des équivalents ou des analogies en français.
  • Quand un caractère arabe a un équivalent exact en français, on le représente par cet équivalent ;
  • Quand il n'a qu'un analogue plus ou moins éloigné, on le représente par cet analogue accompagné d'un point, d'un accent, d'une marque quelconque, en se conformant, pour les ouvrages imprimés, aux ressources typographiques de la localité.
  • Quand il n'a ni analogue ni équivalent, on le représente conventionnellement comme on peut. C'est ainsi qu'on a rendu خ par kh et ع par '.
Cet accent, cette marque, n'a pas la prétention de fixer une prononciation que dans toutes les langues les caractères ne retracent que par convention : il a pour but de prévenir le lecteur que la lettre française qu'il accompagne n'a pas exactement en arabe sa propre valeur, et qu'elle indique une articulation seulement analogue, mais non rigoureusement équivalente à la prononciation française représentée.
C'est au lecteur à apprendre par l'oreille la valeur réelle de la représentation du caractère arabe, ou mieux du caractère arabe lui-même, comme il a appris dans son enfance la valeur, pour les Français, des lettres A B C D, etc.
Bresnier - 1855 - Cours d'arabe, p. 21.

Conventions du Wiktionnaire pour la transcription de l'arabe

modifier

Les conventions suivantes sont destinées à faciliter la saisie des textes arabes sur des claviers latin. Ce sont les conventions utilisées dans les modèles manipulant les schèmes, racines et mots arabes.

  • Une consonne arabe ou une voyelle sera translittérée par une lettre unique de l'alphabet latin courant, ce qui permet ensuite de translittérer sans ambiguïté vers un système alternatif au choix.
  • Les consonnes dont la prononciation est raisonnablement similaire à une consonne française sont transcrites par la minuscule correspondante. Dans le cas contraire, la lettre est transcrite par une majuscule « proche » (d'une manière ou d'une autre) de l'arabe.
  • Pour les entrées du Wiktionnaire, l'écriture de référence comprend les diacritiques.

Cette convention de transcription est propre au Wiktionnaire. La présente description est publiée sous les termes de la licence Creative Commons attribution partage à l’identique 3.0. La convention proprement dite est librement réutilisable.

Consonnes

modifier
ا (_'_), ا (_A_),
ب (_b_), ت (_t_), ث (_F_),
ج (_j_), ح (_H_), خ (_X_),
د (_d_), ذ (_V_), ر (_r_), ز (_z_),
س (_s_), ش (_C_),
ص (_S_), ض (_D_), ط (_T_), ظ (_Z_),
ع (_3_), غ (_R_),
ف (_f_), ق (_q_),
ك (_k_), ل (_l_), م (_m_), ن (_n_),
ه (_h_),
و (_w_), ي (_y_).
  • Le ta marbûta final est noté @ (at) : خَلِفَة (Xalif@).
  • La lettre de prolongation finale ى est conventionnellement notée é : زَوَى (zawé) (et produit un « i sans point » dans le corps des mots)
  • Le Lam-alif est géré automatiquement par la fonte : لَا ()
Lettres additionnelles

Voyelles et diacritiques

modifier
  • Les voyelles brèves sont transcrites par a (e dans le الـ (el-) préfixe), i et u ; les voyelles longues par â, î et û.
  • Le alif long diacritique est transcrit E : بِسْمِ اللّٰهِ (bismi ellEhi)
  • sukûn (سُكُون, absence de voyelle) et Šadda (شَدَّة, dédoublement de la consonne) ne sont pas transcrits (ils se déduisent directement de la translittération). La Sadda peut être cependant notée lorsque c'est nécessaire dans les modèles de schèmes : شَدَّة (Cad²@)
  • La hamza instable initiale, implicite par la présence d'une voyelle, est omise (dans les cas où elle n'est pas une consonne radicale) : إِبْن (ibn_)
  • La hamza est normalement transcrite par une apostrophe droite ا (_'_), indépendamment de sa prise en charge.
  • Le tanwîn est noté par un tilde (représentant le n) sur la voyelle : رَجُلًا (rajulã), رَجُلٍ (rajulĩ), رَجُلٌ (rajulũ).
Note : un tanwîn sur un ى se note donc par deux voyelles : مَأْتًى ( ma'tãé).
Note: les modèles s'attendent à ce que les mots finissent par une voyelle, et inséreront un sukûn dans le cas contraire : كِتَابْ (kitâb) Pour expliciter que la terminaison est indifférente, il faut la marquer par un blanc souligné : كِتَاب (kitâb_)

Forçages conventionnels

modifier
Ces forçages ne sont pas à proprement parler des translittérations, mais permettent de gérer finement certaines variantes orthographiques :
Note La « translittération » n'ayant souvent aucun intérêt dans ce cas, il est préférable d'utiliser les modèles {{ar-mo}} ou {{ar-ab}}, qui ne la reproduisent pas dans le corps de la page.
  • La hamza est normalement représentée par une apostrophe droite _'_, le modèle gérant le support nécessaire en fonction du contexte.
Pour forcer une hamza particulière, on peut utiliser les voyelles avec accent grave : أ (_à_), إ (_è_), ئ (_ì_), ٔ (_ò_), ؤ (_ù_) et ء (_`_).
بَدْءٌ ( bad'ũ ), بَدْؤٌ ( badùũ ), بَدْئٌ ( badìũ ), بِدْءَةٌ ( bid`@ũ )
  • Noter la construction بِـٔـبِ (bi-ò-bi) pour insérer une hamza suscrite.
  • Pour les variantes d'écriture, le « i support de hamza sans point » correspond à « i sans points », donc un codage de type ـىـ (-_é-).
  • Par convention, les « squelettes » avec hamza font l'objet d'une entrée équivalente sans hmza. Exemple : إستئذان (èstìVAn), استىذان (AstéVAn)
  • Squelettes, sukûn, et blanc souligné:
Les sukûn (absence de voyelle) et chadda sont gérés automatiquement dans presque tous les cas. Il est parfois nécessaire de les préciser explicitement, par exemple dans أَلْـ (al°-). Le redoublement ـّ () est plutôt destiné aux modèles de schèmes. Pour une translittération plus naturelle, il est recommandé de redoubler simplement la consonne quand le mot est donné explicitement (exemple, كَتَّبَ (kattaba) plutôt que كَتَّبَ (kat²aba)).
Si la translittération ne comprend aucune voyelle ni sukûn, le mot est considéré comme un "squelette" : مكتوب (mktUb). Il est interprété comme sans diacritique et translittéré en conséquence.
Dans le cas contraire, l'absence de voyelle est interprétée comme un sukûn (comparer كتب (ktb) et كُتْبْ (kutb)).
Pour éviter l'insertion de sukun dans un mot partiellement vocalisé, il faut faire suivre les consonnes non vocalisées par un blanc souligné : كُتب (kut_b_). Un blanc souligné n'est pas transcrit : كتب (k_t_b_) mais il neutralise de facto les recherches d'absence de voyelle ou de redoublement de consonne : سُككُن (suk_kun_)
On peut forcer une prolongation de voyelle sans diacritique par la majuscule correspondante : كاتب (kAt_b_), كتيب (k_tIb_).
De même, un blanc souligné permet de « casser » une confusion possible avec un préfixe : voir par exemple بِئْرٌ (b_i'rũ) par opposition à un بِئْرٌ (bi'rũ).
  • L'article est noté conventionnellement el, pour permettre la gestion correcte de la shadda sur les lettres solaires (et supprimer le diacritique) : comparer الشَّمْسُ (elCamsu) contre أَلْشَمْسُ (alCamsu) ou أَلْ شَمْسُ (al Camsu). Il en est de même pour les particules d'une lettre préfixées. S'il y a plusieurs particules, il faut séparer le el des précédentes particules par un blanc souligné pour que le mécanisme fonctionne correctement : بِالإِنْغْلِيزِيَّة (bi_el'inglîziyy@).
Il reste possible de gérer finement l'écriture par des codifications de type أَلشَّمْسُ (al_C²amsu) ou encore الشَّمْسُ (Al_C²amsu)
  • Un (ou plusieurs) tiret permet de prolonger une liaison inter-lettre : كِـــتـــَابٌ (ki---t---âbũ)
  • Le alif peut être produit spécifiquement sous forme de alif wasla ٱ (^) (pour des liaisons neutralisant la hamza instable) ou de alif madda آ (~) (mais ce cas est normalement géré automatiquement).

Récapitulatif du transcodage

modifier
abcdefghijklm
ـَــبــشــدــاــفــغــهــِــجــكــلــمـ
nopqrstuvwxyz
ـنــــپــقــرــســتــُــڤــوــخــيــزـ
ABCDEFGHIJKLM
ـاــڥــشــضــٰــثــــحــيــچــخـــــ
NOPQRSTUVWXYZ
ـــــــــغــصــطــوــذــوــخــيــظـ
ũãĩ^~'èàùì`°²
ـٌــًاــٍــٱــآــءــإــأــؤــئــءــْــّـ

Références

modifier

Discussions collectives :

Voir aussi

modifier