Wiktionnaire:Prise de décision/Traitement lexicographique
Le développement public de cette prise de décision a été abandonné au profit d'un projet plus vaste et personnel. Cette page restera donc une esquisse expérimentale. Pour de plus amples informations sur l'état actuel du projet, veuillez me contacter par message privé.
Avant-propos
modifierProlégomènes
modifierLa mise en place d'un tel dictionnaire nécessite un appareil linguistique puissant. Cet appareil est nécessaire pour la mise en place du traitement lexicographique, mais n'a pas besoin d'être maitrisé par les contributeurs.
La linguistique est une discipline qui ne présente aucune cohérence épistémologique. Nous avons donc choisi de refonder la terminologie.
Problématique
modifierComment réguler le dictionnaire ? Comment concilier expertise et pédagogie ?
Les principes fondateurs
modifierLa terminologie
modifierPrésentation
modifierLa terminologie est l'étude des termes utilisés dans une discipline.
Par extension, la terminologie est le résultat de cette étude : c'est l'ensemble des termes d'une discipline.
Le terminologie est épistémologiquement essentielle à l'étude : c'est l'outil — le langage — qui permet de décrire son objet. La linguistique est ainsi une discipline toute particulière, puisque son objet d'étude est également son outil. On parlera alors de métalangage, c'est-à-dire une langue — la métalangue, ici la terminologie linguistique — qui décrit le langage. Par cette particularité dont le linguiste ne peut se défaire, la terminologie linguistique doit davantage être pointue.
Problèmes
modifier- L'absence de terminologie entretient la confusion et l'incompréhension.
- La terminologie en linguistique ne fait l'objet d'aucun consensus.
Discussions
modifierSolutions
modifier- Refonder et clarifier la terminologie linguistique.
- Créer une marque d'usage « Terme adopté par Wiktionnaire » : (Wiktionnaire).
- Rassembler ces termes en un glossaire « Terminologie du Wiktionnaire ».
Les unités linguistiques
modifierLe glosse
modifier|glosse|
= /phone/
∧ [sème]
∧ <>taxe<>
.
Terminologie
modifierDe |γλῶσσα|
= \glossa\
∧ [langue]
, et par apocope, de |glossème|
.
Les termes suivants ont été rejetés :
- Le monème porte à confusion avec le glossème
|mono-|
=[singulier]
. - Le morphème porte à confusion avec son morphe qui renvoie au signifiant et son sème qui renvoie au signe.
- Le mot est polysémique.
- Le nom est réservé au paradigme nominal.
- Le rhème est réservé au prédicat informationnel.
- Le signe est bipartite (signifiant et signifié), alors que le glosse est au moins tripartite (morphe, sème et taxe) ; nous le laisserons à la sémiologie.
Les méroglosses
modifierLe morphe
modifierLe phone
modifierLe graphe
modifierLe sème
modifierLe taxe
modifierL'endotaxe
modifierL'exotaxe
modifierLe glossème
modifierLe glossome
modifierLe glotte
modifierRéférences
modifier- Sylvain Kahane, « Les unités minimales de la syntaxe et de la sémantique : le cas du français », dans Congrès Mondial de Linguistique Française, no 219, page 20 [résumé] [texte intégral] [texte intégral]
Les catégories linguistiques
modifierLes catégories lexicales
modifierLe nom
modifierL'adjectif
modifierLe verbe
modifierProlégomènes
modifierLe verbe est très souvent prédicatif, c'est-à-dire qu'il est l'élément de la phrase qui ne porte aucune fonction syntaxique, et qui, par conséquent, régit tous les autres éléments de la phrase. Ainsi, on classe les verbes en fonction de ces subordonnés. On distinguera les aspects syntaxique et sémantique : la forme et le sens. Les rapports conceptuels entre les unités linguistiques sont les rôles sémantiques. Les procédés formels utilisés pour marquer ces rôles sémantiques sont les fonctions syntaxiques. On classe ainsi les verbes selon ces deux aspects : rôles sémantiques et fonctions syntaxiques.
Nous éviterons le terme complément dont la polysémie entache la clarté épistémologique.
Types de relations formelles :
- Dépendance e (A <— B) : L'existence de A n'implique pas l'existence de B, et l'existence de B implique l'existence de A.
- Interdépendance e (A <—> B) : L'existence de A implique l'existence de B, et l'existence de B implique l'existence de A.
- Indépendance e (A — B) : L'existence de A n'implique pas l'existence de B, et l'existence de B n'implique pas l'existence de A.
Cette dépendance peut être formelle ou conceptuelle, autrement dit syntaxique ou sémantique.
Dans le cas de la dépendance, nous appellerons A le supérieur e de B, et B l'inférieur e de A.
Nous appellerons argument tout inférieur syntaxique. L'argument (Arg.) n'a pas de besoin sémantique, il peut être tautologique — Jouons à un jeu ! — voire dénué de sens — Il pleut. L'argument est une contrainte formelle relative à la langue.
Nous classerons donc les verbes en fonction de leur structure argumentale. En français, le modèle syntaxique maximal de la phrase verbale se présente ainsi : Arg.1 + Verbe + Arg.2 + Arg.3 + Arg.4.
- Sujet (Suj.) : Nm
- Objet (Obj.) : Nm
- Adjet (Adj.) : Prép. + Nm
- Attribut (Atb.) : Aj
- Locatif (Loc.) : Prép. + Nm
La présence ou non du complément circonstanciel n'altère pas le rapport entre le verbe et ses arguments. Alors que la suppression ou l'insertion d'un complément sélectionné, hors emploi elliptique, modifie le sens du verbe.
Présentation
modifierProblèmes
modifier- Les verbes sont classés par leur emploi canonique.
- Les verbes attributifs ne sont pas reconnus.
- Les verbes pronominaux sont dégroupés.
Solutions
modifier- Traitement des verbes en fonction de la valence de chacun de leurs emplois :
- Intransitif — le verbe régit un seul argument : un sujet.
- Paul dort.
- Transitif — le verbe régit plusieurs arguments : un sujet et au moins un complément.
- Transitif direct — le verbe régit deux arguments : un sujet et un complément direct e.
- Paul mange une pomme.
- Transitif indirect — le verbe régit deux arguments : un sujet et un complément indirect e.
- Paul parle à Marie.
- Bitransitif — le verbe régit trois arguments : un sujet et deux compléments.
- Paul parle de football à Marie.
- Tritransitif — le verbe régit quatre arguments : un sujet et trois compléments.
- Paul a échangé son vélo contre une montre avec Marie.
- Attributif — le verbe régit au moins un attribut.
- Attributif direct — le verbe régit deux arguments : un sujet et un attribut du sujet.
- Mairie est jolie.
- Attributif indirect — le verbe régit trois arguments : un sujet, un complément et un attribut du complément.
- Paul trouve Marie jolie.
- Pronominal — le verbe régit au moins un pronom réfléchi.
- Paul se lave.
- Impersonnel :
Notes
modifier- La dépendance est appelée expansion chez Martinet.
- L'interdépendance est appelée relation actualisateur-prédicat chez Martinet.
- L'indépendance est appelée coprésence chez Martinet.
- Le supérieur est appelé régisseur chez Tesnière.
- L'inférieur est appelé subordonné chez Tesnière.
- Le complément direct du verbe est un complément relié au verbe sans préposition.
- Le complément indirect du verbe est un complément relié au verbe avec préposition.
L'adverbe
modifierLes catégories pro-lexicales
modifierLes pro-noms
modifierLes pro-adjectifs
modifierLes pro-verbes
modifierLes pro-adverbes
modifierLes catégories grammaticales
modifierLes catégories énonciatives
modifierLa macrostructure
modifierProlégomènes
modifierNous appellerons macrostructure l'organisation en articles des unités linguistiques.
Présentation
modifierLa macrostructure est à proprement parler le traitement lexicographique. C'est la méthodologie d'un dictionnaire. Elle repose sur un ensemble de choix épistémologiques qui se traduisent par des règles d'application. Tout d'abord, le dictionnaire choisit sa visée : linguistique, encyclopédique, générale, spécialisée, écrite, orale, monolingue, bilingue, etc. Cette visée oriente le lexicographe vers un corpus. En fonction de cet objectif, le dictionnaire choisira d'inclure certaines unités linguistiques et d'en exclure d'autres. Le dictionnaire choisit également les types d'unités linguistiques à indexer : mot, locution, expression, flexions, affixes, cooccurrences, etc. Une fois que les critères d'admissibilité sont clairement définis, le lexicographe obtient une liste d'unités linguistiques à traiter. Il les regroupe ensuite par lemmes. Et enfin, il établit la façon dont ils seront indexés dans le dictionnaire.
L'admission des glosses
modifierQuelles unités linguistiques ?
Prolégomènes
modifierLes glosses sont classés par morphes. Autrement dit, le traitement lexicographique adopté consiste à donner toutes les informations linguistiques d'une forme. Nous appellerons article ce développement lexicographique. Nous appellerons entrée le titre de cet article. Nous appellerons nomenclature l'ensemble des entrées.
Présentation
modifierQuels sont les critères qui permettent d'admettre un glosse dans le Wiktionnaire ?
La compositionnalité
modifierL'attestabilité
modifierLa prédictibilité
modifierLa lemmatisation des glosses
modifierVariabilité morphique, sémique et taxique. Regroupement d'unités linguistiques.
L'indexation des glosses
modifierQuel classement ? Comment indexer les dérivés, locutions, etc. ? Dégroupement ou regroupement ?
Références
modifier- Injoo Choi-Jonin, Corinne Delhay, Introduction à la méthodologie en linguistique : Application au français contemporain, Presses Universitaires de Strasbourg, Strasbourg, 1998, 312 pages, ISBN 2-86820-003-6
La microstructure
modifierLa structure des articles n'est pas adéquate à la réalité linguistique.
Prolégomènes
modifierNous appellerons microstructure l'organisation interne d'un article.
L'étymologie
modifierPrésentation
modifierL'étymologie étudie l'origine des mots en suivant leur évolution. C'est en quelque sorte l'Histoire des mots. La perspective est donc diachronique. En retraçant la filiation d'un mot, on cherche sa forme la plus ancienne : l'étymon. Au fil de l'évolution, un mot peut perdre toute homologie de forme et de sens avec son étymon. Par exemple, l'étymon de chèvre est capra : les deux mots n'ont plus aucun phonème en commun.
Par extension, l'étymologie est le résultat de cette étude : c'est la filiation d'un mot.
Pertinence
modifierL'étymon du mot étymologie, ἐτυμολογία (etymología), signifie « recherche du vrai ». L'étymologie sert ainsi en tout premier lieu à retrouver le véritable sens des mots.
Problèmes
modifier- La présentation n'est pas uniforme.
- L'étymologie est propre à chaque glossome. Or, dans la structure des articles, l'étymologie n'est hiérarchiquement pas inférieure à chaque glossome, mais égale au morphe. Exemple : botte.
Solutions
modifier- Établir un prototype.
- Subordonner l'étymologie à chaque mot.
La morphologie
modifierPrésentation
modifierLa morphologie étudie la structure interne des mots. La perspective est donc synchronique.
Par extension, la morphologie est le résultat de cette étude : c'est la construction d'un mot.
Exemple : anticonstitutionnellement, fleuriste.
Confusion entre le lemme et sa forme : être = forme de l'infinitif.
Pertinence
modifier- Permet de générer automatiquement les dérivés.
Problèmes
modifier- La morphologie est souvent confondue avec l'étymologie.
Solutions
modifier- Intégration d'une section Morphologie hiérarchiquement inférieure à chaque mot.
- Spécification des définitions hyperonymiques :
{{dh}}
.
Les emplois
modifierPrésentation
modifierProblèmes
modifier- Les verbes pronominaux sont dégroupés.
Solutions
modifier- Création d'une section intermédiaire Emplois.
Références
modifier- Injoo Choi-Jonin, Corinne Delhay, Introduction à la méthodologie en linguistique : Application au français contemporain, Presses Universitaires de Strasbourg, Strasbourg, 1998, 316 pages, ISBN 2-86820-003-6
Résolution
modifierGlossaire
modifierA
- Allo- : Variante libre d'un glosse.
- Allographèmes : Graphèmes ayant les mêmes fonctions d'U.M.D.
- Dans
|paraitre|
,\(i)\
et\(î)\
ont les mêmes fonctions linguistiques :\paraitre\
et\paraître\
. Ce sont donc des allographèmes.
- Dans
- Allographes : Glossèmes paragraphiques, homosémiques et homotaxiques.
|poïkilo-|
et|pœcilo-|
ont les mêmes sèmes et taxes, et quasiment les mêmes graphes :\poïkilo\
et\pœcilo\
. Ce sont donc des allographes.
- Allomorphèmes : Morphèmes ayant les mêmes fonctions d'U.M.D.
- Allomorphes : Glossèmes paramorphiques, homosémiques et homotaxiques.
- Allophonèmes : Phonèmes ayant les mêmes fonctions d'U.M.D.
- Dans
|râteau|
,/(ʁ)/
et/(ʀ)/
ont les mêmes fonctions linguistiques :/ʁato/
et/ʀato/
. Ce sont donc des allophonèmes.
- Dans
- Allophones : Glossèmes paraphoniques, homosémiques et homotaxiques.
- Allosèmes e : Glossèmes homomorphiques, parasémiques et homotaxiques.
- Dans
Le palais est en construction
etVoici la nouvelle construction de l'architecte
, les glossèmes|(construction)|
ont les mêmes morphes et taxes, et quasiment les mêmes sèmes :[action de construire]
et[résultat de construire]
.
- Dans
- Allotaxes : Glossèmes homomorphiques, homosémiques et parataxiques.
- Dans
Paul est sur Internet
etPaul est sur l'Internet
, les glossèmes|(Internet)|
ont les mêmes morphes et sèmes, et quasiment les mêmes exotaxes :<>-déterminant<>
et<>+déterminant<>
. Ce sont donc des parataxes.
- Dans
C
- Combinaison : Environnement d'une unité dans un énoncé.
D
- Diagraphe : Ensemble des graphes d'un glosse.
- Diamorphe e : Ensemble des morphes d'un glosse.
- Diaphone : Ensemble des phones d'un glosse.
- Diasème e : Ensemble des sèmes d'un glosse.
- Diataxe : Ensemble des taxes d'un glosse.
- Distribution : Ensemble des possibilités combinatoires d'une unité.
E
- -ème : Au niveau méroglossique, unité minimale distinctive. Au niveau hologlossique, unité invariable.
G
- Glosse : Association conventionnelle d'une forme, d'un sens et d'une distribution.
- Transcription :
|X|
.
- Transcription :
- Glossème : Glosse minimal et invariable.
- Transcription :
|(X)|
. |(nénuphar)|
associe un graphe\nénuphar\
, un sème[plante aquatique nymphéacée]
et un taxe<>nom commun<>
. C'est donc un glossème.|(nénufar)|
associe un graphe\nénufar\
, un sème[plante aquatique nymphéacée]
et un taxe<>nom commun<>
. C'est donc un glossème.
- Transcription :
- Glossome : Ensemble contigu de glossèmes, glosse variable.
- Transcription :
|{X}|
. |{nénufar}|
associe deux graphes\nénufar\
et\nénuphar\
, un sème[plante aquatique nymphéacée]
et un taxe<>nom commun<>
. C'est donc un glosse.
- Transcription :
- Glotte : Tout système linguistique autonome.
- Grammème : Glossème d'ordre grammatical.
- Graphe : Graphèmes d'un glosse.
- Transcription :
\X\
.
- Transcription :
- Graphème : U.M.D. de forme graphique.
- Transcription :
\(X)\
. |bar|
et|car|
sont graphiquement discriminés par\(b)\
et\(c)\
. Ce sont donc des graphèmes.
- Transcription :
- Graphis : Unité graphique extraglossique.
- Graphomère : T.O.D. de graphèmes.
- Transcription :
\+-X\
.
- Transcription :
H
- Hétérographes : Glosses ayant des graphes différents.
- Les glosses
|voiture|
et|vert|
ont des graphes différents :\voiture\
et\vert\
. Ce sont donc des hétérographes.
- Les glosses
- Hétéromorphes : Glosses ayant des morphes différents.
- Hétérophones : Glosses ayant des phones différents.
- Les glosses
|voiture|
et|vert|
ont des phones différents :/vwatyʁ/
et/vɛʁ/
. Ce sont donc des hétérophones.
- Les glosses
- Hétérosèmes : Glosses ayant des sèmes différents.
- Les glosses
|table|
et|rouge|
ont des sèmes différents :[meuble]
et[couleur]
. Ce sont donc des hétérosèmes.
- Les glosses
- Hétérotaxes : Glosses ayant des taxes différents.
- Les glosses
|dormir|/nowiki></code> et <code><nowiki>|gentil|
ont des taxes différents :<>verbe<>
et<>adjectif<>
. Ce sont donc des hétérotaxes.
- Les glosses
- Homographes : Glosses ayant les mêmes graphes.
|(voler)|
=[dérober]
et|(voler)|
=[planer]
ont les mêmes graphes. Ce sont donc des homographes.
- Homomorphes e : Glosses ayant les mêmes morphes.
|(voler)|
=[dérober]
et|(voler)|
=[planer]
ont les mêmes morphes. Ce sont donc des homomorphes.
- Homophones : Glosses ayant les mêmes phones.
|eau|
,|haut|
et|au|
ont les mêmes phones : /o/. Ce sont donc des homophones.
- Homosèmes e : Glosses ayant les mêmes sèmes.
|ictère|
et|jaunisse|
ont les mêmes sèmes. Ce sont donc des homosèmes.
- Homotaxes : Glosses ayant les mêmes taxes.
- Dans
Paul mange une pomme
,|pomme|
a le même taxe que|fraise|
et|saucisse|
. Ce sont donc des homotaxes.
- Dans
- Homotaxomes : Glosses ayant les mêmes taxomes.
L
- Lexème : Glossème d'ordre lexical.
M
- -mère : Au niveau méroglossique, trait ontologique distinctif.
- Méroglosse : Composante du glosse.
- Morphe : Forme d'un glossème.
- Transcription :
\X\/X/
.
- Transcription :
- Morphème : U.M.D. de morphes.
- Morphis : Unité formelle extraglossique.
- Morphome : Morphes d'un glossome.
- Morphomère : T.O.D. de morphèmes.
N
- Niveau extraglossique : Niveau d'analyse sans considération du glosse.
- Niveau hologlossique e : Niveau d'analyse du glosse par son ensemble.
- Niveau intraglossique : Niveau d'analyse relativement au glosse.
- Niveau méroglossique e : Niveau d'analyse du glosse par ses parties.
O
- -ome : Au niveau méroglossique, ensemble. Au niveau hologlossique, unité variable.
P
- Paragraphes : Glossèmes ayant quasiment les mêmes graphes.
|nénufar|
et|nénuphar|
ont quasiment les mêmes graphes :\nénufar\
et\nénuphar\
. Ce sont donc des paragraphes.
- Paramorphes : Glossèmes ayant quasiment les mêmes morphes.
- Paraphones : Glossèmes ayant quasiment les mêmes phones.
- Parasèmes : Glossèmes ayant quasiment les mêmes sèmes.
|prune|
et|mirabelle|
ont quasiment les mêmes sèmes :[-jaune]
et[+jaune]
. Ce sont donc des parasèmes.
- Parataxes : Glossèmes ayant quasiment les mêmes taxes.
|mamie|
et|papi|
ont quasiment les mêmes taxes :<>+féminin<>
et<>+masculin<>
. Ce sont donc des parataxes.
- Phone : Phonèmes d'un glossèmes.
- Transcription :
/X/
.
- Transcription :
- Phonème : U.M.D. de forme phonique.
- Transcription :
/(X)/
. |bar|
et|car|
sont phoniquement discriminés par/(b)/
et/(k)/
. Ce sont donc des phonèmes.
- Transcription :
- Phonis : Unité phonique extraglossique.
- Phonomère : T.O.D. de phonèmes.
- Transcription :
/+-X/
.
- Les phonèmes
/(p)/
et/(b)/
sont phoniquement discriminés par le voisement :/-voisé/
et/+voisé/
. C'est donc un phonomère.
- Les phonèmes
- Transcription :
S
- Sème e : Sens d'un glossème.
- Transcription :
[X]
.
- Transcription :
- Sémème e : U.M.D. de sèmes.
- Transcription :
[(X)]
.
|chaise|
et|tabouret|
sont sémiquement discriminés par[+dossier]
et[-dossier]
. C'est donc un sémomère.
- Transcription :
- Sémis : Unité conceptuelle extraglossique.
- Sémome : Sèmes d'un glossome.
- Sémomère : T.O.D. de sémèmes.
- Transcription :
[+-X]
.
- Transcription :
- Syngraphe : Ensemble maximal d'homographes.
- Symorphe : Ensemble maximal d'homomorphes.
- Synphone : Ensemble maximal d'homophones.
- Synsème : Ensemble maximal d'homosèmes.
- Syntaxe : Ensemble maximal d'homotaxes.
T
- Taxe e : Distribution d'un glossème.
- De
|τάξις|
=/taksis/
+[disposition]
. - Transcription :
<>X<>
.
|maison|
a pour taxe<>nom commun<>
.
- De
- Taxème : U.M.D. de taxes.
- Transcription :
<>(X)<>
.- Dans
Paul est un grand musicien
,|grand|
a pour taxème<>(épithète préposé)<>
.
- Dans
- Transcription :
- Taxis : Unité distributionnelle extraglossique.
- Taxome : Taxes d'un glossome.
- Taxomère : T.O.D. de taxèmes.
- Transcription :
<>+-X<>
.
- Dans
Paul nage
etPaul nage le crawl
, les deux glossèmes|(nage)|
sont taxiquement discriminés par<>-transitif direct<>
et<>+transitif direct<>
. C'est donc un taxomère.
- Dans
- Transcription :
- Trait ontologique distinctif (T.O.D.) : Propriété d'opposition binaire constitutive d'une U.M.D.
U
- Unité minimale distinctive (U.M.D.) : Élément qui permet de discriminer les glossèmes entre eux.
Notes
modifier- Le sémème est appelé sème en sémantique classique. Nous avons choisi de respecter le sens analogique du suffixe -ème : unité minimale distinctive.
- Le sème est appelé sémème en sémantique classique. Ici, sème est un radical, étymologisé de σῆμα, et non une suffixation en -ème, ce qui en fait une unité non distinctive, contrairement au sémème.
- Les allosèmes sont appelés acceptions en linguistique classique.
- La diamorphie
- La diasémie est appelée polysémie en linguistique classique.
- Les homomorphes sont appelés homonymes en lexicologie classique.
- Les homosèmes sont appelés synonymes en lexicologie classique.
- Le niveau hologlossique est appelé première articulation en linguistique fonctionnelle.
- Le niveau méroglossique, dans sa composante formelle, est appelé deuxième articulation en linguistique fonctionnelle.
- Le taxe est appelé classe distributionnelle ou classe morphosyntaxique ou nature grammaticale en linguistique classique.