Discussion aide:Homophones et paronymes

Dernier commentaire : il y a 4 ans par Urhixidur dans le sujet Sous-sections d’homophones

Paronymes : liste exhaustive ? modifier

Les sections paronymes, mots apparentés et autres méronymes sont souvent négligées au stade actuel du projet. Mais avec le temps, je ne doute pas qu'elles s'enrichiront de manière intéressante. Le risque que j'entrevois, c'est que, victimes du zèle des wiktionnaristes, elles s'allongent au point de perdre de leur utilité. C'est pourquoi je pense qu'il faut dès à présent préciser un peu mieux le contexte et les règles qui régissent le remplissage de ces sections, en particulier les paronymes.

Ce qui m'a amené à cette réflexion est la section paronymes de rose. On peut y lire cause, dose, pause, prose, …, ruse et leurs dérivés. 27 mots en tout, auxquels d'autres wiktionnaristes pourront rajouter roche, rôle, rosse, rote, etc. au gré de leur inspiration. En cherchant bien, je suis sûr que la liste peut atteindre la centaine de mots, et ce sera aussi le cas pour tous les mots courts de la langue française.

Donc, la question que je pose, c'est faut-il vraiment coller à la définition linguistique du paronyme et jouer la carte de l'exhaustivité (toute subjective qu'elle soit) ? Je pense que non.

Sur ce point, la définition du Littré est intéressante : « Mot qui a du rapport avec un autre par le son qu'il fait entendre, de sorte que les gens mal instruits peuvent les confondre. ». Elle rejoint ce qui est dit dans cette page « Homophones et paronymes » : « Cette section permet notamment d'orienter le lecteur vers d'autres mots avec lesquels il aurait pu confondre le mot qu'il recherche. ».

Selon moi, c'est la raison d'être de cette section : non d'être linguistiquement exhaustive, mais d'être utile aux personnes ayant des difficultés avec la langue française (étrangers, écoliers,…). Et pour qu'elle soit utile, il faut qu'elle soit courte (5 mots maxi). Pour cela, il ne faut pas s'arrêter à la vague ressemblance des mots mais tenir compte des difficultés rencontrées réellement par les personnes. Cette difficulté dépend de la complexité des mots (ex: conjoncture/conjecture), de leur fréquence dans la langue orale contemporaine (anoblir/ennoblir) et de l'orthographe française pas toujours évidente (bailler/bâiller).

Inversement, j'imagine mal quelqu'un confondre rose (adj.) et ruse (nom), ni rose (nom masc.) et ruse (nom fém.), ni oralement, ni à l'écrit, et ceci quel que soit son niveau de français. Même avec rose (nom fém.) et ruse (nom fém.), le contexte de la phrase lèvera toute ambigüité.

En bref, je pense qu'il faut se limiter aux difficultés usuelles, donc aux cas réels ou plausibles :

  • les mots difficiles, ou peu usités, qui conduiraient un enfant ou un étranger à chercher au mauvais endroit (ex: collusion cherché à la page collision, pesanteur/apesanteur, …) seraient inclus
  • les mots qui, malgré leur ressemblance, ne peuvent pas être confondus de par le contexte (ex: un verbe et un adjectif) seraient exclus
  • les homophones (cote et cotte) ont leur section donc peuvent être omis
  • les quasi-homophones (ex: cote et côte) pourraient aussi être déplacés chez les homophones, même s'ils ne répondent pas stricto sensu à la définition, car c'est là qu'ils seront le plus utiles

Je comprends que cette proposition puisse choquer, surtout ceux qui s'attachent à la linguistique, car on tend à s'éloigner du sens exact de la section pour se rapprocher de la pratique. Mais je pense qu'il faut s'attacher à ce que le wiktionnaire reste utile, et je ne vois pas l'utilité d'une section paronyme d'une cinquantaines de mots qui, bien que corrects, ne sont pas tirés de confusions réelles.

Si je suis dans le vrai, je verrais bien quelques précisions supplémentaires sur cette page, en particulier que mettre et que ne pas mettre dans les paronymes. Xavier 24 février 2006 à 22:28 (UTC)Répondre

La règle que je me suis imposée, c'est de limiter les paronymes aux mots qui sont différents d'un seul phonème. Pour reprendre l'exemple de « rose », parmi les most suggérés ci-haut (roche, rôle, rosse, rote), seul rôle passe ce test, car les trois autres sont différents de deux phonèmes. Xhienne soulève cependant plusieurs bons points. Peut-être faut-il graduer la section des paronymes en paronymes de premier et second ordre, ou quelque chose comme ça...
Urhixidur 25 février 2006 à 00:55 (UTC)Répondre
Je m'étais moi aussi fait la réflexion que, très souvent, les mots cités n'étaient pas des paronymes. Pour moi aussi, un paronyme est un mot dont la proximité phonétique entraine fréquemment une confusion. Lmaltier 25 février 2006 à 07:35 (UTC)Répondre
On pourrait donc définir quelques règles (ou un guide) pour se fixer des limites... Je pense que se baser sur la différence d'un phonème n'est pas la solution la plus pertinente dans ce cas, il faudrait être plus précis. Par exemple, on pourrait mettre en évidence des familles de sons proches : t et d ; b, p ; v et f etc. mais qu'on déconseillera de mélanger entre elles (pas t et r par exemple). Bien sûr, cela ne doit pas empêcher d'avoir des pesanteur/apesanteur, etc.
En fait, plutôt que d'appliquer des règles trop précises, il vaudrait mieux se poser la question : « ce mot peut-il être confondu s'il est mal entendu/compris/prononcé ? ». C'est certes subjectif mais il ne s'agit pas ici de faire une liste stricte de termes liés par des relations sémantiques rigoureuses... c'est surtout pour aider les lecteurs. Si possible de manière pertinente. - Dakdada (discuter) 25 février 2006 à 11:33 (UTC)Répondre
Je suis complètement de ces avis. Je suggère déjà qq règles dans mon premier message, et je propose en résumé de nous limiter aux difficultés usuelles, donc aux cas réels ou plausibles (quoique le mot plausible est peut-être encore de trop). En tout cas, réelle ou plausible, je pense qu'il faut que la confusion soit possible et, pour reprendre rôle, je n'arrive à trouver aucun exemple où rôle peut être mis à la place de rose. Sans doute parce que ces termes ne présentent à la base aucune difficulté de langage. — Xavier 25 février 2006 à 11:51 (UTC)Répondre
On peut toujours se baser sur la distance de Levenshtein ; celle-ci permet de calculer la distance entre deux mots, tout en laissant une liberté sur quelle valeur on chaque changement. Les opération de suppression, insertion sont sans doute à prendre en compte, mais aussi la substitution (avec un phonème proche) et l’échange de place entre deux phonèmes (adjacent ou nom, unique ou par groupe) peuvent aussi l’être. On peut ensuite donner une valeur à chaque opération et seulement indiqué les mots ayant une distance en dessous d’une valeur comme paronymes. C’est un peu technique et moche, mais si c’est bien fait, c’est une méthode bien définie et systématique qui pourrait fonctionner ---/moyogo/ 25 février 2006 à 12:05 (UTC)Répondre
La distance de Levenshtein est intéressante, mais devrait se baser sur la représentation API et non l'écriture française. Par exemple, la distance de Levenshtein entre "eau" et "ô" est nulle en API, mais loin de l'être en français...
Ceci dit, devrait-on créer une section "Rimes" ?
Urhixidur 25 février 2006 à 17:57 (UTC)Répondre
Très juste. Je serais d'ailleurs très intéressé de voir ce que donnerait un outil de recherche basé sur la distance de Levenshtein des mots en API. Pour ce qui est des rimes, j'ai déjà vu des catégories « rimes en XXX », et je trouve que c'est une très bonne idée. Là encore, un outil de recherche basé sur la terminaison phonétique des mots serait utile. Il y a un moyen simple de récupérer la liste de toutes les prononciations SAMPA du wiktionnaire ?
Pour en revenir à la question initiale, quel est le but exact de la section paronymes ? Recenser un maximum de mots proches, ou seulement les difficultés sur lesquelles buttent ceux qui ne maîtrisent pas bien le français ? Dans le premier cas, la distance de Levenshtein sur la prononciation API serait très utile mais la liste sera longue pour beaucoup de mots. Alors peut-être serait-il utile de rajouter une section « confusions fréquentes », ou qq chose comme ça.
Xavier 26 février 2006 à 23:05 (UTC)Répondre
PS: pour ceux que ça intéresse et qui utilisent Linux, voici la commande liste dont le but est d'afficher les mots de distance 1 pour le mot passé en paramètre (c'est du shell bash - je sais, le code est obscur, mais c'est pour gagner de la place) :
function liste { dict=/usr/share/dict/french; m="|$1"; r="^(.$1"; for ((i=1; i<${#m}; i++)); do p=${m:0:$i}; l=${m:$i:1}; s=${m:$i+1}; r="$r$p$s$p$l.$s$p[^$l]$s"; done; egrep "$r)$" "$dict"; }
J'ai exécuté la commande « liste mot » pour chaque mot du dictionnaire wfrench (debian) qui est loin d'être complet. J'ai 200 mots qui donnent une liste de 20 mots ou plus. La plus longue liste, avec « pare », fait 34 mots.
Il me semble que si on a du ménage à faire, car c'est de cela qu'il s'agit, il faut s'en tenir à une règle qui ne soit pas informatique. D'autre part, l'idée m'est venu que certaines difficultés viennent aussi suivant la langue maternelle que l'on a. Des sons sont moins connus par certains et entraînent des confusions. Une règle comme la définition du mot me semble une bonne règle.

Homophones modifier

Pour ceux qui ont lu trop vite, on ajouter les mots homophones ne signifie pas les locutions, pour des raisons pratiques (trop long et insensé). JackPotte ($) 19 janvier 2010 à 21:12 (UTC)Répondre

Les homophones sont des mots différents qui se prononcent pareil. rue (plante) est un homophone de rue (voie), donc on pourrait le mettre, mais, comme c'est déjà dans la même page, ça n'aurait pas d'intérêt.
On n'a pas de raison de mettre rues comme un homophone de rue, puisque c'est le même mot.
Par contre, rien n'empêche, à mon avis, de mettre une locution, ou (sans mettre de liens) une séquence de mots susceptibles d'être utilisés ensemble, parce que ça peut être utile (par exemple, pour palourde, pourquoi ne pas mettre pas lourde, ou point carré pour Poincaré (en pensant à la phrase fameuse, si c'est rond, c'est point carré) ? Bien sûr, ça ne peut se faire que manuellement, pour juger de l'intérêt, pas par robot. Lmaltier 19 janvier 2010 à 21:26 (UTC)Répondre
Non mais je parlais de phrases non admissibles comme entrées, ce qui est devenu encouragé par ta dernière retouche. JackPotte ($) 6 janvier 2013 à 11:31 (UTC)Répondre
Je ne peux que répéter ce que je disais plus haut. Et je rappelle que les locutions sont des mots, au sens linguistique. On pourrait expliquer dans l'aide ce que je disais ci-dessus, car, bien sûr, il ne s'agit pas de mettre des charades ou de mettre des choses sans intérêt, seulement de mettre des choses admissibles comme entrées et, exceptionnellement, d'autres choses quand ça semble intéressant. Ce qui avait été mis à cyprès n'est certainement pas un modèle à suivre. Lmaltier (discussion) 6 janvier 2013 à 11:38 (UTC)Répondre

Sous-sections d’homophones modifier

Lorsque la graphie vedette possède de multiples prononciations (par ex. couvent qui a \ku.vɑ̃\ et \kuv\), il faut subdiviser les sections homophones (et paronymes). La méthode la plus simple est de préfixer chaque sous-section avec ; \pron\ :, comme cet exemple tiré de fils :

==== {{S|homophones|fr}} ====
; \fis\ :
* [[FIS]]
* [[fisse]], [[fissent]], [[fisses]] {{cf|lang=fr|faire}}
; \fil\ :
* [[fil]]
* [[file#fr-nom|file]], [[files#fr-flex-nom|files]]
* [[file#fr-flex-verb|file]], [[filent]], [[files#fr-flex-verb|files]] {{cf|lang=fr|filer}}

Peut-on entériner ceci (ou une variation de ceci) ? Urhixidur (discussion) 8 janvier 2020 à 17:03 (UTC)Répondre

Revenir à la page « Homophones et paronymes ».