Orthographe phonémique - Phonemic orthography

Une orthographe phonémique est une orthographe (système d'écriture d'une langue ) dans laquelle les graphèmes (symboles écrits) correspondent aux phonèmes (sons parlés significatifs) de la langue. Les langues naturelles ont rarement des orthographes parfaitement phonémiques ; on peut s'attendre à un degré élevé de correspondance graphème-phonème dans les orthographes basées sur des systèmes d'écriture alphabétiques , mais elles diffèrent par le degré de complétude de cette correspondance. L'orthographe anglaise , par exemple, est alphabétique mais hautement non phonémique ; il était autrefois principalement phonémique au stade du moyen anglais, lorsque les orthographes modernes sont apparues , mais l' anglais parlé a changé rapidement tandis que l'orthographe était beaucoup plus stable, ce qui a donné une situation non phonémique moderne. Cependant, en raison de leurs modernisations relativement récentes par rapport à l'anglais, les systèmes orthographiques roumain , italien , turc , espagnol , finnois , tchèque , letton et polonais se rapprochent beaucoup plus d'être des représentations phonémiques cohérentes.

En termes moins formels, une langue avec une orthographe hautement phonémique peut être décrite comme ayant une orthographe régulière . Une autre terminologie est celle des orthographes profondes et peu profondes , dans lesquelles la profondeur d'une orthographe est le degré auquel elle s'écarte d'être vraiment phonémique. Le concept peut également être appliqué aux systèmes d'écriture non alphabétiques comme les syllabaires .

Orthographe phonémique idéale

Dans une orthographe phonémique idéale, il y aurait une correspondance complète un à un ( bijection ) entre les graphèmes (lettres) et les phonèmes de la langue, et chaque phonème serait invariablement représenté par son graphème correspondant. Ainsi, l'orthographe d'un mot indiquerait sans ambiguïté et de manière transparente sa prononciation, et inversement, un locuteur connaissant la prononciation d'un mot serait en mesure d'en déduire son orthographe sans aucun doute. Cette situation idéale est rare mais existe dans quelques langues.

Un exemple contesté d'une orthographe idéalement phonémique est la langue serbo-croate . Dans son alphabet (alphabet latin ainsi que cyrillique serbe ), il y a 30 graphèmes, chacun correspondant de manière unique à l'un des phonèmes. Cette orthographe phonémique apparemment parfaite mais simple a été réalisée au 19ème siècle - l'alphabet cyrillique d'abord en 1814 par le linguiste serbe Vuk Karadžić , et l'alphabet latin en 1830 par le linguiste croate Ljudevit Gaj . Cependant, l'alphabet latin de Gaj et le cyrillique serbe ne distinguent pas les voyelles courtes et longues, et les tons non toniques (le court est écrit), montant et descendant du serbo-croate. En serbo-croate, les tons et les longueurs des voyelles étaient éventuellement écrits comme (en latin) ⟨e⟩, ⟨ē⟩, ⟨è⟩, ⟨é⟩, et ⟨ȇ⟩, en particulier dans les dictionnaires.

Une autre orthographe phonémique idéale est originaire de l' espéranto , employant le principe alors prononcé par le créateur de la langue LL Zamenhof « une lettre, un son ».

Il existe deux types distincts de déviation par rapport à cet idéal phonémique. Dans le premier cas, la correspondance exacte un à un peut être perdue (par exemple, certains phonèmes peuvent être représentés par un digramme au lieu d'une seule lettre), mais la « régularité » est conservée : il y a toujours un algorithme (mais un plus complexe) pour prédire l'orthographe à partir de la prononciation et vice versa. Dans le second cas, une véritable irrégularité est introduite, car certains mots viennent à être orthographiés et prononcés selon des règles différentes des autres, et la prédiction de l'orthographe à partir de la prononciation et vice versa n'est plus possible. Les cas courants des deux types d'écart par rapport à l'idéal sont discutés dans la section suivante.

Déviations de l'orthographe phonémique

Certaines façons dont les orthographes peuvent s'écarter de l'idéal de correspondance un à un graphème-phonème sont énumérées ci-dessous. La première liste contient des écarts qui tendent uniquement à complexifier la relation entre l'orthographe et la prononciation, sans affecter sa prévisibilité (voir paragraphe ci-dessus).

Cas 1 : Régulier

La prononciation et l'orthographe correspondent toujours de manière prévisible

  • Un phonème peut être représenté par une séquence de lettres, appelée multigraphe , plutôt que par une seule lettre (comme dans le cas du digraphe ch en français et du trigraphe sch en allemand). Cela ne conserve la prévisibilité que si le multigraphe ne peut pas être décomposé en unités plus petites. Certaines langues utilisent des signes diacritiques pour faire la distinction entre un digramme et une séquence de lettres individuelles, et d'autres nécessitent une connaissance de la langue pour les distinguer; comparer chevrier et loather en anglais.

Exemples:

sch contre s-ch en romanche

ng contre n + g en gallois

ch contre çh en gaélique mannois : il s'agit d'un cas légèrement différent où le même digraphe est utilisé pour deux phonèmes uniques différents.

ai contre en français

Cela est souvent dû à l'utilisation d'un alphabet qui était à l'origine utilisé pour une langue différente (l' alphabet latin dans ces exemples) et n'a donc pas de lettres uniques disponibles pour tous les phonèmes utilisés dans la langue actuelle (bien que certaines orthographes utilisent des dispositifs tels que comme signes diacritiques pour augmenter le nombre de lettres disponibles).

  • Parfois, à l'inverse, une seule lettre peut représenter une séquence de plus d'un phonème (comme x peut représenter la séquence /ks/ en anglais et dans d'autres langues).
  • Parfois, les règles de correspondance sont plus complexes et dépendent de lettres adjacentes, souvent à la suite de changements sonores historiques (comme avec les règles de prononciation du ca et du ci en italien et du e muet en anglais).

Cas 2 : Irrégulier

La prononciation et l'orthographe ne correspondent pas toujours de manière prévisible

  • Parfois, différentes lettres correspondent au même phonème (par exemple, u et ó en polonais sont tous deux prononcés comme le phonème /u/). C'est souvent pour des raisons historiques (les lettres polonaises représentaient à l'origine des phonèmes différents, qui ont ensuite fusionné phonologiquement). Cela affecte la prévisibilité de l'orthographe à partir de la prononciation, mais pas nécessairement l'inverse. Un autre exemple se trouve en grec moderne , dont le phonème /i/ peut s'écrire de six manières différentes : ι, η, υ, ει, οι et υι.
  • Inversement, une lettre ou un groupe de lettres peut correspondre à différents phonèmes dans différents contextes. Par exemple, th en anglais peut être prononcé comme /ð/ (comme dans this ) ou /θ/ (comme dans thin ), ainsi que /th/ (comme dans chèvre ).
  • L'orthographe peut autrement représenter une prononciation historique; l'orthographe ne suit pas nécessairement les changements sonores de la langue parlée. Par exemple, le k et le digraphe gh du chevalier anglais étaient autrefois prononcés (ce dernier est toujours prononcé dans certaines variétés écossaises ), mais après la perte de leurs sons, ils ne représentent plus la structure phonémique du mot ou sa prononciation.
  • L'orthographe peut représenter la prononciation d'un dialecte différent de celui considéré.
  • L'orthographe des mots empruntés adhère souvent ou est influencée par l'orthographe de la langue source (comme avec les mots anglais ballet et fajita , du français et de l' espagnol respectivement). Avec certains emprunts, cependant, la régularité est conservée soit par
  • L'orthographe peut refléter une étymologie populaire (comme dans les mots anglais hoccough , island , ainsi orthographié en raison d'un lien imaginaire avec les mots toux et isle ), ou une étymologie lointaine (comme dans le mot anglais dette dans lequel le b silencieux a été ajouté sous le influence du latin).
  • L'orthographe peut refléter la structure morphophonémique plutôt que purement phonémique (voir la section suivante) bien qu'elle soit souvent aussi le reflet de la prononciation historique.

La plupart des orthographes ne reflètent pas les changements de prononciation connus sous le nom de sandhi dans lesquels la prononciation est affectée par des sons adjacents dans des mots voisins (le sanskrit écrit et d'autres langues indiennes reflètent cependant de tels changements). Une langue peut également utiliser différents ensembles de symboles ou différentes règles pour des ensembles distincts d'éléments de vocabulaire tels que les syllabaires japonais hiragana et katakana (et le traitement différent dans l'orthographe anglaise des mots dérivés du latin et du grec).

Fonctionnalités morphophoniques

Les orthographes alphabétiques ont souvent des caractéristiques morphophonémiques plutôt que purement phonémiques. Cela signifie que l'orthographe reflète dans une certaine mesure la structure morphologique sous-jacente des mots, pas seulement leur prononciation. Par conséquent, différentes formes d'un morphème (unité minimale significative de la langue) sont souvent orthographiées de manière identique ou similaire malgré les différences dans leur prononciation. C'est souvent pour des raisons historiques ; l'orthographe morphophonémique reflète une prononciation antérieure d'avant les changements sonores historiques qui ont causé la variation de la prononciation d'un morphème donné. De telles orthographes peuvent aider à la reconnaissance des mots lors de la lecture.

Quelques exemples de caractéristiques morphophonémiques en orthographe sont décrits ci-dessous.

  • Le morphème pluriel anglais s'écrit -s indépendamment du fait qu'il se prononce comme /s/ ou /z/ , par exemple cat s et dog s , pas cat s et dog z . En effet, les sons [s] et [z] sont des formes du même morphophonème sous-jacent , automatiquement prononcé différemment selon son environnement. (Cependant, lorsque ce morphème prend la forme /ɪz/ , l'ajout de la voyelle se reflète dans l'orthographe : church es , mass es .)
  • De même, le morphème du passé anglais s'écrit -ed indépendamment du fait qu'il se prononce comme /d/ , /t/ ou /ɪd/ .
  • De nombreux mots anglais conservent des orthographes qui reflètent leur étymologie et leur morphologie plutôt que leur prononciation actuelle. Par exemple, signe et signature incluent l'orthographe « signe », qui signifie la même chose mais se prononce différemment dans les deux mots. D' autres exemples sont la science ence / saɪ / vs con science ence / ʃ / , pré judice / prɛ / vs pré quel / Pri / , na tion / neɪ / vs na tionalism / Næ / et spe cial / spɛ / vs . spe CIES / Špi / .
  • L' assimilation phonologique n'est souvent pas reflétée dans l'orthographe, même dans des orthographes autrement phonémiques telles que l'espagnol, dans lesquelles obtener « obtenir » et optimista « optimist » s'écrivent avec b et p , mais sont généralement neutralisés en ce qui concerne la voix et prononcés de diverses manières, telles que comme les deux [β] dans un style neutre ou les deux [p] dans la prononciation emphatique. D'autre part, l'orthographe serbo-croate (serbe, croate, bosniaque et monténégrin) reflète l'assimilation donc on écrit Ср б ија/Sr b ija "Serbie" mais ср п ски/sr p ski "Serbe".
  • L' affaiblissement final-obstruant qui se produit dans de nombreuses langues (telles que l'allemand, le polonais et le russe) n'est normalement pas reflété dans l'orthographe. Par exemple, en allemand, Bad "bain" s'écrit avec un ⟨d⟩ final même s'il se prononce /t/ , correspondant ainsi à d'autres formes morphologiquement liées telles que le verbe baden (baigner) dans lequel le d se prononce /d / . (Comparez Rat , raten ("conseil", "conseiller") dans lequel le t est prononcé /t/ dans les deux positions.) L' orthographe turque , cependant, est plus strictement phonémique : par exemple, l'impératif de eder "does" est orthographié et , tel qu'il se prononce (et le même que le mot pour "viande"), et non *ed , comme ce serait le cas si l'orthographe allemande était utilisée.

Le hangul coréen est passé au cours des siècles d'une orthographe hautement phonémique à une orthographe largement morphophonémique.Les kana japonais sont presque entièrement phonémiques mais présentent quelques aspects morphophonémiques, notamment dans l'utilisation de ぢdi et づdu (plutôt que じji et ずzu , leur prononciation en dialecte tokyoïte standard ), lorsque le caractère est l'expression d'un sous-jacent ou . Cela vient du changement de son rendaku combiné à la fusion yotsugana de morae formellement différents. L' orthographe russe est également principalement morphophonémique, car elle ne reflète pas la réduction des voyelles, l'assimilation des consonnes et la dévoicing finale-obstruante. De plus, certaines combinaisons de consonnes ont des consonnes silencieuses.

Orthographes défectueuses

Une orthographe défectueuse est une orthographe qui n'est pas capable de représenter tous les phonèmes ou distinctions phonémiques d'une langue. Un exemple d'une telle carence en anglais est le manque graphie de distinction entre les voisées et sans voix « e » (phonèmes / ð / et / θ / respectivement), se produisant dans des mots comme cette / ð ɪ s / (voix) et mince / & thetav ɪ n / (sans voix) , respectivement, à la fois avec ⟨th⟩ écrite.

Comparaison entre les langues

Les langues avec une forte correspondance graphème-phonème et phonème-graphème (hors exceptions dues aux mots d'emprunt et à l'assimilation) comprennent :

De nombreuses autres orthographes phonémiques sont légèrement défectueuses : le malais (y compris le malais et l' indonésien ), l' italien , le maltais , le gallois et le kazakh ne distinguent pas complètement leurs voyelles, le lituanien , le letton et le serbo-croate ne distinguent pas le ton et la longueur des voyelles (également voyelles pour le lituanien et le letton), le somali ne distingue pas la phonation vocalique et les graphèmes b et v représentent le même phonème dans toutes les variétés d'espagnol, tandis qu'en espagnol des Amériques, /s/ peut être représenté par les graphèmes s , c ou z . Les langues indo-aryennes modernes comme l' hindi , le pendjabi , le gujarati , le maithili et plusieurs autres comportent une suppression schwa , où la voyelle implicite par défaut est supprimée sans être explicitement marquée comme telle. D'autres, comme le marathi , n'ont pas de correspondance élevée entre graphèmes et phonèmes pour les longueurs de voyelles.

Le français , avec ses lettres muettes et son utilisation intensive des voyelles nasales et de l' élision , peut sembler manquer de beaucoup de correspondance entre l'orthographe et la prononciation, mais ses règles de prononciation, bien que complexes, sont cohérentes et prévisibles avec un bon degré de précision. Cependant, la correspondance réelle lettre-phonème est souvent faible et une séquence de sons peut avoir plusieurs façons d'être orthographiées.

Des orthographes telles que celles de l' allemand , du hongrois (principalement phonémique à l'exception de ly , j représentant le même son, mais la longueur des consonnes et des voyelles ne sont pas toujours exactes et diverses orthographes reflètent l'étymologie, pas la prononciation), le portugais et le grec moderne (écrit avec le L'alphabet grec ), ainsi que le hangul coréen , sont parfois considérés comme étant de profondeur intermédiaire (par exemple, ils incluent de nombreuses caractéristiques morphophonémiques, comme décrit ci-dessus).

Comme pour le français, il est beaucoup plus facile de déduire la prononciation d'un mot allemand de son orthographe que l'inverse. Par exemple, pour les locuteurs qui fusionnent /eː/ et /ɛː/, le phonème /eː/ peut être orthographié e , ee , eh , ä ou äh .

L'orthographe anglaise est hautement non phonémique. L'irrégularité de l'orthographe anglaise provient en partie du fait que le grand décalage des voyelles s'est produit après l'établissement de l'orthographe ; en partie parce que l'anglais a acquis un grand nombre de mots empruntés à différentes époques, conservant leur orthographe d'origine à différents niveaux ; et en partie parce que la régularisation de l'orthographe (s'éloignant de la situation dans laquelle de nombreuses orthographes différentes étaient acceptables pour le même mot) s'est produite arbitrairement sur une période sans aucun plan central. Cependant, même l'anglais a des règles générales, quoique complexes, qui prédisent la prononciation à partir de l'orthographe, et plusieurs de ces règles sont efficaces la plupart du temps ; les règles pour prédire l'orthographe à partir de la prononciation ont un taux d'échec plus élevé.

La plupart des langues construites telles que l' espéranto et le lojban ont principalement des orthographes phonémiques.

Les systèmes syllabaires du japonais ( hiragana et katakana ) sont des exemples d'orthographe presque parfaitement superficielle - les exceptions incluent l'utilisation de et (voir ci-dessus ) et l'utilisation de , et pour représenter les sons わ, et え, comme des reliques de l' usage historique du kana . Il n'y a pas non plus d'indication d'accent tonique, ce qui entraîne une homographie de mots comme 箸 et 橋 (はし en hiragana), qui se distinguent dans le discours.

Réalignement de l'orthographe

Avec le temps, les prononciations changent et les orthographes deviennent obsolètes, comme cela est arrivé à l'anglais et au français . Afin de maintenir une orthographe phonémique, un tel système nécessiterait une mise à jour périodique, comme cela a été tenté par divers régulateurs de langue et proposé par d'autres réformateurs orthographiques .

Parfois, la prononciation d'un mot change pour correspondre à son orthographe ; c'est ce qu'on appelle une prononciation orthographique . C'est le plus courant avec les emprunts, mais cela se produit parfois aussi dans le cas des mots natifs établis.

Dans certains noms de personnes et noms de lieux anglais, la relation entre l'orthographe du nom et sa prononciation est si éloignée que les associations entre phonèmes et graphèmes ne peuvent pas être facilement identifiées. De plus, en d'autres termes, la prononciation a évolué par la suite à partir d'une orthographe fixe, de sorte qu'il faut dire que les phonèmes représentent les graphèmes plutôt que l'inverse. Et dans beaucoup de jargon technique, le principal moyen de communication est la langue écrite plutôt que la langue parlée, donc les phonèmes représentent les graphèmes, et la façon dont le mot est prononcé importe peu. De plus, les sons que les gens alphabétisés perçoivent comme étant entendus dans un mot sont considérablement influencés par l'orthographe réelle du mot.

Parfois, les pays font subir à la langue écrite une réforme orthographique pour réaligner l'écriture avec la langue parlée contemporaine. Ceux-ci peuvent aller de simples changements d'orthographe et de formes de mots à la commutation de l'ensemble du système d'écriture lui-même, comme lorsque la Turquie est passée de l'alphabet arabe à un alphabet turc d'origine latine.

Transcription phonétique

Les méthodes de transcription phonétique telles que l' alphabet phonétique international (API) visent à décrire la prononciation sous une forme standard. Ils sont souvent utilisés pour résoudre des ambiguïtés dans l'orthographe de la langue écrite. Ils peuvent également être utilisés pour écrire des langues sans forme écrite antérieure. Des systèmes comme IPA peuvent être utilisés pour la représentation phonémique ou pour afficher des informations phonétiques plus détaillées (voir Transcription étroite ou transcription large ).

Les orthographes phonémiques sont différentes de la transcription phonétique ; alors que dans une orthographe phonémique, les allophones seront généralement représentés par le même graphème, une écriture purement phonétique exigerait que des allophones phonétiquement distincts soient distingués. Pour prendre un exemple de l'anglais américain : le son /t/ dans les mots « table » et « cat » serait, dans une orthographe phonémique, écrit avec le même caractère ; cependant, une écriture strictement phonétique ferait une distinction entre le « t » aspiré dans « table », le rabat dans « beurre », le « t » non aspiré dans « stop » et le « t » glottalisé dans « chat » (pas tous ces allophones existent dans tous les dialectes anglais ). En d'autres termes, le son que la plupart des anglophones considèrent comme /t/ est en réalité un groupe de sons, tous prononcés légèrement différemment selon l'endroit où ils apparaissent dans un mot. Une orthographe phonémique parfaite a une lettre par groupe de sons (phonème), avec des lettres différentes uniquement là où les sons distinguent les mots (donc « bed » s'écrit différemment de « bet »).

Une transcription phonétique étroite représente les téléphones , les sons que les humains sont capables de produire, dont beaucoup seront souvent regroupés en un seul phonème dans une langue naturelle donnée, bien que les groupements varient d'une langue à l'autre. L'anglais, par exemple, ne fait pas la distinction entre les consonnes aspirées et non aspirées, mais d'autres langues, comme le coréen , le bengali et l' hindi le font. D'autre part, le coréen ne fait pas de distinction entre les consonnes sonores et sourdes contrairement à un certain nombre d'autres langues.

Les sons de la parole de toutes les langues du monde peuvent être écrits par un alphabet phonétique universel assez petit. Une norme pour cela est l' alphabet phonétique international .

Voir également

Les références