Agglutination - Agglutination

Le signe du milieu est en hongrois , qui s'agglutine abondamment. (Le haut et le bas sont des signes en roumain et allemand , respectivement, les deux langues fléchies .) La traduction anglaise est « Ministère de l' alimentation et l' agriculture: Comté Satu Mare Direction générale de l' alimentation et de l' agriculture ».

L'agglutination est un processus linguistique de morphologie dérivationnelle dans lequel des mots complexes sont formés en enchaînant des morphèmes sans les changer d'orthographe ou de phonétique. Les langues qui utilisent largement l'agglutination sont appelées langues agglutinantes . Un exemple d'une telle langue est le turc , où, par exemple, le mot evlerinizden , ou "de vos maisons", se compose des morphèmes ev-ler-iniz-den, traduit littéralement morphème-par-morphème par maison-pluriel-votre -de .

Les langues agglutinantes sont souvent contrastées à la fois avec les langues dans lesquelles la structure syntaxique est exprimée uniquement au moyen de l' ordre des mots et des mots auxiliaires ( langues isolantes ) et avec les langues dans lesquelles un seul affixe exprime généralement plusieurs catégories syntaxiques et une même catégorie peut être exprimée par plusieurs différents . affixes (comme c'est le cas dans les langues flexionnelles (fusionnelles) ). Cependant, les langues fusionnelles et isolantes peuvent utiliser l'agglutination dans les constructions les plus souvent utilisées et utiliser fortement l'agglutination dans certains contextes, tels que la dérivation de mots. C'est le cas de l' anglais , qui a un marqueur pluriel agglutiné -(e)s et des mots dérivés tels que Hash·less·ness .

Les suffixes agglutinants sont souvent insérés indépendamment des limites syllabiques , par exemple, en ajoutant une consonne à la syllabe coda comme en anglais tie - tie s . Les langues agglutinantes ont également de grands inventaires d' encliques , qui peuvent être et sont séparés de la racine du mot par des locuteurs natifs d'usage quotidien.

Le terme agglutination est parfois utilisé plus généralement pour désigner le processus morphologique consistant à ajouter des suffixes ou d'autres morphèmes à la base d'un mot. Ce sujet est traité plus en détail dans la section sur les autres utilisations du terme .

Exemples de langues agglutinantes

Bien que l'agglutination soit caractéristique de certaines familles de langues, cela ne signifie pas que lorsque plusieurs langues dans une certaine zone géographique sont toutes agglutinantes, elles sont nécessairement liées phylogénétiquement. Dans le passé, cette hypothèse a conduit les linguistes à proposer la soi-disant famille de langues ouralo-altaïque , qui comprenait (dans la plus grande portée jamais proposée) les langues ouraliennes et turques, ainsi que le mongol, le coréen et le japonais. La linguistique contemporaine considère cette proposition comme controversée.

Une autre considération lors de l'évaluation de la proposition ci-dessus est que certaines langues, qui se sont développées à partir de proto-langues agglutinantes, ont perdu leurs caractéristiques agglutinantes. Par exemple, l'estonien contemporain, qui est si étroitement lié au finnois que les deux langues sont mutuellement intelligibles, a évolué vers le type fusionnel. (Il a également perdu d'autres caractéristiques typiques des familles ouraliennes, telles que l' harmonie des voyelles .)

Eurasie

Des exemples de langues agglutinantes incluent les langues ouraliennes , telles que le finnois , l' estonien et le hongrois . Ceux-ci ont des expressions très agglutinées dans l'usage quotidien, et la plupart des mots sont bisyllabiques ou plus longs. Les informations grammaticales exprimées par les adpositions dans les langues indo-européennes occidentales se trouvent généralement dans les suffixes.

Le hongrois utilise une agglutination extensive dans presque toutes ses parties. Les suffixes se succèdent dans un ordre spécial basé sur le rôle du suffixe, et beaucoup peuvent être entassés les uns sur les autres, ce qui donne des mots véhiculant des significations complexes sous des formes compactes. Un exemple est fiaiéi, où la racine "fi(ú)-" signifie "fils", les quatre voyelles suivantes sont toutes des suffixes séparés, et le mot entier signifie "[les propriétés plurielles] appartiennent à ses fils". La structure possessive imbriquée et l'expression des pluriels sont assez remarquables (notez que le hongrois n'utilise pas de genre).

Presque toutes les langues austronésiennes , comme le malais , et la plupart des langues philippines , appartiennent également à cette catégorie, leur permettant ainsi de former de nouveaux mots à partir de formes de base simples. Le mot indonésien et malais mempertanggungjawabkan est formé en ajoutant des affixes de voix active, causatifs et bénéfiques au verbe composé tanggung jawab , qui signifie « compter sur ». En tagalog (et son registre standardisé, le philippin ), nakakapágpabagabag (« ce qui dérange/dérange ») est formé à partir de la racine bagabagdérangeant » ou « dérangeant »).

Japonais est une langue agglutinante, en ajoutant des informations telles que la négation , passive voix , passé tendue , honorific degré et la causalité dans la forme verbale. Des exemples courants seraient hatarakaseraretara (働かせられたら) , qui combine des conjugaisons causales, passives ou potentielles et conditionnelles pour arriver à deux significations en fonction du contexte "si (sujet) avait été fait pour fonctionner..." et "si (sujet) pourrait faire (l'objet) fonctionner", et tabetakunakatta (食べたくなかった) , qui combine le désir, la négation et les conjugaisons au passé pour signifier "je/il/elle/ils ne voulaient pas manger".

  • taberu ("(sujet) mangera (ça)")
  • tabetai ("(sujet) veut manger (ça)")
  • tabetakunai ("(sujet) ne veut pas manger (ça)")
  • tabetakunakatta ("(sujet) ne voulait pas manger (ça)")

Le turc , avec toutes les autres langues turques , est une autre langue agglutinante : à titre d'exemple extrême, l'expression Muvaffakiyetsizleştiricileştiriveremeyebileceklerimizdenmişsinizcesine se prononce comme un seul mot en turc, mais elle peut être traduite en anglais par « comme si vous étiez de ceux que nous ne pourrions pas se transformer en un faiseur d'échecs" (le "-siniz" fait référence à la forme plurielle de vous avec "-sin" étant la forme singulière, de la même manière "-im" étant "je" et "-imiz" le faisant devenir "nous").

Toutes les langues dravidiennes , y compris le kannada , le malayalam , le tamoul et le télougou, sont agglutinantes.

L'agglutination est également une caractéristique notable du basque . La conjugaison des verbes, par exemple, se fait en ajoutant différents préfixes ou suffixes à la racine du verbe : dakartzat , qui signifie « je les apporte », est formé par da (indique le présent), kar (racine du verbe ekarri → apporter), tza (indique le pluriel) et t (indique le sujet, dans ce cas, "je"). Un autre exemple serait la déclinaison : Etxean = "Dans la maison" où etxe = maison.

Afrique

Toutes les langues bantoues , telles que KiKongo , IsiZulu , ChiChewa , LuGanda et Swahili .

Langues sénégambies comme le wolof et le peul .

Langues Igboïdes .

Amériques

Connectez-vous en espagnol, anglais et kichwa , une langue agglutinante.

Agglutination est utilisé très largement dans la plupart des Amérindien langues , telles que les langues inuites , nahuatl , mapuche , Quechua , Tz'utujil , Kaqchikel , Cha'palaachi et K'iche , où un mot peut contenir assez morphèmes pour transmettre le sens de ce serait une phrase complexe dans d'autres langues. À l'inverse, le navajo contient des affixes pour certains usages, mais les superpose de manière si imprévisible et inséparable qu'il est souvent qualifié de langage fusionnel.

Construit

L'espéranto est une langue auxiliaire construite avec une grammaire très régulière et une morphologie des mots agglutinante. Voir Vocabulaire en espéranto .

Fictif

La novlangue est une langue fictive en 1984 basée sur le seul but de l'agglutination, comme l'exprime le personnage Syme, "Chaque concept qui peut être nécessaire sera exprimé par exactement un mot" Par exemple, en utilisant la racine du mot "bon", nous pouvons former des mots tels que bien (fait bien), plusgood (très bien), doubleplusgood (très bien) et ungood (mauvais). Les mots avec des significations comparatives et superlatives sont également simplifiés, de sorte que "meilleur" devient "meilleur" et "meilleur" devient "meilleur".

Machines à sous

Comme indiqué ci-dessus, c'est une caractéristique typique des langues agglutinantes qu'il existe une correspondance un à un entre les suffixes et les catégories syntaxiques. Par exemple, un nom peut avoir des marqueurs séparés pour le nombre, la casse, l'usage possessif ou conjonctif, etc. L'ordre de ces affixes est fixe ; ainsi nous pouvons considérer n'importe quel nom ou verbe comme un radical suivi de plusieurs "fentes" flexionnelles, c'est-à-dire des positions dans lesquelles des suffixes flexionnels peuvent apparaître. Il arrive souvent que l'instance la plus courante d'une catégorie grammaticale donnée ne soit pas marquée, c'est-à-dire que l'affixe correspondant est vide.

Le nombre de créneaux pour une partie donnée du discours peut être étonnamment élevé. Par exemple, un verbe coréen fini a sept emplacements (les parenthèses rondes intérieures indiquent des parties de morphèmes qui peuvent être omises dans certains environnements phonologiques) :

  1. honorifique : -(eu)si ((으)시) est utilisé lorsque le locuteur respecte le sujet de la phrase
  2. temps : (eo)ss (었) pour une action ou un état (passé) terminé ; lorsque cette case est vide, le temps est interprété comme présent(Le 'ss' se prononce 't' s'il est placé derrière une consonne. Par exemple, -었어(eoss-eo) se prononce (eosseo), mais - 었다(eoss-ta) se prononce comme (eotta). Veuillez noter que la même règle s'applique à toutes les instances de la terminaison 'ss'.)
  3. aspect expérientiel-contrastif : (eo)ss (었) doubler le marqueur du passé signifie "le sujet a eu l'expérience décrite par le verbe"
  4. modal: gess (겠) est utilisé avec la première personne-sujets que pour l' avenir défini et avec la deuxième ou troisième-personne-sujets aussi pour présent ou passé probable
  5. formel : (eu)pni ((으)ㅂ니) exprime la politesse à l'auditeur
  6. aspect rétrospectif : deo ; (더) indique que le locuteur se souvient de ce qu'il a observé dans le passé et rapporte dans la situation présente
  7. mood : da (다) pour déclaratif, kka (까) pour interrogatif, ra/la (라) pour impératif, ja (자) pour propositif, yo (요) pour poli déclaratif et un grand nombre d'autres marqueurs d'humeur possibles

De plus, les formes verbales passives et causatives peuvent être dérivées en ajoutant des suffixes à la base, qui pourraient être considérés comme la case nulle.

Même si certaines combinaisons de suffixes ne sont pas possibles (par exemple, une seule des cases d'aspect peut être remplie avec un suffixe non vide), plus de 400 formes verbales peuvent être formées à partir d'une seule base. Voici quelques exemples formés à partir de la racine du mot ga « à emporter » ; les chiffres indiquent quels emplacements contiennent des suffixes non vides :

  • 7 (marqueur d'humeur impératif) : le suffixe impératif -ra (라) se combine avec la racine ga- (가) pour exprimer l'impératif : ga-ra (가라) « Go ! » ;
  • 7 (marqueur d'humeur propositive) : si nous voulons exprimer une proposition plutôt qu'un ordre, le marqueur d'humeur propositive est utilisé : -ja (자) au lieu de -ra (라) : ga-ja (가자) 'Allons-y !'
  • 5 et 7 : Si le locuteur veut faire preuve de respect pour l'auditeur, il utilise le marqueur de politesse -(eu)pni ((으)ㅂ니) (dans la case 5) ; différents marqueurs d'humeur peuvent être utilisés simultanément (dans la case 7, donc après le marqueur de politesse) : gap-ni-da (갑니다) 'Il s'en va.', gap-ni-kka ? (갑니까) 'Est-ce qu'il y va ?'
  • 6 : aspect rétrospectif : Jon-i jib-e ga-deo-ra (존이 집에 가더라) 'J'ai remarqué que John rentrait chez lui et maintenant je vous le rapporte.'
  • 7 : indicatif simple : seon-saeng-nim-i jib-e gan-da (선생님이 집에 간다) 'Le professeur rentre à la maison. (ne pas exprimer de respect ou de politesse)'
  • 5 et 7 : politesse envers l'auditeur : seon-saeng-nim-i jib-e gap-ni-da (선생님이 집에 갑니다) ou seon-saeng-nim-i jib-e ga-yo (선생님이 집에 가요) 'Le professeur rentre à la maison.',
  • 1 et 7 : respect envers le sujet : seon-saeng-nim-i jib-e ga-sin-da (선생님이 집에 가신다) 'Le (respecté) professeur rentre à la maison.'
  • 1, 5 et 7 : deux sortes de politesse en une phrase : seon-saeng-nim-i jib-e ga-syeo-yo (선생님이 집에 가셔요) ou seon-saeng-nim-i jib-e ga- sip-ni-da (선생님이 집에 가십니다) 'Le professeur rentre à la maison. (exprimant le respect à la fois à l'auditeur et à l'enseignant)'
  • 2, 3 et 7 : formes passées : Jon-i hak-gyo-e ga-ss-da/gat-ta (존이 학교에 갔다) 'John est allé à l'école (et est là maintenant).', Jon- i hak-gyo-e gass-eoss-da/gass-eot-ta (존이 학교에 갔었다) 'John a été à l'école (et est revenu).'
  • 4 et 7 : modal à la première personne : nae-ga nae-il ga-gess-da/ga-get-ta (내가 내일 가겠다) 'J'irai demain.'
  • 4 et 7 : modal à la troisième personne : Jon-i nae-il ga-gess-da/ga-get-ta (존이 내일 가겠다) 'Je suppose que John ira demain.', Jon-i eo-je gass- gess-da/gat-get-ta (존이 어제 갔겠다) 'Je suppose que John est parti hier.'

Suffixe ou préfixe

Bien que la plupart des langues agglutinantes en Europe et en Asie soient principalement des suffixes, les langues bantoues d'Afrique australe sont connues pour un mélange très complexe de préfixes, de suffixes et de réduplication. Une caractéristique typique de cette famille de langues est que les noms appartiennent à des classes de noms. Pour chaque classe nominale, il existe des préfixes singuliers et pluriels spécifiques, qui servent également de marqueurs d'accord entre le sujet et le verbe. De plus, le nom détermine les préfixes de tous les mots qui le modifient et le sujet détermine les préfixes d'autres éléments dans la même phrase verbale.

Par exemple, les noms swahili -toto ("enfant") et -tu ("personne") appartiennent à la classe 1, avec le préfixe singulier m- et le préfixe pluriel wa- . Le nom -tabu ("livre") appartient à la classe 7, avec le préfixe singulier ki- et le préfixe pluriel vi- . Les phrases suivantes peuvent être formées :

  • m-toto a-li-fika 'L'enfant est arrivé.'
  • m-toto a-ta-fika 'L'enfant va arriver.'
  • wa-toto wa-li-fika 'Les enfants sont arrivés.'
  • wa-toto wa-ta-fika 'Les enfants vont arriver.'
  • m-tu a-li-lala 'La personne a dormi.'
  • m-tu a-ta-lala 'La personne dormira.'
  • wa-tu wa-li-lala 'Les personnes dormaient.'
  • wa-tu wa-ta-lala 'Les personnes dormiront.'
  • ki-tabu ki-li-anguka 'Le livre est tombé.'
  • ki-tabu ki-ta-anguka 'Le livre va tomber.'
  • vi-tabu vi-li-anguka 'Les livres sont tombés.'
  • vi-tabu vi-ta-anguka 'Les livres tomberont.'

yu-le 1sg-que

m-tu 1sg-personne

m-moja 1sg-one

m- refu 1sg-grand

a-li 1sg-il-passé

vous 7sg-rel.-il

ki-soma 7sg-lire

ki-le 7sg-ça

livre ki-tabu 7sg

ki- refu 7sg-long

« Cette personne de grande taille qui a lu ce long livre. »

wa-le 1pl-que

wa-tu 1pl-personne

wa-wili 1pl-deux

wa- refu 1pl-grand

wa-li 1pl-il-passé

(w)-o 7pl-rel.-it

vi-soma 7pl-lire

vi-le 7pl-que

vi-tabu 7pl-livre

vi- refu 7pl-long

« Ces deux personnes de grande taille qui lisent ces longs livres.

Dans le contexte de la linguistique quantitative

Le linguiste américain Joseph Harold Greenberg dans son article de 1960 a proposé d'utiliser ce qu'on appelle l' indice agglutinatif pour calculer une valeur numérique qui permettrait à un chercheur de comparer le « degré d'agglutination » de diverses langues. Pour Greenberg, l' agglutination signifie que les morphes ne sont joints qu'avec peu ou pas de modification. Un morphème est dit automatique s'il prend une seule forme de surface (morph), ou si sa forme de surface est déterminée par des règles phonologiques qui s'appliquent à toutes les instances similaires dans cette langue. Une jonction de morphes - une position dans un mot où deux morphes se rencontrent - est considérée comme agglutinante lorsque les deux morphèmes inclus sont automatiques. L'indice d'agglutination est égal au rapport moyen du nombre de jonctions agglutinantes sur le nombre de jonctions morphologiques. Les langues avec des valeurs élevées de l'indice agglutinant sont agglutinantes et avec des valeurs faibles de l'indice agglutinant sont fusionnelles.

Dans le même article, Greenberg a proposé plusieurs autres indices, dont beaucoup s'avèrent pertinents pour l'étude de l'agglutination. L' indice synthétique est le nombre moyen de morphèmes par mot, avec la valeur la plus basse concevable égale à 1 pour isoler les langues (analytiques) et les valeurs réelles dépassant rarement 3. L'indice composé est égal au nombre moyen de morphèmes racines par mot ( par opposition aux morphèmes dérivationnels et flexionnels). Les indices de dérivation, flexion, préfixe et suffixe correspondent respectivement au nombre moyen de morphèmes, préfixes et suffixes de dérivation et de flexion.

Voici un tableau d'exemples de valeurs :

agglutination synthèse composition dérivation inflexion préfixe suffixe
swahili 0,67 2,56 1,00 0,03 0,31 0,45 0,16
turc parlé 0,67 1,75 1.04 0,06 0,38 0,00 0,44
turc écrit 0,60 2.33 1,00 0,11 0,43 0,00 0,54
Yakoute 0,51 2.17 1.02 0,16 0,38 0,00 0,53
grec 0,40 1,82 1.02 0,07 0,37 0,02 0,42
Anglais 0,30 1,67 1,00 0,09 0,32 0,02 0,38
Inuits 0,03 3,70 1,00 0,34 0,47 0,00 0,73

Phonétique et agglutination

La relation un à un entre un affixe et sa fonction grammaticale peut être quelque peu compliquée par les processus phonologiques actifs dans la langue donnée. Par exemple, les deux phénomènes phonologiques suivants apparaissent dans de nombreuses langues ouraliennes et turques :

  • gradation des consonnes , c'est-à-dire qu'il y a alternance entre certaines paires de groupes de consonnes de telle sorte qu'un membre de la paire apparaît au début d'une syllabe ouverte et l'autre au début d'une syllabe fermée ; (en langues ouraliennes)
  • assimilation dévoicing consonne: processus similaire mais différent d'en haut, assimilant dévoicing d'une consonne sourde finale non voisée; (dans certaines langues turques)
  • harmonie vocalique , ce qui signifie que seules des sous-classes spécifiques de voyelles coexistent dans un mot non composé.

Plusieurs exemples du finnois illustreront comment ces deux règles et d'autres processus phonologiques conduisent à des détournements de la relation de base un à un entre les morphes et leur fonction syntaxique et sémantique. Aucune règle phonologique n'est appliquée dans la déclinaison de talo « maison ». Cependant, le deuxième exemple illustre plusieurs types de phénomènes phonologiques.

talo
'maison'
märkä paita
'une chemise mouillée'
les racines contiennent des groupes de consonnes -rk- et -t-
talo-n
'de la maison'
märä-npaida-n
'd'une chemise mouillée'
gradation des consonnes : le suffixe génitif -n ferme la syllabe précédente ;
          rk -> r, t->d
talo-ssa
'dans la maison'
märä-ssäpaida-ssa
'dans une chemise mouillée'
harmonie vocalique : un mot contenant ä ne peut pas contenir les voyelles a, o, u ;
          un allomorphe de la terminaison inessive -ssa/ssä est utilisé
talo-i-ssa
'dans les maisons'
mär-i-ssäpaido-i-ssa
'en chemises mouillées'
les règles phonologiques impliquent également des changements de voyelle différents lorsque le marqueur pluriel -i- rencontre une voyelle radicale-finale

Extrêmes

Il est possible de construire des exemples d'agglutination artificiellement extrêmes, qui n'ont pas d'utilité réelle, mais illustrent la capacité théorique de la grammaire à agglutiner. Il ne s'agit pas de "mots longs", car certaines langues permettent des combinaisons illimitées avec des mots composés, clitiques négatifs ou autres, qui peuvent être (et sont) exprimés avec une structure analytique dans l'usage réel.

L'anglais est capable d'agglutiner des morphèmes d'origine uniquement native ( germanique ), comme un-whole-some-ness , mais de manière générale, les mots les plus longs sont assemblés à partir de formes d'origine latine ou grecque antique . L'exemple classique est l' antidisestablishmentarianism . Les langues agglutinantes ont souvent une agglutination dérivationnelle plus complexe que les langues isolantes, elles peuvent donc faire la même chose dans une bien plus grande mesure. Par exemple, en hongrois, un mot tel que elnemzetietleníthetetlenségnek , qui signifie « aux fins de la non-dénationalisation » peut trouver un usage réel. De la même manière, il y a des mots qui ont un sens, mais qui ne sont probablement jamais utilisés comme legeslegmegszentségteleníttethetetlenebbjeitekként , qui signifie "comme la plupart des plus indignes d'entre vous", mais est difficile à déchiffrer même pour les locuteurs natifs. En utilisant l'agglutination flexionnelle, ceux-ci peuvent être étendus. Par exemple, le record du monde officiel Guinness est le finnois epäjärjestelmällistyttämättömyydellänsäkäänköhän "Je me demande si – même avec sa qualité de ne pas avoir été rendu non systématisé". Il a le mot dérivé epäjärjestelmällistyttämättömyys comme racine et est allongé avec les terminaisons flexionnelles -llänsäkäänköhän . Cependant, ce mot est grammaticalement inhabituel, car -kään "aussi" n'est utilisé que dans les clauses négatives, mais -kö (question) uniquement dans les clauses de question.

Une agglutination turque très populaire est Çekoslovakyalılaştıramadıklarımızdanmışsınız , ce qui signifie « Vous faites partie de ceux que nous n'avons pas pu convertir en Tchécoslovaques ». Cette référence historique est utilisée comme une blague pour les individus difficiles à changer ou ceux qui se démarquent dans un groupe.

Par contre, Afyonkarahisarlılaştırabildiklerimizdenmişsinizcesine est un mot plus long qui ne surprend pas les gens et qui signifie « Comme si tu étais de ceux que nous pouvions faire ressembler aux gens d' Afyonkarahisar ». Un ajout récent aux revendications est venu avec l'introduction du mot suivant en turc muvaffakiyetsizleştiricileştiriveremeyebileceklerimizdenmişsinizcesine , qui signifie quelque chose comme "(vous parlez) comme si vous étiez l'un de ceux que nous n'avons pas pu transformer en un fabricant de personnes sans succès" ( quelqu'un qui déséduque les gens pour les rendre infructueux).

Le géorgien est également une langue très agglutinante. Par exemple, le mot gadmosakontrrevolucieleblebisnairebisatvisaco ( გადმოსაკონტრრევოლუციელებლებისნაირებისათვისაცო ) signifierait "(quelqu'un non précisé) a dit que c'est aussi pour ceux qui sont comme ceux qui ont besoin d'être à nouveau/retour contre-révolutionnés".

La comédie d' Aristophane Assemblywomen comprend le mot grec λοπαδοτεμαχοσελαχογαλεοκρανιολειψανοδριμυποτριμματοσιλφιοκαραβομελιτοκατακεχυμενοκιχλεπικοσσυφοφαττοπεριστεραλεκτρυονοπτοκεφαλλιοκιγκλοπελειολαγῳοσιραιοβαφητραγανοπτερύγων , un plat fictif nommé avec un mot qui énumère ses ingrédients. Il a été créé pour ridiculiser une tendance pour les longs composés en grec attique à l'époque.

Les langues slaves ne sont pas considérées comme agglutinantes mais fusionnelles . Cependant, des dérivations extrêmes similaires à celles trouvées dans les langues agglutinantes typiques existent. Un exemple célèbre est le mot bulgare непротивоконституциослователствувайте , qui signifie ne pas parler contre la constitution et secondairement ne pas agir contre la constitution . Il est composé de seulement trois racines : против contre , конституция constitution , un mot d'emprunt et donc dépourvu de sa composition interne et du mot слово . Les autres sont des morphèmes liés pour la négation ( не , un proclitique, autrement écrit séparément en verbes), l'intensificateur de nom ( -ателств ), la conversion nom-verbe ( -ува ), la fin du pluriel à la deuxième personne du mode impératif ( -йте ). C'est plutôt inhabituel, mais trouve un certain usage, par exemple les gros titres des journaux le 13 juillet 1991, le lendemain de l'adoption de l'actuelle constitution bulgare avec beaucoup de controverses, de débats et même de scandales.

Autres usages des mots agglutination et agglutination

Les mots agglutination et agglutinant viennent du mot latin agglutinare , « coller ensemble ». En linguistique, ces mots sont utilisés depuis 1836, lorsque Wilhelm von Humboldt a publié à titre posthume l'ouvrage Über die Verschiedenheit des menschlichen Sprachbaues und ihren Einfluß auf die geistige Entwicklung des Menschengeschlechts [lit.: Sur les différences de construction du langage humain et son influence sur le développement mental de l'humanité] a introduit la division des langues en isolant , flexionnel , agglutinant et incorporant .

Surtout dans certaines littératures plus anciennes, agglutinant est parfois utilisé comme synonyme de synthétique . Dans ce cas, il embrasse ce que nous appelons les langues agglutinantes et flexionnelles, et c'est un antonyme d' analytique ou d' isolant . Outre la motivation étymologique claire (après tout, les terminaisons flexionnelles sont également "collées" aux radicaux), cet usage plus général est justifié par le fait que la distinction entre langues agglutinantes et flexionnelles n'est pas nette, comme nous l'avons déjà vu.

Dans la seconde moitié du 19e siècle, de nombreux linguistes croyaient qu'il y avait un cycle naturel d'évolution de la langue : des mots fonctions de type isolant sont collés à leurs mots-tête, de sorte que la langue devient agglutinante ; les morphes ultérieurs fusionnent par des processus phonologiques, et ce qui en sort est un langage flexionnel ; enfin, les terminaisons flexionnelles sont souvent abandonnées dans le discours rapide, l'inflexion est omise et la langue revient au type isolant.

Le passage suivant de Lord (1960) montre bien toute la gamme de sens que peut avoir le mot agglutination .

( Agglutination ...) consiste en la fusion de deux ou plusieurs termes apparaissant constamment comme un groupe syntagmatique en une seule unité, qui devient soit difficile, soit impossible à analyser par la suite.

L'agglutination prend diverses formes. En français, le soudage devient fusion complète. Le latin hanc horam 'à cette heure' est l'unité adverbiale française encore . L'ancien français tous jours devient toujours , et dès jà ('depuis maintenant') déjà ('déjà'). En anglais, en revanche, hormis de rares combinaisons telles que good-bye from God be with you , noyer de Wales nut , window from wind-eye (ON vindauga ), les unités composant les formes agglutinées conservent leur identité. Des mots comme merle et bouvier sont une bouilloire différente; ils conservent leurs unités mais leur sens ultime n'est pas entièrement déductible de ces unités. (...)

Saussure a préféré distinguer les mots composés des combinaisons véritablement synthétisées ou agglutinées.

Langues agglutinantes dans le traitement automatique du langage naturel

Dans le traitement automatique du langage , les langues à morphologie riche posent des problèmes d'une tout autre nature que les langues isolantes. Dans le cas des langues agglutinantes, le principal obstacle réside dans le grand nombre de formes de mots pouvant être obtenues à partir d'une même racine. Comme nous l'avons déjà vu, la génération de ces formes de mots est quelque peu compliquée par les processus phonologiques de la langue particulière. Bien que la relation un à un de base entre la forme et la fonction syntaxique ne soit pas rompue en finnois, l'institution faisant autorité, l' Institut pour les langues de Finlande ( Kotus ) répertorie 51 types de déclinaison pour les noms, adjectifs, pronoms et chiffres finnois.

Encore plus de problèmes surviennent avec la reconnaissance des formes de mots. Les méthodes linguistiques modernes reposent en grande partie sur l'exploitation de corpus ; cependant, lorsque le nombre de formes de mots possibles est grand, tout corpus n'en contiendra nécessairement qu'une petite fraction. Hajič (2010) affirme que l'espace et la puissance informatiques sont si bon marché de nos jours que toutes les formes de mots possibles peuvent être générées à l'avance et stockées sous la forme d'un lexique répertoriant toutes les interprétations possibles d'une forme de mot donnée. (La structure de données du lexique doit être optimisée pour que la recherche soit rapide et efficace.) Selon Hajič, c'est la désambiguïsation de ces formes de mots qui est difficile (davantage pour les langues flexionnelles où l'ambiguïté est élevée que pour les langues agglutinantes langues).

D'autres auteurs ne partagent pas le point de vue de Hajič selon lequel l'espace n'est pas un problème et au lieu d'énumérer toutes les formes de mots possibles dans un lexique, l'analyse des formes de mots est mise en œuvre par des modules qui tentent de décomposer la forme de surface en une séquence de morphèmes apparaissant dans un ordre autorisé par la langue. Le problème d'une telle analyse est le grand nombre de frontières de morphèmes typiques des langues agglutinantes. Un mot d'une langue flexionnelle n'a qu'une seule terminaison et donc le nombre de divisions possibles d'un mot dans la base et la terminaison n'est que linéaire avec la longueur du mot. Dans une langue agglutinante, où plusieurs suffixes sont concaténés à la fin du mot, le nombre de divisions différentes dont il faut vérifier la cohérence est grand. Cette approche a été utilisée par exemple dans le développement d'un système pour l'arabe, où l'agglutination se produit lorsque les articles, les prépositions et les conjonctions sont joints avec le mot suivant et les pronoms sont joints avec le mot précédent. Voir Grefenstette et al. (2005) pour plus de détails.

Voir également

Remarques

Les références

Bibliographie

  • Kimmo Koskenniemi & Lingsoft Oy : analyseur morphologique finlandais , Lingsoft Language Solutions, 1995-2011.
  • Bernard Comrie (éditeur) : The World's Major Languages, Oxford University Press, New York – Oxford 1990.
  • Keith Denning, Suzanne Kemmer (éd.) : Sur la langue : écrits sélectionnés de Joseph H. Greenberg , Stanford University Press, 1990. Des parties sélectionnées sont disponibles sur googlebooks .
  • Victoria Fromkin, Robert Rodman, Nina Hyams : Une introduction au langage , Thompson Wadsworth, 2007.
  • Joseph H. Greenberg : Une approche quantitative de la typologie morphologique du langage , 1960. Disponible via JSTOR et dans Denning et al. (1990), p. 3–25. Il y a aussi un bon petit résumé .
  • Gregory Grefenstette , Nasredine Semmar, Faïza Elkateb-Gara : Modifying a Natural Language Processing System for European Languages ​​to Treat Arabic in Information Processing and Information Retrieval Applications , Computational Approaches to Semitic Languages ​​– Workshop Proceedings, University of Michigan 2005, p. 31-38. Disponible sur [1] .
  • Jan Hajič: Revivre l'histoire: les débuts de la traduction automatique statistique et des langues à morphologie riche , Actes IceTAL'10 de la 7e conférence internationale sur les progrès du traitement automatique des langues, Springer-Verlag Berlin, Heidelberg, 2010. Résumé disponible sur [2] .
  • Helena Lehečková : Úvod do ugrofinistiky, Státní pedagogické nakladatelství, Prague 1983.
  • Robert Lord : Teach Yourself Comparative Linguistics, The English Universities Press Ltd., St Paul's House, Londres 1967 (première édition 1966).
  • Hans Christian Luschützky : Uvedení do typologie jazyků , Filozofická fakulta Univerzity Karlovy, Praha 2003.
  • J. Vendryes : Language – A Linguistic Introduction to History, Kegan Paul, Trench, Trubner Co., Ltd., Londres 1925 (traduit par Paul Radin)

Liens externes