Catena (linguistique) - Catena (linguistics)

En linguistique , la Catena (prononciation anglaise: / k ə t Ï n ə / , pluriel catenas ou catenae , du latin pour « chaîne ») est une unité de la syntaxe et la morphologie , associée étroitement avec grammaires de dépendance . C'est une unité plus flexible et inclusive que le constituant et peut donc être mieux adaptée que le constituant pour servir d'unité fondamentale de l'analyse syntaxique et morphosyntaxique.

La catène a servi de base à l'analyse d'un certain nombre de phénomènes de syntaxe, tels que la signification idiosyncratique , les mécanismes d' ellipse (ex. Espacement , décapage , VP-ellipse , pseudogapping , sluicing , ellipse de réponse , suppression comparative), prédicat - structures d' argumentation , et les discontinuités ( topicalisation , wh-fronting , brouillage , extraposition , etc.). Le concept catena a également été pris comme base pour une théorie de la morphosyntaxe, c'est-à-dire pour l'extension des dépendances en mots; les dépendances sont reconnues entre les morphes qui constituent les mots.

Alors que le concept catena a été appliqué principalement à la syntaxe de l'anglais, d'autres travaux démontrent également son applicabilité à la syntaxe et à la morphologie d'autres langues.

Descriptions et définitions

Deux descriptions et deux définitions de l'unité catena sont maintenant données.

Catena (description quotidienne)
Tout mot unique ou toute combinaison de mots liés entre eux par des dépendances.
Catena (description théorique des graphes)
En termes de théorie des graphes, tout arbre syntaxique ou sous-graphe connexe d'un arbre est un catena. Tout élément individuel (mot ou morph) ou combinaison d'éléments liés ensemble dans la dimension verticale est un catena. La structure des phrases est conçue comme existant en deux dimensions. Les combinaisons organisées le long de la dimension horizontale (en termes de priorité) sont appelées chaînes , tandis que les combinaisons organisées le long de la dimension verticale (en termes de dominance) sont des catènes. En termes de système de coordonnées cartésien , des chaînes existent le long de l' axe x et des catènes le long de l' axe y .
Catena (définition informelle de la théorie des graphes)
Tout mot unique ou toute combinaison de mots qui sont continus dans la dimension verticale, c'est-à-dire par rapport à la dominance (axe des y).
Catena (définition formelle de la théorie des graphes)
Étant donné un arbre de dépendances T, un catena est un ensemble S de nœuds dans T tel qu'il y a un et un seul membre de S qui n'est immédiatement dominé par aucun autre membre de S.
Illustration de morph catenae

Quatre unités

Une compréhension de la catène est établie en faisant la distinction entre la catène et d'autres unités définies de manière similaire. Il y a quatre unités (y compris la catena) qui sont pertinentes à cet égard: chaîne , catena , composant et constituant . La définition informelle du catena est répétée pour une comparaison facile avec les définitions des trois autres unités:

Chaîne
Tout élément unique ou combinaison d'éléments continus dans la dimension horizontale ( axe des x ).
Catena
Tout élément unique ou combinaison d'éléments continus dans la dimension verticale ( axe y ).
Composant
Tout élément unique ou combinaison d'éléments qui forment à la fois une chaîne et une catène.
Constituant
Un composant complet .

Un composant est complet s'il inclut tous les éléments que son nœud racine domine. La chaîne et la catène se complètent de manière évidente, et la définition du constituant est essentiellement la même que celle que l'on trouve dans la plupart des théories de la syntaxe, où un constituant est compris comme étant n'importe quel nœud plus tous les nœuds que ce nœud domine . Ces définitions seront maintenant illustrées à l'aide de l'arbre de dépendances suivant. Les lettres majuscules servent à abréger les mots:

Illustration de Catena

Toutes les chaînes, catènes, composants et constituants distincts de cet arbre sont répertoriés ici:

Chaînes distinctes
A, B, C, D, E, F, AB, BC, CD, DE, EF, ABC, BCD, CDE, DEF, ABCD, BCDE, CDEF, ABCDE, BCDEF et ABCDEF.
Catènes distinctes
A, B, C, D, E, F, AB, BC, CF, DF, EF, ABC, BCF, CDF, CEF, DEF, ABCF, BCDF, BCEF, CDEF, ABCDF, ABCEF, BCDEF et ABCDEF.
Composants distincts
A, B, C, D, E, F, AB, BC, EF, ABC, DEF, CDEF, BCDEF et ABCDEF.
Constituants distincts
A, D, E, AB, DEF et ABCDEF.

Il convient de noter que l'arbre contient 39 combinaisons de mots distinctes qui ne sont pas des catènes, par exemple AC, BD, CE, BCE, ADF, ABEF, ABDEF, etc. Observez également qu'il n'y a que six constituants, mais 24 catènes. Il y a donc quatre fois plus de catènes dans l'arbre qu'il n'y a de constituants. L'inclusivité et la flexibilité de l'unité catena deviennent évidentes. Le diagramme de Venn suivant donne un aperçu de la relation entre les quatre unités:

Diagramme de Venn qui illustre la relation entre quatre unités clés de syntaxe et de morphologie

L'histoire

Le concept catena est présent en linguistique depuis quelques décennies. Dans les années 1970, le grammairien allemand des dépendances Jürgen Kunze a qualifié l'unité de «sous-arbre» ​​de Teilbaum . Au début des années 1990, les psycholinguistes Martin Pickering et Guy Barry ont reconnu l'unité catena, la qualifiant de constituant de la dépendance . Cependant, le concept de catena n'a pas suscité beaucoup d'intérêt parmi les linguistes jusqu'à ce que William O'Grady observe dans son article de 1998 que les mots qui forment des idiomes sont stockés sous forme de catenae dans le lexique. O'Grady a appelé l'unité syntaxique pertinente une chaîne , mais pas une catène . Le terme catena a été introduit plus tard par Timothy Osborne et ses collègues comme un moyen d'éviter la confusion avec le concept de chaîne préexistant de la théorie minimaliste . Depuis ce temps, le concept de catena a été développé au-delà de l'analyse des idiomes d'O'Grady pour servir de base à l'analyse d'un certain nombre de phénomènes centraux dans la syntaxe des langues naturelles (par exemple les ellipses et les structures prédicat-argument).

Langage idiosyncratique

Le langage idiosyncratique de toutes sortes peut être capturé en termes de catènes. Lorsque le sens est construit d'une manière qui ne permet pas de reconnaître des morceaux de sens comme constituants, le catena est impliqué. Les unités porteuses de sens sont des catènes et non des constituants. Cette situation est illustrée ici en termes de diverses collocations et idiomes propres.

Quelques collocations

Des collocations simples (c'est-à-dire la cooccurrence de certains mots) démontrent bien le concept de catena. La nature idiosyncratique des collocations de verbes de particules fournit le premier groupe d'exemples: prendre après , prendre , prendre , prendre , prendre en charge , etc. Dans sa forme la plus pure, le verbe prendre signifie «saisir, saisir, posséder». Dans ces collocations avec les différentes particules, cependant, la signification de take change de manière significative à chaque fois en fonction de la particule. La particule et la prise véhiculent ensemble une signification distincte, par laquelle cette signification distincte ne peut être comprise comme une combinaison directe du sens de prendre seul et du sens de la préposition seule. Dans de tels cas, on dit que le sens est non compositionnel . La signification non compositionnelle peut être saisie en termes de catènes. Les combinaisons de mots qui supposent une signification non compositionnelle forment catènes (mais pas les constituants):

quatre prennent des arbres

Les deux phrases a et b montrent que si le verbe et sa particule ne forment pas un constituant, ils forment une catène à chaque fois. Le contraste dans l'ordre des mots entre les phrases de chaque paire illustre ce que l'on appelle le décalage . Le décalage se produit pour s'adapter au poids relatif des constituants impliqués. Les constituants lourds préfèrent apparaître à droite des constituants frères plus légers. Le décalage ne change pas le fait que le verbe et la particule forment une catène à chaque fois, même lorsqu'ils ne forment pas une chaîne.

De nombreuses combinaisons verbe-préposition sont des collocations idiosyncratiques dans la mesure où le choix de la préposition est fortement restreint par le verbe, par exemple rendre compte , compter sur , remplir , compter sur , prendre après , attendre , etc. La signification de beaucoup de ces combinaisons est également non compositionnel, comme avec les verbes de particules. Et aussi comme pour les verbes de particules, les combinaisons forment des catènes (mais pas des constituants) dans des phrases déclaratives simples:

Combinaisons verbe-préposition

Le verbe et la préposition qu'il exige forment une seule unité porteuse de sens, cette unité étant une catène. Ces unités porteuses de sens peuvent ainsi être stockées comme catènes dans le lexique mental des locuteurs. En tant que catènes, ce sont des unités concrètes de syntaxe.

Le dernier type de collocations produit ici pour illustrer les catènes est la préposition complexe, par exemple à cause de , due à , à l' intérieur de , malgré , hors de , à l' extérieur de , etc. Le modèle d'intonation pour ces prépositions suggère que les conventions orthographiques sont correctes dans en les écrivant en deux (ou plus) mots. Cette situation, cependant, pourrait être considérée comme un problème, car il n'est pas clair que les deux mots puissent à chaque fois être considérés comme formant un constituant. À cet égard, ils sont bien sûr qualifiés de catena, par exemple

arbres de verbes de particules

Les collocations illustrées dans cette section se sont principalement concentrées sur les prépositions et les particules et ne sont donc qu'une petite sélection de collocations porteuses de sens. Ils sont cependant assez suggestifs. Il semble probable que toutes les collocations porteuses de sens soient stockées sous forme de catènes dans le lexique mental des utilisateurs du langage.

Expressions idiomatiques

Les expressions idiomatiques complètes sont les cas canoniques de signification non compositionnelle. Les mots fixes des idiomes ne portent pas leur sens productif, par exemple le prennent sur le menton . Quelqu'un qui "le prend sur le menton" n'éprouve en fait aucun contact physique avec son menton, ce qui signifie que le menton n'a pas sa signification productive normale et doit donc faire partie d'une plus grande collocation. Cette plus grande collocation est l'idiome, qui se compose de cinq mots dans ce cas. Alors que l'idiome le prend sur le menton peut être stocké en tant que constituant VP (et n'est donc pas un problème pour les théories basées sur les constituants), il existe de nombreux idiomes qui ne peuvent clairement pas être stockés en tant que constituants. Ces idiomes posent un problème pour les théories fondées sur les constituants précisément parce qu'ils ne sont pas qualifiés de constituants. Cependant, ils sont bien sûr qualifiés de catènes. La discussion ici se concentre sur ces idiomes car ils illustrent particulièrement bien la valeur du concept catena.

De nombreux idiomes en anglais se composent d'un verbe et d'un nom (et plus), le nom prenant un possesseur qui co-indexé avec le sujet et variera donc avec le sujet. Ces idiomes sont stockés en tant que catènes mais clairement pas en tant que constituants, par exemple

Expressions idiomatiques 1

Les idiomes similaires ont un possesseur qui est plus libre dans la mesure où il n'est pas nécessairement co-indexé avec le sujet. Ces idiomes sont également stockés en tant que catènes (mais pas en tant que constituants), par ex.

Catena: Expressions idiomatiques 2

Les expressions idiomatiques suivantes incluent le verbe et l'objet, ainsi qu'au moins une préposition. Il devrait à nouveau être évident que les mots fixes des idiomes ne peuvent en aucun cas être considérés comme des constituants:

Expressions idiomatiques 3

Les idiomes suivants incluent le verbe et la phrase prépositionnelle en même temps que l'objet est libre:

Expressions idiomatiques 4

Et les idiomes suivants impliquant un verbe ditransitif incluent le deuxième objet en même temps que le premier objet est libre:

Expressions idiomatiques 5

Certes, les dictons sont également idiomatiques. Lorsqu'un adverbe (ou un autre complément) apparaît dans un dicton, il ne fait pas partie du dicton. Néanmoins, les mots du dicton forment toujours une catène:

Arbres de dictons

Ellipse

Les mécanismes d'ellipse (espacement, stripping, VP-ellipsis, pseudogapping, fragments de réponse, sluicing, suppression comparative) éliminent les catènes, dans lesquelles beaucoup de ces catènes sont non constituantes. Les exemples suivants illustrent l' écart :

Ellipse image 1

Les clauses a sont des exemples acceptables d'espacement; le matériau espacé correspond à la catène en vert. Les clauses b sont des tentatives infructueuses d'écart; ils échouent parce que le matériau espacé ne correspond pas à une catène. Les exemples suivants illustrent le décapage . De nombreux linguistes voient le décapage comme une manifestation particulière de l'écart où un seul reste reste dans la clause gapped / stripped:

Ellipse photo 2

Les clauses a sont des exemples acceptables de décapage, en partie parce que le matériau décapé correspond à un catena (en vert). Les clauses b échouent à nouveau; ils échouent parce que le matériau dépouillé n'est pas considéré comme un catena. Les exemples suivants illustrent les points de suspension:

Ellipse image 4

Dans chacun des fragments de réponse acceptables (a – e), le matériau élidé correspond à une catène. En revanche, le matériau élidé correspond à une non-catène dans chacun des fragments de réponse inacceptables (f – h).

Structures prédicat-argument

L'unité catena convient à la compréhension des prédicats et de leurs arguments - un prédicat est une propriété affectée à un argument ou en tant que relation établie entre des arguments. Un prédicat donné apparaît dans la structure de la phrase en tant que catena, de même que ses arguments. Un prédicat matriciel standard dans une phrase se compose d'un verbe de contenu et potentiellement d'un ou plusieurs verbes auxiliaires. Les exemples suivants illustrent comment les prédicats et leurs arguments se manifestent dans des phrases synonymes à travers les langues:

Première image illustrant les structures prédicat-argument

Les mots en vert sont le prédicat principal et ceux en rouge sont les arguments de ce prédicat. Le prédicat à un seul mot indiqué dans la phrase anglaise à gauche correspond au prédicat à deux mots hat gesagt en allemand. Chaque prédicat montré et chacun de ses arguments présentés est un catena.

L'exemple suivant est similaire, mais cette fois une phrase française est utilisée pour faire le point:

Deuxième image illustrant les structures des arguments de prédicat

Les prédicats matriciels sont à nouveau en vert et leurs arguments en rouge. Le bord de dépendance de la flèche marque un complément - cette convention n'a pas été utilisée dans les exemples ci-dessus. Dans ce cas, le prédicat principal en anglais est constitué de deux mots correspondant à un mot en français.

Les exemples suivants donnent une idée de la manière dont le prédicat de la phrase principale reste un catena à mesure que le nombre de verbes auxiliaires augmente:

Préd-arg 3

La phrase a contient un verbe auxiliaire, la phrase b deux et la phrase c trois. L'apparition de ces verbes auxiliaires ajoute des informations fonctionnelles au contenu de base fourni par le verbe de contenu révisé . Au fur et à mesure que chaque verbe auxiliaire supplémentaire est ajouté, le prédicat se développe, le prédicat catena gagne des liens.

Lors de l'évaluation de l'approche des structures prédicat-argument en termes de catènes, il est important de garder à l'esprit que l'unité constitutive de la grammaire de la structure de la phrase est beaucoup moins utile pour caractériser les combinaisons de mots réelles qui se qualifient comme prédicats et leurs arguments. Ce fait devrait être évident à partir des exemples ici, où les combinaisons de mots en vert ne seraient pas considérées comme des constituants dans les grammaires de structure de phrase.

Voir également

Remarques

Références

  • O'Grady, W. 1998. La syntaxe des idiomes. Langage naturel et théorie linguistique 16. 279–312.
  • Groß, T. 2014. Clitiques dans la morphologie de la dépendance. Dans Linguistics Today Vol. 215: Dependency Linguistics , éd. par E. Hajičová et al., pp. 229–252. Amsterdam / Philadelphie: John Benjamins Publishing.
  • Groß, T. et T. Osborne 2013. Katena und Konstruktion: Ein Vorschlag zu einer dependenziellen Konstruktionsgrammatik. Zeitschrift für Sprachwissenschaft 32, 1, 41–73.
  • Imrényi, A. 2013a. La syntaxe des auxiliaires hongrois: un compte de grammaire de dépendance. Actes de la deuxième conférence internationale sur la linguistique des dépendances (DepLing 2013). Prague, du 27 au 30 août 2013. Université Charles de Prague / Matfyzpress. 118–127.
  • Imrényi A. 2013b. Un magyar mondat viszonyhálózati modellje. ( Un modèle de réseau relationnel de la clause hongroise .) Budapest: Akadémiai Kiadó. (154 pages).
  • Imrényi, A. 2013c. Circonscription ou dépendance? Notes sur le modèle syntaxique du hongrois de Sámuel Brassai. Dans: Szigetvári, Péter (éd.), VLlxx. Documents présentés à László Varga à l'occasion de son 70e anniversaire . Budapest: Tinta. 167–182.
  • Kunze, J. 1975. Abhängigkeitsgrammatik. Studia Grammatica XII. Berlin: Akademie Verlag.
  • Osborne, T. 2005. Au-delà du constituant: une analyse DG des chaînes. Folia Linguistica 39, 3–4. 251–297.
  • Osborne, T. 2012. Caractéristiques de bord, catènes et minimalisme basé sur les dépendances. Analyse linguistique 34, 3–4, 321–366.
  • Osborne, T. 2014. Grammaire des dépendances. Dans The Routledge Handbook of Syntax , éd. par A. Carnie, Y. Sato et D. Saddiqi, pp. 604–626. Londres: Routledge.
  • Osborne, T. 2015. Grammaire des dépendances. In Handbücher zur Sprach- und Kommunikationswissenschaft / Handbooks of Linguistics and Communication Science (HSK) 42, 2, 1027–1044.
  • Osborne, T. 2019. Ellipse dans la grammaire des dépendances. Dans Jeroen van Craenenbrock et Tanja Temmerman (éd.), The Oxford Handbook of Ellipsis, 142–161. Oxford, Royaume-Uni: Oxford University Press.
  • Osborne, T. 2019. A Dependency Grammar of English: An Introduction and Beyond . Amsterdam: John Benjamins. https://doi.org/10.1075/z.224
  • Osborne, T. et T. Groß 2012a. Les constructions sont catenae: la grammaire de construction rencontre la grammaire de dépendance. Linguistique cognitive 23, 1, 163–214.
  • Osborne, T. et T. Groß 2012b. Contention d'antécédent: Une solution de grammaire de dépendance en termes de catènes. Studia Linguistica 66, 2, 94–127.
  • Osborne, T. et T. Groß. 2016. Le do-so-diagostic: Contre les PV finis et les PV plats non finis. Folia Linguistica 50, 1, 97–35.
  • Osborne, T. et T. Groß. 2018. Répondez à des fragments. The Linguistic Review 35, 1, 161–186.
  • Osborne, T., M. Putnam et T. Groß. 2011. Structure de phrase nue, arbres sans étiquette et syntaxe sans spécificateur: le minimalisme devient-il une grammaire de dépendances? The Linguistic Review 28: 315–364.
  • Osborne, T., M. Putnam et T. Groß 2012. Catenae: Introduction d'une nouvelle unité d'analyse syntaxique. Syntaxe 15, 4, 354–396.
  • Pickering, M. et G. Barry 1993. Grammaire catégorielle des dépendances et coordination. Linguistics 31, 855–902.