Numéro catalan - Catalan number

Le C 5 = 42 partitions non croisées d'un ensemble de 5 éléments (ci-dessous, les 10 autres des 52 partitions )

En mathématiques combinatoires , les nombres catalans sont une séquence de nombres naturels qui se produisent dans divers problèmes de comptage , impliquant souvent des objets définis de manière récursive . Ils portent le nom du mathématicien franco-belge Eugène Charles Catalan (1814-1894).

Le n ième nombre de Catalan peut être exprimé directement en termes de coefficients binomiaux par

Les premiers nombres catalans pour n = 0, 1, 2, 3, ... sont

1, 1, 2, 5, 14, 42, 132, 429, 1430, 4862, 16796, 58786, ... (séquence A000108 dans l' OEIS ).

Propriétés

Une expression alternative pour C n est

pour

ce qui équivaut à l'expression donnée ci-dessus car . Cette expression montre que C n est un entier , ce qui n'est pas immédiatement évident à partir de la première formule donnée. Cette expression constitue la base d'une preuve de l'exactitude de la formule .

Les nombres catalans satisfont les relations de récurrence

et

Asymptotiquement, les nombres catalans croissent comme

en ce sens que le quotient du n ième nombre catalan et de l'expression de droite tend vers 1 lorsque n tend vers l' infini. Ceci peut être prouvé en utilisant la croissance asymptotique des coefficients binomiaux centraux , par l'approximation de Stirling pour , ou via des fonctions génératrices .

Les seuls nombres catalans C n impairs sont ceux pour lesquels n  = 2 k  − 1 ; tous les autres sont pairs. Les seuls nombres premiers catalans sont C 2 = 2 et C 3 = 5.

Les nombres catalans ont la représentation intégrale

.

Applications en combinatoire

Il existe de nombreux problèmes de comptage en combinatoire dont la solution est donnée par les nombres de Catalan. Le livre Combinatoire énumérative : Volume 2 du combinatoire Richard P. Stanley contient une série d'exercices qui décrivent 66 interprétations différentes des nombres catalans. Voici quelques exemples, avec des illustrations des cas C 3  = 5 et C 4  = 14.

Treillis des 14 mots de Dyck de longueur 8 - ( et ) interprétés comme haut et bas
  • C n est le nombre de mots de
Dyck de longueur 2 n . Un mot de Dyck est une chaîne composée de n X et n Y de telle sorte qu'aucun segment initial de la chaîne n'ait plus de Y que de X. Par exemple, voici les mots de Dyck de longueur 6 :
XXXYYY XYXXYY XYXYXY XXYYXY XXYXYY.
  • En réinterprétant le symbole X comme une parenthèse ouverte et Y comme une parenthèse fermée, C n compte le nombre d'expressions contenant n paires de parenthèses qui correspondent correctement :
((())) ()(()) ()()() (())() (()())
((ab)c)d (a(bc))d (ab)(cd) a((bc)d) a(b(cd))
L' associaèdre d'ordre 4 avec le C 4 = 14 arbres binaires complets à 5 feuilles
  • Les applications successives d'un opérateur binaire peuvent être représentées en termes d'un arbre binaire complet , avec chaque crochet correctement correspondant décrivant un nœud interne. Il s'ensuit que C n est le nombre d' arbres binaires complets avec n  + 1 feuilles, ou, de manière équivalente, avec un total de n nœuds internes :
Catalan 4 feuilles arbre binaire example.svg

De plus, l'intérieur du Y de fermeture correspondant correctement pour le premier X d'un mot de Dyck contient la description du sous-arbre gauche, l'extérieur décrivant le sous-arbre droit.

  • C n est le nombre d' arbres ordonnés (ou plans) non isomorphes à n + 1 sommets. Voir encoder des arbres généraux en arbres binaires .
  • C n est le nombre de chemins de réseau monotones le long des bords d'une grille avec n × n cellules carrées, qui ne passent pas au-dessus de la diagonale. Un chemin monotone est un chemin qui commence dans le coin inférieur gauche, se termine dans le coin supérieur droit et se compose entièrement d'arêtes pointant vers la droite ou vers le haut. Compter de tels chemins équivaut à compter les mots de Dyck : X signifie "déplacer vers la droite" et Y signifie "déplacer vers le haut".

Les schémas suivants montrent le cas n = 4 :

Exemple de grille numéro catalan 4x4.svg

Cela peut être représenté en listant les éléments catalans par hauteur de colonne :

Le triangle noir est le nœud racine, les triangles clairs correspondent aux nœuds internes des arbres binaires et les barres vertes sont les feuilles.
[0,0,0,0] [0,0,0,0,1] [0,0,0,0,2] [0,0,1,1]
[0,1,1,1] [0,0,1,2] [0,0,0,3] [0,1,1,2] [0,0,2,2] [0,0, 1,3]
[0,0,2,3] [0,1,1,3] [0,1,2,2] [0,1,2,3]
polygones ). Le nombre de triangles formés est n et le nombre de façons différentes d'y parvenir est C n . Les hexagones suivants illustrent le cas n = 4 :
Catalan-Hexagones-exemple.svg
  • C n est le nombre de
permutations triables par pile de {1, ..., n }. Une permutation w est dite triable par pile si S ( w ) = (1, ...,  n ), où S ( w ) est défini récursivement comme suit : écrire wunvn est le plus grand élément de w et u et v sont des séquences plus courtes et définissent S ( w ) =  S ( u ) S ( v ) n , S étant l'identité des séquences à un élément.
  • C n est le nombre de permutations de {1, ...,  n } qui évitent le motif de permutation  123 (ou, en variante, n'importe lequel des autres motifs de longueur 3) ; c'est-à-dire le nombre de permutations sans sous-séquence croissante à trois termes. Pour n = 3, ces permutations sont 132, 213, 231, 312 et 321. Pour n = 4, ce sont 1432, 2143, 2413, 2431, 3142, 3214, 3241, 3412, 3421, 4132, 4213, 4231, 4312 et 4321.
  • C n est le nombre de partitions non croisées de l'ensemble {1, ...,  n }. A fortiori , C n ne dépasse jamais le n ième numéro de Bell . C n est aussi le nombre de partitions non croisées de l'ensemble {1, ..., 2 n } dans lesquelles chaque bloc est de taille 2. La conjonction de ces deux faits peut être utilisée dans une preuve par induction mathématique que tous les les cumulants libres de degré supérieur à 2 de la loi du demi-cercle de Wigner sont nuls. Cette loi est importante dans la théorie des probabilités libres et la théorie des matrices aléatoires .
  • C n est le nombre de façons de carreler une forme d'escalier de hauteur n avec n rectangles. Couper l'anti-diagonale et ne regarder que les bords donne des arbres binaires complets. La figure suivante illustre le cas n  = 4 :
  • Escalier catalan 4.svg
    • C n est le nombre de façons de former une "chaîne de montagnes" avec n montées et n descentes qui restent toutes au-dessus d'une ligne horizontale. L'interprétation de la chaîne de montagnes est que les montagnes ne descendront jamais sous l'horizon.
    Numéro Catalan
    • C n est le nombre de tableaux de Young standard dont le diagramme est un rectangle de 2 sur n . En d'autres termes, c'est le nombre de façons dont les nombres 1, 2, ..., 2 n peuvent être arrangés dans un rectangle de 2 par n de sorte que chaque ligne et chaque colonne augmente. En tant que telle, la formule peut être dérivée comme un cas particulier de la formule de la longueur du
    crochet .
  • C n est le nombre de semi -
  • ordres sur n éléments non étiquetés.
    • Étant donné un
    arbre de décision binaire parfait infini et n-1 votes, est le nombre de résultats de vote possibles, étant donné qu'à n'importe quel nœud, vous pouvez diviser vos votes comme vous le souhaitez.
  • est le nombre de séquences de longueur n commençant par , et pouvant augmenter de ou , ou diminuer de n'importe quel nombre (jusqu'à au moins ). Car ceux-ci sont . Par rapport à la représentation similaire des
  • numéros de Bell , il ne manque que.

    Preuve de la formule

    Il y a plusieurs façons d'expliquer pourquoi la formule

    résout les problèmes combinatoires énumérés ci-dessus. La première preuve ci-dessous utilise une fonction génératrice . Les autres preuves sont des exemples de preuves bijectives ; ils impliquent de compter littéralement une collection d'une sorte d'objet pour arriver à la formule correcte.

    Première preuve

    Nous observons d'abord que tous les problèmes combinatoires énumérés ci-dessus satisfont la relation de récurrence de Segner

    Par exemple, chaque mot de Dyck w de longueur ≥ 2 peut être écrit d'une manière unique sous la forme

    w = X w 1 Y w 2

    avec (éventuellement vide) les mots de Dyck w 1 et w 2 .

    La fonction génératrice des nombres de Catalan est définie par

    La relation de récurrence donnée ci-dessus peut alors être résumée sous forme de fonction génératrice par la relation

    en d'autres termes, cette équation découle de la relation de récurrence en développant les deux côtés en séries entières . D'une part, la relation de récurrence détermine uniquement les nombres de Catalan ; d'autre part, la relation de fonction génératrice peut être résolue algébriquement pour donner

    En choisissant le signe moins, la fraction a une série entière à 0 donc ses coefficients doivent donc être les nombres de Catalan. Cette solution satisfait

    Le terme racine carrée peut être développé comme une série entière en utilisant l'identité

    C'est un cas particulier du théorème binomial généralisé de

    Newton ; comme avec le théorème général, il peut être prouvé en calculant des dérivées pour produire sa série de Taylor.

    Le réglage y = -4 x donne

    et en substituant cette série entière dans l'expression pour c ( x ) et en décalant l'indice de sommation n de 1, le développement se simplifie en

    Soit , pour que

    et parce que (voir 'preuve de récidive' ci-dessus)

    on a

    Deuxième preuve

    Figure 1. La partie invalide du chemin (pointillé rouge) est inversée (rouge continu). Les mauvais chemins (après le retournement) atteignent ( n  – 1,  n  + 1) au lieu de ( n , n ).

    On compte le nombre de chemins qui commencent et se terminent sur la diagonale d'une grille n  ×  n . Tous ces chemins ont n étapes droites et n étapes montantes. Comme on peut choisir laquelle des 2 n marches est en haut ou à droite, il existe au total des chemins monotones de ce type. Un

    mauvais chemin traverse la diagonale principale et touche la prochaine diagonale supérieure (en rouge sur l'illustration).

    La partie du chemin après la diagonale supérieure est inversée autour de cette diagonale, comme illustré par la ligne pointillée rouge. Cela permute toutes les bonnes étapes en étapes supérieures et vice versa. Dans la section du chemin qui n'est pas reflétée, il y a une marche supérieure de plus que les marches droites, donc la section restante du mauvais chemin a une marche droite de plus que les marches supérieures. Lorsque cette partie du chemin est réfléchie, elle aura un pas de plus que les pas de droite.

    Puisqu'il y a encore 2 n pas, il y a maintenant n  + 1 pas vers le haut et n  − 1 pas vers la droite. Ainsi, au lieu d'atteindre ( n , n ), tous les mauvais chemins après réflexion se terminent à ( n  − 1,  n  + 1). Parce que chaque chemin monotone dans la  grille ( n  − 1) × ( n + 1) rencontre la diagonale supérieure, et parce que le processus de réflexion est réversible, la réflexion est donc une bijection entre les mauvais chemins dans la grille d'origine et les chemins monotones dans la nouvelle la grille.

    Le nombre de mauvais chemins est donc :

    et le nombre de chemins catalans (c'est-à-dire de bons chemins) est obtenu en retirant le nombre de mauvais chemins du nombre total de chemins monotones de la grille d'origine,

    .

    En termes de mots de Dyck, nous commençons par une séquence (non-Dyck) de n X et n Y et échangeons tous les X et Y après le premier Y qui viole la condition de Dyck. Après ce Y, notez qu'il y a exactement un Y de plus qu'il n'y a de X.

    Troisième preuve

    Cette preuve bijective fournit une explication naturelle du terme n  + 1 apparaissant au dénominateur de la formule pour  C n . Une version généralisée de cette preuve peut être trouvée dans un article de Rukavicka Josef (2011).

    Figure 2. Un chemin avec dépassement 5.

    Étant donné un chemin monotone, le dépassement du chemin est défini comme étant le nombre d' arêtes verticales au-dessus de la diagonale. Par exemple, sur la figure 2, les bords au-dessus de la diagonale sont marqués en rouge, le dépassement de ce chemin est donc de 5.

    Étant donné un chemin monotone dont le dépassement n'est pas nul, nous appliquons l'algorithme suivant pour construire un nouveau chemin dont le dépassement est inférieur de 1 à celui de départ.

    • En partant du bas à gauche, suivez le chemin jusqu'à ce qu'il passe d'abord au-dessus de la diagonale.
    • Continuez à suivre le chemin jusqu'à ce qu'il touche à nouveau la diagonale. Désignons par X la première arête de ce type atteinte.
    • Échangez la portion du chemin se produisant avant X avec la portion se produisant après X .

    Sur la figure 3, le point noir indique le point où le chemin croise en premier la diagonale. Le bord noir est X , et nous plaçons le dernier point de réseau de la partie rouge dans le coin supérieur droit et le premier point de réseau de la partie verte dans le coin inférieur gauche, et plaçons X en conséquence, pour créer un nouveau chemin , montré dans le deuxième diagramme.

    Figure 3. Les portions verte et rouge sont en cours d'échange.

    Le dépassement est passé de 3 à 2 . En fait, l'algorithme fait diminuer le dépassement de 1 pour tout chemin que nous alimentons, car le premier pas vertical commençant sur la diagonale (au point marqué d'un point noir) est l'unique arête verticale qui passe au-dessus de la diagonale en dessous - tous les autres bords verticaux restent du même côté de la diagonale.

    Figure 4. Tous les chemins monotones dans une grille 3×3, illustrant l'algorithme de diminution des dépassements.

    Il n'est pas non plus difficile de voir que ce processus est réversible : étant donné tout chemin P dont le dépassement est inférieur à n , il y a exactement un chemin qui donne P lorsque l'algorithme lui est appliqué. En effet, le bord (noir) X , qui était à l'origine le premier pas horizontal se terminant sur la diagonale, est devenu le dernier pas horizontal commençant sur la diagonale. Vous pouvez également inverser l'algorithme d'origine pour rechercher le premier bord qui passe sous la diagonale.

    Ceci implique que le nombre de chemins de dépassement n est égal au nombre de chemins de dépassement n  − 1, qui est égal au nombre de chemins de dépassement n  − 2, et ainsi de suite jusqu'à zéro. En d'autres termes, nous avons divisé l'ensemble de tous les chemins monotones en n  + 1 classes de taille égale, correspondant aux dépassements possibles entre 0 et n . Comme il existe des chemins monotones, on obtient la formule désirée

    La figure 4 illustre la situation pour  n  = 3. Chacun des 20 chemins monotones possibles apparaît quelque part dans le tableau. La première colonne montre tous les chemins de dépassement trois, qui se trouvent entièrement au-dessus de la diagonale. Les colonnes de droite montrent le résultat des applications successives de l'algorithme, le dépassement diminuant d'une unité à la fois. Il y a cinq lignes, c'est-à-dire  C 3  = 5, et la dernière colonne affiche tous les chemins ne dépassant pas la diagonale.

    En utilisant des mots de Dyck, commencez par une séquence de . Soit le premier

    X qui amène une sous-séquence initiale à l'égalité, et configure la séquence comme . La nouvelle séquence est .

    Quatrième preuve

    Cette preuve utilise la définition de triangulation des nombres de Catalan pour établir une relation entre C n et C n +1 .

    Étant donné un polygone P à n  + 2 côtés et une triangulation, marquez l'un de ses côtés comme base, et orientez également l'un de ses 2 n  + 1 arêtes au total. Il existe (4 n  + 2) C n de telles triangulations marquées pour une base donnée.

    Étant donné un polygone Q avec n  + 3 côtés et une triangulation (différente), marquez à nouveau l'un de ses côtés comme base. Marquez l'un des côtés autres que le côté de la base (et non un bord triangulaire intérieur). Il existe ( n  + 2) C n  + 1 de telles triangulations marquées pour une base donnée.

    Il existe une bijection simple entre ces deux triangulations marquées : On peut soit rabattre le triangle en Q dont le côté est marqué (de deux manières, et soustraire les deux qui ne peuvent pas rabattre la base), soit, à l'inverse, développer l'arête orientée en P à un triangle et marquer son nouveau côté.

    Ainsi

    .

    Écrire .

    Parce que

    alors

    L'application de la récursivité avec donne le résultat.

    Cinquième preuve

    Cette preuve est basée sur l' interprétation des mots de Dyck des nombres catalans, donc C n est le nombre de façons de faire correspondre correctement n paires de parenthèses. On note une chaîne correcte (éventuellement vide) avec c et son inverse (où "[" et "]" sont échangés) avec c ' . Puisque tout c peut être décomposé de manière unique en c  = [  c 1  ] c 2 , la somme des emplacements possibles pour placer la parenthèse fermante donne immédiatement la définition récursive

    Soit b une chaîne équilibrée de longueur 2 n, c'est-à-dire contenant un nombre égal de "[" et "]", donc . Comme précédemment, toute chaîne équilibrée peut être décomposée de manière unique en [ 

    c  ]  b ou ]  c '  [  b , donc
    .

    Toute chaîne équilibrée incorrecte commence par c  ], et la chaîne restante en a un de plus [ que ], donc

    De plus, à partir des définitions, nous avons :

    Par conséquent

    Sixième preuve

    Cette preuve est basée sur l' interprétation des mots de Dyck des nombres catalans et utilise le lemme du cycle de Dvoretzky et Motzkin.

    On appelle dominante une séquence de X et de Y si, en lisant de gauche à droite, le nombre de X est toujours strictement supérieur au nombre de Y. Le lemme du cycle énonce que toute séquence de X et de Y, où , a précisément des permutations cycliques dominantes. Pour voir cela, organisez la séquence donnée de X et de Y dans un cercle. La suppression répétée des paires XY laisse exactement X. Chacun de ces X était le début d'une permutation cyclique dominante avant que quoi que ce soit ne soit supprimé.

    Par exemple, considérez . Ceci est dominant, mais aucune de ses permutations cycliques , , et ne l' est.

    En particulier, quand , il y a exactement une permutation cyclique dominante. Supprimer le X de tête (une séquence dominante doit commencer par X) laisse une séquence de Dyck. Puisqu'il y en a au total et que chacun appartient à une classe d'équivalence de taille

    2n+1 (car n , m et 2n+1 sont deux à deux premiers entre eux), nous avons des cycles distincts de X et de Y, chacun correspondant à exactement un Dyck séquence, compte donc les séquences de Dyck.

    Matrice de Hankel

    La

    matrice de Hankel n × n dont ( ij ) l'entrée est le nombre de Catalan C i + j −2 a le déterminant 1, quelle que soit la valeur de n . Par exemple, pour n = 4 on a

    De plus, si l'indexation est « décalée » de sorte que l' entrée ( i , j ) soit remplie du nombre catalan C i + j −1 alors le déterminant est toujours 1, quelle que soit la valeur de n . Par exemple, pour n = 4 on a

    Prises ensemble, ces deux conditions définissent de manière unique les nombres catalans.

    Une autre caractéristique unique de la matrice de Catalan-Hankel est le déterminant de la sous-matrice n x n commençant à 2 a le déterminant n+1 .

    etc.

    Histoire

    Nombres catalans dans le livre de Mingantu La méthode rapide pour obtenir le rapport précis de division d'un cercle volume III

    La séquence catalane a été décrite au XVIIIe siècle par Leonhard Euler , qui s'intéressait au nombre de façons différentes de diviser un polygone en triangles. La séquence porte le nom d' Eugène Charles Catalan , qui a découvert le lien avec des expressions entre parenthèses lors de son exploration du puzzle des Tours de Hanoï . L'astuce de comptage des reflets (deuxième preuve) pour les mots de Dyck a été trouvée par Désiré André en 1887.

    Le nom « Chiffres catalans » vient de John Riordan .

    En 1988, il est apparu que la suite de nombres catalane avait été utilisée en Chine par le mathématicien mongol Mingantu vers 1730. C'est alors qu'il a commencé à écrire son livre Ge Yuan Mi Lu Jie Fa [La méthode rapide pour obtenir le rapport précis de Division d'un cercle] , qui fut achevé par son élève Chen Jixin en 1774 mais publié soixante ans plus tard. Peter J. Larcombe (1999) a esquissé certaines des caractéristiques de l'œuvre de Mingantu, dont le stimulus de Pierre Jartoux, qui a apporté trois séries infinies en Chine au début des années 1700.

    Par exemple, Ming a utilisé la séquence catalane pour exprimer les développements en série de sin(2α) et sin(4α) en termes de sin(α).

    Généralisations

    La suite à deux paramètres d'entiers non négatifs est une généralisation des nombres de Catalan. Ceux-ci sont nommés

    nombres super-catalans , par Ira Gessel . Ceux-ci ne doivent pas être confondus avec les nombres de Schröder-Hipparchus , qui sont parfois aussi appelés nombres super-catalans.

    Pour , c'est juste deux fois les nombres catalans ordinaires, et pour , les nombres ont une description combinatoire facile. Cependant, d'autres descriptions combinatoires ne sont connues que pour et , et c'est un problème ouvert de trouver une interprétation combinatoire générale.

    Sergey Fomin et Nathan Reading ont donné un nombre de Catalan généralisé associé à tout groupe de Coxeter cristallographique fini , à savoir le nombre d'éléments pleinement commutatifs du groupe ; en termes de système racinaire associé , c'est le nombre d'anti-chaînes (ou idéaux d'ordre) dans le poset de racines positives. Le nombre catalan classique correspond au système racinaire de type . La relation de récurrence classique se généralise : le nombre de Catalan d'un diagramme de Coxeter est égal à la somme des nombres de Catalan de tous ses sous-diagrammes propres maximaux.

    La convolution k-fold catalane est :

    Les nombres de Catalan sont une solution d'une version du problème des moments de Hausdorff .

    Voir également

    Remarques

    Les références

    Liens externes

    partition sur Wikiversity