Algorithme de Kleene - Kleene's algorithm

En informatique théorique , en particulier en théorie du langage formel , l'algorithme de Kleene transforme un automate fini non déterministe (NFA) donné en une expression régulière . Avec d'autres algorithmes de conversion, il établit l'équivalence de plusieurs formats de description pour les langues régulières . Des présentations alternatives de la même méthode incluent la "méthode d'élimination" attribuée à Brzozowski et McCluskey , l'algorithme de McNaughton et Yamada et l'utilisation du lemme d' Arden .

Description de l'algorithme

Selon Gross et Yellen (2004), l'algorithme peut être retracé jusqu'à Kleene (1956). Une présentation de l'algorithme dans le cas des automates finis déterministes (DFA) est donnée dans Hopcroft et Ullman (1979). La présentation de l'algorithme pour les NFA ci-dessous suit Gross et Yellen (2004).

Étant donné un automate fini non déterministe M = ( Q , Σ, δ, q ₀ , F ), avec Q = { q ₀ , ..., q _n } son ensemble d' états , l'algorithme calcule

les ensembles R ^k
_ij de toutes les chaînes qui prennent M de l'état q _i à q _j sans passer par un état numéroté supérieur à k .

Ici, «passer par un état» signifie y entrer et en sortir, donc i et j peuvent être supérieurs à k , mais aucun état intermédiaire ne le peut. Chaque ensemble R ^k
_ij est représenté par une expression régulière; l'algorithme les calcule pas à pas pour k = -1, 0, ..., n . Puisqu'il n'y a pas d'état numéroté plus haut que n , l'expression régulière R ⁿ
_0j représente l'ensemble de toutes les chaînes qui prennent M de son état de départ q ₀ à q _j . Si F = { q ₁ , ..., q _f } est l'ensemble des états d'acceptation , l' expression régulière R ⁿ
₀₁ | ... | R ⁿ
_0f représente la langue acceptée par M .

Les expressions régulières initiales, pour k = -1, sont calculées comme suit pour i ≠ j :

R ⁻¹
_ij = a ₁ | ... | a _m où q _j ∈ δ ( q _i , a ₁ ), ..., q _j ∈ δ ( q _i , a _m )

et comme suit pour i = j :

R ⁻¹
_ii = a ₁ | ... | un _m | ε où q _i ∈ δ ( q _i , a ₁ ), ..., q _i ∈ δ ( q _i , a _m )

En d'autres termes, R ⁻¹
_ij mentionne toutes les lettres qui marquent une transition de i à j , et nous incluons également ε dans le cas où i = j .

Après cela, à chaque étape, les expressions R ^k
_ij sont calculés à partir des précédents par

R ^k
_ij = R ^{k -1}
_ik ( R ^{k -1}
_kk ) ^* R ^{k -1}
_kj | R ^{k -1}
_ij

Une autre façon de comprendre le fonctionnement de l'algorithme est comme une "méthode d'élimination", où les états de 0 à n sont successivement supprimés: lorsque l'état k est supprimé, l'expression régulière R ^{k -1}
_ij , qui décrit les mots qui étiquettent un chemin de l'état i > k à l'état j > k , est réécrit dans R ^k
_ij afin de prendre en compte la possibilité de passer par l'état "éliminé" k .

Par récurrence sur k , on peut montrer que la longueur de chaque expression R ^k
_ij est au plus 1 / 3 (4 ^{k +1} (6 s +7) - 4) symboles, où s désigne le nombre de caractères dans Σ. Par conséquent, la longueur de l'expression régulière représentant le langage accepté par M est au plus 1 / 3 (4 ^{n +1} (6 s +7) f - f - 3) symboles, où f désigne le nombre d'états finaux. Cette explosion exponentielle est inévitable, car il existe des familles de DFA pour lesquelles toute expression régulière équivalente doit être de taille exponentielle.

En pratique, la taille de l'expression régulière obtenue en exécutant l'algorithme peut être très différente selon l'ordre dans lequel les états sont considérés par la procédure, c'est-à-dire l'ordre dans lequel ils sont numérotés de 0 à n .

Exemple

Exemple de DFA donné à l'algorithme de Kleene

L'automate montré dans l'image peut être décrit comme M = ( Q , Σ, δ, q ₀ , F ) avec

l'ensemble des états Q = { q ₀ , q ₁ , q ₂ },
l'alphabet d'entrée Σ = { a , b },
la fonction de transition δ avec δ ( q ₀ , a ) = q ₀ , δ ( q ₀ , b ) = q ₁ , δ ( q ₁ , a ) = q ₂ , δ ( q ₁ , b ) = q ₁ , δ ( q ₂ , a ) = q ₁ , et δ ( q ₂ , b ) = q ₁ ,
l'état de départ q ₀ , et
ensemble d'états d'acceptation F = { q ₁ }.

L'algorithme de Kleene calcule les expressions régulières initiales comme

R ⁻¹ ₀₀	= a \| ε
R ⁻¹ ₀₁	= b
R ⁻¹ ₀₂	= ∅
R ⁻¹ ₁₀	= ∅
R ⁻¹ ₁₁	= b \| ε
R ⁻¹ ₁₂	= a
R ⁻¹ ₂₀	= ∅
R ⁻¹ ₂₁	= a \| b
R ⁻¹ ₂₂	= ε

Après cela, le R ^k
_ij sont calculés à partir du R ^{k -1}
_ij pas à pas pour k = 0, 1, 2. Les égalités d' algèbre de Kleene sont utilisées pour simplifier autant que possible les expressions régulières.

Étape 0

R ⁰ ₀₀	= R ⁻¹ ₀₀ ( R ⁻¹ ₀₀ ) ^* R ⁻¹ ₀₀ \| R ⁻¹ ₀₀	= ( a \| ε)	( a \| ε) ^*	( a \| ε)	\| a \| ε	= a ^*
R ⁰ ₀₁	= R ⁻¹ ₀₀ ( R ⁻¹ ₀₀ ) ^* R ⁻¹ ₀₁ \| R ⁻¹ ₀₁	= ( a \| ε)	( a \| ε) ^*	b	\| b	= a ^* b
R ⁰ ₀₂	= R ⁻¹ ₀₀ ( R ⁻¹ ₀₀ ) ^* R ⁻¹ ₀₂ \| R ⁻¹ ₀₂	= ( a \| ε)	( a \| ε) ^*	∅	\| ∅	= ∅
R ⁰ ₁₀	= R ⁻¹ ₁₀ ( R ⁻¹ ₀₀ ) ^* R ⁻¹ ₀₀ \| R ⁻¹ ₁₀	= ∅	( a \| ε) ^*	( a \| ε)	\| ∅	= ∅
R ⁰ ₁₁	= R ⁻¹ ₁₀ ( R ⁻¹ ₀₀ ) ^* R ⁻¹ ₀₁ \| R ⁻¹ ₁₁	= ∅	( a \| ε) ^*	b	\| b \| ε	= b \| ε
R ⁰ ₁₂	= R ⁻¹ ₁₀ ( R ⁻¹ ₀₀ ) ^* R ⁻¹ ₀₂ \| R ⁻¹ ₁₂	= ∅	( a \| ε) ^*	∅	\| une	= a
R ⁰ ₂₀	= R ⁻¹ ₂₀ ( R ⁻¹ ₀₀ ) ^* R ⁻¹ ₀₀ \| R ⁻¹ ₂₀	= ∅	( a \| ε) ^*	( a \| ε)	\| ∅	= ∅
R ⁰ ₂₁	= R ⁻¹ ₂₀ ( R ⁻¹ ₀₀ ) ^* R ⁻¹ ₀₁ \| R ⁻¹ ₂₁	= ∅	( a \| ε) ^*	b	\| a \| b	= a \| b
R ⁰ ₂₂	= R ⁻¹ ₂₀ ( R ⁻¹ ₀₀ ) ^* R ⁻¹ ₀₂ \| R ⁻¹ ₂₂	= ∅	( a \| ε) ^*	∅	\| ε	= ε

Étape 1

R ¹ ₀₀	= R ⁰ ₀₁ ( R ⁰ ₁₁ ) ^* R ⁰ ₁₀ \| R ⁰ ₀₀	= a ^* b	( b \| ε) ^*	∅	\| a ^*	= a ^*
R ¹ ₀₁	= R ⁰ ₀₁ ( R ⁰ ₁₁ ) ^* R ⁰ ₁₁ \| R ⁰ ₀₁	= a ^* b	( b \| ε) ^*	( b \| ε)	\| a ^* b	= a ^* b ^* b
R ¹ ₀₂	= R ⁰ ₀₁ ( R ⁰ ₁₁ ) ^* R ⁰ ₁₂ \| R ⁰ ₀₂	= a ^* b	( b \| ε) ^*	une	\| ∅	= a ^* b ^* ba
R ¹ ₁₀	= R ⁰ ₁₁ ( R ⁰ ₁₁ ) ^* R ⁰ ₁₀ \| R ⁰ ₁₀	= ( b \| ε)	( b \| ε) ^*	∅	\| ∅	= ∅
R ¹ ₁₁	= R ⁰ ₁₁ ( R ⁰ ₁₁ ) ^* R ⁰ ₁₁ \| R ⁰ ₁₁	= ( b \| ε)	( b \| ε) ^*	( b \| ε)	\| b \| ε	= b ^*
R ¹ ₁₂	= R ⁰ ₁₁ ( R ⁰ ₁₁ ) ^* R ⁰ ₁₂ \| R ⁰ ₁₂	= ( b \| ε)	( b \| ε) ^*	une	\| une	= b ^* a
R ¹ ₂₀	= R ⁰ ₂₁ ( R ⁰ ₁₁ ) ^* R ⁰ ₁₀ \| R ⁰ ₂₀	= ( a \| b )	( b \| ε) ^*	∅	\| ∅	= ∅
R ¹ ₂₁	= R ⁰ ₂₁ ( R ⁰ ₁₁ ) ^* R ⁰ ₁₁ \| R ⁰ ₂₁	= ( a \| b )	( b \| ε) ^*	( b \| ε)	\| a \| b	= ( a \| b ) b ^*
R ¹ ₂₂	= R ⁰ ₂₁ ( R ⁰ ₁₁ ) ^* R ⁰ ₁₂ \| R ⁰ ₂₂	= ( a \| b )	( b \| ε) ^*	une	\| ε	= ( a \| b ) b ^* a \| ε

Étape 2

R ² ₀₀	= R ¹ ₀₂ ( R ¹ ₂₂ ) ^* R ¹ ₂₀ \| R ¹ ₀₀	= a ^* b ^* ba	(( a \| b ) b ^* a \| ε) ^*	∅	\| a ^*	= a ^*
R ² ₀₁	= R ¹ ₀₂ ( R ¹ ₂₂ ) ^* R ¹ ₂₁ \| R ¹ ₀₁	= a ^* b ^* ba	(( a \| b ) b ^* a \| ε) ^*	( a \| b ) b ^*	\| a ^* b ^* b	= a ^* b ( a ( a \| b ) \| b ) ^*
R ² ₀₂	= R ¹ ₀₂ ( R ¹ ₂₂ ) ^* R ¹ ₂₂ \| R ¹ ₀₂	= a ^* b ^* ba	(( a \| b ) b ^* a \| ε) ^*	(( a \| b ) b ^* a \| ε)	\| a ^* b ^* ba	= a ^* b ^* b ( a ( a \| b ) b ^* ) ^* a
R ² ₁₀	= R ¹ ₁₂ ( R ¹ ₂₂ ) ^* R ¹ ₂₀ \| R ¹ ₁₀	= b ^* a	(( a \| b ) b ^* a \| ε) ^*	∅	\| ∅	= ∅
R ² ₁₁	= R ¹ ₁₂ ( R ¹ ₂₂ ) ^* R ¹ ₂₁ \| R ¹ ₁₁	= b ^* a	(( a \| b ) b ^* a \| ε) ^*	( a \| b ) b ^*	\| b ^*	= ( a ( a \| b ) \| b ) ^*
R ² ₁₂	= R ¹ ₁₂ ( R ¹ ₂₂ ) ^* R ¹ ₂₂ \| R ¹ ₁₂	= b ^* a	(( a \| b ) b ^* a \| ε) ^*	(( a \| b ) b ^* a \| ε)	\| b ^* a	= ( a ( a \| b ) \| b ) ^* a
R ² ₂₀	= R ¹ ₂₂ ( R ¹ ₂₂ ) ^* R ¹ ₂₀ \| R ¹ ₂₀	= (( a \| b ) b ^* a \| ε)	(( a \| b ) b ^* a \| ε) ^*	∅	\| ∅	= ∅
R ² ₂₁	= R ¹ ₂₂ ( R ¹ ₂₂ ) ^* R ¹ ₂₁ \| R ¹ ₂₁	= (( a \| b ) b ^* a \| ε)	(( a \| b ) b ^* a \| ε) ^*	( a \| b ) b ^*	\| ( a \| b ) b ^*	= ( a \| b ) ( a ( a \| b ) \| b ) ^*
R ² ₂₂	= R ¹ ₂₂ ( R ¹ ₂₂ ) ^* R ¹ ₂₂ \| R ¹ ₂₂	= (( a \| b ) b ^* a \| ε)	(( a \| b ) b ^* a \| ε) ^*	(( a \| b ) b ^* a \| ε)	\| ( a \| b ) b ^* a \| ε	= (( a \| b ) b ^* a ) ^*

Puisque q ₀ est l'état de départ et q ₁ est le seul état d'acceptation, l'expression régulière R ²
₀₁ désigne l'ensemble de toutes les chaînes acceptées par l'automate.

Voir également

Algorithme Floyd – Warshall - un algorithme sur des graphes pondérés qui peut être implémenté par l'algorithme de Kleene en utilisant une algèbre de Kleene particulière
Problème de hauteur d'étoile - quelle est la profondeur d'imbrication minimale des étoiles de toutes les expressions régulières correspondant à un DFA donné?
Problème généralisé de hauteur d'étoile - si un opérateur de complément est autorisé en plus dans les expressions régulières, la profondeur d'imbrication des étoiles de la sortie de l'algorithme de Kleene peut-elle être limitée à une borne fixe?
L'algorithme de construction de Thompson - transforme une expression régulière en un automate fini

R ² ₀₀	= R ¹ ₀₂ ( R ¹ ₂₂ ) ^* R ¹ ₂₀ \| R ¹ ₀₀	= a ^* b ^* ba	(( a \| b ) b ^* a \| ε) ^*	∅	\| a ^*	= a ^*
R ² ₀₁	= R ¹ ₀₂ ( R ¹ ₂₂ ) ^* R ¹ ₂₁ \| R ¹ ₀₁	= a ^* b ^* ba	(( a \| b ) b ^* a \| ε) ^*	( a \| b ) b ^*	\| a ^* b ^* b	= a ^* b ( a ( a \| b ) \| b ) ^*
R ² ₀₂	= R ¹ ₀₂ ( R ¹ ₂₂ ) ^* R ¹ ₂₂ \| R ¹ ₀₂	= a ^* b ^* ba	(( a \| b ) b ^* a \| ε) ^*	(( a \| b ) b ^* a \| ε)	\| a ^* b ^* ba	= a ^* b ^* b ( a ( a \| b ) b ^* ) ^* a
R ² ₁₀	= R ¹ ₁₂ ( R ¹ ₂₂ ) ^* R ¹ ₂₀ \| R ¹ ₁₀	= b ^* a	(( a \| b ) b ^* a \| ε) ^*	∅	\| ∅	= ∅
R ² ₁₁	= R ¹ ₁₂ ( R ¹ ₂₂ ) ^* R ¹ ₂₁ \| R ¹ ₁₁	= b ^* a	(( a \| b ) b ^* a \| ε) ^*	( a \| b ) b ^*	\| b ^*	= ( a ( a \| b ) \| b ) ^*
R ² ₁₂	= R ¹ ₁₂ ( R ¹ ₂₂ ) ^* R ¹ ₂₂ \| R ¹ ₁₂	= b ^* a	(( a \| b ) b ^* a \| ε) ^*	(( a \| b ) b ^* a \| ε)	\| b ^* a	= ( a ( a \| b ) \| b ) ^* a
R ² ₂₀	= R ¹ ₂₂ ( R ¹ ₂₂ ) ^* R ¹ ₂₀ \| R ¹ ₂₀	= (( a \| b ) b ^* a \| ε)	(( a \| b ) b ^* a \| ε) ^*	∅	\| ∅	= ∅
R ² ₂₁	= R ¹ ₂₂ ( R ¹ ₂₂ ) ^* R ¹ ₂₁ \| R ¹ ₂₁	= (( a \| b ) b ^* a \| ε)	(( a \| b ) b ^* a \| ε) ^*	( a \| b ) b ^*	\| ( a \| b ) b ^*	= ( a \| b ) ( a ( a \| b ) \| b ) ^*
R ² ₂₂	= R ¹ ₂₂ ( R ¹ ₂₂ ) ^* R ¹ ₂₂ \| R ¹ ₂₂	= (( a \| b ) b ^* a \| ε)	(( a \| b ) b ^* a \| ε) ^*	(( a \| b ) b ^* a \| ε)	\| ( a \| b ) b ^* a \| ε	= (( a \| b ) b ^* a ) ^*

Languages

In other projects

Algorithme de Kleene - Kleene's algorithm

Contenu

Description de l'algorithme

Exemple

Voir également

Références