Type de données algébrique généralisé - Generalized algebraic data type

En programmation fonctionnelle , un type de données algébrique généralisé ( GADT , également type fantôme de première classe , type de données récursif gardé ou type qualifié par l'égalité ) est une généralisation des types de données algébriques paramétriques .

Aperçu

Dans un GADT, les constructeurs de produits (appelés constructeurs de données dans Haskell ) peuvent fournir une instanciation explicite de l'ADT en tant qu'instanciation de type de leur valeur de retour. Cela permet de définir des fonctions avec un comportement de type plus avancé. Pour un constructeur de données de Haskell 2010, la valeur de retour a le type instanciation impliqué par l'instanciation des paramètres ADT au niveau de l'application du constructeur.

-- A parametric ADT that is not a GADT
data List a = Nil | Cons a (List a)

integers = Cons 12 (Cons 107 Nil)       -- the type of integers is List Int
strings = Cons "boat" (Cons "dock" Nil) -- the type of strings is List String

-- A GADT
data Expr a where
    EBool  :: Bool     -> Expr Bool
    EInt   :: Int      -> Expr Int
    EEqual :: Expr Int -> Expr Int  -> Expr Bool

eval :: Expr a -> a

eval e = case e of
    EBool a    -> a
    EInt a     -> a
    EEqual a b -> (eval a) == (eval b)

expr1 = EEqual (EInt 2) (EInt 3)        -- the type of expr1 is Expr Bool
ret = eval expr1                        -- ret is False

Ils sont actuellement implémentés dans le compilateur GHC en tant qu'extension non standard, utilisée, entre autres, par Pugs et Darcs . OCaml supporte GADT nativement depuis la version 4.00.

L'implémentation GHC prend en charge les paramètres de type quantifiés existentiellement et les contraintes locales.

Histoire

Une première version des types de données algébriques généralisées a été décrite par Augustsson & Petersson (1994) et basée sur l' appariement de formes dans ALF .

Les types de données algébriques généralisées ont été introduites de manière indépendante par Cheney et Hinze (2003) et avant par Xi, Chen et Chen (2003) comme des extensions de ML 's et Haskell de types de données algébriques . Les deux sont essentiellement équivalents l'un à l'autre. Ils sont similaires aux familles inductives de types de données (ou types de données inductifs ) trouvées dans le calcul des constructions inductives de Coq et d'autres langages à typage dépendant , modulo les types dépendants et sauf que ces derniers ont une restriction de positivité supplémentaire qui n'est pas appliquée dans les GADT .

Sulzmann, Wazny & Stuckey (2006) ont introduit des types de données algébriques étendus qui combinent les GADT avec les types de données existentiels et les contraintes de classe de types introduites par Perry (1991) , Läufer & Odersky (1994) et Läufer (1996) .

L'inférence de type en l'absence de toute annotation de type fournie par le programmeur est indécidable et les fonctions définies sur les GADT n'admettent pas les types principaux en général. La reconstruction de type nécessite plusieurs compromis de conception et est un domaine de recherche active ( Peyton Jones, Washburn & Weirich 2004 ; Peyton Jones et al. 2006 ; Pottier & Régis-Gianas 2006 ; Sulzmann, Schrijvers & Stuckey 2006 ; Simonet & Pottier 2007 ; Schrijvers et al. 2009 ; Lin et Sheard 2010a ; Lin et Sheard 2010b ; Vytiniotis, Peyton Jones et Schrijvers 2010 ; Vytiniotis et al. 2011 ).

Au printemps 2021, Scala 3.0 sort. Cette mise à jour majeure de Scala introduit la possibilité d'écrire des GADT avec la même syntaxe que les ADT , ce qui n'est pas le cas dans d'autres langages de programmation selon Martin Odersky .

Applications

Les applications des GADT incluent la programmation générique , la modélisation des langages de programmation ( syntaxe abstraite d'ordre supérieur ), le maintien d' invariants dans les structures de données , l'expression de contraintes dans des langages intégrés spécifiques à un domaine et la modélisation d'objets.

Syntaxe abstraite d'ordre supérieur

Une application importante de GADTs est d'intégrer la syntaxe abstraite d'ordre supérieur dans un SÛR type de mode. Voici un plongement du calcul lambda simplement typé avec une collection arbitraire de types de base , de tuples et d'un combinateur à virgule fixe :

data Lam :: * -> * where
  Lift :: a                     -> Lam a        -- ^ lifted value
  Pair :: Lam a -> Lam b        -> Lam (a, b)   -- ^ product
  Lam  :: (Lam a -> Lam b)      -> Lam (a -> b) -- ^ lambda abstraction
  App  :: Lam (a -> b) -> Lam a -> Lam b        -- ^ function application
  Fix  :: Lam (a -> a)          -> Lam a        -- ^ fixed point

Et une fonction d'évaluation de type sûr :

eval :: Lam t -> t
eval (Lift v)   = v
eval (Pair l r) = (eval l, eval r)
eval (Lam f)    = \x -> eval (f (Lift x))
eval (App f x)  = (eval f) (eval x)
eval (Fix f)    = (eval f) (eval (Fix f))

La fonction factorielle peut maintenant s'écrire sous la forme :

fact = Fix (Lam (\f -> Lam (\y -> Lift (if eval y == 0 then 1 else eval y * (eval f) (eval y - 1)))))
eval(fact)(10)

Nous aurions rencontré des problèmes en utilisant des types de données algébriques réguliers. La suppression du paramètre de type aurait rendu les types de base levés quantifiés existentiellement, rendant impossible l'écriture de l'évaluateur. Avec un paramètre de type, nous serions toujours limités à un seul type de base. De plus, des expressions mal formées telles qu'il App (Lam (\x -> Lam (\y -> App x y))) (Lift True)aurait été possible de construire, alors qu'elles sont de type incorrect à l'aide du GADT. Un analogue bien formé est App (Lam (\x -> Lam (\y -> App x y))) (Lift (\z -> True)). En effet, le type de x est Lam (a -> b), déduit du type du Lamconstructeur de données.

Voir également

Type variable

Remarques

Lectures complémentaires

Applications

Augustsson, Lennart ; Petersson, Kent (septembre 1994). "Familles de type stupide" (PDF) . Citer le journal nécessite |journal=( aide )
Cheney, James ; Hinze, Ralf (2003). "Types fantômes de première classe". Rapport technique CUCIS TR2003-1901 . L'Université de Cornell. hdl : 1813/5614 .
Xi, Hongwei ; Chen, Chiyan ; Chen, Gang (2003). Constructeurs de types de données récursifs protégés . Actes du 30e Symposium ACM SIGPLAN-SIGACT sur les principes des langages de programmation (POPL'03) . Presse ACM. p. 224-235. CiteSeerX 10.1.1.59.4622 . doi : 10.1145/604131.604150 . ISBN 978-1581136289.
Sheard, Tim ; Pasalic, Emir (2004). "Méta-programmation avec égalité de type intégrée" . Actes du Quatrième Atelier International sur les Cadres Logiques et les Méta-langages (LFM'04), Cork . 199 : 49-65. doi : 10.1016/j.entcs.2007.11.012 .

Sémantique

Patricia Johann et Neil Ghani (2008). " Fondements de la programmation structurée avec les GADT ".
Arie Middelkoop, Atze Dijkstra et S. Doaitse Swierstra (2011). " Une spécification allégée pour les GADT : le système F avec des preuves d'égalité de première classe ". Calcul d'ordre supérieur et symbolique .

Reconstitution de type

Peyton Jones, Simon ; Washburn, Geoffrey ; Weirich, Stéphanie (2004). « Types bancals : inférence de type pour les types de données algébriques généralisées » (PDF) . Rapport technique MS-CIS-05-25 . Université de Pennsylvanie.
Peyton Jones, Simon ; Vytiniotis, Dimitrios ; Weirich, Stéphanie ; Washburn, Geoffrey (2006). « Inférence de type basée sur l'unification simple pour les GADT » (PDF) . Actes de la conférence internationale ACM sur la programmation fonctionnelle (ICFP'06), Portland .
Sulzmann, Martin ; Wazny, Jérémy ; Stuckey, Peter J. (2006). « Un cadre pour les types de données algébriques étendus ». A Hagiya, M.; Wadler, P. (éd.). 8e Symposium international sur la programmation fonctionnelle et logique (FLOPS 2006) . Notes de cours en informatique . 3945 . p. 46-64.
Sulzmann, Martin ; Schrijvers, Tom ; Stuckey, Peter J. (2006). « Inférence de type principal pour les classes de type multi-paramètres de style GHC ». Dans Kobayashi, Naoki (éd.). Langages et systèmes de programmation : 4e Symposium asiatique (APLAS 2006) . Notes de cours en informatique. 4279 . p. 26-43.
Schrijvers, Tom ; Peyton Jones, Simon ; Sulzmann, Martin ; Vytiniotis, Dimitrios (2009). « Inférence de type complète et décidable pour les GADT » (PDF) . Actes de la Conférence internationale ACM sur la programmation fonctionnelle (ICFP'09), Édimbourg .
Lin, Chuan-kai (2010). Inférence de type pratique pour le système de type GADT (PDF) (thèse de thèse de doctorat). Université d'État de Portland.

Autre

Andrew Kennedy et Claudio V. Russo. " Types de données algébriques généralisées et programmation orientée objet ". Dans Actes de la 20e conférence annuelle ACM SIGPLAN sur la programmation, les systèmes, les langages et les applications orientés objet . ACM Press, 2005.

Liens externes

Page de type de données algébrique généralisé sur le wiki Haskell
Types de données algébriques généralisées dans le guide de l'utilisateur GHC
Types de données algébriques généralisées et programmation orientée objet
GADT – Haskell Prime – Trac
Articles sur l'inférence de type pour les GADT , bibliographie par Simon Peyton Jones
Inférence de type avec contraintes , bibliographie de Simon Peyton Jones
Émuler les GADT en Java via le lemme de Yoneda

Languages

In other projects