Chapter 1 Typage d'un mini-ML
Un compilateur ML se décompose de manière classique en :
-
une analyse lexicale puis syntaxique du texte source en entrée qui construit un arbre de syntaxe;
- un vérificateur de types qui infère les types des expressions et détecte donc les erreurs
de typage;
- un producteur de code assembleur, souvent d'une machine abstraite;
- et d'une phase d'assemblage pour exécuter ce code sur un processeur existant.
On se propose dans cette section de définir la syntaxe abstraite d'un langage appelé mini-ML,
qui est un sous-ensemble de Caml-light et de montrer son mécanisme de typage, qui à des simplifications
près est celui de Caml-light. Mini-ML correspond au noyau fonctionnel de Caml-light sans
le filtrage. Il ne contient ni exceptions ni traits impératifs. Cette dernière restriction
simplifie le vérificateur de types sans en changer la nature profonde. L'algorithme d'unification
est assez différent de celui déjà vu pour le typage du λ-calcul car il appliquera
directement, en faisant une modification physiques sur les types, les substitutions de variables de type.
Le programme de vérification de types s'inspire des deux exemples de Michel Mauny que l'on peut lire dans
la présentation d'une “spécification CAML d'un sous-ensemble de CAML” et du langage ASL de la documentation Caml-light (voir bibliographie).
1.1 Arbres de syntaxe abstraite de mini-ML
Mini-ML est uniquement un langage d'expression. Il ne contient pas de déclarations de variables globales,
d'exceptions ou de types. Néanmoins, les expressions de mini-ML sont assez riches par rapport
au λ-calcul. Elles correspondent à une extension du λ-calcul par les
constantes numériques, de chaînes de caractères et des booléens, des couples et des listes,
de la structure de contrôle conditionnelle, de la déclaration locale let
qui introduit
le polymorphisme et de la récursion. Voici les types Caml-light
des expressions et des déclarations :
# type
ml_expr
=
Const
of
ml_const
|
Var
of
string
|
Pair
of
ml_expr
*
ml_expr
|
Cons
of
ml_expr
*
ml_expr
|
Cond
of
ml_expr
*
ml_expr
*
ml_expr
|
App
of
ml_expr
*
ml_expr
|
Abs
of
string
*
ml_expr
|
Letin
of
string
*
ml_expr
*
ml_expr
|
Letrecin
of
string
*
ml_expr
*
ml_expr
and
ml_const
=
Int
of
int
|
Float
of
float
|
Bool
of
bool
|
String
of
string
|
Emptylist
|
Unit;;
1.2 Rôle du vérificateur de types de mini-ML
La phase de typage de mini-ML s'insère entre l'analyseur syntaxique (qui construit un arbre de
syntaxe abstraite) et le traducteur vers une machine abstraite. Les informations de typage
ne seront pas utilisées dans la partie traduction dans un but de simplication du traducteur.
Ainsi la fonction type_check
, correspondant au vérificateur de types, n'aura
qu'un rôle de vérification et s'arrêtera à la première erreur de types rencontrée.
1.3 Syntaxe des types de mini-ML
L'ensemble des types ( T) de mini-ML est construit à partir d'un ensemble de
constantes de types ( C), un ensemble de variables de types ( P) et de 3 constructeurs
de types (→, * et list).
-
constante de type :
Int_type
, Float_type
, String_type
, Bool_type
et Unit_type
∈ C : si α∈ C alors α∈ T;
- variable de type ∈ P :si α∈ P alors α∈ T;.
- type produit : si σ, τ ∈ T alors σ * τ ∈ T;
- type liste : si σ ∈ T alors σ list ∈ T;
- type fonctionnel : si σ, τ ∈ T alors σ → τ ∈ T;
La syntaxe abstraite des types de mini-ML est la suivante :
# type
vartype
=
|
Unknown
of
int
|
Instanciated
of
ml_type
and
consttype
=
|
Int_type
|
Float_type
|
String_type
|
Bool_type
|
Unit_type
and
ml_type
=
|
Var_type
of
vartype
ref
|
Const_type
of
consttype
|
Pair_type
of
ml_type
*
ml_type
|
List_type
of
ml_type
|
Fun_type
of
ml_type
*
ml_type;;
Où une variable de type est une référence sur une inconnue ou un type. Cela permettra
d'effectuer une modification de types lors de l'application d'une substitution sur une variable de type.
La fonction de création de variables de type est la suivante :
# let
new_unknown,
reset_unknowns
=
let
c
=
ref
1
in
(
(function
()
→
c:=
!
c+
1
;
Var_type(
ref(Unknown
!
c))),
(function
()
→
c:=
1
))
;;
val new_unknown : unit -> ml_type = <fun>
val reset_unknowns : unit -> unit = <fun>
L'ensemble des types qui vient d'être décrit correspondant aux types simples étendus
par les constantes de type et les constructeurs pour les paires et les listes.
Il est encore nécessaire de définir les schémas de type (type quantified_type
).
# type
quantified_type
=
Forall
of
(int
list)
*
ml_type;;
type quantified_type = | Forall of int list * ml_type
1.4 Environnement de typage
L'environnement de typage, nécessaire lors du typage pour les variables libres (comme les
primitives ou les paramètres formels) d'expressions est représenté par une liste d'association (string * quantified_type) list
.
Il est nécessaire de faire une distinction entre les variables d'un type si elles sont
quantifiées (variables liées) ou si elles ne le sont pas (variables libres).
# let
rec
vars_of_type
t
=
let
rec
vars
vl
=
function
Const_type
_
→
vl
|
Var_type
vt
→
(
match
!
vt
with
Unknown
n
→
if
List.mem
n
vl
then
vl
else
n::vl
|
Instanciated
t
→
vars
vl
t
)
|
Pair_type
(t1,
t2)
→
vars
(vars
vl
t1)
t2
|
List_type
t
→
vars
vl
t
|
Fun_type
(t1,
t2)
→
vars
(vars
vl
t1)
t2
in
vars
[]
t
;;
val vars_of_type : ml_type -> int list = <fun>
Pour calculer les variables libres et liées d'un schéma de type,
# let
subtract
l1
l2
=
List.flatten
(List.map
(function
id
→
if
(List.mem
id
l2)
then
[]
else
[
id]
)
l1);;
val subtract : 'a list -> 'a list -> 'a list = <fun>
# let
free_vars_of_type
(bv,
t)
=
subtract
(vars_of_type
t)
bv
and
bound_vars_of_type
(fv,
t)
=
subtract
(vars_of_type
t)
fv
;;
val free_vars_of_type : int list * ml_type -> int list = <fun>
val bound_vars_of_type : int list * ml_type -> int list = <fun>
# let
append
l1
l2
=
l1@
l2;;
val append : 'a list -> 'a list -> 'a list = <fun>
# let
flat
ll
=
List.fold_right
append
ll
[];;
val flat : 'a list list -> 'a list = <fun>
# let
free_vars_of_type_env
l
=
flat
(
List.map
(function
(id,
Forall
(v,
t))
→
free_vars_of_type
(v,
t))
l)
;;
val free_vars_of_type_env : ('a * quantified_type) list -> int list = <fun>
Lors du typage d'un identificateur dans un environnement C
, le vérificateur cherche
dans l'environnement le type quantifié associé à cet identificateur et en retourne une
instance, où les variables quantifiées valent de nouvelles variables (ou inconnues).
# let
type_instance
st
=
match
st
with
Forall(gv,
t)
→
let
unknowns
=
List.map
(function
n
→
n,
new_unknown())
gv
in
let
rec
instance
=
function
Var_type
{contents=
(Unknown
n)}
as
t
→
(try
List.assoc
n
unknowns
with
Not_found
→
t)
|
Var_type
{contents=
(Instanciated
t)}
→
instance
t
|
Const_type
ct
as
t
→
t
|
Pair_type
(t1,
t2)
→
Pair_type
(instance
t1,
instance
t2)
|
List_type
t
→
List_type
(instance
t)
|
Fun_type
(t1,
t2)
→
Fun_type
(instance
t1,
instance
t2)
in
instance
t
;;
val type_instance : quantified_type -> ml_type = <fun>
1.5 Erreurs de typage
Les exceptions suivantes sont levées quand une erreur de type est détectée :
# type
typing_error
=
Unbound_var
of
string
|
Clash
of
ml_type
*
ml_type
;;
# exception
Type_error
of
typing_error;;
Elles correspondent soit à une variable d'une expression qui n'a pas été déclarée, soit
à une erreur proprement dite de typage.
1.6 Unification
La grande différence dans l'algorithme de typage du λ-calcul et celui présenté ici provient
de l'algorithme d'unification. dans le premier cas, la fonction TYPE
retournait la liste
des substitutions (l'unificateur principal UP) à appliquer pour que deux termes t1 et t2
vérifient UP(t1)=UP(t2). Cet algorithme bien que juste n'est pas forcément très efficace. En mini-ML,
Les substitutions trouvées sont immédiatement appliquées aux types en effectuant une modification physique
de ces types.
Deux problèmes se posent :
-
la vérification d'occurrences, quand une variable de type est remplacée par un autre type, ce second
type ne doit pas contenir d'occurrence de cette première variable. La fonction
occurs
réalise
ce test.
- Lorsqu'une inconnue se voit attribuer comme valeur une autre inconnue, on crée une chaîne d'indirection
qu'il faut alors simplifier :
Var_type (ref (Var_type ( ref (Instanciated t))))
deviendra alors seulement t
.
La fonction shorten
réalise ce travail.
# let
occurs
n
t
=
List.mem
n
(vars_of_type
t);;
val occurs : int -> ml_type -> bool = <fun>
# let
rec
shorten
=
function
Var_type
(vt)
as
tt
→
(match
!
vt
with
Unknown
_
→
tt
|
Instanciated
((Var_type
_
)
as
t)
→
let
t2
=
shorten
t
in
vt
:=
Instanciated
t;
t2
|
Instanciated
t
→
t
)
|
t
→
t;;
val shorten : ml_type -> ml_type = <fun>
La fonction unify_types
prend deux types, modifie leur taille (par la fonction shorten
)
et les rend égaux ou échoue.
# let
rec
unify_types
(t1,
t2)
=
let
lt1
=
shorten
t1
and
lt2
=
shorten
t2
in
match
(lt1,
lt2)
with
|
Var_type
(
{contents=
Unknown
n}
as
occn
),
Var_type
{contents=
Unknown
m}
→
if
n=
m
then
()
else
occn:=
Instanciated
lt2
|
Var_type
({contents=
(Unknown
n)}
as
occn),
_
→
if
occurs
n
lt2
then
raise
(Type_error(Clash(lt1,
lt2)))
else
occn:=
Instanciated
lt2
|
_
,
Var_type
({contents=
(Unknown
n)})
→
unify_types
(lt2,
lt1)
|
Const_type
ct1,
Const_type
ct2
→
if
ct1=
ct2
then
()
else
raise
(Type_error(Clash(lt1,
lt2)))
|
Pair_type
(t1,
t2),
Pair_type
(t3,
t4)
→
unify_types
(t1,
t3);
unify_types(t2,
t4)
|
List_type
t1,
List_type
t2
→
unify_types
(t1,
t2)
|
Fun_type
(t1,
t2),
Fun_type
(t3,
t4)
→
unify_types
(t1,
t3);
unify_types(t2,
t4)
|
_
→
raise(Type_error(Clash(lt1,
lt2)));;
val unify_types : ml_type * ml_type -> unit = <fun>
1.7 Typage des expressions
Le typage des constantes est très simple à l'exception de
la liste vide. Ces règles de typage sont toutes considérées comme
des axiomes.
-
(ConstInt)
-
C ⊢ nombre entier : Int
- (ConstFloat)
-
C ⊢ nombre flottant : Float
- (ConstString)
-
C ⊢ chaine : String
- (ConstBool)
-
C ⊢ booleen : Bool
- (ConstUnit)
-
C ⊢ () : Unit
- (ConstListeVide)
-
C ⊢ [] : ∀α.α list
Ces règles se traduisent très simplement en Caml :
# let
type_const
=
function
Int
_
→
Const_type
Int_type
|
Float
_
→
Const_type
Float_type
|
String
_
→
Const_type
String_type
|
Bool
_
→
Const_type
Bool_type
|
Unit
→
Const_type
Unit_type
|
Emptylist
→
List_type
(new_unknown())
;;
val type_const : ml_const -> ml_type = <fun>
On introduit deux fonctions instance qui retourne une
instance de type à partir d'un schéma de types et generalize
qui crée un schéma de types à partir d'un type et d'un environnement.
La fonction instance correspond à la fonction O'Caml type_instance
. Elle
remplace les variables de types quantifiées d'un schéma de type par de nouvelles
variables de types. La fonction generalize correspond à la fonction O'Caml
suivante :
# let
type_instance
st
=
match
st
with
Forall(gv,
t)
→
let
unknowns
=
List.map
(function
n
→
n,
new_unknown())
gv
in
let
rec
instance
t
=
match
t
with
Var_type
(vt)
as
tt
→
(
match
!
vt
with
Unknown
n
→(try
List.assoc
n
unknowns
with
Not_found
→
tt)
|
Instanciated
ti
→
instance
ti
)
|
Const_type
tc
→
t
|
List_type
t1
→
List_type
(instance
t1)
|
Fun_type
(t1,
t2)
→
Fun_type
(instance
t1,
instance
t2)
|
Pair_type
(t1,
t2)
→
Pair_type
(instance
t1,
instance
t2)
in
instance
t
;;
val type_instance : quantified_type -> ml_type = <fun>
# let
generalize_types
gamma
l
=
let
fvg
=
free_vars_of_type_env
gamma
in
List.map
(function
(s,
t)
→
(s,
Forall(free_vars_of_type
(fvg,
t),
t)))
l
;;
val generalize_types :
('a * quantified_type) list ->
('b * ml_type) list -> ('b * quantified_type) list = <fun>
Elle crée un schéma de type en quantifiant les variables libres d'un type
qui n'appartiennent pas aux variables libres de l'environnement.
Les règles de typages des expressions sont les règles de typage des constantes
et les règles suivantes :
-
(Var)
-
x:σ,C ⊢ x : τ τ=instance(σ)
- (Pair)
-
|
C⊢ e1 : τ1 C⊢ e2 : τ2 |
|
C⊢ (e1,e2) : τ1 * τ2 |
|
- (List)
-
|
C⊢ e1 : τ C⊢ e2 : τ list |
|
C⊢ (e1 :: e2) : τ list |
|
- (If)
-
|
C⊢ e1 : Bool C⊢ e2 : τ C⊢ e3 : τ |
|
C⊢ (if e1 then e2 else e3) : τ |
|
- (App)
-
|
C⊢ e1 : τ' → τ C⊢ e2 : τ' |
|
C⊢ (e1 e2) : τ |
|
- (Abs)
-
|
x:τ1,C⊢ e : τ2 |
|
C⊢ (function x −> e) : τ1 → τ2 |
|
- (Let)
-
|
C⊢ e1=τ1 σ = generalize(τ1,C) (x:σ),C⊢ e2:τ2 |
|
C⊢ let x = e1 in e2 : τ2 |
|
- (LetRec)
-
|
(x:α),C⊢ e1=τ1 α∉V(C) σ = generalize(τ1,C) (x:σ),C⊢ e2:τ2 |
|
C⊢ let x = e1 in e2 : τ2 |
|
Le polymorphisme est introduit dans les règles Let et LetRec. La règle LetRec suppose que
la variable définie récursivement (x) est du type α, nouvelle variable de type qui n'apparaît pas libre
dans l'environnement. Ce qui ne fait aucune supposition sur le type de x, mais dans la mesure où le type
de x n'est pas un schéma de type, les contraintes de type sur x dans e1 seront bien répercutées
sur le type final de e1.
La fonction type_expr
suivante suit les règles de typage définies ci-dessus.
# let
rec
type_expr
gamma
=
let
rec
type_rec
expri
=
match
expri
with
Const
c
→
type_const
c
|
Var
s
→
let
t
=
try
List.assoc
s
gamma
with
Not_found
→
raise
(Type_error(Unbound_var
s))
in
type_instance
t
|
Pair
(e1,
e2)
→
Pair_type
(type_rec
e1,
type_rec
e2)
|
Cons
(e1,
e2)
→
let
t1
=
type_rec
e1
and
t2
=
type_rec
e2
in
unify_types
(List_type
t1,
t2);
t2
|
Cond
(e1,
e2,
e3)
→
let
t1
=
unify_types
(Const_type
Bool_type,
type_rec
e1)
and
t2
=
type_rec
e2
and
t3
=
type_rec
e3
in
unify_types
(t2,
t3);
t2
|
App
(e1,
e2)
→
let
t1
=
type_rec
e1
and
t2
=
type_rec
e2
in
let
u
=
new_unknown()
in
unify_types
(t1,
Fun_type
(t2,
u));
u
|
Abs(s,
e)
→
let
t
=
new_unknown()
in
let
new_env
=
(s,
Forall
([],
t))::gamma
in
Fun_type
(t,
type_expr
new_env
e)
|
Letin
(s,
e1,
e2)
→
let
t1
=
type_rec
e1
in
let
new_env
=
generalize_types
gamma
[
(s,
t1)
]
in
type_expr
(new_env@
gamma)
e2
|
Letrecin
(s,
e1,
e2)
→
let
u
=
new_unknown
()
in
let
new_env
=
(s,
Forall([
],
u))::gamma
in
let
t1
=
type_expr
(new_env@
gamma)
e1
in
let
final_env
=
generalize_types
gamma
[
(s,
t1)
]
in
type_expr
(final_env@
gamma)
e2
in
type_rec;;
val type_expr : (string * quantified_type) list -> ml_expr -> ml_type = <fun>
1.8 Environnement initial
Le langage mini-ML possède un certain nombre de fonctions prédéfinies. Ces fonctions
munies de leur type correspondent à l'environnement initial de typage. Il peut être
créé de la manière suivante :
# let
initial_typing_env
=
let
mk_type
(ct1,
ct2,
ct3)
=
Forall([],
Fun_type
(Pair_type(Const_type
ct1,
Const_type
ct2),
Const_type
ct3))
in
let
int_ftype
=
mk_type(Int_type,
Int_type,
Int_type)
and
float_ftype
=
mk_type(Float_type,
Float_type,
Float_type)
and
int_predtype
=
mk_type(Int_type,
Int_type,
Bool_type)
and
float_predtype
=
mk_type(Float_type,
Float_type,
Bool_type)
and
alpha
=
Var_type(ref(Unknown
1
))
and
beta
=
Var_type(ref(Unknown
2
))
in
("="
,
Forall([
1
],
Fun_type
(Pair_type
(alpha,
alpha),
Const_type
Bool_type)))::
(List.map
(function
s
→
(s,
int_ftype))
[
"*"
;
"+"
;
"-"
;
"/"
]
)
@
(List.map
(function
s
→
(s,
float_ftype))
[
"*."
;
"+."
;
"-."
;
"/."
]
)
@
(List.map
(function
s
→
(s,
int_predtype))
[
"<"
;
">"
;
"<="
;
">="
]
)
@
(List.map
(function
s
→
(s,
float_predtype))
[
"<."
;
">."
;
"<=."
;
">=."
]
)
@
[
"^"
,
mk_type
(String_type,
String_type,
String_type)
]
@
[
("hd"
,
Forall([
1
],
Fun_type
(List_type
alpha,
alpha)));
("tl"
,
Forall([
1
],
Fun_type
(List_type
alpha,
List_type
alpha)));
("null"
,
Forall([
1
],
Fun_type
(alpha,
Fun_type
(List_type
alpha,
Const_type
Bool_type))));
("fst"
,
Forall([
1
;
2
],
Fun_type
(Pair_type
(alpha,
beta),
alpha)));
("snd"
,
Forall([
1
;
2
],
Fun_type
(Pair_type
(alpha,
beta),
beta)))
]
;;
val initial_typing_env : (string * quantified_type) list =
["=", Forall ([1], Fun_type (Pair_type (...), Const_type ...));
"*", Forall ([], Fun_type (Pair_type (...), Const_type ...)); ...]
1.9 Impression des types et des erreurs
Comme les variables de types sont codées à l'aide d'entiers, il serait particulièrement
désagréable d'avoir un affichage de types dépendant de cette numérotation.
Pour cela, pour chaque expression globale est crée une liste d'association des numéros de variables
de types et des symboles pour les types polymorphes.
Les constantes de types sont affichées directement par la fonction print_consttype
:
# let
print_consttype
=
function
Int_type
→
print_string
"int"
|
Float_type
→
print_string
"float"
|
String_type
→
print_string
"string"
|
Bool_type
→
print_string
"bool"
|
Unit_type
→
print_string
"unit"
;;
val print_consttype : consttype -> unit = <fun>
La fonction var_name
retourne une chaîne de caractères unique pour chaque entier
passé en argument :
# let
string_of_char
c
=
let
s
=
" "
in
s.[
0
]
<-
c;
s;;
val string_of_char : char -> string = <fun>
# let
var_name
n
=
let
rec
name_of
n
=
let
q,
r
=
((n
/
2
6
),
(n
mod
2
6
))
in
if
q=
0
then
string_of_char(Char.chr
(9
6
+
r))
else
(name_of
q)^
(string_of_char(Char.chr
(9
6
+
r)))
in
"'"
^
(name_of
n);;
val var_name : int -> string = <fun>
La fonction principale est l'impression d'un schéma de type. Le seul problème est
de trouver le nom d'une variable de types. la fonction locale names_of
retourne
les variables quantifiées, chacune associée à une chaîne de caractères particulière.
Si une variable de type n'est pas donc cet ensemble une exception est déclenchée, car il ne peut avoir
d'expression globale contenant des variables de type non quantifiées.
# let
print_quantified_type
(Forall
(gv,
t))
=
let
names
=
let
rec
names_of
=
function
(n,[]
)
→
[]
|
(n,
(v1::lv))
→
(var_name
n)::(names_of
(n+
1
,
lv))
in
(names_of
(1
,
gv))
in
let
var_names
=
List.combine
(List.rev
gv)
names
in
let
rec
print_rec
=
function
Var_type
{contents=
(Instanciated
t)}
→
print_rec
t
|
Var_type
{contents=
(Unknown
n)}
→
let
name
=
(
try
List.assoc
n
var_names
with
Not_found
→
raise
(Failure
"Non quantified variable in type"
))
in
print_string
name
|
Const_type
ct
→
print_consttype
ct
|
Pair_type(t1,
t2)
→
print_string
"("
;
print_rec
t1;
print_string
" * "
;
print_rec
t2;
print_string
")"
|
List_type
t
→
print_string
"(("
;
print_rec
t;
print_string
") list)"
|
Fun_type(t1,
t2)
→
print_string
"("
;
print_rec
t1;
print_string
" -> "
;
print_rec
t2;
print_string
")"
in
print_rec
t;;
val print_quantified_type : quantified_type -> unit = <fun>
L'impression d'un type simple utilise l'impression des chémas de type en créant pour
l'occasion une quantification sur toutes les variables libres du type.
# let
print_type
t
=
print_quantified_type
(Forall(free_vars_of_type
([],
t),
t));;
val print_type : ml_type -> unit = <fun>
Il est fort intéressant d'afficher les causes d'un échec de typage, comme
par exemple les types mis en cause lors d'une erreur de typage ou le nom
d'une variable indéfinie.
La fonction typing_handler
reçoit en argument une fonction de typage, un environnement et
une expression à typer. Elle capture les exceptions dues à une erreur de typage, affiche un
message plus clair et déclenche une nouvelle exception.
# let
typing_handler
typing_fun
env
expr
=
reset_unknowns();
try
typing_fun
env
expr
with
Type_error
(Clash(lt1,
lt2))
→
print_string
"Type clash between "
;
print_type
lt1;
print_string
" and "
;
print_type
lt2;
print_newline();
failwith
"type_check"
|
Type_error
(Unbound_var
s)
→
print_string
"Unbound variable "
;
print_string
s;
print_newline();
failwith
"type_check"
;;
val typing_handler : ('a -> 'b -> 'c) -> 'a -> 'b -> 'c = <fun>
1.10 Fonction principale
La fonction type_check
type l'expression e
par la fonction type_expr
avec l'environnement de typage initial et affiche le type calculé de e
.
# let
type_check
e
=
let
t
=
typing_handler
type_expr
initial_typing_env
e
in
let
qt
=
snd(List.hd(generalize_types
initial_typing_env
[
"it"
,
t]
))
in
print_string
"it : "
;
print_quantified_type
qt;
print_newline();;
val type_check : ml_expr -> unit = <fun>
1.11 Exemples
# type_check
(Const
(Int
3
));;
it : int
- : unit = ()
# type_check
(Const
(Float
3
.
2
));;
it : float
- : unit = ()
# type_check
(Abs
("x"
,
Var
"x"
));;
it : ('a -> 'a)
- : unit = ()
# type_check
(Abs
("x"
,
Pair(Var
"x"
,
Var
"x"
)));;
it : ('a -> ('a * 'a))
- : unit = ()
# type_check
(Letin
("f"
,
Abs
("x"
,
Pair(Var
"x"
,
Var
"x"
)),
(
Pair
((App
(Var
"f"
,
Const
(Int
3
))),
(App
(Var
"f"
,
Const
(Float
3
.
1
4
)))))));;
it : ((int * int) * (float * float))
- : unit = ()
# type_check
(App
(Var
"*"
,
Pair
(Const
(Int
3
),
Const
(Float
3
.
1
))));;
Type clash between int and float
Uncaught exception: Failure("type_check")
# type_check
(Cond
(
App
(Var
"="
,
Pair(Const(Int
0
),
Const
(Int
0
))),
Const(Int
2
),
Const(Int
5
)));;
it : int
- : unit = ()
# type_check
(
Letrecin
("fact"
,
Abs
("x"
,
Cond
(App
(Var
"="
,
Pair(Var
"x"
,
Const(Int
1
))),
Const(Int
1
),
App
(Var
"*"
,
Pair(Var
"x"
,
App
(Var
"fact"
,
App
(Var
"-"
,
Pair(Var
"x"
,
Const(Int
1
)
))
)
)
)
)
),
App
(Var
"fact"
,
Const
(Int
4
))));;
it : int
- : unit = ()
1.12 Exercices
-
Écrire la fonction
parse_ml_expr
qui lit dans un fichier
des expressions ml_expr
et construit leur arbre de syntaxe correspondant.
- Ajouter les déclarations globales dans le langage mini-ML et modifier
le vérificateur de types en conséquence.
- Comment typer les exceptions, le filtrage de motif et les références?
1.13 Bibliographie
-
R. Milner. “A theory of type polymorphism in programming”.
J. Comput. Syst. Sci. 1978.
- Michel Mauny. “ Spécification CAML d'un sous-ensemble de CAML”
Notes de cours - DEA Informatique Fondamentale - 1989
Chapter 2 Typage des traits impératifs
2.1 Remarques sur le typage d'Objective Caml
Le typeur de mini-ML ne tenait pas compte des valeurs mutables
(physiquement modifiables). Objective Caml est un langage fonctionnel
muni d'effets de bord. Or ceci si le mécanisme de généralisation (des
types en schémas de types) variables de types
2.1.1 Polymorphisme et valeurs mutables
Le typeur de Objective Caml utilise des variables de types
faibles pour rendre sûr la manipulation de valeurs mutables.
En effet si les primitives de constructions de valeurs mutables étaient
traités comme des valeurs polymorphes classiques le typeur ne
détecterait
pas les inconsistances de types. Le programme suivant en est un exemple :
let x = ref (fun x -> x)
in
x:=(fun x -> x + 1);
!x true;;
et entraîne une erreur de typage.
Une solution serait de ne construire que
des valeurs mutables monomorphes. Comme
cette contrainte est trop forte, il est possible de créer des valeurs mutables
polymorphes spéciales, en utilisant des variables de types faibles
pour celles-ci. L'idée est d'assurer lors de l'instanciation de cette variable
de type, dans d'une application, que l'on obtient un type simple ou une
variable de type liée au contexte de typage.
Pour cela on différencie les expressions en deux classes : les
expressions non expansives incluant principalement les variables,
les constructeurs et l'abstraction
et les expressions expansives incluant principalement l'application.
Seules les expressions expansives peuvent engendrer une exception ou
étendre le domaine (incohérence de types).
2.1.2 Expressions non-expansives
Voici le texte de la fonction de reconnaissance d'expression non expansives
du compilateur Objective Caml 3.0 :
let rec is_nonexpansive exp =
match exp.exp_desc with
Texp_ident(_,_) -> true
| Texp_constant _ -> true
| Texp_let(rec_flag, pat_exp_list, body) ->
List.for_all (fun (pat, exp) -> is_nonexpansive exp) pat_exp_list &
is_nonexpansive body
| Texp_apply(e, None::el) ->
is_nonexpansive e &&
List.for_all (function None -> true | Some exp -> is_nonexpansive e) el
| Texp_function _ -> true
| Texp_tuple el ->
List.for_all is_nonexpansive el
| Texp_construct(_, el) ->
List.for_all is_nonexpansive el
| Texp_variant(_, Some e) -> is_nonexpansive e
| Texp_variant(_, None) -> true
| Texp_record(lbl_exp_list, opt_init_exp) ->
List.for_all
(fun (lbl, exp) -> lbl.lbl_mut = Immutable & is_nonexpansive exp)
lbl_exp_list &&
(match opt_init_exp with None -> true | Some e -> is_nonexpansive e)
| Texp_field(exp, lbl) -> is_nonexpansive exp
| Texp_array [] -> true
| Texp_new (_, cl_decl) when Ctype.class_type_arity cl_decl.cty_type > 0 ->
true
| _ -> false
;;
Les expressions suivantes sont non-expansives (donc pourront être généralisées :les constantes, les identificateurs, les n-uplet
si toutes les sous-expressions le sont, les constructeurs constants, les constructeurs d'arité 1 si ce constructeur n'est pas mutable et si l'expression passée au constructeur est elle aussi non-expansive, les déclarations locales (let et let rec) si l'expression finale et toute les expressions des déclarations locales sont non-expansives, l'abstraction, la récupération d'exceptions si l'expression à calculer et toutes les expressions de partie droite du filtrage le sont, la séquence si le dernier élément de la séquence l'est, la
conditionnelle si les branches then et else le sont,
les expressions contraintes par un type si la sous-expression l'estm
le vecteur vide, les enregistrements si tous ces champs sont non-mutables et
si chaque expression associée à un champ l'est, l'accès à un champ d'un enregistrement si l'expression correspondante à l'enregistrement l'est, les filtrages de flots et les gardes si l'expression associée l'est.
Toutes les autres expressions sont expansives.
En Objective Caml on pourra
généraliser (c'est-à-dire construire un schéma de type)
les variables de type rencontrées dans des expressions non expansives
et ne pas généraliser (variable de type faible notée _'a
) celles
rencontrées dans des expressions expansives.
Ces variables de type faible pourront être instanciées ultérieurement dans
le typage d'un module. Il est à noter que ces variables de type faible ne peuvent sortir d'un module (sans le risque de réemplois ultérieurs incompatibles).
Voici deux séries d'exemples de typage d'expressions non-expansives et d'expressions expansives :
avec effets de bord
Objective Caml 3.0 |
commentaires |
expression non expansive |
|
let nref x = ref x;; |
abstraction |
nref : 'a -> 'a ref = <fun> |
schéma de type |
expression expansive |
|
let x = ref [];; |
ref est un constructeur mutable |
x : '_a list ref = ref [] |
variable de type faible _a |
x:=[3];; |
affinage du type de x |
x;; |
|
int list ref |
|
sans effets de bord
Objective Caml 3.0 |
commentaires |
let a x y = x y;; |
le combinateur A |
('a -> 'b) -> 'a -> 'b |
son schéma de type |
let g = a id;; |
une application partielle |
'_a -> '_a |
son type non généralisé |
g 3;; |
affinage du type de g |
int = 3 |
|
g;; |
|
int -> int |
|
-
Introduire les références dans mini-ML.
- Modifier le typeur de mini-ML pour tenir compte des
expressions expansives.
2.1.5 Bibliographie
La thèse de Xavier Leroy [] décrit le typage polymorphe
pour les effets de bords, les canaux de communications et les continuations dans un langage algorithmique fonctionnel.
La thèse d'Emmanuel Engel compare différents systèmes de typage polymorphe
pour les effets de bords en présence de modules poru le langage Caml.
This document was translated from LATEX by
HEVEA.