OFFICE HANSSENS S.P.R.L.
BREVETS
MARQUES
MODELES
Square Marie-Louise 40*19
BE - 1000 BRUXELLES (Belgique)
Tel: 32 2 230 79 63 - Fax: 32 2 231 11 29
Email: ofhans@officehanssens.com
TVABE 0415 966 979 - RPM Bruxelles
BANQUE FORTIS BE76 2100 5588 6095 SWIFT GEBABEBB
BANQUE DE LA POSTE BE91 0001 1665 9876 SWIFT BPOTBEB1
Alain COLENS
Dr. Sc.
Jacques KUBORN
I.C.E.(Eleclron) Lg.
Mandataires agréés près
l'Office Européen des
Brevets
l'Office des Marques et
Modèles Communautaires
et l'Office Belge de la
Propriété Intellectuelle
Annick VEKENS
Administration
^hf5Ä!^
06
ouoos
G&3lfcfcA\ ft 2-
Service Public Fédéral Economie,
PME, Classes moyennes & Energie
Office de la Propriété intellectuelle
Bd du Roi Albert II, 16
1000 BRUXELLES
N/Réf: B 41 678
Mandataire agréé: Alain COLENS
0302
Le 31 mars 2009
Objet: Brevet EUROPEEN 0 662 827
Yale University
Meadames, Messieurs
Nous avons l'honneur de vous faire parvenir, en annexe, conformément à l'article
5 § 1 de la loi du 8 juillet 1977, la traduction en français du fascicule de
brevet européen ci-dessus, tel qu'il a été maintenu après opposition, ainsi que
les dessins.
Les données relatives à la publication de la mention du maintien de ce brevet
sous une forme modifiée sont: Bulletin Européen des brevets 09/02 du 07.01.09.
Nous vous prions d'agréer, Mesddames, Messieurs, nos salutations distinguées.
Alain Colëns

(11) Numéro de publication
européen: 0 662 82 7
(12) TRADUCTION DU BREVET EUROPEEN (B2)
(21) Numéro de dépôt de la demande
de brevet européen: 93 923 752.5
(22) Date de dépôt de la demande
de brevet européen: 30.09.93
(54) Titre: Procédés diagnostiques et compositions pharmaceutiques à base de
protéines Notch et d'acides nucléiques.
(73) Titulaire du brevet: Yale University
(45) Numéro et date du Bulletin Européen dans lequel a été publiée la décision
de maintien du brevet sous une forme modifiée: 09/02 - 07.01.09
1. INTRODUCTION
La présente invention concerne des compositions
thérapeutiques comprenant des protéines Notch, des
analogues et des dérivés de celles-ci, des anticorps
dirigés contre celles-ci, des acides nucléiques codant
5 pour les protéines Notch, les dérivés ou les analogues,
des acides nucléiques antisens Notch. Des utilisations
thérapeutiques et des procédés de diagnostic sont
également fournis.
10 2. CONTEXTE DE L'INVENTION
2.1 GENE ET PROTEINE NOTCH
Des mutations nulles dans l'un quelconque des loci
neurogéniques zygotiques, Notch (N) , Delta (D) ,
15 mastermind (mam), Enhancer of Split (E(spl), neutralized
(neu) et big brain (bib) , entraînent une hypertrophie du
système nerveux aux dépens des structures épidermiques
ventrales et latérales. Cet effet est dû à une erreur de
routage des cellules précurseurs épidermiques dans une
20 voie neuronale et il implique que la fonction de gènes
neurogéniques est nécessaire pour détourner les cellules
au sein de la région neurogénique d'un sort neuronal en
un sort epithelial. Des études qui ont estimé les effets
de l'ablation au laser de neuroblastes embryonnaires
spécifiques de sauterelles (Doe et Goodman 1985, Dev.
Biol. 111, 206-219) ont montré que des interactions
5 cellulaires entre les neuroblastes et les cellules
accessoires environnantes servent à empêcher ces cellules
accessoires d'adopter un sort de neuroblaste. Ensemble,
ces observations génétiques et développementales ont mené
à l'hypothèse que les produits protéiques des loci
10 neurogéniques fonctionnent comme des composants d'un
mécanisme d'interaction cellulaire nécessaire à un
développement épidermique correct (Artavanis-Tsakonas,
1988, Trends Genet. 4, 95-100).
Des analyses des séquences (Wharton et al., 1985,
15 Cell 43, 567-581 ; Kidd et al., 1986, Mol. Cell. Biol. 6,
3094-3108 ; Vassin et al., 1987, EMBO J. 6, 3431-3440 ;
Kopczynski et al., 1988, Genes Dev. 2, 1723-1735) ont
montré que deux des loci neurogéniques, Notch et Delta,
semblent coder pour des protéines transmembranaires qui
20 couvrent la membrane une seule fois. Le gène Notch de
Drosophila code pour une protéine de ~ 300 kd (nous
utilisons « Notch » pour indiquer cette protéine) avec un
grand domaine extracellulaire N-terminal qui comprend 36
répétitions en tandem de type facteur de croissance des
25 cellules épidermiques (EGF) suivies de trois répétitions
riches en cysteine, appelées répétitions de Notch/lin-12
(Wharton et al., 1985, Cell 43, 567-581 ; Kidd et al.,
1986, Mol. Cell Biol. 6, 3094-3108 ; Yochem et al., 1988,
Nature 335, 547-550). Les séquences de Xenopus (Coffman
30 et al., 1990, Science 249: 1438-1441) et d'un homologue
Notch humain nommé TAN-1 (Ellisen et al., 1991, Cell
66: 649-661) ont été également rapportées. Delta code
pour une protéine de ~ 100 kd (nous utilisons « Delta »
pour indiquer DLZM, le produit protéique des transcrits
zygotiques et maternels prédominants ; Kopczynski et al.,
1988, Genes Dev. 2, 1723-1735) qui a neuf répétitions de
5 type EGF au sein de son domaine extracellulaire (Vassin
et al., 1987, EMBO J. 6. 3431-3440 ; Kopczynski et al.,
1988, Genes Dev. 2, 1723-1735). Bien que l'on en sache
peu quant à la signification fonctionnelle de ces
répétitions, le motif de type EGF a été trouvé dans toute
10 une diversité de protéines, y compris celles impliquées
dans la cascade de la coagulation sanguine (Furie et
Furie, 1988, Cell 53, 505-518). En particulier, ce motif
a été trouvé dans des protéines extracellulaires telles
que les facteurs IX et X de la coagulation sanguine (Rees
15 et al., 1988, EMBO J. 7, 2053-2061 ; Furie et Furie,
1988, Cell 53, 505-518), dans d'autres gènes de
Drosophila (Knust et al., 1987, EMBO J. 761-766 ;
Rothberg et al., 1988, Cell 55, 1047-1059), et dans
certaines protéines de récepteurs de la surface
20 cellulaire, telles que la thrombomoduline (Suzuki et al.,
1987, EMBO J. 6, 1891-1897) et le récepteur de LDL
(Sudhof et al., 1985, Science 228, 815-822). Un site de
liaison de protéine a été cartographie par rapport au
domaine des répétitions d'EGF dans la thrombomoduline et
25 l'urokinase (Kurosawa et al., 1988, J. Biol. Chem 263,
5993-5996 ; Appella et al., 1987, J. Biol. Chem. 262,
4437-4440) .
Un réseau curieux d'interactions entre les mutations
de Notch et Delta a été décrit (Vassin, et al., 1985, J.
30 Neurogenet. 2, 291-308 ; Shepard et al., 1989, Genetics
122, 429-438 ; Xu et al., 1990, Genes Dev., 4, 464-475).
Un certain nombre d'études génétiques (résumées dans
Alton et al., 1989, Dev. Genet. 10, 261-272) ont indiqué
que les dosages des gènes Notch et Delta l'un par rapport
à l'autre sont cruciaux pour un développement normal. Une
réduction de 50 % de la dose de Delta dans un contexte de
5 Notch de type sauvage provoque un élargissement des
veines des ailes en créant un « delta » à la base
(Lindsley et Grell, 1968, Publication Number 627,
Washington, D.C., Carnegie Institute of Washington). Un
phénotype similaire est provoqué par une augmentation de
10 50 % de la dose de Notch dans un contexte de Delta de
type sauvage (un phénotype « Confluens » ; Welshons,
1965, Science 150, 1122-1129). Ce phénotype Delta est
partiellement réprimé par une réduction du dosage de
Notch. Des travaux ont montré que les interactions
15 létales entre les alleles qui corrèlent avec les
modifications dans les répétitions de type EGF peuvent
être secourues en réduisant la dose de Delta (Xu et al.,
1990, Genes Dev. 4, 464-475). Xu et al. (1990, Genes Dev.
4, 464-475) ont découvert que des mutations nulles au
20 niveau de soit Delta soit mam répriment les interactions
létales entre des combinaisons hétérozygotes de certains
alleles Notch, connues comme les mutations Abruptex (Ax) .
Les alleles Ax sont associés à des mutations d'erreurs
d'utilisation au sein des répétitions de type EGF du
25 domaine extracellulaire de Notch (Kelley et al., 1987,
Cell 51, 539-548 ; Hartley et al., 1987, EMBO J. 6, 3407-
3417) .
Des études récentes ont montré que Notch et Delta,
et Notch et Serrate, interagissent directement au niveau
30 moléculaire (Fehon et al., 1990, Cell 61: 523-534 ; Rebay
et al., 1991, Cell 67: 687-699).
Notch est exprimée sur des processus axoniques au
cours de la projection des neurones embryonnaires
(Johansen et al., 1989 J. Cell Biol. 109: 2427-2440 ;
Kidd et al., 1989, Genes Dev. 3: 1113-1129 ; Fehon et
5 al., 1991, J. Cell Biol. 113: 657-669).
Une étude a montré que certains alleles Ax de Notch
peuvent gravement modifier le guidage axonique au cours
de la projection des neurones sensoriels dans les disques
imaginaires, bien que l'on ne sache pas encore si une
10 expression aberrante de Notch dans l'axone lui-même ou
l'épithélium le long duquel il se développe soit
responsable de cette anomalie (Palka et al., 1990,
Development 109, 167-175).
15 2.2. CANCER
Un néoplasme, ou tumeur, est une masse néoplasique
résultant d'une croissance cellulaire anormale
incontrôlée, qui peut provoquer un gonflement sur la
surface corporelle et qui peut être bénigne ou maligne.
20 Les tumeurs bénignes demeurent généralement localisées.
Les tumeurs malignes sont appelées de manière collective
des cancers. Le terme « malin » signifie généralement que
la tumeur peut envahir et détruire les structures
corporelles voisines et se propager vers des sites
25 distants pour provoquer la mort (pour une description,
voir Robbins et Angell, 1976, Basic Pathology, 2d Ed.,
W.B. Saunders Co., Philadelphia, pp. 68-122).
Un traitement et une prévention efficace d'un cancer
demeurent un besoin longtemps ressenti et un objectif
30 majeur de la recherche biomédicale.
3. RESUME DE L'INVENTION
La présente invention est définie dans les
revendications 1 à 19 présentées à la fin de la
description.
5 La description suivante présente des détails
concernant à la fois des modes de réalisation couverts
par les revendications et la matière sujette non couverte
par les revendications. La description de la matière
sujette non couverte par les revendications est fournie
10 pour information uniquement.
3.1 Définitions
Tels qu'utilisés dans ce document, les termes
suivants auront les significations indiquées :
15 AA = acide aminé
EGF = facteur de croissance des cellules
épidermiques
ELR = répétition (homologue) de type EGF
IC = intracellulaire
20 PCR = réaction en chaîne de la polymerase
Tel qu'utilisé dans le document, le nom d'un gène en
italique indiquera le gène, au contraire de son produit
protéique codé qui est indiqué par le nom en l'absence de
tout caractère italique. Par exemple, « Notch »
25 signifiera le gène Notch, tandis que « Notch » indiquera
le produit protéique du gène Notch.
4. DESCRIPTION DES FIGURES
Figure 1. Séquence nucléotidique primaire de l'ADNc
30 de Delta DU (SEQ ID NO : 1) et séquence d'acides aminés
de Delta (SEQ ID NO : 2). La séquence d'ADN du brin 5'-3'
de l'ADNc de DU est représentée, laquelle contient un
certain nombre de corrections par comparaison à celles
présentées dans Kopczynkski et al. (1988, Genes Dev.
2: 1723-1735) .
Figure 2. Produits de construction de l'expression
5 de Notch et cartographie par deletion du domaine de
liaison de Delta/Serrate. Des cellules S2 en phase de
croissance logarithmique ont été transfectées de manière
transitoire avec la série des produits de construction
d'expression : les dessins représentent les produits de
10 construction des protéines prédites des divers mutants
créés par deletion de Notch. Tous les produits de
construction d'expression ont été dérivés à partir du
produit de construction #1 pMtNMg. Les cellules
transfectées de manière transitoire ont été mélangées
15 avec des cellules exprimant Delta provenant de la lignée
transformée de manière stable L49-6-7 ou avec des
cellules transfectées de manière transitoire exprimant
Serrate, induites avec du CuS04, incubées dans des
conditions d'agrégation et ensuite cotées pour leur
20 capacité à s'agréger en utilisant des antiserums
spécifiques et une microscopie à immunofluorescence. Les
agrégats sont définis comme des groupes de quatre
cellules ou plus contenant des cellules exprimant à la
fois Notch et Delta/Serrate. Les valeurs données pour le
25 % d'agrégation se rapportent au pourcentage de toutes les
cellules exprimant Notch trouvées dans de tels groupes
soit avec Delta (Dl) (colonne de gauche) soit avec
Serrate (Ser) (colonne de droite). Les divers produits de
construction par deletion de Notch sont représentés
30 schématiquement avec les lignes d'épissage indiquant les
jonctions des ligatures. Chaque répétition d'EGF est
indiquée sous la forme d'un cadre rectangulaire en
pointillés et les nombres des répétitions d'EGF sont
notés de chaque côté d'une jonction de ligature. Au
niveau des jonctions des ligatures, les répétitions d'EGF
partielles produites par les diverses deletions sont
5 indiquées par des cadres ouverts et des parenthèses
fermées (par exemple, voir #23 ACla+EGF(10-12)). Les
produits de constructions #3 à 13 représentent la série
des deletions Clal. Comme il est représenté
schématiquement, quatre des sites Clal, dans les
10 répétitions 7, 9, 17 et 26, rompent la répétition au
milieu, immédiatement après la troisième cysteine
(indiqué par les répétitions en cadre ouvert ; voir la
figure 3 pour plus de clarification), alors que le
cinquième site le plus en 3' se rompt nettement entre les
15 répétitions d'EGF 30 et 31 (indiqué par la répétition en
cadre ouvert 31 ; voir de nouveau la figure 3) . Dans le
produit de construction #15 split, la répétition d'EGF 14
qui porte la mutation ponctuelle split, est dessinée sous
la forme d'un cadre barré. Dans le produit de
20 construction #33 ACla+XEGF(10-13) , les répétitions d'EGF
dérivées de Notch de Xenopus se distinguent des
répétitions de Drosophila par un profil d'ombrage
différent. SP, peptide signal ; EGF, répétition de
facteur de croissance des cellules épidermiques ; N,
25 répétition de Notch/lin-12 ; TM, domaine
transmembranaire ; cdclO, répétitions de cdclO/ankyrine ;
PA, séquence consensus de liaison des nucleotides
potentielle ; opa, suite de polyglutamine nommée opa ;
Dl, Delta ; Ser, Serrate.
30 Figure 3. Structure détaillée de produits de
construction par deletion de Notch #19 à 24 : les
deux répétitions d'EGF 11 et 12 sont requises pour
l'agrégation Notch-Delta. Les répétitions d'EGF 10 à 13
sont schématisées en haut en montrant l'espacement
régulier des six résidus de cysteine (C). Les produits de
PCR générés pour ces produits de construction (noms et
5 nombres tels que donnés sur la figure 2) sont représentés
par les lignes noires épaisses et les points finals
exacts sont notés par rapport aux diverses répétitions
d'EGF. La capacité à s'agréger avec Delta est enregistrée
par ( + ) ou (-) pour chaque produit de construction. Les
10 fragments de PCR soit rompent les répétitions d'EGF au
milieu, juste après la troisième cysteine au même endroit
comme quatre sites Clal sur cinq, ou exactement entre
deux répétitions au même endroit que le site Clal le plus
C-terminal.
15 Figure 4. Comparaison de la séquence d'acides aminés
des répétitions d'EGF 11 et 12 provenant de Notch de
Drosophila et de Xenopus. La séquence des acides aminés
des répétitions d'EGF 11 et 12 de Notch de Drosophila
(SEQ ID NO : 14) (Wharton et al., 1985, Cell 43: 567-
20 581 ; Kidd et al., 1986, Mol. Cell Biol. 6: 3094-3108)
est alignée avec celle des deux mêmes répétitions d'EGF
provenant de Notch de Xenopus (SEQ ID NO : 15) (Coffman
et al., 1990, Science 249: 1438-1441). Les acides aminés
identiques sont encadrés. Les six résidus de cysteine
25 conservés de chaque répétition d'EGF et les résidus
consensus de liaison de Ca++ (Rees et al., 1988, EMBO J.
7: 2053-2061) sont marqués d'un astérisque (*). Le
changement de leucine en proline trouvé dans le clone de
PCR de Xenopus qui n'a pas réussi à s'agréger est noté en
30 dessous.
Figure 5. Homologies des séquences d'acide nucléique
entre Serrate et Delta. Une partie de la séquence
10
nucléotidique de Serrate de Drosophila (SEQ ID NO : 3) ,
avec la séquence de protéine Serrate codée
(SEQ ID NO : 4) inscrite au-dessous (Fleming et al.,
1990, Genes & Dev. 4: 2188-2201 à 2193-94) est
5 représentée. Les quatre régions présentant une homologie
de séquence élevée avec la séquence de Delta de
Drosophila sont numérotées au-dessus de la ligne et
indiquées par des crochets. La région totale d'homologie
couvre les nucleotides numéros 627 à 1290 de la séquence
10 nucléotidique de Serrate (numérotation comme sur la
figure 4 de Fleming et al., 1990, Genes & Dev. 4: 2188-
2201) .
Figure 6. Diagramme schématique de clones de Notch
humain. Un diagramme schématique de Notch humain est
15 représenté. Les lignes en gras épaisses au-dessous du
diagramme montrent la partie de la séquence de Notch
contenue dans chacun des quatre clones d'ADNc. La
localisation des amorces utilisées dans la PCR et leur
orientation sont indiquées par des flèches.
20 Figure 7. Séquences de Notch humain alignées avec la
séquence de Notch de Drosophila. Les lignes verticales
numérotées correspondent aux coordonnées de Notch de
Drosophila. Les lignes horizontales au-dessous de chaque
carte montrent où les clones se situent par rapport aux
25 suites de la séquence (lignes horizontales épaisses).
Figure 8. Séquences nucléotidiques de Notch humain
contenues dans le clone hN2K d'ADNc de plasmide. Figure
8A : la séquence d'ADN (SEQ ID NO : 5) d'une partie de
l'insert de Notch humain est représentée, démarrant au
30 niveau du site EcoRI à l'extrémité 3' et progressant dans
la direction 3' à 5'. Figure 8B : la séquence d'ADN
(SEQ ID NO : 6) d'une partie de l'insert de Notch humain
11
est représentée, démarrant au niveau du site EcoRI à
l'extrémité 5' et progressant dans la direction 5' à 3'.
Figure 8C : la séquence d'ADN (SEQ ID NO : 7) d'une
partie de l'insert de Notch humain est représentée,
5 démarrant en 3 ' de la séquence représentée sur la figure
8B et progressant dans la direction 5' à 3'. Les
séquences représentées sont des tentatives, sujettes à
une confirmation par détermination des séquences
chevauchantes.
10 Figure 9. Séquences nucléotidiques de Notch humain
contenues dans le clone hN4K d'ADNc de plasmide. Figure
9A : la séquence d'ADN (SEQ ID NO : 8) d'une partie de
l'insert de Notch humain est représentée, démarrant au
niveau du site EcoRI à l'extrémité 5' et progressant dans
15 la direction 5' à 3'. Figure 9B : la séquence d'ADN
(SEQ ID NO : 9) d'une partie de l'insert de Notch humain
est représentée, démarrant près de l'extrémité 3' et
progressant dans la direction 3' à 5'. Les séquences
représentées sont des tentatives, sujettes à une
20 confirmation par détermination des séquences
chevauchantes.
Figure 10. Séquences d'ADN (SEQ ID NO : 10) et
d'acides aminés (SEQ ID NO : 11) de Notch humain contenu
dans le clone hN3k d'ADNc de plasmide.
25 Figure 11. Séquences d'ADN (SEQ ID NO : 12) et
d'acides aminés (SEQ ID NO : 13) de Notch humain contenu
dans le clone hN5k d'ADNc de plasmide.
Figure 12. Comparaison de hN5k avec d'autres
homologues de Notch. Figure 12A. Représentation
30 schématique de Notch de Drosophila. Sont indiqués la
séquence signal (signal), les 36 répétitions de type EGF,
les trois répétitions de Notch/lin-12, le domaine
12
transmembranaire (TM), les six répétitions de CDC10, la
répétition OPA et la région riche en PEST (proline, acide
glutamique, serine, threonine) . Figure 12B. Alignement de
la séquence d'acides aminés déduite de hN5k avec les
5 séquences d'autres homologues de Notch. Les acides aminés
sont numérotés sur le côté gauche. Les régions de cdclO
et riche en PEST sont toutes les deux encadrées et les
répétitions individuelles de cdclO sont marquées. Les
acides aminés qui sont identiques dans trois séquences ou
10 plus sont mis en surbrillance. Les amorces utilisées pour
cloner hN5k sont indiquées au-dessous des séquences à
partir desquelles elles ont été conçues. Les sites de la
séquence de localisation nucléaire (NLS), de la caséine
kinase II (CKII) et de la cdc2 kinase (cdc2) du motif de
15 CnN potentiel des homologues de Notch de vertébrés sont
encadrés. La séquence de ciblage nucléaire bipartite
possible (BNTS) et les sites de phosphorylation proximaux
de Notch de drosophila sont également encadrés.
Figure 13. Séquences d'acides aminés alignées de
20 protéines Notch de diverses espèces. humN : la protéine
Notch humaine codée par l'homologue hN (contenu en partie
dans le plasmide hN5k) (SEQ ID NO : 19). TAN-1 : la
protéine Notch humaine codée par l'homologue TAN-1
(SEQ ID NO : 20) (la séquence représentée est dérivée
25 partiellement de nos propres travaux et partiellement de
la séquence de TAN-1 telle que publiée par Ellisen et
al., 1991, Cell 66: 649-661) ; Xen N : protéine Notch de
Xenopus (Coffman et al., 1990, Science 249: 1438-1441).
Dros N : protéine Notch de Drosophila (Wharton et al.,
30 1985, Cell 43: 567-581). Les domaines structuraux sont
indiqués.
13
Figure 14. Coloration immunocytochimique de tissu de
cancer du sein provenant d'un patient humain. Le tissu du
sein malin dans un échantillon obtenu d'un patient humain
a été noyé dans une coupe de paraffine et soumis à une
5 coloration immunocytochimique avec l'anticorps monoclonal
anti-Notch humaine P4, dirigé contre la protéine TAN-1.
Le tissu du sein non malin a présenté beaucoup moins de
coloration (non présenté).
Figure 15. Coloration immunocytochimique de tissu du
10 côlon provenant d'un patient humain souffrant d'un cancer
du côlon. Un échantillon de tissu du côlon obtenu à
partir d'un patient souffrant d'un cancer du côlon a été
noyé dans une coupe de paraffine et soumis à une
coloration immunocytochimique avec l'anticorps monoclonal
15 anti-Notch humaine PI, dirigé contre la protéine codée
par hN. Les zones de coloration accrue sont les zones
dans lesquelles les cellules malignes sont présentes,
déterminées par la morphologie cellulaire.
Figure 16. Coloration immunocytochimique de tissu du
20 col de l'utérus. Les échantillons de tissus humains ont
été obtenus, contenant le cancer du col de l'utérus
(figure 16A) ou l'épithélium du col de l'utérus normal
(figure 16B) à partir de la même patiente, noyés dans une
coupe de paraffine et soumis à une coloration
25 immunocytochimique avec l'anticorps monoclonal anti-Notch
humaine, dirigé contre la protéine TAN-1. Les zones
contenant les cellules malignes (déterminées par la
morphologie) ont présenté une coloration accrue par
rapport aux cellules non malignes. Parmi les cellules non
30 malignes, le tissu conjonctif et la couche basale de
l'épithélium (contenant des cellules souches) se sont
colorés avec l'anticorps anti-Notch.
14
Figure 17. ADN (SEQ ID NO : 21) et séquence d'acides
aminés codée (contenue dans SEQ ID NO : 19) de
l'homologue hN de Notch humaine. La séquence codante
d'ADN entière est présentée (ainsi que la séquence non
5 codante), avec l'exclusion de celle codant pour
l'initiateur Met. Les 8 derniers nucleotides présentés
(numéros 9716 à 9723) sont des séquences du vecteur et
pas de hN.
10 5. DESCRIPTION DETAILLEE DE L'INVENTION
La présente invention concerne des utilisations
thérapeutiques et des procédés de diagnostic et des
compositions à base de protéines et d'acides nucléiques
Notch. L'invention fournit un traitement de troubles de
15 sort ou de différenciation cellulaire par
l'administration d'un composé thérapeutique de
l'invention. De tels composés thérapeutiques (appelés
dans ce document « produits thérapeutiques »)
comprennent : des protéines Notch et des analogues et des
20 dérivés (y compris des fragments) de celles-ci ; des
anticorps dirigés contre ceux-ci ; des acides nucléiques
codant pour les protéines Notch, les analogues ou les
dérivés ; et des acides nucléiques antisens Notch. Sont
également compris des protéines et des dérivés et des
25 analogues de celles-ci qui sont capables d'inhiber les
interactions d'une protéine Notch avec une autre protéine
toporythmique. Dans un mode de réalisation préféré, un
produit thérapeutique de l'invention peut être administré
pour traiter une condition cancéreuse ou pour prévenir la
30 progression à partir d'un état pré-néoplasique ou non
malin (par exemple, une condition métaplasique) vers un
état néoplasique ou malin. Dans un autre mode de
15
réalisation spécifique, un produit thérapeutique de
1'invention peut être administré pour traiter un trouble
du système nerveux, tel qu'une lésion nerveuse ou une
maladie degenerative. Dans encore un autre mode de
5 réalisation spécifique, un produit thérapeutique de
l'invention peut être administré pour favoriser la
régénérescence et la réparation tissulaire pour le
traitement de diverses conditions.
Dans un mode de réalisation, les produits
10 thérapeutiques qui s'opposent à ou inhibent la fonction
de Notch (ci-après dans ce document « produits
thérapeutiques antagonistes ») peuvent être administrés
pour un effet thérapeutique ; les troubles qui peuvent
être ainsi traités peuvent être identifiés par des tests
15 in vitro tels que décrits dans la section 5.1, ci-dessous.
De tels produits thérapeutiques antagonistes comprennent,
sans limitation, des acides nucléiques antisens Notch,
des anticorps de neutralisation anti-Notch, des
inhibiteurs compétitifs des interactions protéine Notch-
20 protéine (par exemple, une protéine comprenant l'ELR-11
et l'ELR-12 de Notch) et des molécules qui interfèrent
avec la fonction intracellulaire de Notch telle que celle
médiée par les répétitions de cdclO, comme il est
détaillé ci-dessous.
25 Dans un autre mode de réalisation, les produits
thérapeutiques qui favorisent la fonction de Notch
(ci-après dans ce document « produits thérapeutiques
agonistes ») peuvent être administrés pour un effet
thérapeutique ; les troubles qui peuvent être ainsi
30 traités peuvent être identifiés par des tests in vitro
tels que décrits dans la section 5.1, ci-dessous. De tels
produits thérapeutiques agonistes comprennent, sans
16
limitation, des protéines Notch et des dérivés de
celles-ci comprenant le domaine intracellulaire, des
acides nucléiques Notch codant pour les précédents.
Des troubles de sort cellulaire, en particulier des
5 conditions précancéreuses telles qu'une métaplasie et une
dysplasie, et des troubles hyperprolifératifs (par
exemple, un cancer) ou hypoprolifératifs, impliquant des
taux aberrants ou indésirables d'expression ou d'activité
de la protéine Notch peuvent être diagnostiqués par la
10 détection de tels taux, comme il est décrit plus
pleinement ci-dessous.
Dans un aspect préféré, un produit thérapeutique de
l'invention est une protéine constituée d'au moins un
fragment (appelé dans ce document « fragment adhésif »)
15 des protéines codées par des gènes toporythmiques qui
médie la liaison aux protéines Notch ou à des fragments
adhésifs de celles-ci. Les gènes toporythmiques, tels
qu'utilisés dans ce document, signifieront le gène Notch.
L'invention fournit en outre des utilisations, dans
20 des compositions pharmaceutiques ou pour la fabrication
d'un médicament, d'une protéine Notch humaine codée par
l'homologue hN, et des protéines comprenant le domaine
extracellulaire de la protéine Notch et des
sous-séquences de celui-ci. Les acides nucléiques codant
25 pour les précédents et des cellules recombinantes sont
également fournis.
Pour la clarté de la description, et pas à titre de
limitation, la description détaillée de l'invention est
divisée en sous-sections suivantes :
30 (i) utilisations thérapeutiques ;
(ii) utilisations prophylactiques ;
17
(iii) démonstration de l'utilité thérapeutique ou
prophylactique ;
(iv) administration thérapeutique/prophylactique et
compositions ;
5 (v) régulation antisens de l'expression de Notch ;
(vi) utilité diagnostique ;
(vii) acides nucléiques Notch ;
(viii) production recombinante de produits
thérapeutiques protéiques ;
10 (ix) dérivés et analogues de Notch et autres
protéines toporythmiques ;
(x) dosages des protéines Notch, des dérivés et des
analogues ; et
(xi) anticorps dirigés contre les protéines Notch,
15 les dérivés et les analogues.
5.1 UTILISATIONS THERAPEUTIQUES
Comme il a été indiqué ci-dessus, les produits
thérapeutiques antagonistes de la présente invention sont
20 des produits thérapeutiques qui s'opposent à ou inhibent
la fonction de Notch. De tels produits thérapeutiques
antagonistes sont de manière préférée entre toutes
identifiés par l'utilisation de tests in vitro pratiques
connus, par exemple, basés sur leur capacité à inhiber la
25 liaison de Notch à d'autres protéines (voir les sections
6 à 8 dans ce document) ou à inhiber toute fonction
connue de Notch telle que testée in vitro, bien que des
tests génétiques (par exemple, dans Drosophila) puissent
être également employés. Dans un mode de réalisation
30 préféré, le produit thérapeutique antagoniste est une
protéine ou un dérivé de celle-ci comprenant un fragment
fonctionnellement actif tel qu'un fragment adhésif de
Notch. Dans des modes de réalisation spécifiques, un tel
produit thérapeutique antagoniste peut être des protéines
adhésives codées par les produits de construction
appropriés décrits dans les sections 6 et 7, ci-dessous,
5 ou des protéines comprenant la région extracellulaire de
Notch, en particulier ELR-11 et ELR-12, ou un anticorps
dirigé contre celles-ci, ou un analogue/inhibiteur
compétitif d'une région transduisant les signaux
intracellulaires de Notch, un acide nucléique capable
10 d'exprimer un fragment adhésif de Notch, ou un acide
nucléique antisens Notch (voir la section 5.5 dans ce
document) . Il faudra noter que dans certains cas, un
fragment adhésif de Notch (ou éventuellement d'autres
agents thérapeutiques antagonistes présumés) peut agir en
15 variante comme un agent thérapeutique agoniste, selon les
antécédents développementaux du tissu exposé au produit
thérapeutique ; de préférence, des tests in vitro ou in
vivo appropriés, tels que décrits ci-dessous, devront
être utilisés pour déterminer l'effet d'un produit
20 thérapeutique spécifique et si son administration est
indiquée pour le traitement du tissu affecté.
Dans un autre mode de réalisation de l'invention, un
acide nucléique contenant une partie d'un gène Notch est
utilisé, comme produit thérapeutique antagoniste, pour
25 favoriser l'inactivation de Notch par une recombinaison
homologue (Koller et Smithies, 1989. Proc. Natl. Acad.
Sei. USA 86: 8932-8935 ; Zijlstra et al., 1989, Nature
342: 435-438).
Les produits thérapeutiques agonistes de
30 l'invention, tels que décrits ci-dessus, favorisent la
fonction de Notch.
19
D'autres descriptions et sources de produits
thérapeutiques des inventions se trouvent dans les
sections 5.4 à 5.8 dans ce document.
Les produits thérapeutiques agonistes et
5 antagonistes de l'invention ont une utilité thérapeutique
pour des troubles de sort cellulaire. Les produits
thérapeutiques agonistes peuvent être administrés de
manière thérapeutique (y compris prophylactique) :
(1) dans des maladies ou des troubles impliquant une
10 absence ou une diminution des taux (par rapport aux taux
normaux ou souhaités) de la fonction de Notch, par
exemple, chez des patients où la protéine Notch est
manquante, génétiquement défectueuse, biologiquement
inactive ou sous-active, ou sous-exprimée ; et (2) dans
15 des maladies ou des troubles dans lesquels des tests
in vitro (ou in vivo) indiquent l'utilisation de
l'administration d'un agoniste de Notch. L'absence ou une
diminution des taux de la fonction de Notch peuvent être
facilement détectées, par exemple, en obtenant un
20 échantillon tissulaire de patient (par exemple, une
biopsie tissulaire) et en l'analysant in vitro pour les
taux de protéine, la structure et/ou l'activité de la
protéine Notch exprimée. De nombreux procédés classiques
dans l'art peuvent être ainsi employés, y compris, sans
25 limitation, des tests immunologiques pour détecter et/ou
visualiser la protéine Notch (par exemple, Western blot,
immunoprécipitation suivie d'une électrophorèse sur gel
de Polyacrylamide avec du dodécylsulfate de sodium,
immunocytochimie, etc. voir également les tests énumérés
30 dans la section 5.6, ci-dessous) et/ou des tests
d'hybridation pour détecter l'expression de Notch en
détectant et/ou en visualisant l'ARNm de Notch (par
20
exemple, tests Northern, dot blots, hybridation in situ,
etc.).
Les tests in vitro qui peuvent être utilisés pour
déterminer si l'administration d'un produit thérapeutique
5 agoniste ou d'un produit thérapeutique antagoniste
spécifique est indiquée, comprennent des tests de culture
cellulaire in vitro dans lesquels un échantillon
tissulaire de patient est développé en culture et exposé
à ou auquel il a été autrement administré un produit
10 thérapeutique, et l'effet d'un tel produit thérapeutique
sur l'échantillon tissulaire est observé. Dans un mode de
réalisation, où le patient a une malignité, un
échantillon de cellules provenant d'une telle malignité
est plaqué ou cultivé en culture, et les cellules sont
15 ensuite exposées à un produit thérapeutique. Un produit
thérapeutique qui inhibe la survie ou la croissance des
cellules malignes (par exemple, en favorisant la
différenciation terminale) est sélectionné pour une
utilisation thérapeutique in vivo. De nombreux tests
20 classiques dans l'art peuvent être utilisés pour estimer
une telle survie et/ou croissance ; par exemple, la
prolifération cellulaire peut être testée par la mesure
de l'incorporation de 3H-thymidine, par le dénombrement
direct des cellules, par la détection de changements de
25 l'activité transcriptionnelle de gènes connus tels que
des proto-oncogènes (par exemple, fos, myc) ou des
marqueurs du cycle cellulaire ; la viabilité cellulaire
peut être estimée par une coloration au bleu trypan, la
différenciation peut être estimée visuellement en se
30 basant sur les changements de morphologie, etc. Dans un
aspect spécifique, les cultures des cellules malignes
sont exposées séparément à (1) un produit thérapeutique
21
agoniste et (2) produit thérapeutique antagoniste ; le
résultat du test peut indiquer quel type de produit
thérapeutique a une efficacité thérapeutique.
Dans un autre mode de réalisation, un produit
5 thérapeutique est indiqué pour une utilisation qui
présente l'effet souhaité, l'inhibition ou la promotion
de la croissance cellulaire, sur l'échantillon cellulaire
de patient provenant d'un tissu ayant ou suspecté d'avoir
un trouble d'hyper- ou d'hypo-prolifération,
10 respectivement. De tels troubles hyper- ou
hypo-prolifératifs comprennent, sans limitation, ceux
décrits dans les sections 5.1.1 à 5.1.3, ci-dessous.
Dans un autre mode de réalisation spécifique, un
produit thérapeutique est indiqué pour une utilisation
15 dans le traitement d'une lésion nerveuse ou d'un trouble
dégénératif du système nerveux (voir la section 5.1.2)
qui favorise in vitro la régénérescence
nerveuse/extension de névrite à partir des cellules
nerveuses du type de patient affecté.
20 En outre, l'administration d'un produit
thérapeutique antagoniste de l'invention est également
indiquée dans des maladies ou des troubles déterminés ou
connus pour impliquer un phénotype dominant activé de
Notch (mutations de « gain de fonction »).
25 L'administration d'un produit thérapeutique agoniste est
indiquée dans des maladies ou des troubles déterminés ou
connus pour impliquer un phénotype dominant négatif de
Notch (mutations de « perte de fonction ») . Nous avons
étudié les fonctions de divers domaines structuraux de la
30 protéine Notch in vivo, par expression de manière
ectopique d'une série de mutants par deletion de Notch de
Drosophila sous le promoteur de choc thermique hsp70,
22
ainsi que des promoteurs spécifiques de l'oeil. Deux
classes de phénotypes dominants ont été observées, l'une
suggestive de mutations de perte de fonction de Notch et
l'autre de mutations de gain de fonction de Notch. Des
5 phénotypes « activés » dominants ont résulté de la
surexpression d'une protéine manquant de la plupart des
séquences extracellulaires, alors que des phénotypes
dominants « négatifs » ont résulté de la surexpression
d'une protéine manquant de la plupart des séquences
10 intracellulaires. Nos résultats indiquent que Notch
fonctionne comme un récepteur dont le domaine
extracellulaire médie la liaison de ligands, entraînant
la transmission de signaux développementaux par le
domaine cytoplasmique. Les phénotypes observés ont
15 également suggéré que la région de répétition de
cdclO/ankyrine au sein du domaine intracellulaire joue un
rôle essentiel dans les événements de transduction de
signaux médiés par Notch (fonction intracellulaire).
Dans divers modes de réalisation spécifiques, des
20 tests in vitro peuvent être réalisés avec des cellules
représentatives de types cellulaires impliqués dans un
trouble de patient, pour déterminer si un produit
thérapeutique a un effet souhaité sur de tels types
cellulaires.
25 Dans un autre mode de réalisation, des cellules d'un
échantillon tissulaire de patient suspecté d'être
pré-néoplasique sont plaquées de manière similaire ou
cultivées in vitro, et exposées à un produit
thérapeutique. Le produit thérapeutique qui entraîne un
30 phénotype cellulaire qui est plus normal (c'est-à-dire,
moins représentatif d'un état pré-néoplasique, d'un état
néoplasique, d'un état malin ou d'un phénotype
23
transformé) est sélectionné pour une utilisation
thérapeutique. De nombreux tests classiques dans l'art
peuvent être utilisés pour estimer si un état
pré-néoplasique, un état néoplasique, ou un phénotype
5 transformé ou malin, est présent (voir la section 5.2.1).
Par exemple, des caractéristiques associées à un
phénotype transformé (un ensemble de caractéristiques in
vitro associées à une capacité tumorigène in vivo)
comprennent une morphologie cellulaire plus arrondie, une
10 fixation au substrat plus lâche, une perte de
l'inhibition de contact, une perte de la dépendance de
l'ancrage, une libération de proteases telles que
l'activateur du plasminogène, une augmentation du
transport de sucres, une diminution du besoin en sérum,
15 une expression d'antigènes f?taux, une disparition de la
protéine de surface de 250 000 daltons (voir Luria et
al., 1978, General Virology, 3d Ed., John Wiley & Sons,
New York pp. 436-446)
Dans d'autres modes de réalisation spécifiques, les
20 tests in vitro décrits ci-dessus peuvent être réalisés en
utilisant une lignée cellulaire, plutôt qu'un échantillon
cellulaire dérivé du patient spécifique à traiter, où la
lignée cellulaire est dérivée de ou présente une ou
plusieurs caractéristiques associées au trouble malin,
25 néoplasique ou pré-néoplasique qu'il est souhaité traiter
ou prévenir, ou est dérivée du type neural ou d'un autre
type cellulaire sur lequel un effet est souhaité, selon
la présente invention.
Les produits thérapeutiques antagonistes peuvent
30 être administrés de manière thérapeutique (y compris
prophylactique) : (1) dans des maladies ou des troubles
impliquant une augmentation des taux (par rapport aux
24
taux normaux ou souhaités) de la fonction de Notch, par
exemple, où la protéine Notch est surexprimée ou
superactive ; et (2) dans des maladies ou des troubles
dans lesquels des tests in vitro (ou in vivo) indiquent
5 l'utilité de l'administration d'un antagoniste de Notch.
L'augmentation des taux de la fonction de Notch peut être
facilement détectée par des procédés tels que ceux
décrits ci-dessus, par la quantification de la protéine
et/ou de l'ARN. Des tests in vitro avec des cellules
10 d'échantillon tissulaire de patient ou de la lignée
cellulaire ou du type cellulaire approprié, pour
déterminer l'utilité thérapeutique, peuvent être réalisés
comme il a été décrit ci-dessus.
15 5.1.1. MALIGNITES
Les conditions malignes et pré-néoplasiques qui
peuvent être testées comme il a été décrit ci-dessus pour
l'efficacité d'une intervention avec des produits
thérapeutiques antagonistes ou agonistes et qui peuvent
20 être traitées après avoir ainsi observé une indication
d'utilité thérapeutique, comprennent, sans limitation,
celles décrites ci-dessous dans les sections 5.1.1 et
5.2.1.
Les malignités et les troubles apparentés, dont les
25 types cellulaires peuvent être testés in vitro (et/ou in
vivo) et après avoir observé ainsi le résultat du test
approprié, traités selon la présente invention,
comprennent, sans limitation, ceux énumérés dans le
tableau 1 (pour une description de tels troubles, voir
30 Fishman et al., 1985, Medicine, 2d Ed., J.B. Lippincott
Co., Philadelphia) :
25
Tableau 1
Malignités et troubles apparentés
Leucémie
leucémie aiguë
5 leucémie aiguë lymphocytaire
leucémie aiguë myélocytaire
myeloblastique
promyélocytaire
myélomonocytaire
10 monocytaire
érythroleucémie
leucémie chronique
leucémie chronique myélocytaire
(granulocytaire)
15 leucémie chronique lymphocytaire
Polyglobulie essentielle
Lymphome
maladie de Hodgkin
maladie non hodgkinienne
20 Myélome multiple
Macroglobulinémie de Waldenstrom
Maladie des chaînes lourdes
Tumeurs solides
sarcomes et carcinomes
25 fibrosarcome
myxosarcome
liposarcome
chondrosarcome
sarcome ostéogénique
30 chordome
angiosarcome
endothéliosarcome
26
lymphangiosarcome
lymphangio-endothéliosarcome
synoviome
mésothéliome
5 tumeur d'Ewing
léiomyosarcome
rhabdomyosarcome
carcinome du côlon
cancer pancréatique
10 cancer du sein
cancer de 1'ovaire
cancer de la prostate
carcinome à cellules squameuses
carcinome à cellules basales
15 adénocarcinome
carcinome des glandes sudoripares
carcinome des glandes sébacées
carcinome papillaire
adénocarcinomes papillaires
20 cystadénocarcinome
carcinome médullaire
carcinome bronchogénique
carcinome des cellules rénales
hépatome
25 carcinome des conduits biliaires
choriocarcinome
Seminome
carcinome embryonnaire
tumeur de Wilms
30 cancer du col de l'utérus
tumeur testiculaire
carcinome du poumon
27
carcinome du poumon à petites cellules
carcinome de la vessie
carcinome epithelial
gliome
5 astrocytome
médulloblastome
craniopharyngiome
épendymome
Pinealome
10 hémangioblastome
névrome acoustique
Oligodendrogliome
ménangiome
mélanome
15 neuroblastome
rétinoblastome
Dans des modes de réalisation spécifiques, une
malignité ou des changements dysprolifératifs (tels que
20 des métaplasies et des dysplasies) sont traités ou
prévenus dans des tissus épithéliaux tels que ceux dans
le col de l'utérus, l'?sophage et le poumon.
Comme il est détaillé dans la section 10.1 des
exemples ci-dessous, des malignités du sein, du côlon et
25 du col de l'utérus présentent une augmentation de
l'expression de Notch humaine par rapport à un tel tissu
non malin. Ainsi, dans des modes de réalisation
spécifiques, des malignités du sein, du côlon ou du col
de l'utérus sont traitées ou prévenues par
30 l'administration d'une quantité efficace d'un produit
thérapeutique antagoniste de l'invention. La présence
d'une augmentation de l'expression de Notch dans un
28
cancer du sein, du côlon et du col de l'utérus suggère
que beaucoup plus de conditions cancéreuses présentent
une Notch régulée à la hausse. Ainsi, nous envisageons
que beaucoup plus de cancers, par exemple, un Seminome,
5 un mélanome et un cancer du poumon, peuvent être traités
ou prévenus par l'administration d'un produit
thérapeutique antagoniste.
5.1.2 TROUBLES DU SYSTEME NERVEUX
10 Des troubles du système nerveux, impliquant des
types cellulaires qui peuvent être testés comme il a été
décrit ci-dessus pour l'efficacité d'une intervention
avec des produits thérapeutiques antagonistes ou
agonistes, et qui peuvent être traités après avoir ainsi
15 observé une indication d'utilité thérapeutique,
comprennent, sans limitation, des lésions du système
nerveux, et des maladies ou des troubles qui entraînent
soit une déconnexion des axones soit une diminution ou
une dégénérescence des neurones soit une démyélinisation.
20 Les lésions du système nerveux qui peuvent être traitées
chez un patient (y compris des patients mammaliens
humains et non humains) selon l'invention comprennent,
sans limitation, les lésions suivantes des systèmes
nerveux soit central (y compris la moelle épinière, le
25 cerveau) soit périphérique :
(i) des lésions traumatiques, y compris des lésions
provoquées par une lésion physique ou associées à une
chirurgie, par exemple, des lésions qui sectionnent une
partie du système nerveux, ou des lésions par
30 compression ;
(ii) des lésions ischémiques, dans lesquelles un
manque d'oxygène dans une partie du système nerveux
29
entraîne une lésion ou la mort des neurones, y compris un
infarctus ou une ischémie cérébrale(e) , ou un infarctus
ou une ischémie de la moelle épinière ;
(iii) des lésions malignes, dans lesquelles une
5 partie du système nerveux est détruite ou lésée par du
tissu malin qui est soit une malignité associée au
système nerveux soit une malignité dérivée d'un tissu de
système non nerveux ;
(iv) des lésions infectieuses, dans lesquelles une
10 partie du système nerveux est détruite ou lésée comme
conséquence d'une infection, par exemple, par un abcès ou
associées à une infection par le virus de
1'immunodéficience humaine, le virus herpétique du zona,
ou le virus herpes simplex ou à la maladie de Lyme, la
15 tuberculose, la syphilis ;
(v) des lésions dégénératives, dans lesquelles une
partie du système nerveuse est détruite ou lésée comme
conséquence d'un processus dégénératif y compris, sans
limitation, une dégénérescence associée à la maladie de
20 Parkinson, la maladie d'Alzheimer, la chorée de
Huntington ou la sclérose latérale amyotrophique ;
(vi) des lésions associées à des maladies ou des
troubles de la nutrition, dans lesquelles une partie du
système nerveux est détruite ou lésée par un trouble
25 nutritionnel ou un trouble du métabolisme y compris, sans
limitation, un déficit en vitamine B12, un déficit en
acide folique, la maladie de Wernicke, une amblyopie
tabagique-alcoolique, la maladie de Marchiafava-Bignami
(dégénérescence primaire du corps calleux) et une
30 dégénérescence cérébelleuse alcoolique ;
(vii) des lésions neurologiques associées à des
maladies systémiques y compris, sans limitation, le
30
diabète (neuropathie diabétique, paralysie de Bell), le
lupus érythémateux systémique, un carcinome ou la
sarcoïdose ;
(viii) des lésions provoquées par des substances
5 toxiques y compris l'alcool, le plomb ou des neurotoxines
particulières ; et
(ix) des lésions démyélinisées dans lesquelles une
partie du système nerveux est détruite ou lésée par une
maladie démyélinisante y compris, sans limitation, la
10 sclérose en plaques, une myélopathie associée au virus de
1'immunodéficience humaine, une myélopathie transverse ou
diverses etiologies, une leuco-encéphalopathie
multifocale progressive et la myélinolyse centro-pontine.
Des produits thérapeutiques qui sont utiles selon
15 l'invention pour le traitement d'un trouble du système
nerveux peuvent être sélectionnés par l'analyse de
l'activité biologique dans la promotion de la survie ou
de la différenciation des neurones (voir également la
section 5.1) . Par exemple, et pas à titre de limitation,
20 des produits thérapeutiques qui déclenchent l'un
quelconque des effets suivants peuvent être utiles selon
l'invention :
(i) augmentation du temps de survie des neurones en
culture ;
25 (ii) augmentation du bourgeonnement des neurones en
culture ou in vivo ;
(iii) augmentation de la production d'une molécule
associée aux neurones en culture ou in vivo, par exemple,
la choline acétyltransferase ou 1'acetylcholinesterase en
30 ce qui concerne les neurones moteurs ; ou
(iv) diminution des symptômes d'un dysfonctionnement
des neurones in vivo. De tels effets peuvent être mesurés
31
par tout procédé connu dans l'art. Dans des modes de
réalisation non limitatifs préférés, l'augmentation de la
survie des neurones peut être mesurée par le procédé
présenté dans Arakawa et al. (1990, J. Neurosci.
5 10: 3507-3515) ; l'augmentation du bourgeonnement des
neurones peut être détectée par des procédés présentés
dans Pestronk et al. (1980, Exp. Neurol. 70: 65-82) ou
Brown et al. (1981, Ann. Rev. Neurosci. 4: 17-42) ;
l'augmentation de la production de molécules associées
10 aux neurones peut être mesurée par un test biologique, un
test enzymatique, la liaison à des anticorps, un test
Northern blot, etc., selon la molécule à mesurer ; et une
dysfonction des neurones moteurs peut être mesurée par
l'estimation de la manifestation physique du trouble des
15 neurones moteurs, par exemple, une faiblesse, la vitesse
de conduction des neurones moteurs ou une incapacité
fonctionnelle.
Dans un mode de réalisation spécifique, les troubles
des neurones moteurs qui peuvent être traités selon
20 l'invention comprennent, sans limitation, des troubles
tels qu'un infarctus, une infection, une exposition à une
toxine, un traumatisme, une lésion chirurgicale, une
maladie degenerative ou une malignité qui peuvent
affecter les neurones moteurs ainsi que d'autres
25 composants du système nerveux, ainsi que des troubles qui
affectent sélectivement des neurones tels que la sclérose
latérale amyotrophique, et y compris, sans limitation,
une atrophie musculaire spinale progressive, une
paralysie bulbaire progressive, une sclérose latérale
30 primaire, une atrophie musculaire infantile et juvénile,
une paralysie bulbaire progressive de l'enfance (syndrome
de Fazio-Londe), la poliomyélite et le syndrome post-
32
polio et la neuropathie motosensorielle héréditaire
(maladie de Charcot-Marie-Tooth).
5.1.3 REPARATION ET REGENERATION TISSULAIRE
5 Dans un autre mode de réalisation de l'invention, un
produit thérapeutique de l'invention est utilisé pour
favoriser la régénération et la réparation tissulaire, y
compris, sans limitation, le traitement de troubles
dysprolifératifs bénins. Des modes de réalisation
10 spécifiques sont orientés vers le traitement de la
cirrhose du foie (une condition dans laquelle la
formation de cicatrices a dépassé les processus de
régénération normale du foie), le traitement de la
formation de chéloïdes (cicatrices hypertrophiques)
15 (défiguration de la peau dans laquelle le processus de
formation de cicatrices interfère avec un renouvellement
normal), du psoriasis (une condition cutanée courante
caractérisée par une prolifération excessive de la peau
et un retard de la détermination correcte du sort
20 cellulaire) et de la calvitie (une condition dans
laquelle les follicules pileux en différenciation
terminale (un tissu riche en Notch) ne réussissent pas à
fonctionner correctement).
25 5.2. UTILISATIONS PROPHYLACTIQUES
5.2.1. MALIGNITES
Les produits thérapeutiques de l'invention peuvent
être administrés pour prévenir la progression vers un
30 état néoplasique ou malin, y compris, sans limitation,
les troubles énumérés dans le tableau 1. Une telle
administration est indiquée où il est montré dans des
33
tests, tels que décrits ci-dessus, que le produit
thérapeutique a une utilité pour le traitement ou la
prévention d'un tel trouble. Une telle utilisation
prophylactique est indiquée dans des conditions connues
5 ou suspectées de précéder la progression vers une
néoplasie ou un cancer, en particulier, où une croissance
cellulaire non néoplasique constituée d'une hyperplasie,
d'une métaplasie, ou le plus particulièrement, d'une
dysplasie est survenue (pour une description de telles
10 conditions anormales de croissance, voir Robbins et
Angell, 1976, Basic Pathology, 2d Ed., W.B. Saunders Co.,
Philadelphia, pp. 68-79). L'hyperplasie est une forme de
prolifération cellulaire contrôlée impliquant une
augmentation du nombre des cellules dans un tissu ou un
15 organe, sans modification significative de la structure
ou de la fonction. Comme exemple, une hyperplasie
endométriale précède souvent un cancer endometrial. Une
métaplasie est une forme de croissance cellulaire
contrôlée dans laquelle un type de cellule adulte ou
20 totalement différenciée se substitue à un autre type de
cellule adulte. Une métaplasie peut survenir dans des
cellules de tissu epithelial ou conjonctif. Une
métaplasie atypique implique un epithelium métaplasique
quelque peu désordonné. Une dysplasie est souvent un
25 signe avant-coureur de cancer et elle se trouve
principalement dans les epitheliums ; il s'agit de la
forme la plus désordonnée de croissance cellulaire non
néoplasique, impliquant une perte de l'uniformité
cellulaire individuelle et de l'orientation
30 architecturale des cellules. Les cellules dysplasiques
ont souvent des noyaux anormalement gros, profondément
colorés et elles présentent un pléomorphisme. Une
34
dysplasie survient de manière caractéristique où il
existe une irritation ou une inflammation chronique et
elle se trouve souvent dans le col de l'utérus, les voies
respiratoires, la cavité orale et la vésicule biliaire.
5 En variante ou en plus de la présence d'une
croissance cellulaire anormale caractérisée sous la forme
d'une hyperplasie, d'une métaplasie ou d'une dysplasie,
la présence d'une ou plusieurs caractéristiques d'un
phénotype transformé ou d'un phénotype malin, présentées
10 in vivo ou présentées in vitro par un échantillon
cellulaire provenant d'un patient, peut indiquer le
caractère souhaitable de l'administration
prophylactique/thérapeutique d'un produit thérapeutique
de l'invention. Comme il a été mentionné ci-dessus, de
15 telles caractéristiques d'un phénotype transformé
comprennent des changements de morphologie, une fixation
plus lâche au substrat, une perte de l'inhibition de
contact, une perte de la dépendance d'ancrage, une
libération de proteases, une augmentation du transport de
20 sucres, une diminution du besoin en sérum, une expression
d'antigènes f?taux, la disparition de la protéine de la
surface cellulaire de 250 000 daltons, etc. (voir
également id., à pp. 84-90 pour les caractéristiques
associées à un phénotype transformé ou malin).
25 Dans un mode de réalisation spécifique, une
leucoplasie, une lésion hyperplasique ou dysplasique
d'aspect bénin de l'épithélium ou la maladie de Bowen, un
carcinome in situ, sont des lésions pré-néoplasiques
indicatives du caractère souhaitable d'une intervention
30 prophylactique.
Dans un autre mode de réalisation, une maladie
fibrokystique (hyperplasie kystique, dysplasie mammaire,
35
particulièrement une adénose (hyperplasie epitheliale
bénigne)) est indicative du caractère souhaitable d'une
intervention prophylactique.
Dans d'autres modes de réalisation, un patient qui
5 présente un ou plusieurs des facteurs de prédisposition
suivants pour une malignité est traité par
l'administration d'une quantité efficace d'un produit
thérapeutique : une translocation chromosomique associée
à une malignité (par exemple, le chromosome Philadelphie
10 pour la leucémie chronique myelogene, t(14;18) pour un
lymphome folliculaire, etc.), une polypöse familiale ou
le syndrome de Gardner (des signes avant-coureurs
possibles d'un cancer du côlon), une gammapathie
monoclonale bénigne (un signe avant-coureur possible d'un
15 myélome multiple) et une relation familiale au premier
degré avec des personnes souffrant d'un cancer ou d'une
maladie précancéreuse montrant un schéma d'hérédité
mendélienne (génétique) (par exemple, une polypöse
familiale du côlon, le syndrome de Gardner, une exostose
20 héréditaire, une adenomatöse polyendocrinienne, un
carcinome thyroïdien médullaire avec production
d'amyloïde et phéochromocytome, le syndrome de Peutz-
Jeghers, la neurofibromatose de Von Recklinghausen, un
rétinoblastome, une tumeur du corps carotidien, un
25 mélanocarcinome cutané, un mélanocarcinome intra-oculaire,
une xérodermie pigmentée, une ataxie télangiectasique, le
syndrome de Chediak-Higashi, l'albinisme, l'anémie
aplasique de Fanconi et le syndrome de Bloom ; voir
Robbins et Angell, 1976, Basic Pathology, 2d Ed.,
30 W.B. Saunders Co., Philadelphia, pp. 112-113) etc.).
Dans un autre mode de réalisation spécifique, un
produit thérapeutique antagoniste de l'invention est
36
administré à un patient humain pour prévenir une
progression vers un cancer du sein, du côlon ou du col de
1'utérus.
5 5.2.2. AUTRES TROUBLES
Dans d'autres modes de réalisation, un produit
thérapeutique de l'invention peut être administré pour
prévenir un trouble du système nerveux décrit dans la
section 5.1.2, ou un autre trouble (par exemple, une
10 cirrhose du foie, un psoriasis, des chéloïdes, une
calvitie) décrit dans la section 5.1.3.
5.3. DEMONSTRATION DE L'UTILITE THERAPEUTIQUE OU
PROPHYLACTIQUE
15 Les produits thérapeutiques de l'invention peuvent
être testés in vivo pour l'activité thérapeutique ou
prophylactique souhaitée. Par exemple, de tels composés
peuvent être testés dans des systèmes de modèles animaux
appropriés avant les tests chez les êtres humains, y
20 compris, sans limitation, des rats, des souris, des
poulets, des vaches, des singes, des lapins, etc. Pour
une analyse in vivo, avant l'administration à des êtres
humains, tout système de modèle animal connu dans l'art
peut être utilisé.
25
5.4 ADMINISTRATION THERAPEUTIQUE/PROPHYLACTIQUE ET
COMPOSITIONS
L'invention fournit des compositions pharmaceutiques
pour le traitement (et la prophylaxie) par
30 l'administration à un sujet d'une quantité efficace d'un
produit thérapeutique de l'invention. Dans un aspect
préféré, le produit thérapeutique est substantiellement
37
purifié. Le sujet est de préférence un animal, y compris,
sans limitation, des animaux tels que des vaches, des
porcs, des poulets, etc., et est de préférence un
mammifère, et de manière préférée entre toutes un être
5 humain.
Divers systèmes de délivrance sont connus et peuvent
être utilisés pour administrer un produit thérapeutique
de l'invention, par exemple, une encapsulation dans des
liposomes, des microparticules, des microcapsules, une
10 expression par des cellules recombinantes, une endocytose
médiée par des récepteurs (voir, par exemple, Wu et Wu,
1987, J. Biol. Chem. 262: 4429-4432), la construction
d'un acide nucléique thérapeutique faisant partie d'un
vecteur retroviral ou autre, etc. Les procédés
15 d'introduction comprennent, sans limitation, les voies
intradermique, intramusculaire, intraperitoneale,
intraveineuse, sous-cutanée, intranasale et orale. Les
composés peuvent être administrés par toute voie
pratique, par exemple par perfusion ou injection de
20 bolus, par absorption à travers des muqueuses
epitheliales ou muco-cutanées (par exemple, la muqueuse
orale, la muqueuse rectale et intestinale, etc.) et ils
peuvent être administrés conjointement avec d'autres
agents biologiquement actifs. L'administration peut être
25 systémique ou locale. En plus, il peut être souhaitable
d'introduire les compositions pharmaceutiques de
l'invention dans le système nerveux central par toute
voie appropriée, y compris une injection
intraventriculaire et intrathécale ; l'injection
30 intraventriculaire peut être facilitée par un cathéter
intraventriculaire, par exemple, fixé à un réservoir, tel
qu'un réservoir Ommaya.
38
Dans un mode de réalisation spécifique, il peut être
souhaitable d'administrer les compositions
pharmaceutiques de l'invention localement sur la zone
nécessitant un traitement ; ceci peut être obtenu, par
5 exemple, et non à titre de limitation, par une perfusion
locale au cours d'une chirurgie, une application topique,
par exemple, conjointement avec un pansement après une
chirurgie, par une injection, au moyen d'un cathéter, au
moyen d'un suppositoire ou au moyen d'un implant, ledit
10 implant étant d'un matériau poreux, non poreux ou
gélatineux, y compris des membranes, telles que des
membranes silastiques, ou des fibres. Dans un mode de
réalisation, l'administration peut être réalisée par une
injection directe au niveau du site (ou d'un site
15 antérieur) d'une tumeur maligne ou d'un tissu néoplasique
ou pré-néoplasique.
Dans un mode de réalisation spécifique,
l'administration d'un produit thérapeutique dans une
cellule exprimant Notch est accomplie par la liaison du
20 produit thérapeutique à une protéine Delta (ou une autre
protéine toporythmique) ou à une partie de celle-ci
capable de médier la liaison à Notch. Le contact d'une
cellule exprimant Notch avec le produit thérapeutique lié
entraîne la liaison du produit thérapeutique lié par
25 l'intermédiaire de la partie Delta à Notch sur la surface
de la cellule, ceci suivi de l'absorption du produit
thérapeutique lié dans la cellule exprimant Notch.
Dans un mode de réalisation spécifique, dans lequel
un analogue d'un domaine de transduction des signaux
30 intracellulaires de Notch est employé en tant que produit
thérapeutique, tel qu'il peut inhiber la transduction des
signaux de Notch, l'analogue est de préférence délivré au
39
niveau intracellulaire (par exemple, par expression à
partir d'un vecteur d'acide nucléique, ou par liaison à
une protéine Delta capable de se lier à Notch, ceci suivi
d'une liaison et d'une internalisation, ou par des
5 mécanismes médiés par des récepteurs).
Dans un mode de réalisation spécifique où le produit
thérapeutique est un acide nucléique codant pour un
produit thérapeutique protéique, l'acide nucléique peut
être administré in vivo pour favoriser l'expression de sa
10 protéine codée, en le construisant comme une partie d'un
vecteur d'expression d'acide nucléique approprié et en
l'administrant de manière à ce qu'il se retrouve
intracellulaire, par exemple, par l'utilisation d'un
vecteur retroviral (voir le brevet US No. 4 980 286), ou
15 par une injection directe ou par l'utilisation d'un
bombardement de microparticules (par exemple, un canon à
gènes ; Biolistic, Dupont) ou un enrobage avec des
lipides ou des récepteurs de la surface cellulaire ou des
agents de transfection, ou par son administration en
20 liaison avec un peptide de type homéoboîte qui est connu
pour pénétrer dans le noyau (voir, par exemple, Joliot et
al., 1991, Proc. Natl. Acad. Sei. USA 88: 1864-1868),
etc. En variante, un produit thérapeutique à base d'acide
nucléique peut être introduit au niveau intracellulaire
25 et incorporé au sein de l'ADN des cellules de l'hôte, par
recombinaison homologue.
Dans des modes de réalisation spécifiques orientés
vers le traitement ou la prévention de troubles
particuliers, de préférence les formes d'administration
30 suivantes sont utilisées :
40
Trouble Formes d'administration
préférées
Cancer du col de l'utérus Topique
Cancer gastro-intestinal Orale ; intraveineuse
Cancer du poumon Inhalée ; intraveineuse
Leucémie Intraveineuse ;
extracorporelle
Carcinomes métastasiques Intraveineuse ; orale
Cancer du cerveau Ciblée ; intraveineuse ;
intrathécale
Cirrhose du foie Orale ; intraveineuse
Psoriasis Topique
Chéloïdes Topique
Calvitie Topique
Lésion de la moelle Ciblée ; intraveineuse ;
épinière intrathécale
Maladie de Parkinson Ciblée ; intraveineuse ;
intrathécale
Maladie des neurones Ciblée ; intraveineuse ;
moteurs intrathécale
Maladie d'Alzheimer Ciblée ; intraveineuse ;
intrathécale
10
La présente invention fournit également des
compositions pharmaceutiques. De telles compositions
comprennent une quantité thérapeutiquement efficace d'un
produit thérapeutique, et un support ou un excipient
pharmaceutiquement acceptable. Un tel support comprend,
sans limitation, une solution saline, une solution saline
tamponnée, le dextrose, l'eau, le glycerol, l'éthanol et
des combinaisons de ceux-ci. Le support et la composition
41
peuvent être stériles. La formulation devra être adaptée
au mode d'administration.
La composition, si c'est souhaité, peut également
contenir des quantités mineures d'agents de mouillage ou
5 émulsifiants, ou des agents tampons du pH. La composition
peut être une solution liquide, une suspension, une
emulsion, un comprimé, une pilule, une capsule, une
formulation à libération prolongée ou une poudre. La
composition peut être formulée sous la forme d'un
10 suppositoire, avec des liants et des supports
traditionnels tels que des triglycérides. Une formulation
orale peut comprendre des supports classiques tels que
des qualités pharmaceutiques de mannitol, de lactose,
d'amidon, de stéarate de magnésium, de saccharine sodique,
15 de cellulose, de carbonate de magnésium, etc.
Dans un mode de réalisation préféré, la composition
est formulée conformément à des procédures de routine
sous la forme d'une composition pharmaceutique adaptée
pour une administration intraveineuse à des êtres humains.
20 De manière générale, des compositions pour une
administration intraveineuse sont des solutions dans du
tampon aqueux isotonique stérile. Où c'est nécessaire, la
composition peut également comprendre un agent
solubilisant et un anesthésique local tel que la
25 lignocaïne pour soulager la douleur au niveau du site
d'injection. De manière générale, les composants sont
fournis soit séparément soit mélangés dans une forme
galénique unitaire, par exemple, sous la forme d'une
poudre lyophilisée sèche ou d'un concentré dépourvu d'eau
30 dans un récipient scellé hermétiquement tel qu'une
ampoule ou un sachet indiquant la quantité d'agent actif.
Où la composition doit être administrée par perfusion,
42
elle peut être dispensée avec une bouteille de perfusion
contenant de l'eau ou une solution saline de qualité
pharmaceutique, stérile. Où la composition est
administrée par injection, une ampoule d'eau stérile pour
5 injection peut être fournie de manière à pouvoir mélanger
les composants avant l'administration.
Les produits thérapeutiques de l'invention peuvent
être formulés sous des formes neutres ou de sels. Les
sels pharmaceutiquement acceptables comprennent ceux
10 formés avec des groupes amino libres tels que ceux
dérivés des acides chlorhydrique, phosphorique, acétique,
oxalique, tartrique, etc., et ceux formés avec des
groupes carboxy libres tels que ceux dérivés d'hydroxydes
de sodium, de potassium, d'ammonium, de calcium,
15 ferriques, de 1'isopropylamine, de la triéthylamine, du
2-éthylamino-éthanol, de l'histidine, de la procaine, etc.
La quantité du produit thérapeutique de l'invention
qui sera efficace dans le traitement d'un trouble ou
d'une condition particulier dépendra de la nature du
20 trouble ou de la condition, et elle peut être déterminée
par des techniques cliniques classiques. En outre, des
tests in vitro peuvent être éventuellement employés pour
aider à identifier des plages posologiques optimales. La
dose précise à employer dans la formulation dépendra
25 également de la voie d'administration, et de la gravité
de la maladie ou du trouble, et elle devra être décidée
selon le jugement du praticien et les circonstances de
chaque patient. Toutefois, les plages posologiques
appropriées pour une administration intraveineuse sont
30 généralement d'environ 20 à 500 microgrammes de composé
actif par kilogramme de poids corporel. Les plages
posologiques appropriées pour une administration
43
intranasale sont généralement d'environ 0,01 pg/kg de
poids corporel à 1 mg/kg de poids corporel. Les doses
efficaces peuvent être extrapolées de courbes dose-
réponse dérivées de systèmes de tests in vitro ou sur des
5 modèles animaux.
Les suppositoires contiennent généralement le
principe actif dans la plage de 0,5 % à 10 % en poids ;
les formulations orales contiennent 10 % à 95 % de
principe actif.
10 L'invention fournit également un conditionnement
pharmaceutique ou un kit comprenant un ou plusieurs
récipients remplis par un ou plusieurs des composants des
compositions pharmaceutiques de l'invention. Peut être
éventuellement associée à un tel/de tels récipient(s),
15 une notice sous la forme prescrite par une agence
gouvernementale régulant la fabrication, l'utilisation ou
la vente de produits pharmaceutiques ou de produits
biologiques, laquelle notice reflète l'approbation par
l'agence de la fabrication, de l'utilisation ou de la
20 vente pour une administration humaine.
5.5 REGULATION PAR DES ANTISENS DE L'EXPRESSION DE NOTCH
La présente invention fournit l'utilisation
thérapeutique ou prophylactique d'acides nucléiques d'au
25 moins six nucleotides qui sont antisens à un gène ou un
ADNc codant pour Notch ou une partie de celle-ci.
« Antisens » tel qu'utilisé dans ce document se rapporte
à un acide nucléique capable de s'hybrider à une partie
d'un ARN Notch (de préférence un ARNm) en vertu d'une
30 certaine complémentarité de séquence. De tels acides
nucléiques antisens ont une utilité en tant que produits
thérapeutiques antagonistes de l'invention et ils peuvent
44
être utilisés dans le traitement ou la prévention de
troubles tels que décrits ci-dessus dans la section 5.1
et ses sous-sections.
Les acides nucléiques antisens de l'invention
5 peuvent être des oligonucleotides qui sont de l'ARN ou de
l'ADN, double brin ou simple brin, ou une modification ou
un dérivé de ceux-ci, qui peuvent être administrés
directement à une cellule ou qui peuvent être produits au
niveau intracellulaire par la transcription de séquences
10 exogènes introduites.
Dans un mode de réalisation spécifique, les acides
nucléiques antisens Notch fournis par la présente
invention peuvent être utilisés pour le traitement de
tumeurs ou d'autres troubles, dont le type tumoral ou le
15 trouble des cellules peut être démontré (in vitro ou in
vivo) pour exprimer le gène Notch. Une telle
démonstration peut être réalisée par la détection d'ARN
Notch ou de la protéine Notch.
L'invention fournit en outre des compositions
20 pharmaceutiques comprenant une quantité efficace des
acides nucléiques antisens Notch de l'invention dans un
support pharmaceutiquement acceptable, tel que décrit
ci-dessus dans la section 5.4.
Dans un autre mode de réalisation, l'invention est
25 orientée vers l'utilisation d'un acide nucléique antisens
Notch pour la fabrication d'un médicament destiné à
inhiber l'expression d'une séquence d'acide nucléique
Notch dans une cellule procaryote ou eucaryote,
comprenant la fourniture à la cellule d'une quantité
30 efficace d'une composition comprenant un acide nucléique
antisens Notch de l'invention.
45
Dans un autre mode de réalisation, l'identification
de cellules exprimant des récepteurs fonctionnels de
Notch peut être réalisée en observant la capacité de
Notch à « sauvegarder » de telles cellules contre les
5 effets cytotoxiques d'un acide nucléique antisens Notch.
Les acides nucléiques antisens Notch et leurs
utilisations sont décrits en détail ci-dessous.
5.5.1. ACIDES NUCLEIQUES ANTISENS NOTCH
10 Les acides nucléiques antisens Notch sont d'au moins
six nucleotides et sont de préférence des
oligonucleotides (situés dans la plage de 6 à environ 50
oligonucleotides). Dans des aspects spécifiques,
1'oligonucleotide est d'au moins 10 nucleotides, au moins
15 15 nucleotides, au moins 100 nucleotides ou au moins 200
nucleotides. Les oligonucleotides peuvent être de l'ADN
ou de l'ARN ou des mélanges chimériques ou des dérivés ou
des versions modifiées de ceux-ci, simple brin ou double
brin. L'oligonucleotide peut être modifié au niveau du
20 radical de la base, du radical du sucre ou du squelette
phosphate. L'oligonucleotide peut comprendre d'autres
groupes attenants tels que des peptides ou des agents
facilitant le transport à travers la membrane cellulaire
(voir, par exemple, Letsinger et al., 1989, Proc. Natl.
25 Acad. Sei. U.S.A. 86: 6553-6556 ; Lemaitre et al., 1987,
Proc. Natl. Acad. Sei. 84: 648-652 ; publication PCT No.
WO 88/09810, publiée le 15 novembre 1988) ou la barrière
hémato-encéphalique (voir, par exemple, la demande PCT
No. WO 89/10134, publiée le 25 avril 1988), des agents de
30 clivages déclenchés par une hybridation (voir, par
exemple, Krol et al., 1988, BioTechniques 6: 958-976) ou
46
des agents s'intercalant (voir, par exemple, Zon, 1988,
Pharm. Res. 5: 539-549).
Dans un aspect préféré de l'invention, un
oligonucleotide antisens Notch est fourni, de préférence
5 d'ADN simple brin. Dans un aspect préféré entre tous, un
tel oligonucleotide comprend une séquence antisens à la
séquence codant pour 1'ELR 11 et 1'ELR 12 de Notch, de
manière préférée entre toutes, de Notch humaine.
L'oligonucleotide peut être modifié au niveau de
10 n'importe quelle position sur sa structure par des
substituants généralement connus dans l'art.
L'oligonucleotide antisens Notch peut comprendre au
moins un radical de base modifié qui est choisi dans le
groupe comprenant, sans limitation, le 5-fluorouracile,
15 le 5-bromouracile, le 5-iodouracile, 1'hypoxanthine, la
xanthine, la 4-acétylcytosine, le 5-(carboxyhydroxyl-
méthyl)uracile, la 5-carboxyméthylaminométhyl-2-thio-
uridine, le 5-carboxyméthylaminométhyluracile, le
dihydrouracile, la bêta-D-galactosylqueuosine, l'inosine,
20 la N6-isopentényladénine, la 1-méthylguanine, la
1-méthylinosine, la 2,2-diméthylguanine, la 2-méthyl-
adénine, la 2-méthylguanine, la 3-méthylcytosine, la
5-méthylcytosine, la N6-adénine, la 7-méthylguanine, la
5-méthylaminométhyluracile, le 5-méthoxyaminométhyl-2-
25 thiouracile, la bêta-D-mannosylqueuosine, le 5'-méthoxy-
carboxyméthyluracile, le 5-méthoxyuracile, la 2-méthyl-
thio-N6-isopentényladénine, l'acide uracil-5-oxyacétique
(v) , la wybutoxosine, le pseudouracile, la queuosine, la
2-thiocytosine, le 5-méthyl-2-thiouracile, le
30 2-thiouracile, le 4-thiouracile, le 5-méthyluracile,
l'ester méthylique de l'acide uracil-5-oxyacétique,
l'acide uracil-5-oxyacétique (v) , le 5-méthyl-2-
47
thiouracile, le 3-(3-amino-3-N-2-carboxypropyl)uracile,
(acp3)w et la 2,6-diaminopurine.
Dans un autre mode de réalisation, 1'oligonucleotide
comprend au moins un radical de sucre modifié choisi dans
5 le groupe comprenant, sans limitation, l'arabinose, le
2-fluoroarabinose, le xylulose et l'hexose.
Dans encore un autre mode de réalisation,
1'oligonucleotide comprend au moins un squelette
phosphate modifié choisi dans le groupe constitué d'un
10 phosphorothioate, d'un phosphorodithioate, d'un
phosphoramidothioate, d'un phosphoramidate, d'un
phosphorodiamidate, d'un méthylphosphonate, d'un
phosphotriester d'alkyle et d'un formacétal ou d'un
analogue de ceux-ci.
15 Dans encore un autre mode de réalisation,
1 ' oligonucleotide est un oligonucleotide a-anomérique. Un
oligonucleotide a-anomérique forme des hybrides double
brin avec l'ARN complémentaire dans lesquels, au
contraire des unités ß habituelles, les brins courent en
20 parallèle les uns aux autres (Gautier et al., 1987, Nucl.
Acids Res. 15: 6625-6641).
L'oligonucleotide peut être conjugué à une autre
molécule, par exemple, un peptide, un agent de
reticulation déclenché par une hybridation, un agent de
25 transport, un agent de clivage déclenché par une
hybridation, etc.
Les oligonucleotides de 1'invention peuvent être
synthétisés par des procédés classiques connus dans
l'art, par exemple, par l'utilisation d'un synthétiseur
30 automatisé d'ADN (tel que ceux disponibles chez
Biosearch, Applied Biosystems, etc.). Comme exemples, des
oligonucleotides à phosphorothioate peuvent être
48
synthétisés par le procédé de Stein et al. (1988, Nucl.
Acids Res. 16: 3209), des oligonucleotides à
méthylphosphonate peuvent être préparés par l'utilisation
de supports de polymères de verre à pores contrôlés
5 (Sarin et al., 1988, Proc. Natl. Acad. Sei. U.S.A.
85: 7448-7451), etc.
Dans un mode de réalisation spécifique,
1'oligonucleotide antisens Notch comprend de l'ARN
catalytique ou un ribozyme (voir, par exemple, la
10 publication internationale PCT WO 90/11364, publiée le 4
octobre 1990 ; Sarver et al., 1990, Science 247: 1222-
1225). Dans un autre mode de réalisation
1'oligonucleotide est un 2'-O-méthylribonucléotide (Inoue
et al., 1987, Nucl. Acids Res. 15: 6131-6148) ou un
15 analogue d'ARN-ADN chimérique (Inoue et al., 1987, FEBS
Lett. 215: 327-330) .
Dans une variante de mode de réalisation, l'acide
nucléique antisens Notch de l'invention est produit au
niveau intracellulaire par transcription à partir d'une
20 séquence exogène. Par exemple, un vecteur peut être
introduit in vivo de telle manière qu'il est absorbé par
une cellule, au sein de laquelle cellule le vecteur ou
une partie de celui-ci est transcrit, produisant un acide
nucléique (ARN) antisens de l'invention. Un tel vecteur
25 contiendra une séquence codant pour l'acide nucléique
antisens Notch. Un tel vecteur peut demeurer épisomique
ou se retrouver intégré au niveau chromosomique, tant
qu'il peut être transcrit pour produire l'ARN antisens
souhaité. De tels vecteurs peuvent être construits par
30 des procédés de la technologie de l'ADN recombinant,
classiques dans l'art. Les vecteurs peuvent être
plasmidiques, viraux ou d'autres connus dans l'art,
49
utilisés pour la replication et l'expression dans des
cellules mammaliennes. L'expression de la séquence codant
pour l'ARN antisens Notch peut être réalisée par tout
promoteur connu dans l'art pour agir dans des cellules
5 mammaliennes, de préférence humaines. De tels promoteurs
peuvent être inductibles ou constitutifs. De tels
promoteurs comprennent, sans limitation : la région
promoteur précoce du SV40 (Bernoist et Chambon, 1981,
Nature 290: 304-310), le promoteur contenu dans la longue
10 répétition terminale en 3 ' du virus du sarcome de Rous
(Yamamoto et al., 1980, Cell 22: 787-797), le promoteur
de la thymidine kinase de l'herpès (Wagner et al., 1981.
Proc. Natl. Acad. Sei. U.S.A. 78: 1441-1445), les
séquences régulatrices du gène de la métallothionéine
15 (Brinster et al., 1982, Nature 296: 39-42), etc.
Les acides nucléiques antisens de l'invention
comprennent une séquence complémentaire d'au moins une
partie d'un transcrit d'ARN d'un gène Notch, de
préférence un gène Notch humain. Toutefois, une
20 complémentarité absolue, bien que préférée, n'est pas
requise. Une séquence « complémentaire d'au moins une
partie d'un ARN », dont il est fait référence dans ce
document, signifie une séquence présentant une
complémentarité suffisante pour être capable de
25 s'hybrider avec l'ARN, en formant un duplex stable ; dans
le cas des acides nucléiques antisens Notch double brin,
un simple brin de l'ADN du duplex peut être ainsi testé,
ou la formation d'un triplex peut être testée. La
capacité à s'hybrider dépendra à la fois du degré de
30 complémentarité et de la longueur de l'acide nucléique
antisens. Généralement, plus l'acide nucléique qui
s'hybride est long, plus il pourra contenir de
50
mésappariements de bases avec un ARN Notch et encore
former un duplex stable (ou un triplex, comme cela peut
être le cas). Un homme du métier peut déterminer un degré
tolerable de mésappariement par l'utilisation de
5 procédures classiques pour déterminer le point de fusion
du complexe hybride.
5.5.2. UTILITE THERAPEUTIQUE DES ACIDES NUCLEIQUES
ANTISENS NOTCH
10 Les acides nucléiques antisens Notch peuvent être
utilisés pour traiter (ou prévenir) des malignités, dont
un type cellulaire a été montré comme exprimant l'ARN
Notch. Les cellules malignes, néoplasiques et
pré-néoplasiques qui peuvent être testées pour une telle
15 expression comprennent, sans limitation, celles décrites
ci-dessus dans les sections 5.1.1 et 5.2.1. Dans un mode
de réalisation préféré, un oligonucleotide antisens Notch
d'ADN simple brin est utilisé.
Des types cellulaires malins (particulièrement,
20 tumoraux) qui expriment l'ARN Notch peuvent être
identifiés par divers procédés connus dans l'art. De tels
procédés comprennent, sans limitation, l'hybridation avec
un acide nucléique spécifique de Notch (par exemple, par
hybridation Northern, hybridation dot blot, hybridation
25 in situ), en observant la capacité de l'ARN issu du type
cellulaire à être traduit in vitro en Notch, etc. Dans un
aspect préféré, le tissu tumoral primaire provenant d'un
patient peut être testé pour l'expression de Notch avant
le traitement.
30 Les compositions pharmaceutiques de l'invention
(voir la section 5.1.4), comprenant une quantité efficace
d'un acide nucléique antisens Notch dans un support
51
pharmaceutiquement acceptable, peuvent être administrées
à un patient souffrant d'une malignité qui est d'un type
qui exprime l'ARN Notch.
La quantité d'acide nucléique antisens Notch qui
5 sera efficace dans le traitement d'un trouble ou d'une
condition particulier dépendra de la nature du trouble ou
de la condition, et elle pourra être déterminée par des
techniques cliniques classiques. Où c'est possible, il
est souhaitable de déterminer la cytotoxicité des
10 antisens du type tumoral à traiter in vitro, et ensuite
dans des systèmes de modèles animaux utiles avant les
tests et l'utilisation chez des êtres humains.
Dans un mode de réalisation spécifique, les
compositions pharmaceutiques comprenant des acides
15 nucléiques antisens Notch peuvent être administrées par
l'intermédiaire de liposomes, de microparticules ou de
microcapsules. Dans divers modes de réalisation de
l'invention, il peut être utile d'utiliser de telles
compositions pour obtenir une libération prolongée des
20 acides nucléiques antisens Notch. Dans un mode de
réalisation spécifique, il peut être souhaitable
d'utiliser des liposomes cibles par l'intermédiaire
d'anticorps sur des antigènes tumoraux identifiables
spécifiques (Leonetti et al., 1990, Proc. Natl. Acad.
25 Sei. U.S.A. 87: 2448-2451 ; Renneisen et al., 1990, J.
Biol. Chem. 265: 16337-16342).
5.6 UTILITE DIAGNOSTIQUE
Les protéines Notch, des analogues, des dérivés et
30 des séquences de celles-ci, des acides nucléiques Notch
(et des séquences complémentaires de ceux-ci), des
anticorps anti-Notch ont des utilisations dans le
52
diagnostic. De telles molécules peuvent être utilisées
dans des tests, tels que des tests immunologiques, pour
détecter, pronostiquer, diagnostiquer ou contrôler
diverses conditions, diverses maladies et divers troubles
5 affectant l'expression de Notch, ou contrôler le
traitement de ceux-ci. En particulier, un tel test
immunologique est réalisé par un procédé comprenant la
mise en contact d'un échantillon dérivé d'un patient avec
un anticorps anti-Notch dans des conditions telles qu'une
10 liaison immunospécifique peut se produire et la détection
ou la mesure de la quantité de toute liaison
immunospécif ique par l'anticorps. Dans un mode de
réalisation spécifique, l'anticorps dirigé contre Notch
peut être utilisé pour rechercher dans un échantillon
15 tissulaire ou sérique de patient la présence de Notch où
un taux aberrant de Notch est une indication d'une
condition malade.
Les tests immunologiques qui peuvent être utilisés
comprennent, sans limitation, des systèmes de tests
20 compétitifs et non compétitifs en utilisant des
techniques telles que des Western blots, des tests radio-
immunologiques, des tests ELISA (enzyme linked
immunosorbent assays), des tests immunologiques de type
« sandwich », des tests d'immunoprécipitation, des
25 réactions de précipitine, des réactions de précipitine
avec diffusion dans un gel, des tests d'immunodiffusion,
des tests d'agglutination, des tests de fixation du
complément, des tests immunoradiométriques, des tests
immunofluorescents, des dosages immunologiques de la
30 protéine A, pour n'en nommer que quelques-uns.
Des gènes Notch et des séquences et des
sous-séquences d'acides nucléiques apparentées, y compris
53
des séquences complémentaires, et d'autres séquences de
gènes toporythmiques, peuvent être également utilisés
dans des tests d'hybridation. Des séquences d'acides
nucléiques Notch ou des sous-séquences de celles-ci
5 comprenant environ au moins 8 nucleotides, peuvent être
utilisées comme sondes d'hybridation. Des tests
d'hybridation peuvent être utilisés pour détecter,
pronostiquer, diagnostiquer ou contrôler des conditions,
des troubles ou des conditions pathologiques associés à
10 des changements aberrants de l'expression et/ou de
l'activité de Notch comme il a été décrit ci-dessus. En
particulier, un tel test d'hybridation est réalisé par un
procédé comprenant la mise en contact d'un échantillon
contenant un acide nucléique avec une sonde d'acide
15 nucléique capable de s'hybrider à l'ADN ou l'ARN Notch,
dans des conditions telles que l'hybridation peut se
produire, et la détection ou la mesure de toute
hybridation résultante.
Comme il est détaillé dans la section 10.1 des
20 exemples, ci-dessous, une augmentation de l'expression de
Notch se produit dans un cancer humain du sein, du côlon
et du col de l'utérus. En conséquence, dans des modes de
réalisation spécifiques, un cancer humain du sein, du
côlon ou du col de l'utérus ou des changements prémalins
25 dans de tels tissus est diagnostiqué en détectant une
augmentation de l'expression (ou de la quantité) de Notch
dans des échantillons de patients par rapport au taux
d'expression (ou de quantité) de Notch dans un
échantillon analogue non malin ou non prémalin, comme
30 cela peut être le cas, (provenant du patient ou d'une
autre personne, déterminé de manière expérimentale ou tel
54
que connu comme un taux classique dans de tels
échantillons).
Dans un mode de réalisation, la protéine Notch (ou
un dérivé possédant une antigénicité Notch) qui est
5 détectée ou mesurée, se trouve sur la surface cellulaire.
Dans un autre mode de réalisation, la protéine Notch (ou
un dérivé) est une molécule soluble acellulaire (par
exemple, mesurée dans un échantillon de sang ou de sérum)
ou elle est intracellulaire. Ne souhaitant pas être liés
10 de manière mécanistique, les demandeurs pensent que la
Notch acellulaire peut résulter de la sécrétion ou d'une
élimination depuis la surface cellulaire. Dans encore un
autre mode de réalisation, les quantités solubles, de la
surface cellulaire et intracellulaires de la protéine
15 Notch ou d'un dérivé sont détectées ou mesurées.
5.7. ACIDES NUCLEIQUES NOTCH
Les produits thérapeutiques de l'invention qui sont
des acides nucléiques Notch ou des acides nucléiques
20 antisens Notch, ainsi que des acides nucléiques codant
pour des produits thérapeutiques protéiques, comprennent
ceux décrits ci-dessus qui peuvent être obtenus par des
procédés connus dans l'art, et en particulier, tels que
décrits ci-dessous.
25 Dans des aspects particuliers, l'invention fournit
des séquences d'acides aminés de Notch, de préférence de
Notch humaine, et des fragments et des dérivés de
celle-ci qui comprennent un déterminant antigénique
(c'est-à-dire, qui peuvent être reconnues par un
30 anticorps) ou qui sont fonctionnellement actives, ainsi
que des séquences d'acides nucléiques codant pour les
précédentes. Un matériau « fonctionnellement actif » tel
55
qu'utilisé dans ce document se rapporte au matériau
présentant une ou plusieurs activités fonctionnelles
connues associées au produit de la protéine Notch (de
type sauvage) pleine longueur, par exemple, la liaison à
5 Delta, la liaison à Serrate, la liaison à tout autre
ligand de Notch, 1'antigénicité (liaison à un anticorps
anti-Notch), etc.
Dans des modes de réalisation spécifiques,
l'invention fournit des fragments d'une protéine Notch
10 constitués d'au moins 40 acides aminés, ou d'au moins 75
acides aminés. Dans d'autres modes de réalisation, les
protéines comprennent ou sont constituées essentiellement
du domaine intracellulaire, de la région transmembranaire,
du domaine extracellulaire, de la région cdclO, de
15 répétitions de Notch/lin-12 ou de répétitions homologues
à l'EGF, ou de toute combinaison des précédents, d'une
protéine Notch. Des fragments, ou des protéines
comprenant des fragments, manquant de certaines ou de la
totalité des répétitions homologues à l'EGF de Notch sont
20 également fournis. Des acides nucléiques codant pour les
précédents sont fournis.
Dans d'autres modes de réalisation spécifiques,
l'invention fournit des séquences et des sous-séquences
nucléotidiques de Notch, de préférence de Notch humain,
25 constituées d'au moins 25 nucleotides, au moins 50
nucleotides ou au moins 150 nucleotides. Des acides
nucléiques codant pour les protéines et les fragments de
protéines décrits ci-dessus sont fournis, ainsi que des
acides nucléiques complémentaires et capables de
30 s'hybrider à de tels acides nucléiques. Dans un mode de
réalisation, une telle séquence complémentaire peut être
complémentaire d'une séquence d'ADNc Notch d'au moins 25
56
nucleotides, ou d'au moins 100 nucleotides. Dans un
aspect préféré, l'invention utilise des séquences d'ADNc
codant pour la Notch humaine ou une partie de celle-ci.
Dans un mode de réalisation spécifique, de telles
5 séquences du gène ou d'ADNc Notch humain sont telles que
contenues dans les plasmides hN3k, hN4k ou hN5k (voir la
section 9, ci-dessous) ou dans le gène qui y correspond ;
une telle séquence de protéine Notch humaine peut être
telle que représentée sur les figures 10 (SEQ ID NO : 11)
10 ou 11 (SEQ ID NO : 13). Dans d'autres modes de
réalisation, l'acide nucléique Notch et/ou sa protéine
codée a au moins une partie de la séquence représentée
dans l'une des publications suivantes : Wharton et al.,
1985, Cell 43: 567-581 (Notch de Drosophila) ; Kidd et
15 al., 1986, Mol. Cell. Biol. 6: 3094-3108 (Notch de
Drosophila) ; Coffman et al., 1990, Science 249: 1438-
1441 (Notch de Xenopus) ; Ellisen et al., 1991, Cell
66: 649-661 (une Notch humaine). Dans un autre aspect,
les séquences de Notch humaine sont celles codant pour
20 les séquences d'acides aminés de Notch humaine ou d'une
partie de celle-ci comme il est représenté sur la figure
13. Dans un aspect particulier, les séquences de Notch
humaine sont celles de l'homologue hN (représenté en
partie par le plasmide hN5k) ou de l'homologue TAN-1.
25 Dans un mode de réalisation de l'invention,
l'invention est orientée vers la protéine Notch humaine
pleine longueur codée par l'homologue hN comme il est
représenté sur la figure 13, à la fois contenant la
séquence signal (c'est-à-dire, la protéine précurseur ;
30 acides aminés 1 à 2169) et manquant de la séquence signal
(c'est-à-dire, la protéine mature : acides aminés - 26 à
2169), ainsi que des parties des précédentes (par
57
exemple, le domaine extracellulaire, la région des
répétitions homologues à l'EGF, les répétitions de type
EGF 11 et 12, les répétitions de cdc-10/ankyrine, etc.)
et des protéines comprenant les précédentes, ainsi que
5 des acides nucléiques codant pour les précédentes.
Comme il est facilement évident, tel qu'utilisé dans
ce document, un « acide nucléique codant pour un fragment
ou une partie d'une protéine Notch » devra être
interprété comme se rapportant à un acide nucléique
10 codant uniquement pour le fragment ou la partie cité(e)
de la protéine Notch et pas pour d'autres parties de la
protéine Notch.
Dans un aspect préféré, mais non limitatif, de
l'invention, une séquence d'ADN Notch humain peut être
15 clonée et séquencée par le procédé décrit dans la section
9, ci-dessous.
Dans un autre aspect préféré, une PCR est utilisée
pour amplifier la séquence souhaitée dans la banque,
avant la sélection. Par exemple, des amorces
20 oligonucléotidiques représentant une partie des domaines
adhésifs codés par un homologue du gène souhaité peuvent
être utilisées en tant qu'amorces dans la PCR.
Les procédés ci-dessus ne sont pas censés limiter la
description générale suivante des procédés par lesquels
25 des clones de Notch peuvent être obtenus.
Toute cellule eucaryote peut servir potentiellement
de source d'acide nucléique pour le clonage moléculaire
du gène Notch. L'ADN peut être obtenu par des procédures
classiques connues dans l'art à partir de l'ADN clone
30 (par exemple, une « banque » d'ADN) , par synthèse
chimique, par clonage d'ADNc ou par le clonage d'ADN
génomique, ou des fragments de celui-ci, purifiés à
58
partir de la cellule humaine souhaitée (voir, par
exemple, Sambrook et al., 1989, Molecular Cloning, A
Laboratory Manual, Cold Spring Harbor Laboratory, 2d.
Ed., Cold Spring Harbor, New York ; Glover, D.M. (ed.),
5 1985, DNA Cloning: A Practical Approach. MRL Press, Ltd.,
Oxford, U.K. Vol. I, II.). Les clones dérivés de l'ADN
génomique peuvent contenir des régions d'ADN régulatrices
et introniques en plus des régions codantes ; les clones
dérivés d'ADNc contiendront uniquement des séquences
10 exoniques. Quelle que soit la source, le gène devra être
clone au niveau moléculaire dans un vecteur approprié
pour la propagation du gène.
Dans le clonage moléculaire du gène provenant de
l'ADN génomique, des fragments d'ADN sont générés, dont
15 certains coderont pour le gène souhaité. L'ADN peut être
clivé au niveau de sites spécifiques en utilisant
diverses enzymes de restriction. En variante, on peut
utiliser une ADNase en présence de manganèse pour
fragmenter l'ADN, ou l'ADN peut être cisaillé
20 physiquement, comme par exemple, par sonication. Les
fragments d'ADN linéaire peuvent être ensuite séparés
selon la taille par des techniques classiques, y compris,
sans limitation, une électrophorèse sur gel d'agarose et
de Polyacrylamide et une Chromatographie sur colonne.
25 Une fois que les fragments d'ADN sont générés,
l'identification du fragment d'ADN spécifique contenant
le gène souhaité peut être accomplie d'un certain nombre
de manières. Par exemple, si une quantité d'une partie
d'un gène Notch (d'une espèce quelconque) ou son ARN
30 spécifique, ou un fragment de celui-ci, par exemple, le
domaine adhésif, est disponible et peut être purifiée et
marquée, les fragments d'ADN générés peuvent être criblés
59
par une hybridation d'acide nucléique à la sonde marquée
(Benton, W. et Davis, R., 1977, Science 196, 180 ;
Grunstein, M. et Hogness, D., 1975, Proc. Natl. Acad.
Sei. U.S.A. 72, 3961). Ces fragments d'ADN présentant une
5 homologie substantielle avec la sonde s'hybrideront. Il
est également possible d'identifier le fragment approprié
par une/des digestion(s) avec des enzymes de restriction
et une comparaison des tailles des fragments avec celles
attendues selon une carte de restriction connue, si telle
10 est disponible. Une autre sélection peut être réalisée
sur la base des propriétés du gène. En variante, la
présence du gène peut être détectée par des tests basés
sur les propriétés physiques, chimiques ou immunologiques
de son produit exprimé. Par exemple, les clones d'ADNc,
15 ou les clones d'ADN qui s'hybrident à-sélectionnent les
ARNm corrects, peuvent être sélectionnés lorsqu'ils
produisent une protéine qui, par exemple, présente une
migration électrophorétique, un comportement
d'isofocalisation électrique, des cartes de digestion
20 protéolytique, une activité d'agrégation in vitro
(« adhésivité ») ou des propriétés antigéniques
similaires ou identiques à ce qui est connu pour Notch.
Si un anticorps dirigé contre Notch est disponible, la
protéine Notch peut être identifiée par la liaison de
25 l'anticorps marqué aux clones synthétisant
potentiellement Notch, dans une procédure de type ELISA
(enzyme-linked immunosorbent assay).
Le gène Notch peut être également identifié par une
sélection d'ARNm par une hybridation d'acide nucléique
30 suivie d'une traduction in vitro. Dans cette procédure,
des fragments sont utilisés pour isoler des ARNm
complémentaires par hybridation. De tels fragments d'ADN
60
peuvent représenter de l'ADN Notch purifié isolé d'une
autre espèce (par exemple, Drosophila). Une analyse par
immunoprécipitation ou des tests fonctionnels (par
exemple, la capacité d'agrégation in vitro ; voir les
5 exemples ci-dessous), des produits de traduction in vitro
des produits isolés des ARNm isolés identifient l'ARNm
et, par conséquent, les fragments d'ADN complémentaire
qui contiennent les séquences souhaitées. En outre, des
ARNm spécifiques peuvent être sélectionnés par adsorption
10 de polysomes isolés à partir de cellules sur des
anticorps immobilisés dirigés spécifiquement contre la
protéine Notch ou Delta. Un ADNc Notch radiomarqué peut
être synthétisé en utilisant l'ARNm sélectionné (à partir
des polysomes adsorbés) comme matrice. L'ARNm ou l'ADNc
15 radiomarqué peut être ensuite utilisé comme sonde pour
identifier les fragments d'ADN Notch parmi d'autres
fragments de l'ADN génomique.
Des variantes pour isoler l'ADN génomique Notch
comprennent, sans limitation, la synthèse chimique de la
20 séquence du gène elle-même à partir d'une séquence connue
ou la fabrication de l'ADNc par rapport à l'ARN qui code
pour le gène Notch. Par exemple, l'ARN pour le clonage de
l'ADNc du gène Notch peut être isolé à partir de cellules
qui expriment Notch. D'autres procédés sont possibles et
25 se situent au sein de l'étendue de l'invention.
Le gène identifié et isolé peut être ensuite inséré
dans un vecteur de clonage approprié. Un grand nombre de
systèmes vecteur-hôte connus dans l'art peuvent être
utilisés. Les vecteurs possibles comprennent, sans
30 limitation, des plasmides ou des virus modifiés, mais le
système du vecteur doit être compatible avec la cellule
hôte utilisée. De tels vecteurs comprennent, sans
61
limitation, des bacteriophages tels que des dérivés
lambda, ou des plasmides tels que des dérivés des
plasmides PBR322 ou pUC. L'insertion dans un vecteur de
clonage peut être accomplie, par exemple, par ligature du
5 fragment d'ADN dans un vecteur de clonage qui a des
extrémités cohésives complémentaires. Toutefois, si les
sites de restriction complémentaires utilisés pour
fragmenter l'ADN ne sont pas présents dans le vecteur de
clonage, les extrémités des molécules d'ADN peuvent être
10 modifiées de manière enzymatique. En variante, tout site
souhaité peut être produit par ligature de séquences
nucléotidiques (lieurs) sur les extrémités d'ADN : ces
lieurs ligaturés peuvent comprendre des oligonucleotides
synthétisés chimiquement spécifiques codant pour des
15 séquences de reconnaissance d'endonucléases de
restriction. Dans une variante de procédé, le vecteur
clivé et le gène Notch peuvent être modifiés par la
formation d'une queue homopolymère. Des molécules
recombinantes peuvent être introduites dans des cellules
20 hôtes par l'intermédiaire d'une transformation, d'une
transfection, d'une infection, d'une électroporation,
etc., si bien que de nombreuses copies de la séquence
génique sont générées.
Dans une variante de procédé, le gène souhaité peut
25 être identifié et isolé après insertion dans un vecteur
de clonage approprié dans une approche de « canon à
gènes ». Un enrichissement pour le gène souhaité, par
exemple, par fractionnement par taille, peut être réalisé
avant l'insertion dans le vecteur de clonage.
30 Dans des modes de réalisation spécifiques, la
transformation des cellules hôtes avec des molécules
d'ADN recombinant qui incorporent le gène, l'ADNc ou la
62
séquence d'ADN synthétisée Notch isolé permet la
génération de copies multiples du gène. Ainsi, le gène
peut être obtenu dans de grandes quantités en cultivant
des transformants, en isolant les molécules d'ADN
5 recombinant à partir des transformants et, lorsque c'est
nécessaire, en récupérant le gène inséré à partir de
l'ADN recombinant isolé.
Les séquences Notch fournies par la présente
invention comprennent les séquences nucléotidiques codant
10 pour pratiquement les mêmes séquences d'acides aminés
telles que trouvées dans la protéine Notch native et les
séquences d'acides aminés codées avec des acides aminés
fonctionnellement équivalents, telles que décrites dans
la section 5.6 ci-dessous pour les dérivés de Notch.
15
5.8. PRODUCTION RECOMBINANTE DE PRODUITS THERAPEUTIQUES
PROTEIQUES
L'acide nucléique codant pour un produit
thérapeutique protéique de l'invention peut être inséré
20 dans un vecteur d'expression approprié, c'est-à-dire, un
vecteur qui contient les éléments nécessaires pour la
transcription et la traduction de la séquence codante de
la protéine insérée. Les signaux transcriptionnels et
traductionnels nécessaires peuvent être également fournis
25 par le gène toporythmique natif et/ou ses régions
flanquantes. Toute une diversité de systèmes hôte-vecteur
peuvent être utilisés pour exprimer la séquence codante
de la protéine. Ceux-ci comprennent, sans limitation, des
systèmes de cellules mammaliennes infectées avec un virus
30 (par exemple, le virus de la vaccine, un adenovirus,
etc.) ; des systèmes de cellules d'insectes infectées
avec un virus (par exemple, un baculovirus) ; des
63
micro-organismes tels que des levures contenant des
vecteurs de levures ou des bactéries transformées avec un
bacteriophage, de l'ADN, de l'ADN plasmidique ou de l'ADN
cosmidique. Les éléments d'expression des vecteurs
5 varient dans leurs forces et leurs spécificités. Selon le
système hôte-vecteur utilisé, l'un quelconque de tout un
nombre d'éléments de transcription et de traduction
appropriés peut être utilisé. Dans un mode de réalisation
spécifique, la partie adhesive du gène Notch, par exemple,
10 celle codant pour des répétitions de type EGF (ELR) 11 et
12, est exprimée. Dans d'autres modes de réalisation
spécifiques, le gène Notch humain est exprimé, ou une
séquence codant pour une partie fonctionnellement active
de la Notch humaine.
15 L'un quelconque des procédés décrits précédemment
pour l'insertion de fragments d'ADN dans un vecteur peut
être utilisé pour construire des vecteurs d'expression
contenant un gène chimérique constitué de signaux de
contrôle de la transcription/traduction appropriés et de
20 séquences codantes des protéines. Ces procédés peuvent
comprendre de l'ADN recombinant in vitro et des
techniques de synthèse et des recombinants in vivo
(recombinaison génétique). L'expression d'une séquence
d'acide nucléique codant pour une protéine ou un fragment
25 peptidique Notch peut être régulée par une seconde
séquence d'acide nucléique si bien que la protéine ou le
peptide Notch est exprimé(e) dans un hôte transformé avec
la molécule d'ADN recombinant. Par exemple, l'expression
d'une protéine Notch peut être contrôlée par tout élément
30 promoteur/amplificateur connu dans l'art. Les promoteurs
pouvant être utilisés pour contrôler l'expression de
gènes toporythmiques comprennent, sans limitation, la
64
région promoteur précoce du SV40 (Bernoist et Chambon,
1981, Nature 290: 304-310), le promoteur contenu dans la
longue répétition terminale en 3 ' du virus du sarcome de
Rous (Yamamoto et al., 1980, Cell 22: 787-797), le
5 promoteur de la thymidine kinase de l'herpès (Wagner et
al., 1981. Proc. Natl. Acad. Sei. U.S.A. 78: 1441-1445),
les séquences régulatrices du gène de la métallothionéine
(Brinster et al., 1982, Nature 296: 39-42) ; des vecteurs
d'expression procaryotes tels que le promoteur de la
10 ß-lactamase (Villa-Kamaroff, et al., 1978, Proc. Natl.
Acad. Sei. U.S.A. 75, 3727-3731), ou le promoteur tac
(DeBoer, et al., 1983, Proc. Natl. Acad. Sei. U.S.A. 80,
21-25) ; voir également "Useful proteins from recombinant
bacteria" dans Scientific American, 1980, 242, 74-94 ;
15 des vecteurs d'expression végétaux comprenant la région
du promoteur de la nopaline synthetase (Herrera-Estrella
et al., Nature 303, 209-213) ou le promoteur de l'ARN 35S
du virus de la mosaïque du chou-fleur (Gardner, et al.,
1981, Nucl. Acids Res. 9, 2871), et le promoteur de
20 l'enzyme de la photosynthèse, la ribulose biphosphate
carboxylase (Herrera-Estrella et al., 1984, Nature 310,
115-120) ; des éléments promoteurs provenant de levures
ou d'autres champignons tels que le promoteur Gai 4, le
promoteur ADC (alcool déshydrogénase), le promoteur PGK
25 (phosphoglycérol kinase), le promoteur phosphatase
alcaline, et les régions de contrôle de la transcription
animales suivantes qui présentent une spécificité
tissulaire et qui ont été utilisées chez des animaux
transgéniques : la région de contrôle du gène de
30 l'élastase I qui est active dans les cellules acineuses
pancréatiques (Swift et al., 1984, Cell 38, 639-646 ;
Ornitz et al., 1986, Cold Spring Harbor Symp. Quant.
65
Biol. 50, 399-409 ; MacDonald, 1987, Hepatology 7, 425-
515) ; la région de controle du gène de 1'insuline qui
est active dans les cellules bêta pancréatiques (Hanahan,
1985, Nature 315, 115-122), la région de controle des
5 gènes des immunoglobulines qui est active dans les
cellules lymphoïdes (Grosschedl et al., 1984, Cell 38.
647-658 ; Adames et al., 1985, Nature 318, 533-538 ;
Alexander et al., 1987, Mol. Cell. Biol. 7, 1436-1444),
la région de controle du virus de la tumeur mammaire de
10 souris qui est active dans des cellules testiculaires,
mammaires, lymphoïdes et des mastocytes (Leder et al.,
1986, Cell 45, 485-495), la région de contrôle du gène de
l'albumine qui est active dans le foie (Pinkert et al.,
1987, Genes et Devel. 1, 268-276), la région de contrôle
15 du gène de 1 ' alpha-f?toprotéine qui est active dans le
foie (Krumlauf et al., 1985, Mol. Cell. Biol. 5, 1639-
1648 ; Hammer et al., 1987, Science 235, 53-58) ; la
région de contrôle du gène de 1'alpha-1-antitrypsine qui
est active dans le foie (Kelsey et al., 1987, Genes et
20 Devel. 1, 161-171), la région de contrôle du gène de la
bêta-globine qui est active dans les cellules myéloïdes
(Mogram et al., 1985, Nature 315, 338-340 ; Kollias et
al., 1986, Cell 46, 89-94) ; la région de contrôle du
gène de la protéine basique de la myéline qui est active
25 dans les cellules oligodendrocytaires dans le cerveau
(Readhead et al., 1987, Cell 48, 703-712) ; la région de
contrôle du gène de la chaîne légère 2 de la myosine qui
est active dans le muscle squelettique (Sani, 1985,
Nature 314, 283-286), et la région de contrôle du gène de
30 l'hormone de libération de la gonadotropine qui est
active dans l'hypothalamus (Mason et al., 1986, Science
234, 1372-1378).
66
Des vecteurs d'expression contenant des inserts du
gène Notch peuvent être identifiés par trois approches
générales : (a) l'hybridation d'acide nucléique, (b) la
présence ou l'absence de fonctions de gènes « marqueurs »
5 et (c) l'expression des séquences insérées. Dans la
première approche, la présence d'un gène étranger inséré
dans un vecteur d'expression peut être détectée par une
hybridation d'acide nucléique en utilisant des sondes
comprenant des séquences qui sont homologues à un gène
10 toporythmique inséré. Dans la deuxième approche, le
système recombinant hôte/vecteur peut être identifié et
sélectionné en se basant sur la présence ou l'absence de
certaines fonctions de gènes « marqueurs » (par exemple,
l'activité thymidine kinase, la résistance à des
15 antibiotiques, la transformation du phénotype, la
formation de corps d'inclusion dans un baculovirus, etc.)
provoquées par l'insertion de gènes étrangers dans le
vecteur. Par exemple, si le gène Notch est inséré au sein
de la séquence du gène marqueur du vecteur, des
20 recombinants contenant l'insert Notch peuvent être
identifiés par l'absence de la fonction du gène marqueur.
Dans la troisième approche, des vecteurs d'expression
recombinants peuvent être identifiés par l'analyse du
produit du gène étranger exprimé par le recombinant. De
25 tels tests peuvent être basés, par exemple, sur les
propriétés physiques ou fonctionnelles du produit du gène
Notch dans des systèmes de tests in vitro, par exemple,
la capacité d'agrégation (adhesive) (voir les sections 6
et 7, ci-dessous).
30 Une fois qu'une molécule particulière d'ADN
recombinant est identifiée et isolée, plusieurs procédés
connus dans l'art peuvent être utilisés pour la propager.
67
Une fois qu'un système hôte et des conditions de
croissance appropriés sont établis, des vecteurs
d'expression recombinants peuvent être propagés et
préparés en quantité. Comme il a été précédemment
5 expliqué, les vecteurs d'expression qui peuvent être
utilisés comprennent, sans limitation, les vecteurs
suivants ou leurs dérivés : des virus humains ou animaux
tels que le virus de la vaccine ou un adenovirus ; des
virus d'insectes tels qu'un baculovirus ; des vecteurs de
10 levures ; des vecteurs de bacteriophages (par exemple,
lambda) et des vecteurs d'ADN plasmidique et cosmidique,
pour n'en nommer que quelques-uns.
En outre, il est possible de choisir une souche de
cellule hôte qui module l'expression des séquences
15 insérées, ou qui modifie et traite le produit génique de
la façon souhaitée. L'expression de certains promoteurs
peut être élevée en présence de certains inducteurs ;
ainsi, l'expression de la protéine Notch génétiquement
modifiée peut être contrôlée. En outre, différentes
20 cellules hôtes ont des mécanismes caractéristiques et
spécifiques pour le traitement et la modification
traductionnel(le) et post-traductionnel(le) (par exemple,
glycosylation, clivage) des protéines. Des lignées
cellulaires ou des systèmes hôtes appropriés peuvent être
25 choisis pour garantir la modification et le traitement
souhaité(e) de la protéine étrangère exprimée. Par
exemple, une expression dans un système bactérien peut
être utilisée pour produire un produit de la protéine
core non glycosylé. Une expression dans des levures
30 produira un produit glycosylé. Une expression dans des
cellules mammaliennes peut être utilisée pour garantir
une glycosylation « native » d'une protéine toporythmique
68
mammalienne hétérologue. En outre, différents systèmes
d'expression vecteur/hôte peuvent affecter des réactions
de traitement telles que les clivages protéolytiques à
des degrés différents.
5 Dans d'autres modes de réalisation spécifiques, la
protéine Notch, un fragment, un analogue ou un dérivé
peut être exprimé sous la forme d'un produit de protéine
de fusion ou chimérique (comprenant la protéine, le
fragment, l'analogue ou le dérivé joint par
10 l'intermédiaire d'une liaison peptidique à une séquence
de protéine hétérologue (ou une protéine différente)). Un
tel produit chimérique peut être fabriqué en ligaturant
les séquences d'acides nucléiques appropriées codant pour
les séquences d'acides aminés souhaitées les unes aux
15 autres par des procédés connus dans l'art, dans le cadre
codant correct, et en exprimant le produit chimérique par
des procédés communément connus dans l'art. En variante,
un tel produit chimérique peut être fabriqué par des
techniques de synthèse des protéines, par exemple, par
20 l'utilisation d'un synthétiseur de peptides.
Les séquences à la fois d'ADNc et génomiques peuvent
être clonées et exprimées.
Dans d'autres modes de réalisation, une séquence
d'ADNc Notch peut être intégrée au niveau chromosomique
25 et exprimée. Des procédures de recombinaison homologue
connues dans l'art peuvent être utilisées.
5.8.1. IDENTIFICATION ET PURIFICATION DU PRODUIT GENIQUE
EXPRIME
30 Une fois qu'un recombinant qui exprime la séquence
du gène Notch est identifié, le produit génique peut être
analysé. Ceci peut être obtenu par des tests basés sur
69
les propriétés physiques ou fonctionnelles du produit,
comprenant un marquage radioactif du produit suivi d'une
analyse par électrophorèse sur gel.
Une fois que la protéine Notch est identifiée, elle
5 peut être isolée et purifiée par des procédés classiques
comprenant une Chromatographie (par exemple, une
Chromatographie par échange d'ions, d'affinité et
d'exclusion), une centrifugation, une solubilité
différentielle, ou par toute autre technique classique
10 pour la purification de protéines. Les propriétés
fonctionnelles peuvent être évaluées en utilisant tout
test approprié, y compris, sans limitation, des tests
d'agrégation (voir les sections 6 et 7).
15 5.9. DERIVES ET ANALOGUES DE NOTCH ET AUTRES PROTEINES
TOPORYTHMIQUES
L'invention fournit en outre, en tant que produits
thérapeutiques, des dérivés (y compris, sans limitation,
des fragments) et des analogues des protéines Notch.
20 La production et l'utilisation de dérivés et
d'analogues apparentés à Notch se situent au sein de
l'étendue de la présente invention. Dans un mode de
réalisation spécifique, le dérivé ou l'analogue est
fonctionnellement actif, c'est-à-dire, capable de
25 présenter une ou plusieurs activités fonctionnelles
associées à une protéine Notch de type sauvage pleine
longueur. Comme exemple, de tels dérivés ou analogues qui
possèdent 1'antigénicité souhaitée peuvent être utilisés,
par exemple, dans des tests immunologiques de diagnostic
30 tels que décrits dans la section 5.3. Des molécules qui
conservent ou en variante inhibent une propriété de Notch
souhaitée, par exemple, la liaison à Delta ou d'autres
70
protéines toporythmiques, la liaison à un ligand
intracellulaire, peuvent être utilisées thérapeutiquement
en tant qu'inducteurs ou inhibiteurs, respectivement,
d'une telle propriété et des corrélats physiologiques.
5 Les dérivés ou analogues de Notch peuvent être testés
pour l'activité souhaitée par des procédures connues dans
l'art, y compris, sans limitation, les tests décrits
ci-dessous. Dans un mode de réalisation spécifique, des
banques de peptides peuvent être criblées pour
10 sélectionner un peptide avec l'activité souhaitée ; un
tel criblage peut être réalisé par la recherche, par
exemple, de la liaison à Notch.
En particulier, des dérivés de Notch peuvent être
fabriqués en modifiant des séquences de Notch par des
15 substitutions, des additions ou des deletions qui
fournissent des molécules fonctionnellement équivalentes.
A cause de la dégénérescence des séquences nucléotidiques
codantes, d'autres séquences d'ADN qui codent pour
pratiquement la même séquence d'acides aminés qu'un gène
20 Notch peuvent être utilisées dans la pratique de la
présente invention. Celles-ci comprennent, sans
limitation, des séquences nucléotidiques comprenant la
totalité ou des parties de gènes Notch qui sont modifiés
par la substitution de différents codons qui codent pour
25 un résidu d'acide aminé fonctionnellement équivalent au
sein de la séquence, produisant ainsi un changement
silencieux. De la même manière, les dérivés Notch de
l'invention comprennent, sans limitation, ceux contenant,
en tant que séquence d'acides aminés primaire, la
30 totalité ou une partie de la séquence d'acides aminés
d'une protéine Notch y compris des séquences modifiées
dans lesquelles des résidus d'acides aminés
71
fonctionnellement équivalents sont substitués à des
résidus au sein de la séquence, entraînant un changement
silencieux. Par exemple, un ou plusieurs résidus d'acides
aminés au sein de la séquence peuvent être substitués par
5 un autre acide aminé d'une polarité similaire qui agit
comme un équivalent fonctionnel, entraînant une
modification silencieuse. Des substituts pour un acide
aminé au sein de la séquence peuvent être choisis parmi
d'autres membres de la classe à laquelle l'acide aminé
10 appartient. Par exemple, les acides aminés non polaires
(hydrophobes) comprennent 1'alanine, la leucine,
1'isoleucine, la valine, la proline, la phenylalanine, le
tryptophane et la methionine. Les acides aminés neutres
polaires comprennent la glycine, la serine, la threonine,
15 la cysteine, la tyrosine, 1'asparagine et la glutamine.
Les acides aminés chargés positivement (basiques)
comprennent l'arginine, la lysine et l'histidine. Les
acides aminés chargés négativement (acides) comprennent
l'acide aspartique et l'acide glutamique.
20 Les dérivés ou les analogues de Notch comprennent,
sans limitation, des peptides qui sont pratiquement
homologues à Notch ou à des fragments de celle-ci, ou
dont l'acide nucléique codant est capable de s'hybrider à
une séquence d'acide nucléique Notch.
25 Les dérivés et les analogues de Notch de l'invention
peuvent être produits par divers procédés connus dans
l'art. Les manipulations qui entraînent leur production
peuvent survenir au niveau du gène ou de la protéine. Par
exemple, la séquence du gène Notch clonée peut être
30 modifiée par l'une quelconque de nombreuses stratégies
connues dans l'art (Maniatis, T., 1989. Molecular
Cloning, A Laboratory Manual, 2d ed., Cold Spring Harbor
72
Laboratory, Cold Spring Harbor, New York). La séquence
peut être clivée au niveau de sites appropriés avec
une/des endonucléase (s) de restriction, ceci suivi d'une
autre modification enzymatique si c'est souhaité, isolée
5 et ligaturée in vitro. Dans la production du gène codant
pour un dérivé ou un analogue de Notch, il faut prendre
soin de s'assurer que le gène modifié demeure au sein du
même cadre de lecture de traduction que Notch,
ininterrompu par des signaux d'arrêt de la traduction,
10 dans la région du gène où l'activité Notch souhaitée est
codée.
En outre, la séquence d'acide nucléique codante de
Notch peut être mutée in vitro ou in vivo, pour créer
et/ou détruire des séquences de traduction, d'initiation
15 et/ou de terminaison, ou pour créer des variations dans
des régions codantes et/ou former de nouveaux sites
d'endonucléases de restriction ou en détruire des
pré-existants, pour faciliter une autre modification in
vitro. Toute technique pour une mutagenèse connue dans
20 l'art peut être utilisée, y compris, sans limitation, une
mutagenèse dirigée in vitro (Hutchinson, C, et al.,
1978, J. Biol. Chem 253: 6551), l'utilisation de lieurs
TAB® (Pharmacia), etc.
Des manipulations de la séquence Notch peuvent être
25 également réalisées au niveau de la protéine. Sont
compris au sein de l'étendue de l'invention, des
fragments de protéine Notch ou d'autres dérivés ou
analogues qui sont modifiés de manière différentielle
pendant ou après la traduction, par exemple, par
30 glycosylation, acétylation, phosphorylation, amidation,
dérivatisation par des groupes protecteurs/bloquants
connus, clivage protéolytique, liaison à une molécule
73
d'anticorps ou un autre ligand cellulaire, etc. L'une
quelconque de nombreuses modifications chimiques peut
être réalisée par des techniques connues, y compris, sans
limitation, un clivage chimique spécifique par du bromure
5 de cyanogène, de la trypsine, de la chymotrypsine, de la
papaïne, de la protease V8, du NaBH4 ; une acétylation,
une formylation, une oxydation, une réduction ; une
synthèse métabolique en présence de tunicamycine ; etc.
En outre, des analogues et des dérivés de Notch
10 peuvent être synthétisés chimiquement. Par exemple, un
peptide correspondant à une partie d'une protéine Notch
qui comprend le domaine souhaité ou qui médie l'activité
d'agrégation souhaitée in vitro, ou la liaison à un
récepteur, peut être synthétisé par l'utilisation d'un
15 synthétiseur de peptides. En outre, si c'est souhaité,
des acides aminés non classiques ou des analogues
chimiques d'acides aminés peuvent être introduits comme
substitution ou addition dans la séquence Notch. Les
acides aminés non classiques comprennent, sans limitation
20 les isomères D des acides aminés communs, l'acide
a-amino-isobutyrique, l'acide 4-aminobutyrique,
1'hydroxyproline, la sarcosine, la citrulline, l'acide
cystéique, la t-butylglycine, la t-butylalanine, la
phénylglycine, la cyclohexylalanine, la ß-alanine, des
25 acides aminés synthétisés sur mesure tels que des acides
ß-methyl-amines, des acides Ca-méthyl-aminés et des
acides Na-méthyl-aminés.
Dans un mode de réalisation spécifique, le dérivé de
Notch est une protéine chimérique ou de fusion comprenant
30 une protéine Notch ou un fragment de celle-ci fusionné(e)
par l'intermédiaire d'une liaison peptidique à son
extrémité amino- et/ou carboxy-terminale à une séquence
74
d'acides aminés non Notch. Dans un mode de réalisation,
une telle protéine chimérique est produite par une
expression recombinante d'un acide nucléique codant pour
la protéine (comprenant une séquence codante de Notch
5 jointe dans le cadre à une séquence codante de non
Notch). Un tel produit chimérique peut être fabriqué en
ligaturant les séquences d'acides nucléiques appropriées
codant pour les séquences d'acides aminés souhaitées les
unes avec les autres par des procédés connus dans l'art,
10 dans le cadre codant correct, et en exprimant le produit
chimérique par des procédés communément connus dans
l'art. En variante, un tel produit chimérique peut être
fabriqué par des techniques de synthèse de protéines, par
exemple, par l'utilisation d'un synthétiseur de peptides.
15 Dans un mode de réalisation spécifique, un acide
nucléique chimérique codant pour une protéine Notch
mature avec une séquence signal hétérologue est exprimé
de telle manière que la protéine chimérique est exprimée
et traitée par la cellule en protéine Notch mature. Comme
20 autre exemple, et non à titre de limitation, une molécule
recombinante peut être construite selon l'invention,
comprenant des parties codantes à la fois de Notch et
d'un autre gène toporythmique, par exemple, Delta. La
protéine codée d'une telle molécule recombinante pourra
25 présenter des propriétés associées à la fois à Notch et à
Delta et représenter un nouveau profil d'activités
biologiques, y compris des agonistes ainsi que des
antagonistes. La séquence primaire de Notch et Delta peut
être également utilisée pour prédire la structure
30 tertiaire des molécules en utilisant une simulation
informatique (Hopp et Woods, 1981, Proc. Natl. Acad. Sei.
U.S.A. 78: 3824-3828) ; des gènes recombinants
75
chimériques Notch/Delta pourront être conçus à la lumière
des corrélations entre la structure tertiaire et la
fonction biologique. De la même manière, des gènes
chimériques comprenant des parties de Notch fusionnées à
5 toute séquence codant pour une protéine hétérologue (non
Notch) peuvent être construits. Un mode de réalisation
spécifique concerne une protéine chimérique comprenant un
fragment de Notch d'au moins six acides aminés.
Dans un autre mode de réalisation spécifique, le
10 dérivé de Notch est un fragment de Notch comprenant une
région d'homologie avec une autre protéine toporythmique.
Comme il est utilisé dans ce document, une région d'une
première protéine devra être considérée comme
« homologue » à une seconde protéine lorsque la séquence
15 d'acides aminés de la région est identique à au moins
30 % ou est identique à au moins 75 % ou implique des
changements conservateurs, lors d'une comparaison à toute
séquence dans la seconde protéine d'un nombre égal
d'acides aminés comme le nombre contenu dans la région.
20
5.9.1. DERIVES DE NOTCH CONTENANT UN OU PLUSIEURS
DOMAINES DE LA PROTEINE
Dans un mode de réalisation spécifique, l'invention
fournit des produits thérapeutiques qui sont des dérivés
25 et des analogues de Notch, en particulier des fragments
de Notch et des dérivés de tels fragments, qui
comprennent un ou plusieurs domaines de la protéine Notch,
y compris, sans limitation, le domaine extracellulaire,
le domaine transmembranaire, le domaine intracellulaire,
30 la région associée à la membrane, une ou plusieurs des
répétitions de type EGF (ELR) de la protéine Notch, les
répétitions de cdclO, et les répétitions de Notch/lin-12.
76
Dans des modes de réalisation spécifiques, le dérivé de
Notch peut manquer de la totalité ou d'une partie des ELR,
d'une ou plusieurs autres régions de la protéine.
Dans un mode de réalisation spécifique, concernant
5 une protéine Notch d'une espèce autre que D. melanogaster,
de préférence humaine, des fragments comprenant des
parties spécifiques de Notch sont ceux comprenant des
parties dans la protéine Notch respective la plus
homologue aux fragments spécifiques de la protéine Notch
10 de Drosophila (par exemple, ELR 11 et ELR 12).
5.9.2. DERIVES DE NOTCH OU AUTRES PROTEINES
TOPORYTHMIQUES QUI MEDIENT LA LIAISON A DES DOMAINES DE
PROTEINES TOPORYTHMIQUES, ET INHIBITEURS DE CEUX-CI
15 L'invention fournit également des fragments de Notch,
et des analogues ou des dérivés de tels fragments, qui
médient la liaison à des protéines toporythmiques (et
sont ainsi nommés dans ce document « adhésifs ») et des
séquences d'acides nucléiques codant pour les précédents.
20 Sont également compris en tant que produits
thérapeutiques de l'invention, des inhibiteurs (par
exemple, des inhibiteurs peptidiques) des interactions
des protéines toporythmiques précédentes avec Notch.
La capacité à se lier à une protéine toporythmique
25 peut être démontrée par des tests d'agrégation in vitro
avec des cellules exprimant une protéine toporythmique
ainsi que des cellules exprimant Notch ou un dérivé de
Notch (voir la section 6). C'est-à-dire que la capacité
d'un fragment de protéine à se lier à une protéine Notch
30 peut être démontrée en détectant la capacité du fragment,
lorsqu'il est exprimé sur la surface d'une première
cellule, à se lier à une protéine Notch exprimée sur la
77
surface d'une seconde cellule. Les inhibiteurs des
interactions précédentes peuvent être détectés par leur
capacité à inhiber une telle agrégation in vitro.
Des séquences d'acides nucléiques codant pour des
5 protéines toporythmiques ou des domaines adhésifs de
celles-ci peuvent être isolées de sources humaine,
porcine, bovine, féline, aviaire, équine, canine ou
d'insectes ainsi que de primates et de toute autre espèce
dans laquelle des homologues de gènes toporythmiques
10 connus peuvent être identifiés.
Dans un mode de réalisation spécifique, le fragment
adhésif de Notch est celui comprenant la partie de Notch
la plus homologue à 1 ' ELR 11 et 12, c'est-à-dire, les
acides aminés numéros 447 à 527 (SEQ ID NO : 14) de la
15 séquence Notch de Drosophila (voir la figure 4).
A cause de la dégénérescence des séquences
nucléotidiques codantes, d'autres séquences d'ADN qui
codent pour pratiquement la même séquence d'acides aminés
que les séquences adhésives peuvent être utilisées dans
20 la pratique de la présente invention. Celles-ci
comprennent, sans limitation, des séquences
nucléotidiques comprenant la totalité ou des parties du
gène Notch qui sont modifiées par la substitution de
différents codons qui codent pour un résidu d'acide aminé
25 fonctionnellement équivalent au sein de la séquence,
produisant ainsi un changement silencieux. De la même
manière, les fragments protéiques adhésifs ou des dérivés
de ceux-ci, de l'invention comprennent, sans limitation,
ceux contenant, comme séquence d'acides aminés primaire,
30 la totalité ou une partie de la séquence d'acides aminés
des domaines adhésifs comprenant des séquences modifiées
dans lesquelles des résidus d'acides aminés
78
fonctionnellement équivalents sont substitués à des
résidus au sein de la séquence entraînant un changement
silencieux.
Les fragments adhésifs de protéines toporythmiques
5 et des dérivés, des analogues potentiels ou des peptides
apparentés à des séquences de protéines toporythmiques
adhésives, peuvent être testés pour l'activité de liaison
souhaitée, par exemple, par les tests d'agrégation in
vitro décrits dans les exemples dans ce document. Les
10 dérivés adhésifs ou les analogues adhésifs de fragments
adhésifs de protéines toporythmiques comprennent, sans
limitation, des peptides qui sont pratiquement homologues
aux fragments adhésifs, ou dont l'acide nucléique codant
est capable de s'hybrider à la séquence d'acide nucléique
15 codant pour les fragments adhésifs, et lesquels peptides
et analogues peptidiques possèdent une activité de
liaison positive, par exemple, testée in vitro par un
test d'agrégation tel que décrit dans les sections des
exemples ci-dessous. De tels dérivés et analogues sont
20 envisagés en tant que produits thérapeutiques et se
situent au sein de l'étendue de la présente invention.
Les dérivés, les analogues et les peptides
apparentés à des protéines adhésives de l'invention
peuvent être produits par divers procédés connus dans
25 l'art. Les manipulations qui entraînent leur production
peuvent survenir au niveau du gène ou de la protéine
(voir la section 5.6).
En outre, la séquence d'acide nucléique codant pour
la protéine adhesive peut être mutée in vitro ou in vivo ;
30 et les manipulations de la séquence adhesive peuvent être
également réalisées au niveau de la protéine (section
5.6) .
79
En outre, des analogues et des peptides apparentés
aux fragments adhésifs peuvent être synthétisés
chimiquement.
5 5.10. DOSAGES DES PROTEINES NOTCH, DES DERIVES ET DES
ANALOGUES
L'activité in vitro des protéines Notch, des dérivés
et des analogues et d'autres protéines toporythmiques qui
se lient à Notch, peut être analysée par divers procédés.
10 Par exemple, dans un mode de réalisation, où l'on
analyse la capacité à se lier ou à entrer en compétition
avec Notch de type sauvage pour la liaison à un anticorps
anti-Notch, divers tests immunologiques connus dans l'art
peuvent être utilisés, y compris, sans limitation, des
15 systèmes de tests compétitifs et non compétitifs
utilisant des techniques telles que des tests radio-
immunologiques, des tests ELISA (enzyme linked
immunosorbent assays), des tests immunologiques de type
« sandwich », des tests immuno-radiométriques, des
20 réactions de précipitine avec diffusion dans un gel, des
tests d'immunodiffusion, des tests immunologiques in situ
(en utilisant de l'or colloïdal, des marqueurs
enzymatiques ou radio-isotopiques, par exemple), des
Western blots, des réactions de précipitation, des tests
25 d'agglutination (par exemples, des tests d'agglutination
sur gel, des tests d'hemagglutination) , des tests de
fixation du complément, des tests d'immunofluorescence,
des dosages de la protéine A, et des tests immuno-
électrophorétiques, etc. Dans un mode de réalisation, la
30 liaison de l'anticorps est détectée en détectant un
marqueur sur l'anticorps primaire. Dans un autre mode de
réalisation, l'anticorps primaire est détecté en
80
détectant la liaison d'un anticorps secondaire ou d'un
réactif dirigé contre l'anticorps primaire. Dans un autre
mode de réalisation, l'anticorps secondaire est marqué.
De nombreux moyens sont connus dans l'art pour détecter
5 la liaison dans un test immunologique et ils se situent
au sein de l'étendue de la présente invention.
Dans un autre mode de réalisation où l'on analyse la
capacité à médier la liaison à Notch, on peut réaliser un
test d'agrégation in vitro tel que décrit ci-dessous dans
10 la section 6 ou 7 (voir également Fehon et al., 1990,
Cell 61: 523-534 ; Rebay et al., 1991, Cell 67: 687-699).
Dans un autre mode de réalisation, où un autre
ligand pour Notch est identifié, la liaison du ligand
peut être analysée, par exemple, par des tests de liaison
15 bien connus dans l'art. Dans un autre mode de
réalisation, les corrélats physiologiques de la liaison
du ligand à des cellules exprimant un récepteur de Notch
(transduction des signaux) peuvent être analysés.
Dans un autre mode de réalisation, dans des systèmes
20 d'insectes ou d'autres modèles, des études génétiques
peuvent être réalisées pour étudier l'effet phénotypique
d'un mutant de Notch qui est un dérivé ou un analogue de
Notch de type sauvage.
D'autres procédés seront connus de l'homme du métier
25 et se situent au sein de l'étendue de l'invention.
5.11. ANTICORPS DIRIGES CONTRE DES PROTEINES NOTCH, DES
DERIVES ET DES ANALOGUES
Selon un mode de réalisation de l'invention, des
30 anticorps et des fragments contenant le domaine de
liaison de ceux-ci, dirigés contre Notch sont des
produits thérapeutiques. En conséquence, des protéines
Notch, des fragments ou des analogues ou des dérivés de
celles-ci, en particulier des protéines Notch humaines ou
des fragments de celles-ci, peuvent être utilisés comme
des immunogènes pour générer des anticorps anti-protéine
5 Notch. De tels anticorps peuvent être polyclonaux,
monoclonaux, chimériques, simple chaîne, des fragments
Fab, ou provenir d'une banque d'expression de Fab. Dans
un mode de réalisation spécifique, des anticorps
spécifiques des répétitions de type EGF 11 et 12 de Notch
10 peuvent être préparés. Dans d'autres modes de
réalisation, des anticorps réactifs avec le domaine
extracellulaire de Notch peuvent être générés. Un exemple
de tels anticorps peut prévenir l'agrégation dans un test
in vitro. Dans un autre mode de réalisation, des
15 anticorps spécifiques de la Notch humaine sont produits.
Diverses procédures connues dans l'art peuvent être
utilisées pour la production d'anticorps polyclonaux
dirigés contre une protéine ou un peptide Notch. Dans un
mode de réalisation particulier, des anticorps
20 polyclonaux de lapin dirigés contre un epitope de la
protéine Notch humaine codée par une séquence illustrée
sur la figure 10 ou 11, ou une sous-séquence de celle-ci,
peuvent être obtenus. Pour la production d'anticorps,
divers animaux hôtes peuvent être immunisés par injection
25 avec la protéine Notch native, ou une version
synthétique, ou un fragment de celle-ci, y compris, sans
limitation, des lapins, des souris, des rats, etc. Divers
adjuvants peuvent être utilisés pour augmenter la réponse
immunologique, selon l'espèce de l'hôte, et comprenant,
30 sans limitation, l'adjuvant (complet ou incomplet) de
Freund, des gels minéraux tels que l'hydroxyde
d'aluminium, des substances tensio-actives telles que la
82
lysolécithine, des polyols pluronic, des polyanions, des
peptides, des emulsions huileuses, des hémocyanines de
patelle, le dinitrophénol et des adjuvants humains
potentiellement utiles tels que le BCG (bacille Calmette-
5 Guérin) et Corynebacterium parvum.
Pour la préparation d'anticorps monoclonaux dirigés
contre une séquence de protéine Notch, toute technique
qui fournit la production de molécules d'anticorps par
des lignées cellulaires continues en culture peut être
10 utilisée. Par exemple, la technique des hybridomes
développée à l'origine par Kohler et Milstein (1975,
Nature 256, 495-497), ainsi que la technique des triomes,
la technique des hybridomes à cellules B humaines (Kozbor
et al., 1983, Immunology Today 4. 72), et la technique
15 des hybridomes avec 1'EBV pour produire des anticorps
monoclonaux humains (Cole et al., 1985, dans Monoclonal
Antibodies et Cancer Therapy, Alan R. Liss, Inc., pp. 77-
96) .
Des fragments d'anticorps qui contiennent 1'idiotype
20 (domaine de liaison) de la molécule peuvent être générés
par des techniques connues. Par exemple, de tels
fragments comprennent, sans limitation : le fragment
F (ab') 2 qui peut être produit par une digestion avec de
la pepsine de la molécule d'anticorps ; les fragments
25 Fab' qui peuvent être générés par réduction des ponts
disulfure du fragment F(ab')2 et les fragments Fab qui
peuvent être générés par traitement de la molécule
d'anticorps avec de la papaïne et un agent réducteur.
Dans la production d'anticorps, le criblage à la
30 recherche de l'anticorps souhaité peut être accompli par
des techniques connues dans l'art, par exemple, un test
ELISA (enzyme-linked immunosorbent assay). Par exemple,
83
pour sélectionner des anticorps qui reconnaissent le
domaine adhésif d'une protéine Notch, on peut analyser
les hybridomes générés pour un produit qui se lie à un
fragment de la protéine contenant un tel domaine. Pour la
5 sélection d'un anticorps spécifique de la Notch humaine,
on peut sélectionner sur la base d'une liaison positive à
la Notch humaine et d'un manque de liaison à la Notch de
Drosophila.
En plus de l'utilité thérapeutique, les anticorps
10 précédents ont une utilité dans des tests immunologiques
de diagnostic tels que décrits dans la section 5.6
ci-dessus.
Des procédures similaires à celles décrites
ci-dessus peuvent être utilisées pour fabriquer des
15 produits thérapeutiques qui sont des anticorps dirigés
contre les domaines d'autres protéines (particulièrement
des protéines toporythmiques) qui se lient ou sinon
interagissent avec Notch (par exemple, les fragments
adhésifs de Delta ou Serrate).
20
LES DOMAINES DE NOTCH MEDIENT LA LIAISON AVEC DELTA
Une association intermoléculaire entre les produits
des gènes Notch et Delta a été détectée en étudiant les
effets de leur expression sur l'agrégation dans des
25 cellules de Schneider 2 (S2) de Drosophila (Fehon et al.,
1990. Cell 61, 523-534). Une preuve directe des
interactions intermoléculaires entre Notch et Delta est
décrite dans ce document, ainsi qu'un système de test qui
peut être utilisé dans la dissection des composants de
30 cette interaction. Des cellules S2 de Drosophila
cultivées normalement non adhésives qui expriment Notch
se lient spécifiquement d'une manière dépendante du
84
calcium à des cellules qui expriment Delta. En outre,
alors que des cellules qui expriment Notch ne se lient
pas les unes aux autres, les cellules qui expriment Delta
se lient les unes aux autres, suggérant que Notch et
5 Delta peuvent entrer en compétition pour la liaison à
Delta à la surface cellulaire. Notch et Delta forment des
complexes solubles avec des détergents à la fois dans des
cellules cultivées et des cellules embryonnaires,
suggérant que Notch et Delta interagissent directement au
10 niveau moléculaire in vitro et in vivo. Les analyses
suggèrent que les protéines Notch et Delta interagissent
à la surface cellulaire par l'intermédiaire de leurs
domaines extracellulaires.
15 6.1. PROCEDURES EXPERIMENTALES
6.1.1. PRODUITS DE CONSTRUCTION D'EXPRESSION
Des produits de construction d'expression sont
décrits dans Fehon et al., 1990, Cell 61: 523-534. En
20 bref, Notch codée par le minigène Mglla, un produit de
construction chimérique d'ADNc/génomique (Ramos et al.,
1989, Genetics 123, 337-348) a été exprimée après
l'insertion dans pRmHa-3 (Bunch, et al., 1988, Nucl.
Acids Res. 16, 1043-1061). Dans le produit de
25 construction résultant, nommé pMtNMg, le promoteur de la
métallothionéine dans pRmHa-3 est fusionné à des
séquences de Notch démarrant 20 nucleotides en amont du
site de départ de la traduction.
Le produit de construction Notch extracellulaire
30 (ECN1) a été dérivé d'un cosmide Notch (Ramos et al.,
1989, Genetics 123, 337-348), et a une deletion interne
des séquences codantes de Notch des acides aminés 1790 à
10
2625 compris (Wharton et al., 1985, Cell 43, 567-581), et
un décalage de cadre prédit qui produit une nouvelle
extrémité carboxyle de 59 acides aminés.
Pour le produit de construction d'expression de
Delta, l'ADNc de DU (Kopczynski et al., 1988, Genes Dev.
2, 1723-1735 ; figure 1 ; SEQ ID NO : 1), qui comprend la
capacité codante complète pour Delta, a été inséré dans
le site EcoRI de pRmHa-3. Ce produit de construction a
été appelé pMTDll.
6.1.2. PREPARATION D'ANTICORPS
La lignée cellulaire d'hybridome C17.9C6 a été
obtenue à partir d'une souris immunisée avec une protéine
de fusion basée sur un fragment SalI-HindIII de 2,1 kb
15 qui comprend des séquences codantes pour la plus grande
partie du domaine intracellulaire de Notch (acides aminés
1791 à 2504 ; Wharton et al., 1985, Cell 43, 567-581). Le
fragment a été sous-cloné dans pUR289 (Ruther et Muller-
Hill, 1983, EMBO J. 2, 1791-1794), et ensuite transféré
20 dans le vecteur d'expression pATH 1 (Dieckmann et
Tzagoloff, 1985, J. Biol. Chem. 260, 1513-1520) sous la
forme d'un fragment BglII-HindIII. Une protéine de fusion
soluble a été exprimée, précipitée par du (NH4)2S04 à
25 %, remise en suspension dans 6 M d'urée et purifiée
25 par isofocalisation électrique preparative en utilisant
un Rotofor (Bio-Rad) (pour des détails, voir Fehon, 1989,
Rotofor Review No. 7, Bulletin 1518, Richmond.
California: Bio-Rad Laboratories).
Des antiserums polyclonaux de souris ont été
30 produits contre le domaine extracellulaire de Notch en
utilisant quatre fragments BstYI de 0,8 kb (acides aminés
237 à 501 ; Wharton et al., 1985, Cell 43, 567-581),
86
1,1 kb (acides aminés 501 à 868), 0,99 kb (acides aminés
868 à 1200) et 1,4 kb (acides aminés 1465 à 1935) en
longueur, qui couvraient de la cinquième répétition de
type EGF à travers le domaine transmembranaire, insérés
5 de manière unique dans le cadre dans le vecteur
d'expression pGEX approprié (Smith et Johnson, 1988, Gene
67, 31-40). Les protéines de fusion ont été purifiées sur
des billes de glutathion-agarose (SIGMA). Des antiserums
de souris et de rats ont été précipités avec du (NH4)2S04
10 à 50 % et remis en suspension dans du PBS (160 mM de
NaCl, 14 mM de Na2HP04, 6 mM de NaH2P04) avec 0,02 % de
NaN3.
La lignée cellulaire d'hybridome 201 a été obtenue à
partir d'une souris immunisée avec une protéine de fusion
15 qui comprend des séquences codantes provenant du domaine
extracellulaire de Delta (Kopczynski et al., 1988, Genes
Dev. 2, 1723-1735) comprenant des séquences s'étendant de
la quatrième à la neuvième répétition de type EGF dans
Delta (acides aminés 350 à 529) .
20 Des antiserums polyclonaux de rats ont été obtenus
après une immunisation avec un antigène dérivé du même
produit de construction de protéine de fusion. Dans ce
cas, la protéine de fusion a été préparée par lyse de
cellules induites par de l'IPTG dans du tampon de SDS-
25 Laemmli (Carroll et Laughon, 1987, dans DNA Cloning,
Volume III, D.M. Glover, ed. (Oxford: IRL Press), pp. 89-
111), séparation des protéines par SDS-PAGE, excision de
la bande appropriée à partir du gel et électro-élution de
l'antigène à partir de la tranche de gel pour une
30 utilisation dans une immunisation (Harlow et Lane. 1988,
Antibodies: A Laboratory Manual (Cold Spring Harbor,
New York: Cold Spring Harbor Laboratory)).
87
6.1.3. CULTURE CELLULAIRE ET TRANSFECTION
La lignée cellulaire S2 (Schneider, 1972, J.
Embryol. Exp. Morph. 27, 353-365) a été cultivée dans du
5 milieu M3 (préparé par Hazleton Co.) complémenté avec
2,5 mg/ml de Bacto-Peptone (Difco), 1 mg/ml de TC
Yeastolate (Difco) , 11 % de sérum de veau f?tal (FCS)
inactivé à la chaleur (Hyclone) et 100 U/ml de
pénicilline-100 ug/ml de streptomycine-0,25 ug/ml de
10 fungizone (Hazleton). Les cellules se développant en
phase logarithmique à ~ 2 x 106 cellules/ml ont été
transfectées avec 20 ug de coprécipité d'ADN-phosphate de
calcium dans 1 ml pour 5 ml de culture telle que décrite
précédemment (Wigler et al., 1979, Proc. Natl. Acad. Sei.
15 USA 78, 1373-1376), sauf que du tampon BES (SIGMA) a été
utilisé à la place du tampon HEPES (Chen et Okayama,
1987, Mol. Cell. Biol. 7, 2745-2752). Après 16 à 18 h,
les cellules ont été transférées dans des tubes coniques
de centrifugeuse, transformées en culot dans une
20 centrifugeuse clinique à pleine vitesse pendant 30
secondes, rincées une fois avec 1/4 de volume de milieu
complet frais, remises en suspension dans leur volume
d'origine de milieu complet et retournées dans le ballon
d'origine. Les cellules transfectées ont été ensuite
25 laissées récupérer pendant 24 h avant l'induction.
6.1.4. TESTS D'AGREGATION
L'expression des produits de construction de la
métallothionéine de Notch et Delta a été induite par
30 l'addition de CuS04 jusqu'à 0,7 mM. Les cellules
transfectées avec le produit de construction ECNl ont été
traitées de manière similaire. Les cellules ont été
ensuite mélangées, incubées dans des conditions
d'agrégation et cotées pour leur capacité à s'agréger en
utilisant des antiserums spécifiques et une microscopie à
immunofluorescence pour visualiser les cellules
5 d'expression.
Deux types de tests d'agrégation ont été utilisés.
Dans le premier test, un total de 3 ml de cellules (5 à
10 x 106 cellules/ml) a été placé dans un ballon
d'Erlenmeyer de 25 ml et mis à tourner à 40 à 50 tr/min
10 sur un agitateur rotatif pendant 24 à 48 h à température
ambiante. Pour ces expériences, les cellules ont été
mélangées 1 à 4 h après le début de l'induction et
l'induction a été poursuivie tout le long de la période
d'agrégation. Dans le second test, ~ 0,6 ml des cellules
15 a été placé dans un tube Eppendorf de 0,6 ml (en laissant
une petite bulle) après une induction pendant une nuit
(12 à 16 h) à température ambiante et secoué doucement
pendant 1 à 2 h à 4°C. Les expériences d'inhibition des
anticorps et de dépendance au Ca2+ ont été réalisées en
20 utilisant le dernier test. Pour les expériences de
dépendance au Ca2+, les cellules ont été d'abord
recueillies et rincées dans de la solution saline
équilibrée (BSS) avec 11 % de FCS (BSS-FCS ; le FCS a été
dialyse contre 0,9 % de NaCl, 5 mM de Tris [pH 7,5]) ou
25 dans du BSS-FCS dépourvu de Ca2+ contenant 10 mM d ' EGTA
(Snow et al., 1989, Cell 59, 313-323) et ensuite remises
en suspension dans le même milieu au volume d'origine.
Pour les expériences d'inhibition des anticorps, les
cellules transfectées avec Notch ont été recueillies et
30 rincées dans du milieu M3 et ensuite traitées avant
l'agrégation dans du milieu M3 pendant 1 h à 4°C avec une
dilution au 1/250 des sérums immuns ou pré-immuns
89
provenant de chacune des quatre souris immunisées avec
les protéines de fusion contenant des segments provenant
du domaine extracellulaire de Notch (voir la préparation
des anticorps ci-dessus).
5
6.1.5. IMMUNOFLUORESCENCE
Les cellules ont été recueillies par centrifugation
(3000 tr/min pendant 20 secondes dans une
microcentrifugeuse Eppendorf) et fixées dans des tubes
10 Eppendorf de 0,6 ml avec 0,5 ml de paraformaldehyde à 2 %
fraîchement préparé dans du PBS pendant 10 min à
température ambiante. Après fixation, les cellules ont
été recueillies par centrifugation, rincées deux fois
dans du PBS et colorées pendant 1 h dans l'anticorps
15 primaire dans du PBS avec 0,1 % de saponine (SIGMA) et
1 % de sérum de chèvre normal (Pocono Rabbit Farm,
Canadensis, PA) . Les surnageants des anticorps
monoclonaux ont été dilués au 1/10 et les sérums de
souris ou de rats ont été dilués au 1/1000 pour cette
20 étape. Les cellules ont été ensuite rincées une fois dans
du PBS et colorées pendant 1 h dans des anticorps
secondaires spécifiques (anticorps de chèvre anti-souris
et anticorps de chèvre anti-rat de qualité double
marquage, Jackson Immunoresearch) dans du PBS-saponine-
25 sérum de chèvre normal. Après cette incubation, les
cellules ont été rincées deux fois dans du PBS et montées
sur des lames dans du glycerol à 90 %, 10 % de Tris 1 M
(pH 8,0) et 0,5 % de gallate de n-propyle. Les cellules
ont été observées sous épifluorescence sur un microscope
30 Leitz Orthoplan 2.
Des micrographies confocales ont été prises en
utilisant le système Bio-Rad MRC 500 relié à un
10
90
microscope composé Zeiss Axiovert. Les images ont été
collectées en utilisant les jeux de filtres BHS et GHS,
alignées en utilisant le programme ALIGN et fusionnées en
utilisant MERGE. La traversée de la fluorescence du canal
vert dans le canal rouge a été réduite en utilisant le
programme BLEED (tous les logiciels étant fournis par
Bio-Rad). Les photographies ont été obtenues directement
à partir de l'écran de l'ordinateur en utilisant un film
Kodak Ektar 125.
6.1.6. LYSATS CELLULAIRES, IMMUNOPRECIPITATIONS ET
WESTERN BLOTS
Des lysats avec des détergents non dénaturants
d'embryons Canton-S de culture tissulaire et de type
15 sauvage ont été préparés sur de la glace dans
~ 10 volumes de cellules de tampon de lyse (300 mM de
NaCl, 50 mM de Tris [pH 8,0], 0, 5 % de NP-40, 0,5 % de
désoxycholate, 1 mM de CaCl2, 1 mM de MgCl2) avec 1 mM de
fluorure de phénylméthylsulfonyle (PMSF) et du
20 fluorophosphate de diisopropyle dilué au 1/2500 en tant
qu'inhibiteurs des proteases. Les lysats ont été triturés
séquentiellement en utilisant des aiguilles de calibre
18G, 21G et 25G fixées sur des seringues de tuberculine
de 1 ce et ensuite centrifugés à pleine vitesse dans une
25 microcentrifugeuse 10 min à 4°C pour éliminer le matériau
insoluble. Une immunoprécipitation a été réalisée en
ajoutant ~ 1 ug d'anticorps (1 à 2 ul d'antisérum
polyclonal) à 250 à 500 pi de lysat cellulaire et en
incubant pendant 1 h à 4°C avec agitation. A ce mélange,
30 15 ug d'anticorps de chèvre anti-souris (Jackson
Immunoresearch ; ces anticorps reconnaissent les IgG à la
fois de souris et de rat) ont été ajoutés et laissés
91
incuber pendant 1 h à 4°C avec agitation. Ceci a été
suivi de l'addition de 100 yl de bactéries de
Staphylococcus aureus (Staph A) fixées (Zysorbin, Zymed ;
remises en suspension selon les instructions du
5 fabricant), qui ont été recueillies, lavées cinq fois
dans du tampon de lyse et incubées pendant encore une
heure. Les complexes Staph A-anticorps ont été ensuite
transformés en culot par centrifugation et lavés trois
fois dans du tampon de lyse, ceci suivi de deux lavages
10 de 15 min dans du tampon de lyse. Après avoir été
transféré dans un nouveau tube, le matériau précipité a
été mis en suspension dans 50 ul de tampon à échantillon
pour SDS-PAGE, porté immédiatement à ebullition pendant
10 min, analysé sur des gels avec un gradient de 3 % à
15 15 %, transféré sur nitrocellulose et détecté en
utilisant des anticorps monoclonaux et des anticorps
secondaires de chèvre anti-souris conjugués à de la HRP
tels que décrits précédemment (Johansen et al., 1989, J.
Cell Biol. 109, 2427-2440). Pour les échantillons de
20 protéines de cellules totales utilisés sur des Western
blots, les cellules ont été recueillies par
centrifugation, lysées dans 10 volumes de cellules de
tampon à échantillon qui contenait 1 mM de PMSF, et
portées immédiatement à ebullition.
25
6.2. RESULTATS
6.2.1. EXPRESSION DE NOTCH ET DELTA DANS DES CELLULES
CULTIVEES
30 Pour détecter les interactions entre Notch et Delta,
noua avons examiné le comportement de cellules exprimant
ces protéines sur leur surface en utilisant un test
92
d'agrégation. Nous avons choisi la lignée cellulaire S2
(Schneider, 1972, J. Embryol. Exp. Morph. 27, 353-365)
pour ces études. Les cellules S2 expriment un message
Notch aberrant et aucune Notch détectable due à un
5 réarrangement de l'extrémité 5' de la séquence codante de
Notch. Ces cellules n'expriment pas non plus de Delta
détectable.
Les résultats du Western blot et de l'analyse
immunofluorescente ont clairement montré que les produits
10 de construction de Notch et Delta supportent l'expression
de protéines des tailles et localisation subcellulaire
attendues.
6.2.2. LES CELLULES QUI EXPRIMENT NOTCH ET DELTA
15 S'AGREGENT
Un simple test d'agrégation a été utilisé pour
détecter les interactions entre Notch et Delta exprimées
sur la surface des cellules S2.
Des. cellules S2 en phase logarithmique de croissance
20 ont été transfectées séparément avec le produit de
construction du promoteur de la métallothionéine soit de
Notch soit de Delta. Après induction avec du CuS04, les
cellules transfectées ont été mélangées dans des nombres
égaux et laissées s'agréger pendant une nuit à
25 température ambiante, pour des détails, voir les
procédures expérimentales, section 6.1). En variante,
dans certaines expériences prévues pour réduire
l'activité métabolique, les cellules ont été mélangées
doucement à 4°C pendant 1 à 2 h. Pour déterminer si des
30 agrégats se sont formés, les cellules ont été traitées
pour une microscopie à immunofluorescence en utilisant
des anticorps spécifiques de chaque produit génique et
93
des anticorps secondaires fluorescents marqués
différemment. Les cellules d'expression ont constitué
habituellement moins de 5 % de la population cellulaire
totale parce que des transformants transitoires plutôt
5 que stables ont été utilisés. Les cellules restantes soit
n'ont pas exprimé une protéine donnée soit l'ont exprimée
à des taux trop bas pour une détection par microscopie à
immunofluorescence. Comme contrôles, nous avons réalisé
des agrégations uniquement avec un seul type de cellule
10 transfectée.
Les résultats (Fehon et al., 1990, Cell 61: 523-534)
ont montré qu'alors que les cellules exprimant Notch
(Notch+) seules n'ont pas formé d'agrégats dans le test,
les cellules exprimant Delta (Delta+) en ont formé. La
15 tendance des cellules Delta+ à s'agréger a été évidente
même dans les échantillons contrôles non agrégés, où des
groupes cellulaires de 4 à 8 cellules qui proviennent
probablement de l'adhésion entre des cellules s?urs
mitotiques, sont apparus de manière courante. Toutefois,
20 les groupes ont été plus courants après incubation dans
des conditions d'agrégation (par exemple, 19 % de
cellules Delta+ en agrégats avant incubation contre 37 %
de cellules Delta+ en agrégats après incubation),
indiquant que les cellules Delta+ sont capables de former
25 des contacts stables les unes avec les autres dans ce
test.
D'une manière remarquablement contraire aux
expériences contrôles avec des cellules Notch"1" seules,
l'agrégation de mélanges de cellules Notch"1" et Delta"1" a
30 entraîné la formation de groupes de jusqu'à 20 cellules
ou plus. La fraction des cellules d'expression trouvée
dans les groupes de quatre cellules colorées ou plus
94
après 24 h d'agrégation s'est située dans la plage de
32 % à 54 % dans des mélanges de cellules Notch+ et
Delta+. Cette plage a été similaire à celle observée pour
les cellules Delta"1" seules (37 % à 40 %) mais très
5 différente de celle pour les cellules Notch"1" seules
(seulement 0 % à 5 %) . Bien que quelques groupes
constitués uniquement de cellules Delta"1" aient été
trouvés. Les cellules Notch+ n'ont jamais été trouvées
dans des groupes de plus de quatre à cinq cellules à
10 moins que des cellules Delta"1" ne soient également
présentes. De nouveau, toutes les cellules au sein de ces
groupes ont exprimé soit Notch soit Delta, même si les
cellules transfectées n'ont composé qu'une petite
fraction de la population cellulaire totale. A 48 h, le
15 degré d'agrégation est apparu supérieur (63 % à 71 %),
suggérant que l'agrégation n'avait pas encore atteint un
maximum après 24 h dans ces conditions. En outre, les
cellules co-transfectées avec des produits de
construction de Notch et Delta (de telle manière que
20 toutes les cellules transfectées expriment les deux
protéines) se sont agrégées d'une façon similaire dans
les mêmes conditions expérimentales.
L'implication de Notch dans le processus
d'agrégation a été testée directement en examinant
25 l'effet d'un mélange d'antisérums polyclonaux dirigés
contre les protéines de fusion qui couvraient presque le
domaine extracellulaire entier de Notch sur l'agrégation
(voir les procédures expérimentales, section 6.1). Pour
minimiser les artefacts qui pourraient surgir à cause
30 d'une réponse métabolique à une concentration en patches
des antigènes de surface, le traitement des anticorps et
le test d'agrégation ont été réalisés à 4°C dans ces
95
expériences. Les cellules Notch+ ont été incubées avec
des sérums soit immuns soit pré-immuns de souris pendant
1 h, des cellules Delta"1" ont été ajoutées et l'agrégation
a été réalisée pendant 1 à 2 h. Alors que les cellules
5 Notch"1" prétraitées avec des sérums pré-immuns se sont
agrégées avec les cellules Delta"1" (dans l'une des trois
expériences, 23 % des cellules Notch"1" étaient dans des
agrégats de cellules Notch+-Delta+) , celles traitées avec
des sérums immuns ne se sont pas agrégées (seulement 2 %
10 des cellules Notch"1" étaient dans des agrégats) . Ce
résultat a suggéré que le domaine extracellulaire de
Notch était nécessaire pour l'agrégation des cellules
Notch+-Delta+.
15 6.2.3. L'AGREGATION MEDIEE PAR NOTCH-DELTA EST DEPENDANTE
DU CALCIUM
La capacité des cellules d'expression à s'agréger en
présence ou en l'absence d'ions Ca2+ a été testée pour
déterminer s'il existe un besoin en ions Ca2+ pour
20 l'agrégation de Notch-Delta. Pour minimiser les effets
non spécifiques possibles dus à des réponses métaboliques
à l'élimination de Ca2+, ces expériences ont été
réalisées à 4°C. Les résultats ont démontré clairement
une dépendance de l'agrégation médiée par Notch-Delta au
25 Ca2+ exogène.
6.2.4. NOTCH ET DELTA INTERAGISSENT AU SEIN D'UNE SEULE
CELLULE
La question si Notch et Delta sont associées au sein
30 de la membrane d'une cellule qui exprime les deux
protéines, a été posée en examinant les distributions de
Notch et de Delta dans des cellules co-transfectées. Pour
96
tester si la colocalisation observée a été accidentelle
ou a représenté une interaction stable entre Notch et
Delta, des cellules vivantes ont été traitées avec un
excès d'antisérum polyclonal anti-Notch. Ce traitement a
5 entraîné une « concentration » de Notch sur la surface
des cellules d'expression en patches distincts détectés
par immunofluorescence. Il y a eu une corrélation directe
entre les distributions de Notch et Delta sur la surface
de ces cellules après ce traitement, indiquant que ces
10 protéines sont associées au sein de la membrane.
6.2.5. LES INTERACTIONS AVEC DELTA NE NECESSITENT PAS LE
DOMAINE INTRACELLULAIRE DE NOTCH
En plus d'un gros domaine extracellulaire qui
15 contient des répétitions de type EGF, Notch a un domaine
intracellulaire (IC) assez important de ~ 940 acides
aminés. Le domaine IC comprend un site de phosphorylation
(Kidd et al., 1989, Genes Dev. 3, 1113-1129), un domaine
de liaison de nucleotides potentiel, une suite de
20 polyglutamine (Wharton et al., 1985, Cell 43, 567-581 ;
Kidd, et al., 1986, Mol. Cell. Biol. 6, 3094-3108), et
des séquences homologues au gène cdclO de levure, qui est
impliqué dans le contrôle du cycle cellulaire dans les
levures (Breeden et Nasmyth, 1987, Nature 329, 651-654).
25 Un produit de construction de Notch variant a été utilisé
à partir duquel les séquences codant pour ~ 835 acides
aminés du domaine IC, comprenant la totalité des
caractères structuraux notés ci-dessus, avaient été
délétées (laissant 25 acides aminés proximaux de la
30 membrane et une nouvelle extrémité carboxy-terminale de
59 acides aminés ; voir les procédures expérimentales).
97
Dans des tests d'agrégation, les cellules qui ont
exprimé le produit de construction ECN1 ont formé de
manière régulière des agrégats avec les cellules Delta"1",
mais pas avec elles-mêmes, juste comme il a été observé
5 pour les cellules qui ont exprimé la Notch intacte. Des
bandes nettes de coloration d'ECNl ont été observées au
sein des régions de contact avec les cellules Delta"1",
indiquant de nouveau une localisation d'ECNl au sein des
régions de contact entre les cellules. Pour tester les
10 interactions au sein de la membrane, des expériences de
co-concentration (en patches) des antigènes de surface
ont été conduites en utilisant des cellules
co-transfectées avec les produits de construction ECN1 et
Delta. Comme il a été observé pour la Notch intacte,
15 lorsqu'ECNl a été concentré en patches en utilisant des
antiserums polyclonaux contre le domaine extracellulaire
de Notch, ECN1 et Delta se sont colocalisés au niveau de
la surface cellulaire. Ces résultats démontrent que les
interactions observées entre Notch et Delta au sein de la
20 membrane n'ont pas besoin de la partie délétée du domaine
IC de Notch et sont donc probablement médiées par le
domaine extracellulaire.
6.2.6. NOTCH ET DELTA FORMENT DES COMPLEXES
25 INTERMOLECULAIRES SOLUBLES DANS DES DETERGENTS
Les résultats précédents ont indiqué des
interactions moléculaires entre Notch et Delta présentes
au sein de la même membrane et entre ces protéines
exprimées sur des cellules différentes. Un autre test
30 pour de telles interactions déterminera si ces protéines
co-précipiteront à partir d'extraits avec des détergents
non dénaturants de cellules qui expriment Notch et Delta.
98
Si Notch et Delta forment un complexe intermoléculaire
stable soit entre soit au sein des cellules, alors il
sera possible de précipiter les deux protéines à partir
des extraits cellulaires en utilisant des antiserums
5 spécifiques dirigés contre l'une de ces protéines. Cette
analyse a été réalisée en immunoprécipitant Delta avec
des antiserums polyclonaux à partir de lysats avec du
NP-40/désoxycholate (voir les procédures expérimentales)
de cellules co-transfectées avec les produits de
10 construction de Notch et Delta qui avaient été laissées
s'agréger pendant une nuit ou d'embryons de type sauvage
de 0 à 24 h.
La co-précipitation de Notch a été détectée dans les
immunoprécipités de Delta provenant des cellules
15 co-transfectées et des embryons. Toutefois, la
co-précipitation de Notch a semblé être présente dans des
quantités beaucoup plus petites que Delta et, par
conséquent, elle a été difficile à détecter. Le fait que
1'immunoprécipitation de Delta entraîne la
20 co-précipitation de Notch constitue une preuve directe
que ces deux protéines forment des complexes
intermoléculaires stables dans les cellules S2
transfectées et dans les cellules embryonnaires.
25 6.3. DISCUSSION
L'utilisation d'un test d'agrégation in vitro qui
emploie des cellules S2 normalement non adhésives a
montré que les cellules qui expriment Notch et Delta
adhèrent spécifiquement les unes aux autres.
30
99
7. LES REPETITIONS D'EGF 11 ET 12 SONT REQUISES ET
SUFFISANTES POUR L'AGREGATION MEDIEE PAR NOTCH-DELTA
Le même test d'agrégation a été utilisé comme il est
décrit dans la section 6, conjointement avec des mutants
5 par deletion de Notch pour identifier des régions au sein
du domaine extracellulaire nécessaires pour les
interactions avec Delta. La preuve montre que les
répétitions d'EGF de Notch sont impliquées directement
dans cette interaction et que seulement deux (ELR 11 et
10 12) des 36 répétitions d'EGF semblent nécessaires. Ces
deux répétitions d'EGF sont suffisantes pour la liaison à
Delta et la dépendance au calcium de l'agrégation médiée
par Notch-Delta s'associe également à ces deux
répétitions. Finalement, les deux répétitions d'EGF
15 correspondantes provenant de l'homologue de Xenopus de
Notch médient également l'agrégation avec Delta,
impliquant que non seulement la structure de Notch a été
conservée dans l'évolution mais également sa fonction.
Ces résultats suggèrent que le domaine extracellulaire de
20 Notch est, de manière surprenante, modulaire et pourra
potentiellement lier toute une diversité de protéines en
plus de Delta. (Voir Rebay et al., 1991, Cell 67: 687-
699) .
25 7.1. PROCEDURES EXPERIMENTALES
7.1.1. PRODUITS DE CONSTRUCTION D'EXPRESSION
Les produits de construction décrits sont tous des
dérivés du produit de construction d'expression de Notch
30 pleine longueur #1 pMtNMg (voir la section 6, ci-dessus)
et ont été fabriqués comme il a été décrit (Rebay et al.,
1991, Cell 67: 687-699).
100
7.1.2. CULTURE CELLULAIRE ET TRANSFECTION
La lignée cellulaire S2 de Drosophila a été cultivée
et transfectée comme il est décrit dans la section 6,
5 ci-dessus. La lignée cellulaire S2 transformée de manière
stable exprimant Delta L-49-6-7 (établie gracieusement
par L. Cherbas) a été cultivée dans du milieu M3 (préparé
par Hazleton Co.) complémenté avec 11 % de sérum de veau
f?tal (FCS) inactivé à la chaleur (Hyclone) , 100 U/ml de
10 pénicilline-100 pg/ml de streptomycine-0,25 pg/ml de
fungizone (Hazleton), 2 x 10"7 M de methotrexate, 0,1 mM
d'hypoxanthine et 0,0016 mM de thymidine.
7.1.3. TESTS D'AGREGATION ET IMMUNOFLUORESCENCE
15 Les expériences de tests d'agrégation et de
dépendance à Ca++ ont été telles que décrites ci-dessus,
section 6. Les cellules ont été colorées avec l'anticorps
monoclonal anti-Notch 9C6.C17 et des antiserums
polyclonaux de rat anti-Delta (détails décrits dans la
20 section 6, ci-dessus). L'expression à la surface de
produits de construction de Notch dans des cellule^
imperméabilisées a été analysée en utilisant des
antiserums polyclonaux de rat produits contre le fragment
BstYI de 0,8 kb (acides aminés 237 à 501 ; Wharton et
25 al., 1985, Cell 43. 567-581) issu du domaine
extracellulaire de Notch. Les cellules ont été observées
sous épifluorescence sur un microscope Leitz Orthoplan 2.
101
7.2. RESULTATS
7.2.1. LES REPETITIONS D'EGF 11 ET 12 DE NOTCH SONT
REQUISES POUR L'AGREGATION MEDIEE PAR NOTCH-DELTA
5 Une analyse de deletion étendue a été entreprise du
domaine extracellulaire de la protéine Notch, qui a été
montrée (ci-dessus, section 6 ; Fehon et al., 1990, Cell
61: 523-534) comme étant impliquée dans les interactions
Notch-Delta, pour identifier le domaine précis de Notch
10 mediant ces interactions. La capacité des cellules
transfectées avec les divers produits de construction par
deletion à interagir avec Delta a été testée en utilisant
le test d'agrégation décrit dans la section 6. En bref,
des produits de construction par deletion de Notch ont
15 été transfectés de manière transitoire dans des cellules
S2 de Drosophila, incubées avec du CuS04 et ensuite
agrégées pendant une nuit à température ambiante avec une
petite quantité de cellules issues de la lignée
cellulaire exprimant Delta transformée de manière stable
20 L49-6-7 (Cherbas), produisant une population généralement
composée de ~ 1 % de cellules exprimant Notch et ~ 5 % de
cellules exprimant Delta, avec les cellules restantes
n'exprimant aucune des deux protéines.
Les dessins schématiques des produits de
25 construction testés et les résultats des expériences
d'agrégation sont représentés sur la figure 2. Pour
tester le degré d'agrégation, les cellules ont été
colorées avec des antiserums spécifiques de chaque
produit génique et examinés par microscopie à
30 immunofluorescence. Les agrégats ont été définis comme
des groupes de quatre cellules ou plus contenant des
cellules exprimant à la fois Notch et Delta et les
102
valeurs indiquées sur la figure 2 représentent le
pourcentage de cellules exprimant Notch trouvées dans de
tels groupes. Tous les nombres reflètent le résultat
moyen provenant d'au moins deux expériences de
5 transfection distinctes dans lesquelles au moins 100
unités cellulaires exprimant Notch (soit des cellules
simples soit des groupes) ont été cotées.
Les produits de construction initiaux (#2 DSph et
#3 ACla) ont délété de grandes parties des répétitions
10 d'EGF. Leur incapacité à favoriser l'agrégation de Notch-
Delta a suggéré que les répétitions d'EGF de Notch ont
été impliquées dans l'interaction avec Delta. Une série
de six sites de restriction Clal dans le cadre a été
utilisée pour encore disséquer la région entre les
15 répétitions d'EGF 7 et 30. A cause de l'homologie de
séquence entre les répétitions, cinq des sites Clal sont
apparus dans la même place relative au sein de la
répétition d'EGF, juste après la troisième cysteine,
alors que le sixième site apparaît juste avant la
20 première cysteine de la répétition d'EGF 31 (figure 3).
Ainsi, en réalisant une digestion partielle avec Clal et
ensuite en religaturant, des deletions ont été obtenues
qui non seulement ont conservé le cadre ouvert de lecture
de la protéine Notch mais en plus ont fréquemment
25 maintenu l'intégrité structurale et l'espacement
conservé, au moins théoriquement, des trois liaisons
disulfure dans les répétitions d'EGF chimériques
produites par la religature (figure 2, produits de
construction #4 à 14). Malheureusement, le site Clal le
30 plus en 3 ' a été résistant à la digestion alors que le
site Clal à coté du site le plus en 3' s'est rompu entre
les répétitions d'EGF 30 et 31. Par conséquent, lorsque
103
divers fragments de digestion avec Clal ont été réinsérés
dans la structure du produit de digestion complète avec
Clal (produit de construction #3 ACla), la structure
globale des répétitions d'EGF a été apparemment
5 interrompue à la jonction en 3 ' .
Plusieurs points concernant cette série de produits
de construction sont intéressants à noter. En premier,
l'élimination du fragment de restriction Clal rompant les
répétitions 9 et 17 (produit de construction #8 AEGF9-17)
10 a aboli l'agrégation avec Delta, alors que la réinsertion
de ce morceau dans le produit de construction #3 ACla,
qui manque des répétitions d'EGF 7 à 30, a restauré
l'agrégation à des taux à peu près de type sauvage
(produit de construction #13 ACla+EGF9-17), suggérant que
15 les répétitions d'EGF 9 à 17 contiennent des séquences
importantes pour la liaison à Delta. En deuxième, tous
les produits de construction dans cette série (#4 à 14)
ont été cohérents avec la cartographie des sites de
liaison par rapport aux répétitions 9 à 17. Les produits
20 de construction d'expression contenant ces répétitions
(#6, 7, 9, 10, 13) ont favorisé les interactions Notch-
Delta alors que les produits de construction manquant de
ces répétitions (#4, 5, 8, 11, 12, 14) ne les ont pas
favorisées. Pour confirmer que l'incapacité à s'agréger
25 avec les cellules Delta n'était pas simplement due à
l'échec de la protéine Notch mutagénisée d'atteindre la
surface cellulaire, mais reflétait véritablement la
deletion du site de liaison nécessaire, l'expression à la
surface cellulaire de tous les produits de construction a
30 été testée par une coloration de manière
immunofluorescente de cellules transfectées vivantes avec
des anticorps spécifiques du domaine extracellulaire de
104
Notch. Tous les produits de construction n'arrivant pas à
médier les interactions Notch-Delta ont produit une
protéine qui a semblé être exprimée normalement à la
surface cellulaire. En troisième, bien que le test
5 d'agrégation ne soit pas quantitatif, deux produits de
construction qui contenaient les répétitions d'EGF 9 à
17, #9 AEGF17-26 et de la manière la plus remarquable
#10 AEGF26-30, se sont agrégés à un taux apparemment
inférieur. Les cellules transfectées avec les produits de
10 construction #9 AEGF17-26 et 10 AEGF26-30 ont montré
considérablement moins de coloration de la surface que la
normale, bien que des cellules fixées et perméabilisées
mises à réagir avec le même anticorps se soient colorées
normalement, indiquant que les epitopes reconnus par les
15 antiserums n'avaient pas été simplement délétés. En
comparant le pourcentage des cellules transfectées dans
les populations cellulaires soit perméabilisées soit
vivantes, il a été découvert qu'à peu près 50 % des
cellules transfectées pour le produit de construction
20 #9 AEGF17-26 et 10 % pour le produit de construction
#10 AEGF26-30 ont produit la protéine souhaitable à la
surface cellulaire. Ainsi ces deux produits de
construction ont produit des protéines qui souvent n'ont
pas réussi à atteindre la surface cellulaire, peut-être à
25 cause d'un mauvais repliement, réduisant de cette
manière, mais n'abolissant pas, la capacité des cellules
transfectées à s'agréger avec les cellules exprimant
Delta.
Ayant cartographie le site de liaison par rapport
30 aux répétitions d'EGF 9 à 17, d'autres expériences (Rebay
et al., 1991, Cell 67: 687-699) ont révélé que la
répétition d'EGF 14 de Notch n'était pas impliquée dans
105
les interactions avec Delta modélisées par le test de
culture tissulaire.
Pour encore cartographier le domaine de liaison à
Delta au sein des répétitions d'EGF 9 à 17, des amorces
5 oligonucléotidiques spécifiques et la technique de PCR
ont été utilisées pour générer plusieurs sous-fragments
de cette région. Trois produits de construction se
chevauchant, #16, 17 et 18 ont été produits, dont
seulement un, #16 ACla+EGF9-13, lorsqu'il a été
10 transfecté dans des cellules S2, ont permis l'agrégation
avec les cellules Delta. Le produit de construction
#19 ACla+EGF(10-13), qui manque de la répétition d'EGF 9,
a en outre défini les répétitions d'EGF 10 à 13 comme la
région nécessaire pour les interactions Notch-Delta.
15 Les produits de construction No. 20 à 24 ont
représenté des tentatives pour rompre ce domaine encore
davantage en utilisant la même stratégie de PCR (voir la
figure 3) . Les produits de construction
#20 ACla+EGF(ll-13), dans lequel la répétition d'EGF 12
20 est la seule répétition entière ajoutée, et
#21 ACla+EGF(10-12), dans lequel la répétition d'EGF 11
est la seule répétition entière ajoutée, n'ont pas réussi
à médier l'agrégation, suggérant que la présence de la
répétition d'EGF soit 11 soit 12 seule n'a pas été
25 suffisante pour les interactions Notch-Delta. Toutefois,
puisque la jonction de la ligature en 3' de ces produits
de construction a interrompu la structure globale des
répétitions d'EGF, il a été possible qu'une courte zone
« tampon » ait été nécessaire pour permettre à la
30 répétition cruciale de fonctionner normalement. Ainsi,
par exemple, dans le produit de construction
#19 ACla+EGF(10-13), la répétition d'EGF 12 pourrait ne
106
pas être impliquée directement dans la liaison à Delta
mais à la place pourrait contribuer à la quantité
minimale de séquence tampon nécessaire pour protéger la
structure de la répétition d'EGF 11, permettant de cette
5 manière les interactions avec Delta. Les produits de
construction #22 à 24 ont abordé ce problème. Les
produits de construction #22 ACla+EGF(10-11), qui n'a pas
médié l'agrégation, et #23 ACla+EGF(10-12), qui l'a
médiée, ont de nouveau suggéré que les deux répétitions
10 11 et 12 sont requises alors que la séquence flanquante
provenant de la répétition 13 clairement ne l'est pas.
Finalement, le produit de construction
#24 ACla+EGF(ll-12), bien qu'à présent potentiellement
interrompu structuralement au niveau de la jonction en
15 5', a démontré de manière convaincante que les séquences
issues de la répétition d'EGF 10 ne sont pas cruciales.
Ainsi, en se basant sur des données entièrement
cohérentes provenant de 24 produits de construction, les
répétitions d'EGF 11 et 12 de Notch définissent ensemble
20 la plus petite unité fonctionnelle pouvant être obtenue à
partir de cette analyse qui contient les sites
nécessaires à la liaison à Delta dans les cellules S2
transfectées.
25 7.2.2. LES REPETITIONS D'EGF 11 ET 12 SONT SUFFISANTES
POUR L'AGREGATION MEDIEE PAR NOTCH-DELTA
La grande deletion de Clal dans laquelle des
fragments de PCR ont été insérés (#3 ACla) conserve à peu
près 1/3 des 36 répétitions d'EGF d'origine ainsi que
30 trois répétitions de Notch/'lin-12. Alors que celles-ci
sont clairement insuffisantes pour favoriser
l'agrégation, il est possible qu'elles forment une
107
structure nécessaire au sein de laquelle des répétitions
d'EGF spécifiques peuvent interagir avec Delta. Pour
tester si seulement quelques répétitions d'EGF ont été en
fait suffisantes pour favoriser l'agrégation, deux
5 produits de construction ont été conçus, #25 AEGF qui a
délété la totalité des 36 répétitions d'EGF sauf les deux
premiers tiers de la répétition 1, et #30 AECN qui a
délété la partie extracellulaire entière de Notch sauf le
premier tiers de la répétition d'EGF 1 et ~ 35 acides
10 aminés juste avant le domaine transmembranaire. Les
fragments qui avaient médié l'agrégation de Notch-Delta
dans le contexte du produit de construction #3 ACla,
lorsqu'ils sont insérés dans le produit de construction
#25 AEGF, ont été de nouveau capables de favoriser les
15 interactions avec Delta (produits de construction #26 à
30). Des produits de construction analogues (#31, 32)
dans lesquels les répétitions de Notch/lin-12 étaient
également absentes, ont de nouveau médié avec succès
l'agrégation de Notch-Delta. Ainsi, les répétitions d'EGF
20 11 et 12 semblent fonctionner comme des unités modulaires
indépendantes qui sont suffisantes pour médier les
interactions Notch-Delta dans les cellules S2, même en
l'absence de la plus grande partie du domaine
extracellulaire de Notch.
25
7.2.3. LES REPETITIONS D'EGF 11 ET 12 MAINTIENNENT LA
DEPENDANCE AU CALCIUM DE L'AGREGATION MEDIEE PAR NOTCH-
DELTA
La capacité des cellules exprimant certains produits
30 de construction par deletion à s'agréger avec des
cellules exprimant Delta a été examinée en présence ou en
l'absence d'ions Ca++. La dépendance au calcium de
108
l'interaction a été préservée même dans le plus petit
produit de construction, ce qui est cohérent avec la
notion que les produits de construction minimaux
contenant les répétitions d'EGF 11 et 12 se lient à Delta
5 d'une manière similaire à celle de Notch pleine longueur.
7.2.4. LA FONCTION DE LIAISON A DELTA DES REPETITIONS
D'EGF 11 ET 12 DE NOTCH EST CONSERVEE DANS L'HOMOLOGUE DE
XENOPUS DE NOTCH
10 Des amorces de PCR basées sur la séquence de Notch
de Xenopus (Coffman et al., 1990, Science 249, 1438-1441)
ont été utilisées pour obtenir un fragment de ~ 350 pb à
partir d'une banque d'ADNc du stade 17 de Xenopus qui
comprend les répétitions d'EGF 11 et 12 flanquées de la
15 moitié des répétitions 10 et 13 de chaque côté. Ce
fragment a été clone dans le produit de construction #3
ACla, et trois clones indépendants ont été testés pour
leur capacité à interagir avec Delta dans le test
d'agrégation en culture cellulaire. Deux des clones,
20 #33a&b ACla+XEGF(10-13), lorsqu'ils sont transfectés dans
des cellules S2 ont été capables de médier les
interactions Notch-Delta à un niveau à peu près
équivalent au produit de construction de Notch de
Drosophila analogue #19 ACla+EGF(10-13) et de nouveau
25 d'une manière dépendante du calcium (tableau III).
Toutefois, le troisième clone #33c ACla+XEGF(10-13) n'a
pas réussi à médier les interactions Notch-Delta bien que
la protéine ait été exprimée normalement à la surface
cellulaire, comme il en a été jugé par coloration des
30 cellules vivantes imperméabilisées. La comparaison de la
séquence du produit de PCR de Xenopus dans les produits
de construction #33a et 33c a révélé une mutation faux-
109
sens entraînant un changement de leucine en proline
(acide aminé No. 453, Coffman, et al., 1990, Science 249,
1438-1441) dans la répétition d'EGF 11 du produit de
construction #33c. Bien que ce résidu ne soit pas
5 conservé entre Notch de Drosophila et de Xenopus (figure
8), l'introduction d'un résidu de proline pourrait
facilement perturber la structure de la répétition d'EGF,
et ainsi l'empêcher d'interagir correctement avec Delta.
La comparaison de la séquence d'acides aminés des
10 répétitions d'EGF 11 et 12 de Notch de Drosophila et de
Xenopus révèle un haut degré d'identité des acides
aminés, y compris la séquence consensus de liaison au
calcium (figure 4, SEQ ID NO : 1 et NO : 2) . Toutefois,
le taux d'homologie n'est pas remarquablement différent
15 de celui partagé entre la plupart des autres répétitions
d'EGF, qui présentent globalement environ 50 % d'identité
au niveau des acides aminés. Cette correspondance une à
une entre les répétitions d'EGF individuelles de Notch de
Drosophila et de Xenopus, conjointement avec la
20 conservation fonctionnelle des ELR 11 et 12, suggère que
les 36 répétitions d'EGF de Notch comprennent une zone de
tandem des unités fonctionnelles conservées.
7.3. DISCUSSION
25 Une analyse étendue des deletions du domaine
extracellulaire de Notch a été utilisée pour montrer que
les régions de Notch contenant les répétitions homologues
d'EGF 11 et 12 sont toutes les deux nécessaires et
suffisantes pour l'agrégation médiée par Notch-Delta et
30 que cette capacité de liaison à Delta a été conservée
dans les deux mêmes répétitions d'EGF de Notch de
Xenopus. La découverte que l'agrégation correspondait aux
110
répétitions d'EGF 11 et 12 de Notch démontre que les
répétitions d'EGF de Notch fonctionnent également comme
des domaines spécifiques de liaison des protéines. Les
répétitions d'EGF 11 et 12 seules (#32 AECN+EGF(11-12)
5 ont été suffisantes pour maintenir la dépendance au Ca++
des interactions Notch-Delta.
Les divers produits de construction par deletion
suggèrent que 1'ELR 11 et 1'ELR 12 fonctionnent comme une
unité modulaire, indépendantes du contexte immédiat dans
10 lequel elles sont placées. Ainsi, ni les 34 répétitions
d'EGF restantes ni les trois répétitions de Notch/lin-12
ne semblent nécessaires pour établir une charpente
structurale requise pour que les répétitions d'EGF 11 et
12 fonctionnent. De manière intéressante, presque l'effet
15 opposé a été observé : bien que le test d'agrégation ne
mesure pas la force de l'interaction, lorsque le site de
liaison a été rétréci à des fragments de plus en plus
petits, on a observé une augmentation de la capacité des
cellules transfectées à s'agréger avec les cellules
20 exprimant Delta, suggérant que les séquences d'EGF
flanquantes normales gênent en fait l'association entre
les protéines. Les 34 répétitions d'EGF restantes peuvent
également former des domaines de liaison modulaires pour
d'autres protéines interagissant avec Notch à des temps
25 différents au cours du développement.
La découverte que les répétitions d'EGF 11 et 12 de
Notch forment une unité de liaison de Delta distincte
représente la première preuve concrète supportant l'idée
que chaque répétition d'EGF ou un petit sous-ensemble de
30 répétitions peut jouer un rôle unique au cours du
développement, éventuellement par l'intermédiaire
d'interactions directes avec d'autres protéines. Les
Ill
homologies observées entre le domaine adhésif de Delta et
Serrate (figure 5) suggèrent que la partie homologue de
Serrate est « adhesive » en ce qu'elle médie la liaison à
d'autres protéines toporythmiques (voir la section 8,
5 ci-dessous). En plus, le gène scabrous, qui code pour une
protéine sécrétée présentant une similarité avec le
fibrinogène, peut interagir avec Notch.
En plus de la répétition d'EGF, des copies multiples
d'autres motifs structuraux apparaissent couramment dans
10 toute une diversité de protéines. Un exemple pertinent
est le motif de cdclO/ankyrine, dont six copies se
trouvent dans le domaine intracellulaire de Notch.
L'ankyrine contient 22 de ces répétitions. Peut-être que
les réseaux répétés de motifs structuraux peuvent
15 représenter en général un assemblage linéaire d'une série
d'unités modulaires de liaison des protéines. Etant donné
ces résultats conjointement avec la complexité
structurale, génétique et développementale de Notch,
Notch peut interagir avec un certain nombre de ligands
20 différents selon un schéma temporel et spatial
précisément régulé tout le long du développement. De
telles interactions spécifiques du contexte avec des
protéines extracellulaires pourront être médiées par les
répétitions d'EGF et de Notch/lin-12, alors que les
25 interactions avec des protéines cytosquelettiques et
cytoplasmiques pourront être médiées par les motifs
intracellulaires de cdclO/ankyrine.
8. SEQUENCES QUI MEDIENT LES INTERACTIONS NOTCH-SERRATE
30 Comme il est décrit dans ce document, les deux
répétitions d'EGF de Notch qui médient les interactions
avec Delta, à savoir les répétitions d'EGF 11 et 12,
112
constituent également un domaine de liaison à Serrate
(voir Rebay et al., 1991, Cell 67: 687-699).
Pour tester si Notch et Serrate interagissent
directement, des cellules S2 ont été transfectées avec un
5 produit de construction d'expression de Serrate et
mélangées avec des cellules exprimant Notch dans un test
d'agrégation. Pour le produit de construction
d'expression de Serrate, une amorce synthétique contenant
un site BamHI artificiel immédiatement en 5' par rapport
10 à l'initiateur AUG en position 442 (tous les numéros des
séquences sont selon Fleming et al., 1990, Genes & Dev.
4: 2188-2201) et homologue jusqu'à la position 464, a été
utilisée conjointement avec une seconde amorce des
positions 681 à 698 pour générer un fragment d'ADN de
15 ~ 260 paires de bases. Ce fragment a été coupé avec BamHI
et Kpnl (position 571) et ligaturé dans Bluescript KS +
(Stratagene). Ce produit de construction, BTSer5'PCR, a
été vérifié par séquençage, puis coupé avec Kpnl. Le
fragment Kpnl de Serrate (571 à 2981) a été inséré et
20 l'orientation correcte choisie, pour générer
BTSer5'PCR-Kpn. Le fragment SacII en 5' de BTSer5'PCR-Kpn
(sites SacII dans le lieur multisite de Bluescript et
dans Serrate (1199)) a été isolé et utilisé pour
remplacer le fragment SacII en 5 ' de l'ADNc Cl (Fleming
25 et al., 1990, Genes & Dev. 4: 2188-2201), régénérant
ainsi l'ADNc de Serrate pleine longueur moins les régions
non traduites en 5'. Cet insert a été isolé par une
digestion avec Sali et une digestion partielle avec BamHI
et réarrangé dans les sites BamHI et Sali de pRmHa-3 pour
30 générer le produit de construction d'expression final,
Ser-mtn.
113
Les cellules exprimant Serrate ont adhéré aux
cellules exprimant Notch d'une manière dépendante du
calcium (figure 2 et Rebay et al., 1991, ci-dessus).
Toutefois, à la différence de Delta, dans les conditions
5 expérimentales testées, Serrate n'a pas semblé agir de
manière homotypique. En outre, il n'a été détecté aucune
interaction entre Serrate et Delta.
Un sous-ensemble de produits de construction par
deletion de Notch a été testé et a montré que les
10 répétitions d'EGF 11 et 12, en plus de la liaison à
Delta, médient également les interactions avec Serrate
(figure 2 ; produits de construction #1, 7 à 10, 13, 16,
17, 19, 28 et 32) . En outre, la fonction de liaison à
Serrate de ces répétitions semble également avoir été
15 conservée dans les deux répétitions d'EGF correspondantes
de Notch de Xenopus (#33 ACla+XEGF(10-13)). Ces résultats
montrent sans ambigùité que Notch interagit avec à la
fois Delta et Serrate et que les deux mêmes répétitions
d'EGF de Notch médient les deux interactions. La région
20 de Serrate qui est essentielle pour l'agrégation de
Notch/Serrate a été également définie. La deletion des
nucleotides 676 à 1287 (c'est-à-dire, les acides aminés
79 à 282) (voir la figure 5 ; SEQ ID NO : 3 et NO : 4)
élimine la capacité de la protéine Serrate à s'agréger à
25 Notch.
Notch et Serrate semblent s'agréger de manière moins
efficace que Notch et Delta, peut-être parce que
l'interaction Notch-Serrate est plus faible. Une
explication triviale pour cette quantité réduite
30 d'agrégation pourrait être que le produit de construction
de Serrate n'a simplement pas exprimé autant de protéine
à la surface cellulaire que le produit de construction de
114
Delta, diminuant de cette manière la force de
l'interaction. En variante, la différence de force de
l'interaction peut indiquer une différence fonctionnelle
fondamentale entre les interactions Notch-Delta et Notch-
5 Serrate qui peut être significative in vivo.
9. CLONAGE, SEQUENÇAGE ET EXPRESSION DU NOTCH HUMAIN
9.1. ISOLEMENT ET SEQUENÇAGE DU NOTCH HUMAIN
10 Des clones pour la séquence du Notch humain ont été
obtenus à l'origine en utilisant la réaction en chaîne de
la polymerase (PCR) pour amplifier l'ADN à partir d'une
banque d'ADNc de cerveau de f?tus humain de 17 à 18
semaines dans le vecteur Lambda Zap II (Stratagene).
15 Le fragment de 400 pb obtenu de cette manière a été
ensuite utilisé comme sonde avec laquelle cribler la même
banque pour les clones de Notch humain. Le criblage
d'origine a produit trois clones uniques, hN3k, hN2K et
hN5k, pour lesquels il a été montré par une analyse
20 subséquente des séquences qu'ils se situent à l'extrémité
3' du Notch humain (figure 6). Un second criblage
utilisant l'extrémité 5' de hN3k comme sonde a été
entrepris pour rechercher des clones englobant
l'extrémité 5' du Notch humain. Un clone unique, hN4k, a
25 été obtenu à partir de ce criblage et les données
préliminaires du séquençage indiquent qu'il contient la
plus grande partie de l'extrémité 5' du gène (figure 6).
Ensemble, les clones hN4k, hN3k et hN5k englobent environ
10 kb de l'homologue/des homologues humain(s) de Notch,
30 en commençant tôt dans les répétitions d'EGF et en
s'étendant dans la région non traduite en 3' du gène. Les
trois clones sont des inserts d'ADNc dans le site EcoRI
115
de pBluescript SK- (Stratagene). La souche hôte de
E. coli est XLl-Blue (voir Maniatis, T., 1990, Molecular
Cloning, A Laboratory Manual, 2d ed., Cold Spring Harbor
Laboratory. Cold Spring Harbor, New York, p. A12). Un
5 alignement des séquences de Notch humain avec Notch de
Drosophila est représenté sur la figure 7.
La séquence de diverses parties de Notch contenues
dans les clones d'ADNc a été déterminée (par
l'utilisation de Sequenase®, U.S. Biochemical Corp.) et
10 est représentée pour hN2k et hN4k sur les figures 8
(SEQ ID NO : 5 à 7) et 9 (SEQ ID NO : 8, 9),
respectivement. Une autre analyse de séquence de hN2k a
révélé qu'il code pour une séquence de Notch humaine
chevauchant celle contenue dans hN5k.
15 Les séquences nucléotidiques complètes de l'ADNc de
Notch humain contenues dans hN3k et hN5k ont été
déterminées par le procédé de terminaison de la chaîne
didésoxy en utilisant le kit Sequenase® (U.S. Biochemical
Corp.). Ces séquences nucléotidiques codant pour la Notch
20 humaine, dans le cadre de lecture approprié, ont été
facilement identifiées parce qu'il n'y a pas d'introns et
la traduction dans seulement l'un des trois cadres de
lecture possibles produit une séquence qui, après
comparaison avec la séquence d'acides aminés déduite de
25 Notch de Drosophila publiée, produit une séquence
présentant un degré substantiel d'homologie avec la
séquence de Notch de Drosophila. Les séquences d'ADN et
des protéines déduites de l'ADNc de Notch humain dans
hN3K et hN5k sont présentées sur les figures 10
30 (SEQ ID NO : 19, 11) et 11 (SEQ ID NO : 12, 13),
respectivement. Le clone hN3k code pour une partie d'un
polypeptide Notch démarrant approximativement au niveau
116
de la troisième répétition de Notch/lin-12 jusqu'à
plusieurs acides aminés avant l'acide aminé carboxy-
terminal. Le clone hN5k code pour une partie d'un
polypeptide Notch démarrant approximativement avant la
5 région de cdclO jusqu'à l'extrémité du polypeptide et
contient également une région non traduite en 3'.
La comparaison des séquences d'ADN et de protéine
présentées sur la figure 10 (SEQ ID NO : 10, 11) avec
celles sur la figure 11 (SEQ ID NO : 12, 13) révèle des
10 différences significatives entre les séquences suggérant
que hN3K et hN5k représentent une partie de deux gènes
homologues de Notch distincts. Les données suggèrent
ainsi que le génome humain abrite plus d'un gène
homologue de Notch. Ceci est différent de Drosophila, où
15 Notch semble être un gène à copie unique.
La comparaison des séquences d'ADN et d'acides
aminés des homologues humains de Notch contenues dans
hN3k et hN5k avec les séquences de Notch correspondantes
de Drosophila (telles que publiées dans Wharton et al.,
20 1985, Cell 43: 567-581) et avec les séquences de Notch
correspondantes de Xenopus (telles que publiées dans
Coffman et al., 1990, Science 249: 1438-1441 ou
disponibles auprès de Genbank® (numéro d'accession
M33874)) a également révélé des différences.
25 La séquence d'acides aminés représentée sur la
figure 10 (hN3k) a été comparée avec la séquence prédite
du polypeptide TAN-1 représentée sur la figure 2 de
Ellisen et al., August 1991, Cell 66: 649-661. Certaines
différences ont été trouvées entre les séquences d'acides
30 aminés déduites ; toutefois, globalement la séquence
polypeptidique de Notch de hN3k est identique à 99 % avec
la région TAN-1 correspondante (TAN-1, acides aminés 1455
117
à 2506) . Quatre différences ont été notées : dans la
région entre la troisième répétition de Notch/lin-12 et
le premier motif de cdclO, il y a une arginine (hN3k) à
la place d'un X (TAN-1, acide aminé 1763) ; (2) il y a
5 une proline (hN3k) à la place d'un X (TAN-1, acide aminé
1787) ; (3) il y a un changement conservateur d'un résidu
d'acide aspartique (hN3k) à la place d'un résidu d'acide
glutamique (TAN-1, acide aminé 2495) ; et (4) la région
carboxy-terminale diffère substantiellement entre les
10 acides aminés 2507 et 2535 de TAN-1.
La séquence d'acides aminés représentée sur la
figure 11 (hN5k) a été comparée avec la séquence prédite
du polypeptide TAN-1 représentée sur la figure 2 de
Ellisen et al., August 1991, Cell 66: 649-661. Des
15 différences ont été trouvées entre les séquences d'acides
aminés déduites. Le polypeptide Notch déduit de hN5k est
identique à 75 % avec le polypeptide TAN-1 (identique à
64 % avec Notch de Drosophila) dans la région de cdclO
qui englobe à la fois le motif de cdclO (TAN-1, acides
20 aminés 1860 à 2217) et les régions flanquantes bien
conservées (figure 12) . La région de cdclO couvre les
acides aminés 1860 à 2217 de la séquence de TAN-1. En
outre, le polypeptide codé par hN5k est identique à 65 %
avec le polypeptide TAN-1 (identique à 44 % avec Notch de
25 Drosophila) à l'extrémité carboxy-terminale de la
molécule contenant une région riche en PEST (proline,
acide glutamique, serine, threonine) (TAN-1, acides
aminés 2482 à 2551) (figure 12B) . La suite de 215 acides
aminés reposant entre les régions mentionnées
30 précédemment n'est pas bien conservée parmi l'un
quelconque des clones homologues de Notch représentés par
hN3k, hN5k et TAN-1. Ni le polypeptide de hN5k ni Notch
118
de Drosophila ne montrent des taux significatifs
d'identité des acides aminés avec les autres protéines
dans cette région (par exemple, hN5k/TAN-l = 24 %
d'identité ; hN5k/Notch de Drosophila = 11 % d'identité ;
5 TAN-1/Notch de Drosophila = 17 % d'identité). Au
contraire, Notch de Xenopus (Xotch) (SEQ ID NO : 16),
Notch de rat (SEQ ID NO : 17) et TAN-1 (SEQ ID NO : 18)
continuent à partager des taux significatifs d'identité
de séquence les unes avec les autres (par exemple,
10 TAN-1/Notch de rat = 75 % d'identité, TAN-1/Notch de
Xenopus = 45 % d'identité, Notch de rat/Notch de
Xenopus = 50 % d'identité).
L'examen de la séquence des domaines
intracellulaires des homologues de Notch de vertébrés
15 représentée sur la figure 12B a révélé une découverte
inattendue : toutes ces protéines, y compris hN5k,
contiennent un motif CcN potentiel, associé à la fonction
de ciblage nucléaire, dans la région conservée faisant
suite à la dernière des six répétitions de cdclO (figure
20 12B) . Bien que Notch de Drosophila manque d'un tel motif
défini, un examen de plus près de sa séquence a révélé la
présence d'une séquence de localisation nucléaire
bipartite possible (Robbins et al., 1991, Cell 64: 615-
623), ainsi que de sites de phosphorylation CK II et cdc2
25 possibles, tous dans une proximité relative les uns par
rapport aux autres, définissant éventuellement une
variante de type de motif CcN (figure 12B).
Pour isoler les clones couvrant l'extrémité 5' de hN
(l'homologue de Notch humaine contenu en partie dans
30 hN5k) , le clone hN2k a été utilisé comme sonde pour
cribler 260 000 plaques de banque de phage de cerveau
f?tal humain, disponible commercialement chez Stratagene,
119
pour une hybridation croisée des clones. Quatre clones
ont été identifiés et isolés en utilisant des procédures
classiques (Maniatis et al., 1982. Molecular Cloning: A
Laboratory Manual, Cold Spring Harbor Laboratory. Cold
5 Spring Harbor, New York). Quatre clones ont été également
isolés par hybridation à la séquence homologue de Notch
de Adams et al., 1992, Nature 355: 632-655, qui a été
obtenue auprès de l'ATCC.
Pour isoler les clones couvrant l'extrémité 5' de
10 TAN-1, la banque de cerveau f?tal humain qui est
disponible commercialement chez Stratagene a été criblée
pour les clones qui étendront la séquence jusqu'à
l'extrémité 5'. 880 000 plaques ont été criblées et
quatre clones ont été identifiés comme présentant une
15 hybridation croisée avec les séquences de hN3k. Le
séquençage a confirmé la position relative de ces
séquences au sein de la protéine Notch codée par TAN-1.
La séquence en 5' de notre homologue de TAN-1 isolé
a été déterminée jusqu'au nucleotide 972 (le nucleotide
20 numéro 1 étant le A dans le codon d'initiation ATG) et
comparée avec la séquence telle que publiée par Ellisen
et al. (1991, Cell 66: 649-661). Au niveau du nucleotide
559, notre homologue de TAN-1 a un G, tandis que Ellisen
et al. décrivent un A, lequel changement entraîne un
25 acide aminé codé différent. Ainsi, au sein des 324
premiers acides aminés, notre protéine codée par TAN-1
diffère de celle enseignée par Ellisen et al., puisque
notre protéine a un Gly en position 187, tandis que
Ellisen et al. décrivent un Arg au niveau de cette
30 position (comme il est représenté sur la figure 13).
Les séquences d'acides aminés pleine longueur des
deux protéines codées par hN (SEQ ID NO : 19) et TAN-1
120
(SEQ ID NO : 20) , ainsi que les protéines Notch de
Xenopus et de Drosophila, sont représentées sur la figure
13. La séquence codante d'ADN pleine longueur (sauf pour
celle codant pour l'initiateur Met) (contenue dans
5 SEQ ID NO : 21) et la séquence d'acides aminés codée
(sauf que l'initiateur Met n'est pas représenté)
(contenue dans SEQ ID NO : 19) de hN sont représentées
sur la figure 17.
10 9.2. EXPRESSION DE NOTCH HUMAINE
Des produits de construction d'expression ont été
fabriqués en utilisant les clones d'ADNc de Notch humain
discutés dans la section 9.1 ci-dessus. Dans les cas de
hN3k et hN2k, le clone entier a été excisé de son vecteur
15 sous la forme d'un fragment de restriction EcoRI et
sous-cloné dans le site de restriction EcoRI de chacun
des trois vecteurs pGEX (vecteurs d'expression de la
glutathion-S-transférase ; Smith et Johnson, 1988, Gene
7, 31-40). Ceci permet l'expression du produit de la
20 protéine Notch à partir du sous-clone dans le cadre de
lecture correct. Dans le cas de hN5k, le clone contient
deux sites de restriction EcoRI internes, produisant des
fragments de 2,6, 1,5 et 0,6 kb. Les fragments à la fois
de 2,6 et de 1,5 kb ont été également sous-clonés dans
25 chacun des vecteurs pGEX.
Le système du vecteur pGEX a été utilisé pour
obtenir l'expression de protéines de fusion (chimériques)
de Notch humaine à partir des produits de construction
décrits ci-dessous. L'ADN du Notch clone dans chaque cas
30 a été inséré, en phase, dans le vecteur pGEX approprié.
Chaque produit de construction a été ensuite électroporé
dans des bactéries (E. coli) et a été exprimé sous la
121
forme d'une protéine de fusion contenant les séquences de
la protéine Notch fusionnées à l'extrémité carboxy de la
protéine glutathion-S-transférase. L'expression des
protéines de fusion a été confirmée par l'analyse des
5 extraits de protéines bactériennes par électrophorèse sur
gel de Polyacrylamide, en comparant les extraits de
protéines obtenus à partir des bactéries contenant les
plasmides pGEX avec et sans l'ADN de Notch inséré. Les
protéines de fusion ont été solubles en solution aqueuse
10 et elles ont été purifiées à partir de lysats bactériens
par Chromatographie d'affinité en utilisant de 1'agarose
revêtu de glutathion (puisque l'extrémité carboxy de la
glutathion-S-transférase se lie au glutathion). Les
protéines de fusion exprimées ont été liées par un
15 anticorps dirigé contre Notch de Drosophila, comme il a
été testé par Western blot.
Les produits de construction utilisés pour fabriquer
des protéines de fusion Notch humaine-glutathion-S-
transférase ont été les suivants :
20 hNFP#2 : une PCR a été utilisée pour obtenir un
fragment démarrant juste avant les répétitions de cdclO
au niveau du nucleotide 192 de l'insert de hN5k jusqu'à
juste avant la région riche en PEST au niveau du
nucleotide 1694. L'ADN a été ensuite digéré avec BamHI et
25 Smal et le fragment résultant a été ligaturé dans pGEX-3.
Après expression, la protéine de fusion a été purifiée
par liaison à du glutathion-agarose. Le polypeptide
purifié a été quantifié sur un gel de Polyacrylamide avec
un gradient de 4 à 15 %. La protéine de fusion résultante
30 avait un poids moléculaire approximatif de 83 kD ;
hN3FP#l : l'insert d'ADN de hN3k entier (nucleotides
1 à 3235) a été excisé à partir du vecteur Bluescript
122
(SK) par digestion avec EcoRI. L'ADN a été ligaturé dans
pGEX-3 ;
hN3fp#2 : un segment en 3' de l'ADN de hN3k
(nucleotides 1847 à 3235) plus une partie du lieur
5 multisite ont été découpés du vecteur Bluescript (SK) par
digestion avec Xmal. Le fragment a été ligaturé dans
pGEX-1.
Après purification, ces protéines de fusion sont
utilisées pour fabriquer des anticorps soit polyclonaux
10 et/soit monoclonaux dirigés contre la Notch humaine.
10. EXPRESSION DE NOTCH DANS DES CELLULES NORMALES ET
MALIGNES
Divers échantillons et lignées cellulaires de tissus
15 de patients humains, représentant à la fois des cellules
normales et une large diversité de cellules malignes sont
testés pour détecter et/ou quantifier l'expression de
Notch. Les échantillons de tissus de patients sont
obtenus auprès du département pathologie à la Yale
20 University School of Medicine.
Les tests suivants sont utilisés pour mesurer
l'expression de Notch dans des échantillons de tissus de
patients : (a) hybridation Northern ; (b) Western blots ;
(c) hybridation in situ ; et (d) immunocytochimie. Les
25 tests ont été réalisés en utilisant des techniques
classiques. L'hybridation Northern et l'hybridation in
situ sont réalisées (i) en utilisant une sonde d'ADN
spécifique de la séquence de Notch du clone hN3k ; et
(ii) en utilisant une sonde d'ADN spécifique de la
30 séquence de Notch du clone hN5k. Les Western blots et
1 ' immunocytochimie sont réalisés en utilisant un
123
anticorps dirigé contre la protéine Notch de Drosophila
(qui reconnaît également les protéines Notch humaines).
L'hybridation Northern et les Western blots, tels
que décrits ci-dessus, sont également utilisés pour
analyser de nombreuses lignées cellulaires humaines,
représentant divers tissus normaux ou cancéreux. Les
lignées cellulaires testées sont énumérées dans le
tableau 2.
10
Tableau 2
Lignées cellulaires humaines
Tissu/tumeur Lignée cellulaire
Moelle osseuse IM-9 KG-1
Cerveau A-172 HS 683 U-87MG TE 671
Sein BT-20 Hs 578Bs MDA-MB-330
Côlon Caco-2 SW 4 8 T84 WiDr
Embryon FHs 173We
Rein A-498 A-704 Caki-2
Leucémie ARH-77 KG-1

124
Tissu/tumeur Lignée cellulaire
Foie Hep G2
WRL 68
Poumon Calu-1
HLF-a
SK-Lu-1
Lymphoblastes CCRF-CEM
HuT 7 8
Lymphome Hs 445
MS116
U-937
Mélanome A-375
G-361
Hs 294T
SK-MEL-1
Myélome IM-9
RPMI 8226
Neuroblastome IMR-32
SK-N-SH
SK-N-MC
Ovaire Caov-3
Caov-4 PA-1
Cellules plasmatiques ARH-77
Sarcome A-204
A673 HOS
Peau Amdur II
BUD-8
Testicule Tera-1
Tera-2
Thymus Hs67

125
Tissu/tumeur Lignée cell ulaire
Utérus AN3 Ca HEC-l-A
Les malignités des types cellulaires et tissulaires
malins qui sont ainsi montrées comme exprimant Notch
peuvent être traitées comme il est décrit dans la
section 5.1 et suivantes.
10.1 L'EXPRESSION DE LA PROTEINE NOTCH HUMAINE EST
AUGMENTEE DANS DIVERSES MALIGNITES
Comme il est décrit ci-dessous, nous avons découvert
5 que l'expression de la protéine Notch humaine est
augmentée dans au moins trois cancers humains, à savoir
le cancer du col de l'utérus, du sein et du côlon. Une
coloration immunocytochimique d'échantillons tissulaires
provenant de cancers du col de l'utérus, du sein et du
10 côlon a montré clairement que le tissu malin exprime des
taux élevés de Notch, à des taux accrus par rapport à des
coupes de tissus non malins. Ce large spectre de
néoplasies différentes dans lesquelles il y a une
expression élevée de Notch suggère que beaucoup plus de
15 conditions cancéreuses seront observées comme régulant
Notch à la hausse.
Des lames d'échantillons de tumeurs humaines (pour
des tumeurs du sein, du côlon et du col de l'utérus) ont
été obtenues auprès de la banque de tissus du Pathology
20 Department, Yale Medical School. Les colorations ont été
réalisées en utilisant des anticorps monoclonaux dirigés
contre les protéines de fusion PI et P4 qui ont été
générées à partir de séquences de hN et TAN-1,
respectivement.
126
Les protéines de fusion PI et P4 ont été obtenues
par insertion de la séquence de Notch humain souhaitée
dans le vecteur d'expression pGEX approprié (Smith et
Johnson, 1988, Gene 7: 31-40 ; AMRAD Corp., Melbourne,
5 Australie) et elles ont été purifiées par affinité selon
les instructions du fabricant (AMRAD Corp.). Pour la
production de la protéine de fusion PI, pGEX-2 a été
coupé avec BamHI et ligaturé à un concatémère qui est
constitué de trois copies d'un fragment BamHI-BglII de
10 518 pb de hN. Des rats ont été immunisés avec la protéine
exprimée et des anticorps monoclonaux ont été produits
par des procédures classiques. Pour la production de la
protéine de fusion P4, pGEX-2 a été coupé avec BamHI et
ligaturé à un concatémère qui est constitué de
15 trois copies d'un fragment BamHI-BglII de 473 pb de
TAN-1. Des rats ont été immunisés avec la protéine
exprimée et des anticorps monoclonaux ont été produits
par des procédures classiques.
Dans toutes les tumeurs examinées, les protéines
20 Notch codées par les deux homologues de Notch humain
TAN-1 et hN étaient présentes à des taux accrus dans la
partie maligne du tissu par comparaison à la partie
normale. Des colorations représentatives sont
représentées sur les images fournies (figures 14 à 16).
25 La procédure de coloration a été la suivante : les
tissus ont été fixés dans du paraformaldehyde, noyés dans
de la paraffine, découpés en coupes épaisses de
5 micromètres et placés sur des lames de verre. Ensuite
les étapes suivantes ont été réalisées :
30 1. Déparaffination par l'intermédiaire de
4 changements de xylene, 4 minutes chacun.
127
2. Elimination du xylene par l'intermédiaire de
3 changements dans de l'éthanol absolu, 4 minutes chacun.
3. Réhydratation graduelle des tissus par immersion
des lames dans de l'éthanol à 95 %, 90 %, 80 %, 60 % et
5 30 %, 4 minutes à chaque fois. A la fin, les lames ont
été rincées dans de l'eau distillée pendant 5 minutes.
4. Inactivation de la peroxydase endogène par
incubation pendant 30 minutes dans du peroxyde
d'hydrogène à 0,3 % dans du methanol.
10 5. Lavage dans du PBS (10 mM de phosphate de sodium
pH 7,5, 0,9 % de NaCl) pendant 20 minutes.
6. Incubation pendant 1 heure dans de la solution de
blocage. (Solution de blocage : PBS contenant 4 % de
sérum de lapin normal et 0,1 % de Triton X-100).
15 7. Incubation pendant une nuit à 4°C avec un
anticorps primaire dilué dans de la solution de blocage.
Concentration finale de l'anticorps primaire de 20 à
50 pg/ml.
8. Lavage pendant 20 minutes avec du PBS + 0,1 % de
20 Triton X-100 (3 changements).
9. Incubation pendant 30 minutes avec un anticorps
de lapin anti-rat biotinylé : 50 pi d'anticorps biotinylé
(VECTOR) dans 10 ml de solution de blocage.
10. Lavage pendant 20 minutes avec du PBS + 0,1 % de
25 Triton X-100 (3 changements).
11. Incubation avec du réactif APC (VECTOR) pendant
30 minutes (le réactif est fabriqué dans du PBS + 0,1 %
de Triton X-100).
12. Lavage pendant 20 minutes dans du PBS + 0,1 % de
30 Triton X-100. Suivi d'une incubation pendant 2 minutes
dans du PBS + 0,5 % de Triton X-100.
128
13. Incubation pendant 2 à 5 minutes dans de la
solution de substrat de peroxydase. Solution de substrat
de peroxydase : des volumes égaux de peroxyde d'hydrogène
à 0,02 % dans de l'eau distillée et de tétrachlorhydrate
5 de diaminobenzidine (DAB) à 0,1 % dans 0, 1 M de tampon
Tris pH 7,5 sont mélangés juste avant l'incubation avec
les tissus. Du Triton X-100 est ajouté à la solution
finale à une concentration de 0,5 %.
14. Lavage pendant 15 minutes dans de l'eau du
10 robinet.
15. Contre-coloration pendant 10 minutes avec de
1'hématoxyline de Mayer.
16. Lavage pendant 15 minutes dans de l'eau du
robinet.
15 17. Déshydratation par l'intermédiaire de
changements dans de l'éthanol à 30 %, 60 %, 80 %, 90 %,
95 % (4 minutes à chaque fois).
18. Immersion dans du xylene (2 changements,
4 minutes chacun).
20 19. Montage, microscopie à lumière.
11. DEPOT DES MICRO-ORGANISMES
Les bactéries recombinantes suivantes, chacune
portant un plasmide codant pour une partie de la Notch
25 humaine, ont été déposées le 2 mai 1991 auprès de
1'American Type Culture Collection, 1201 Parklawn Drive,
Rockville, Maryland 20852, sous les conditions du Traité
de Budapest sur la reconnaissance internationale du dépôt
de micro-organismes pour des objectifs de procédures sur
30 des patients.
129
Bactéries portant Plasmide No. accession ATCC
E. coli XL-1 Blue hN4k 68610
E. coli XL-1 Blue hN3k 68609
E. coli XL-1 Blue hN5K 68611
Diverses publications sont citées dans ce document,
dans lesquelles l'homme du métier pourra rechercher
5 davantage d'informations concernant le problème discuté.
10
130
LISTE DES SEQUENCES
(1) INFORMATIONS GENERALES
(i) DEMANDEUR : Artavanis-Tsakonas, S. et al.
(ii) TITRE DE L'INVENTION : Procédés thérapeutiques
et diagnostiques et compositions à base de protéines et
d'acides nucléiques Notch
(iii) NOMBRE DE SEQUENCES : 21
(iv) ADRESSE DE CORRESPONDANCE :
15 (A) DESTINATAIRE : Pennie & Edmonds
(B) RUE : 1155 Avenue of the Americas
(C) VILLE : New York
(D) ETAT : New York
(E) PAYS : Etats-Unis d'Amérique
20 (F) CODE POSTAL : 10036
(v) FORME LISIBLE PAR INFORMATIQUE :
(A) TYPE DE SUPPORT : Disquette
25 (B) ORDINATEUR : Compatible IBM PC
(C) SYSTEME D'EXPLOITATION : PC-DOS/MS-DOS
(D) LOGICIEL : Patentin Révision #1.0, Version
#1.25
30 (vi) DONNEES ACTUELLES DE LA DEMANDE :
(A) NUMERO DE DEMANDE : à assigner
131
(B) DATE DE DEPOT : à la même date
(C) CLASSIFICATION :
(viii) INFORMATIONS SUR L'AVOCAT/AGENT :
5
(A) NOM : Misrock, S. Leslie
(B) NUMERO D'ENREGISTREMENT : 18,872
(C) NUMERO DE REFERENCE/REGISTRE : 7326-Oli
10 (ix) INFORMATIONS DE TELECOMMUNICATION :
(A) TELEPHONE : 212 790-9090
(B) TELECOPIE : 212 8698864/9741
(C) TELEX : 66141 PENNIE
15
(2) INFORMATIONS SUR LA SEQ ID NO : 1 :
(i) CARACTERISTIQUES DE LA SEQUENCE :
20 (A) LONGUEUR : 2892 paires de bases
(B) TYPE : acide nucléique
(C) BRIN : double
(D) TOPOLOGIE : inconnue
25 (ii) TYPE DE MOLECULE : ADNc
(ix) CARACTÉRISTIQUE :
(A) NOM/CLE : CDS
30 (B) LOCALISATION : 142..2640
(xi) DESCRIPTION DE LA SEQUENCE : SEQ ID NO : 1
132
GAATTCGGAG GAATTATTCA AAACATAAAC ACAATAAACA ATTTGAGTAG TTCCCCCACA 60
CACACACACA CACACCCCGT GCATTATTAC ACTAAAACCG ACACTCAATC CAAAAAATCA 120
6CAACAAAAA CATCAÀTAAA C ATC CAT TGC ATT AAA TCT TTA TTA ACA CCA 171
Met 81b Trp He Lya Cye Leu Leu Thr Ala -
1 5 .10
TTC ATT TOC TTC ACA CTC ATC CTC CAO CTT CAC ACT TCC CGC ACC TTT 219
Pbe He Cye Phe Thr val He val ein Val His Ser Ser Oly Ser Phe
IS 20 25
CAO TTC CCC CTG AAG TAC TTC AOC AAC GAT CAC GGG CGC GAC AAC CAO 26?
Glu Leu Arg Leu Lys Tyr Phe 8er Aon Aep Hl» Gly Arg Aep Asn Olu
30 35 40
CCT CGC TCC TCC. ACC CGC CAO TCC GAC GCA CCG ACG CGC AAG TCC CTC 315
Gly Arg Cye Cys ser Gly Glu Ser Asp Gly Ala Thr Oly Lya Cys Leu
45 SO SS
GGC ACC TOC AAG ACC COG TTT CCC CTC TGC CTA AAG CAC TAC CAO GCC 363
Oly Ser Cye Lya Thr Arg Phe Arg Vol Cye Lau Lya Hio Tyr Oln Ala
60 65 70
ACC ATC CAC ACC ACC TCC CAC TGC ACC TAC CCG CAC CTG ATC ACO CCC 411
Thr Zle Aap Thr Thr Ser Gin Cys Thr Tyr Gly Asp Val Ile Thr Pro
75 80 85 90
ATT CTC GCC CAO AAC TCG GTC AAT CTO ACC GAC GCC CAG COC TTC CAG 459
Ile Leu Gly Glu Asn Ser Val Asn Leu Thr Aap Ala ein Arg Phe Oln
95 100 105
AAC AAG GGC TTC ACG AAT CCC ATC CAG TTC CCC TTC TCO TTC TCA TGG SO?
Aan Lys Gly Phe Tbr Aan Pre He Gin Vh« Pro Phe Ser Phe ser Trp
HO HS 120
CCG GOT ACC TTC TCO CTG ATC CTC CAG OCC TGO CAT GAT ACQ AAC AAT " S5S
Pro Gly Thr Pbe Sox Lou He Val Olu Ala Trp Hio Aap Thr Asn Asn
125 130 135
AGC GGC AAT GCC CGA ACC AAC AAC CTC CTC ATC CAO CGA CTC TTG GTC 603
Ser Gly Asn Ale Arg Thr Asn Lys Leu Leu Zle Gin Arg Leu Leu Val
140 145 150
OU/ CAC GTA CTC CAC GTC TCC TCC CAA TCG AAG ACG AAC AAO TCO OAA 651
Cln Clin Val Leu Glu Val Ser Ser Glu Tip Lys Thr Asn Lya ser Glu
155 160 165 170
TCG CAG TAC ACC TCG CTG GAG TAC GAT TTC CGT GTC ACC TGC GAT CTC 69»
Ser Gin Tyr Thr Ser Leu Glu Tyr Asp Phe Arg Val Thr Cys Asp Leu
175 180 185
AAC TAC TAC GGA TCC GCC IGT GCC AAG TTC TGC CSG CCC CGC GAC GAT 74?
Aan Tyr Tyr Gly ser Gly eye Ala Lye Ph© Cya Arg Pro Arg Aap Aap
190 195 200
TCA TTT GGA CAC TCG ACT TGC TCG GAG ACG GGC GAA ATT ATC TCT TTG 795
Sar. Phe Gly Bio Ser Thr Cya Ser Glu Thr Gly Clu Zle Zle Cys Leu
205 210 215
ACC CGA TGG CAG GCC GAT TAC TGT CAC ATA CCC AAA TGC GCC AAA CGC 843
Thr Gly Trp Gin Gly Asp Tyr Cys Hia He Pro Lya Cya Ala Lya Gly
220 225 230
TGT GAA CAT GGA CAT TGC GAC AAA CCC AAT CAA TGC CTT TGC CAA CTG 891
Cya Glu Hia Gly His Cys Aap Lya Pro Aan Cln Cya Val Cya Cln Leu
235 240 245 250
133
CGC TGG AAG GGA CCC TTG TGC AAC GAG TGC GTT CTG GAA CCG AAC TGC 939
Gly Trp Lya Gly Ala Leu Cya Aan Glu Cya Val Leu Glu Pro Asn Cya
25S 260 265
ATC CAT GGC ACC TGC AAC AAA CCC TSC ACT TGC ATC TOC AAC OA0 GGT 967
Ile Hie Gly Thr Cya Asn Lya Pro Trp Thr cya ne Cya Asn Glu Gly
270 275 280
TGG GGA GGC TTG TAC TGC AAC CAO GAT CTG AAC TAC TGC ACC AAC CAC . 1035
Trp Gly Gly Leu Tyr Cya Aan Oln Aap Leu Asn Tyr Cya Thr'Asn His
285 290 295
AGA CCC TGC AAG AAT GGC GGA ACC TGC TTC AAC ACC GGC GAG GGA TTG . 1083
Arg Pro cya Lye Aan Gly Gly Thr Cya Phe Aan Thr Gly Glu Gly Lau
300 30S 310
TAC ACA TCC AAA TGC OCT CCA CGA TAC AGT GCT CAT GAT TCC GAA AAT 2131
Tyr Thr cyo Lys Cys Ala Pro Gly Tyr ser cly Asp Asp Cys Glu Asn
315 320 325 330
CAG ATC TAC TCC TCC GAT CCC GAT GTC AAT CCC TOC CAC AAT CCT CCT 1179
Glu Ile Tyr Ser Cye Asp Ala A8p Val Asn Pro Cya Gin Aan Gly Gly
335 340 345
ACC TGC ATC GAT GAG CCG CAC ACA AAA ACC CGC TAC AAC TGT CAT TGC 1227
Thr Cya Zle Aap Glu Pro Hia Thr Lya Thr Gly Tyr Lys Cys Hio Cya
350 355 360
OCC AAC GCC SOG AGC GGA AAO ATG TOC GAG GAG AAA GTC CTC ACG TGT 1275
Ala Aan Gly Trp Ser Gly Lys Hat Cya Glu Glu Lys Val Leu Thr Cys
365 370 375
TÇO CAC AAA CCC TGT CAT CAC GGA ATC TCC CCC AAC CTT CGT OCT GGC 1323
Ser Asp Lys Pre Cys Bis Oln Gly Zle Cyo Arg Asn Val Arg Pro Cly
. 380 385 390
. TTC CGA ACC AAG GGT CAG GGC TAC CAG TGC GAA TCT CCC ATT GGC TAC 1371
Leu Gly Ser Lya Gly Cln Gly Tyr Cln Cye Glu Cya Pro Ile Gly Tyr
395 400 405 410
AGC CGA CGC AAC TGC CAT CTC CAC CTG GAC AAC TGC AGT CCC AAT CCA 1429
Ser Gly Pro Aan Cys Asp Leu Gin Leu Asp Aan Cys Ser Pro Aan Pro
415 420 425
TCC ATA AAC GGT CCA AGC TGT CAG -CCC AGC GCA AAG TGT ATT TGC CCA 1467
Cys He Asn Gly Cly Ser Cys Cln Pro Ser Gly Lys Cys He Cys Pro
430 .435 440
CCG GGA TTT TCG GGA ACC ACA TGC GAC ACC AAC ATT CAC GAT- TGT CTT 1515
Ala Gly Phe Ser Gly Thr Arg cys Glu Thr Asn He Aap Asp Cys Leu
445 450 455
GCC CAC CAG TGC CAG AAC GGA GGC ACC TGC ATA GAT ATG CTC AAC CAA 1563
Gly Hie Gin Cye Glu Aen Gly Gly Thr Cya Zle Aap Het Val Aan Cln
460 46S 470
TAT CGC TGC CAA TGC GTT CCC GGT TTC CAT GGC ACC ÇAC TCT ACT AGC 1611
Tyr Arg Cys Cln Cye Va). Pro Cly Phe Bis Cly Thr His Cys Ser- Ser
475 480 485 490
AAA GTT GAC TTC TGC CTC ATC ACA CCC TCT CCC AAT GGA GGA ACC TCC 1659
Lye Val Asp Leu Cys Leu Zle Arg Pro Cys Ala Asn Cly. Gly Thr Cya
495 500 505
TTG AAT CTC AAC AAC GAT TAC CAG, TGC ACC TGT CGT GCG GCA TTT ACT 1707
Leu Aan Leu Aan Aan Aap Tyr Gin cya Thr Cya Arg Ala Gly Phe Thr
510 515 520
GGC AAG GAT TGC TCT GTG GAC ATC GAT GAG TGC AGC AGT GGA CCC TGT 1755
Gly Lya Asp Cys Ser Val Asp He Asp Glu Cys Ser Ser Gly Pro Cya
325 530 535
134
CAT AAC GGC GGC ACT TGC ATG AAC CGC CTC AAT TCO TTC OAA TGC OTO 1803
Hia Aan Gly Gly Thr cya Met Aan Arg Val Aan ser Phe Glu Cya Val.
540 545 550
IGT CCC AAT GGT TTC AGG GGC AAG CAO TGC GAT GAG GAG TCC TAC GAT 1851
Cye Ala Aen 'Gly Phe Arg Gly Lya Gin Cye Aap Glu Glu Ser Tyr Aap
555 560 565 .570
TCG GTG ACC TTC GAT CCC CAC CAA TAT GGA GCC ACC ACA CAA CCG AGA 1899
Ser Val Thr Phe Aap Ala His Gin Tyr Gly Ala Thr Thr cln Ala Arg
575 580 585
CCC OAT GGT TTG ACC AAT GCC CAG GTA GTC CTA ATT GCT OTT TTC TCC 1947
Ala Asp Gly Leu Thr Asn Ala Gin Val Val Leu He Ala Val Phe Ser
590 595 600
GTT GCG ATG CCT TTC GTG GCG GTT ATT GCO GCG TGC CTO GTC TTC TCC 2995
Val Ala Met Pro Leu Val Ala Val Ho Ala Ala Cya Val Val Phe Cya
605 ' .610 61S
ATG AAG CGC AAG CGT AAG CCT GCT CAG GAA AAC GAC GAC CCG GAG GCC 2043
Het Lya Arg Lys Arg Lya Arg Ala Gin Glu Lye Aap Asp Ala Glu Ala
620 625 630 .
AGO AAG CAC AAC GAA CAO AAT GCG CTC CCC ACA ATO CAT CAC AAT CGC 2091
Arg Lya Gin Aan Glu Gin Aan Ala Val Ala Thr Met Ris Hia Aen Gly
. 635 . 640 645 650
AGT GGG GTG GGT CTA GCT TTG GCT TCA CCC TCT CTC CGC CCC AAA ACT 2139
Sor Gly val Cly Val Ala Leu Ala ser Ala Ser Leu Cly Gly Lys Thr
655 660 665
COC AGC AAC AGC GOT CTC ACC TTC GAT OOC GGC AAC CCG AAT ATC ATC 218?
Gly ser Asa Ser Gly Leu Thr Phe Asp Cly Gly Asn Pro Asn He He
670 675 680
AAA AAC ACC TCG GAC AAG TCG CTC AAC AAC ATT TGT CCC TCA GCA GCA 2235
Lys Asn Thr Trp Aap Lya ser val Aan Aan He Cya Ala sar Ala Ala
685 '690 695
GCA GCG GCG GCG GCG GCA GCA GCC GCO GAC GAG TGT CTC ATG TAC CGC 2283
Ala Ala Ala Ala Ala Ala Ala Ala Ala Asp Glu Cys Leu Met Tyr Cly
700 70S 710
CGA TAT GTG GCC TCG GTG GCG GAT AAC AAC AAT GCC AAC TCA GAC TTT 2331
Cly. Tyr val Ala Ser val Ala Asp Asn Asn Aen Ala Asn Ser Aap Phe
715 720 725 730
TGT GTG GCT CCG CTA CAA AGA GCC AAG TCG CAA AAC CAA CTC AAC ACC 2379
Cys Val Ala Pro Leu cm Arg Ala Lys ser Gin Lys oln Leu Aan Thr
735 740 745
GAT CCC ACG CTC ATG CAC CGC GGT TCC CCG GCA GGC AGC TCA OOC AAG 242?
Asp Pro Thr Leu Met Hia Arg Gly Ser Pro Ala Gly Ser Ser Ala Lys
750 75S 760
CGA GCG TCT CGC GGA GGA CCG GCA GCO GCG GAO GGC AAG ACG ATC TCT 2475
Gly Ala Sex Gly Gly Gly Pro Gly Ala Ala Glu Gly Lys Arg He Ser
765 . 770 775
GTT TTA CGC GAG CGT TCC TAC TCT AGC CAG CGT TGG CCC TCG TTG GCC 2523
Val Leu Gly Glu Gly Ser Tyr Cye Ser Cln Arg Trp Pro Ser Leu Ala
780 785 790
CCG CCG CGA GTG GCC GGA GCC TGT TCA TCC CAG C7A ATG GCT GCA GCT 2571
Ala Ala Cly val Ala Gly Ala Cys Ser Ser Gin-Leu Met Ala Ala Ala
79S 800 605 810
10
15
135
TCG GCA GCG GGC AGC GGA GCO GGG ACG GCG CAA CAG CAG CGA TCC GTG 2619
Ser Ala Ala Gly Ser Gly Ala Cly Thr Ala Gin Gin Gin Arg Ser Val
815 820 825
GTC TGC CGC ACT CCG CAT ATG TAACÏCCAAA AATCCCGAAG CGCTCCTGCT 2670
Val Cys Gly Thr Pro Hts Met
830
AAATCCGGAG AAATCCGCAT GOAGGAGCTG ACAGCACATA CACAAAGAAA ACACTGGGTT 2730
OGGTTCAAAA TGTGACAGAG A06CCAAAAT GTTGTTGTTG ATTCAAGCAG TTTACTCGTC 2790
ACGAAAAATG AAAAATCTGT AACACGCATA ACTCGTAAAC TCCCTAAAAA ATTTCTATAC 2850
TAATTACCAA AGCTGTOACC CAGCCCTTTC CATCCCGAAT TC 2892
(2) INFORMATIONS SUR LA SEQ ID NO : 2 :
(i) CARACTERISTIQUES DE LA SEQUENCE :
(A) LONGUEUR : 833 acides aminés
(B) TYPE : acide aminé
(D) TOPOLOGIE : inconnue
(ii) TYPE DE MOLECULE : protéine
(xi) DESCRIPTION DE LA SEQUENCE : SEQ ID NO : 2
Met Hie Trp Ile Lye cys Leu Leu Thr Ala Phe 21e cys Phe Thr Val
1 .5 iO 15
Ile Val Gin Val Kia Ser Ser Gly Ser Phe Glu Leu Arg Leu Lys Tyr
20 25 30
Phe Ser As» Aep Mie Gly Arg Asp Aan Glu Gly Arg Cys Cys Ser Gly
35 40 45
Glu ser Aap Gly Ala Thr Gly Lys Cys Leu Gly Ser Cye Lya Thr Ara
SO 55 60
Phe Ara Val Cya Leu Lys His Tyr Gin Ala Thr Zle Asp Thr Thr Ser
6S 70 75 80
Gin Cys Thr Tyr Gly Asp Val Zle Thr Pro Zle Leu Gly Glu Asn Ser
85 90 95
val Aon Leu Thr Asp Ala Gin Arg Phe Gin Asn Lys Gly Phe Thr Asn
100 . 105 110
Pro lie Gin Phe Pro Phe Ser Phe Ser Trp Pro Gly Ihr Phe Ser Leu
, 115 120 125
136
Zle Val Glu Ala Trp Hls Asp Thr Asn Asn Ser Gly Asn Ala Arg Thr
130 135 140
Asn Lys Leu Leu Zle Gin Arg Leu Leu Val Gin Gin Val Leu Glu Val
145 150 155 160
Ser ser Glu Trp Lys Thr Asn Lya Ser Glu ser ein Tyr Thr Ser Leu
165 170 115
Olu Tyr Aap Phe Arg Val Thr Cya Asp Leu Asn Tyr Tyr Cly Ser Gly
180 185 190
Cye Ma Lys Phe cys Arg Pro Arg Asp Asp Ser Phe Gly His Ser Thr
195 200 205
Cye Ser Glu Tbr Gly Glu Ile Zle Cys Leu Thr Gly Trp Gin Gly Aap
aiO . 215 220
Tyr Cye Ris Zle Pro Lye Cys Ala Lys Cly Cya Glu His Gly Hls Cye
225 230 235 240
Aep Lye Pro Aan Gin'Cye Val Cye Gin Leu Cly Trp Lye Oly Ala Leu
245 250 2S5
Cye Asn Glu Cys Val Leu Glu Pro Asn Cya lie Ris Gly Thr Cya Asn
260 265 270
Lye Pro Trp Thr Cya Zle Cyo Asn Glu Gly Trp Gly Gly Lee Tyr Cye
275 280 285
Aan Gin Aep Leu Aan Tyr Cyo Thr Asn Ris Arg Pro Cye Lys Aen Gly
290 295 300
Gly Thr Cys Phe Asn Thr Gly Glu Gly Leu Tyr Thr Cye Lye Cys Ala
305 310 315 320
Pro Gly Tyr ser Gly Asp Asp Cys Glu Asn Glu He Tyr ser cye Aep
325 330 335
Ala Aep Val Aan Pro Cya Gin Asn Gly Gly Thr Cys Zle Aep Glu Pro
340 345 350 .
Blo Thr Lye Thr Gly Tyr Lya Cya His Cya Ala Aon cly Trp Ser Oly
355 .360 365
Lye Met Cye Glu Glu Lys Val Leu Thr Cys Ser Aep Lys pro cye Hia
370 375 380
Cln Gly Zle Cye Arg Aen Val Arg Pro Cly Leu Gly Ser Lya Oly Oln
385 390 395 400
Gly Tyr Gin Cye Glu Cys Pro Zle Gly Tyr Ser Gly Pro Asn Cye Aep
405 . 410 415
Leu Gin Leu Aap Asn Cya Ser Pro Aan Pro Cye lie Asn Gly Gly Ser
420 425 430
Cye Gin Pro Ser Gly Lye cys lie Cya Pro Ala Gly Phe Ser Oly Thr
435 440 445
Arg Cys Glu Thr Asn Zle Aep Aep Cys Leu Gly Hie Gin Cye Glu Aen
450 455 460
Cly-Gly Thr cya lie Asp Het val Asn ein Tyr Arg Cye Gin Cye Val
465 470 475 480
137
Pro Gly Phe Rie Gly Thr Hie Cys Ser Ser Lys val Asp Leu Cye Leu
485 490 495
Zle Arg Pro Cye Ala Aen Cly Cly Thr Cya Leu Aen Leu Aen Asn Aep
500 505 510
Tyr Gin Cys Thr Cys Arg Ala Gly Phe Thr Gly Lye Asp Cys Ser Val
515 520 525
Asp Zle Asp Olu Cys Ser Ser Oly Pro Cya Hls Aan Cly Gly Thr Cys
530 535 540
Met Aen Arg Val Asn Ser Phe Glu Cys Val Cya Ala Aan Cly Phe Arg
545. 550 5S5 560
Cly Lys Gin Cye Asp Glu Glu Ser Tyr Asp Ser Val Thr Phe Asp Ala
S65 570 575
Sis Gin Tyr Cly Ala Thr Thr Gin Ala Arg Ala Asp Gly Leu Thr Aen
S80 585 590
Ala Gin'Val Val Leu Zle Ala Vâl Phe ser val Ala Het Pro Leu Val
595 600 605
Ala val Zle Ala Ala Cys val Val Phe cys Het Lye Arg Lye Arg Lys
610 615 620
Arg Ala Gin Glu Lye Asp Aep Ala Glu Ala Arg Lye Gin Aen Glu Gin
625 630 635 640
Aen Ala Val Ala Thr Met Hie Hia Aen Gly Ser Gly Val Gly Val Ala
64S 650 655
Leu Ala Ser Ala Ser Leu Gly Gly Lya Thr Gly Ser Aen Ser Cly Leu
660 665 670
Thr Phe Aep Gly Gly Asn Pro Aen Zle lie Lye Asn Thr Trp Asp Lye
.675 680 68S
Ser Val Aen Aen He Cye Ala Ser Ala. Ala Ala Ala.Ala Ala Ala Ala
690 695 700
Ala Ala Ala Aep Glu Cys Leu Met Tyr Gly Gly Tyr Val Ala Ser Val
705 710 715 720
Ala Aep Aen Asn Asn Ala Aan ser Aap Phe Cys Val Ala Pro Leu Cln
725 730 735
Arg Ala Lye Ser Gin Lya Gin Leu Aan Thr Aap Pro Thr Leu Het Hie
740 745 750
Arg Cly Ser Pro Ala Gly Ser Ser Ala Lys Cly Ala Ser Gly Gly Gly
755 760 765
Pro Gly Ala Ala Glu Gly Lye Arg Zle Ser Val Leu Gly Glu Gly Ser
770 775 780
Tyr- Cys Ser Gin Arg Trp Pro Ser Leu Ala Ala Ala Gly Val Ala Gly
785 790 795 800
Ala Cys Ser Ser Cln Leu Met Ala Ala Ala Ser Ala Ala Cly Ser Cly
805 810 - 815
138
Ala Gly Thr Ala Cln Gin Gin Arg Ser Val Val Cys Gly Thr Pro Hia
820 825 830
Met
(2) INFORMATIONS SUR LA SEQ ID NO : 3 :
5 (i) CARACTERISTIQUES DE LA SEQUENCE :
(A) LONGUEUR : 1320 paires de bases
(B) TYPE : acide nucléique
(C) BRIN : double
10 (D) TOPOLOGIE : inconnue
(ii) TYPE DE MOLECULE : ADNc
(ix) CARACTÉRISTIQUE :
15
20
(A) NOM/CLE : CDS
(B) LOCALISATION : 442..1320
(xi) DESCRIPTION DE LA SEQUENCE : SEQ ID NO : 3
CCGAGTCGAO CGCCGTGCTT CGACCGGTGA TGAGCCCCTT TTCTGTCAAC CCTAAAGATC 60
TACAAAACAT CAGCGCCTAT CAACTGGAAG TGTCAAGTCT GAACAAAACA AAAACGAGAG . 120
AAGCACATAC TAAGGTCCAT ATAAATAATA AATAATAATT GTGTGTOATA ACAACATTAT 180
CCAAACAAAA CCAAACAAAA CSAAGGCAAA 6TGGAGÀAAA TQATACAGCA TCCAGAGTAC 240
CCCCGTTATT CAGCTATCCA OACCAAGTGT ACTGTGCCAA AATAOAAACA AACAAAGGCA 300
CCAAAATCTG CATACATGGG CTAATTAAGG CTGCCCAGCG AATTTACATT TGTGTGGTGC 360
CAATCCAOAG TGAATCCGAA ACAAACTCCA TCTACATCGC CAACCAGCAT CACGCTCGCA 420
AACGCCCCCA GAATGTACAA A ATG TTT AGO AAA CAT TTT CGC CGA AAA CCA 471
He« phe Arg Lys His Pho Arg Arg Lys Pro
15 10
GCT ACG TCG TCO TCO TTG GAG TCA ACA ATA GAA TCA GCA CAC AGC CTG 519
Ala Tbr Ser Ser Ser Leu Glu Ser Thr Ile Glu Ser Ala Asp Ser Leu
15 20 25
139
GGA ATG TCC AAG AAG ACG CCG ACA AAA AGO CAC CGT CCG AGC CAT CCG 56?
Gly Het Ser Lya Lya Thr Ala Thr Lya Arg Gin Arg Pro Arg 81e Axg
30 35 40
GTA CCC AAA ATC GCG ACC CTO CCA TCG ACG ATC CGC GAT TGT CSA TCA 615
Vol Pro Lys Xle Ala Thr Leu Pro Ser Thr Zle Arg Aep Cya Arg Ser
4S 50 55
TTA AAG TCT GCC TGC AAC TTA ATT GC TTA hr?l TTA ATA CTC TTA GTC 663
Leu Lya Ser Ala Cya Asn Leu Zle Ala Leu Xle Leu Zle Leu Leu Val
60 65 70
CAT AAG ATA TCC GCA GCT GGT AAC TTC. GAG CTO GAA ATA TTA GAA ATC 711
Ris Lys Zle Ser Ala Ala Gly Asn Phe Olu Leu Glu Zle Leu Glu Zle '
75 80 .85 90
TCA AAT ACC AAC ACC CAT CIA CTC AAC GGC TAT TGC TGC CCC ATG CCA 759
Ser Aan Thr Aan Ser Hia Leu Leu Asn Gly Tyr Cya Cya Gly Het Pro
95 100 105
GCG CAA CTT AGG GCC ACC AAG ACG ATA GGC TGC TCG CCA TGC ACG ACG 80?
Ala Glu Leu Arg Ala Thr Lya Thr Zle Gly Cya Ser Pro Cya Thr Thr
110 115 120
GCA TTC CGC CTG TCC CTG AAG GAG TAC CAG ACC ACG GAG CAC GGT CCC 855
Ala Phe Arg Leu Cys Leu Lys Olu Tyr Cln Thr Thx Olu Oln Oly Ala
125 130 135
AGC ATA TCC ACC GCC TGT TCG TTT GGC AAC CCC ACC ACC AAG ATA CTG 903
Ser Zle' Ser Thr Oly Cys Ser Phe Oly Asn Ala Thr Thr Lys lie Leu
140 145 ISO
GCT CGC TCC ACC TTT CTG CTC AGC GAT CCG GGT 'GTG GGA CCC ATT GTG 951
Gly Gly Ser Ser Phe Val Leu Ser Asp pro Oly Val Gly Ala Zle Val
1S5 160 165 170
CTG CCC TTT ACG TTT CGT TGG ACG AAG TCO TTT ACG CTG ATA CTG CAC 999
Leu Pro Phe Thr Phe Arg Trp Thr Lya Ser Phe Thr Leu Zle Leu Gin
175 180 185
CCG TTG GAT ATG TAC AAC ACA TCC TAT CCA GAT GCG GAG ACG TTA ATT 1047
Ala Leu Asp Hat Tyr Asn Thr Ser Tyr Pro Aap Ala Glu Arg Leu Ile
190 195 200
GAG GAA ACA TCA TAC TCG GGC CTO ATA CTG CCG TCO CCG GAG TCC AAG 1095
Olu Glu" Thr Sex tyr Ser Gly Val Ile Leu Pro Ser Pro Glu Trp Lye
20S 210 215
ACG CTG CAC CAC ATC GGG CGC AAC GCG CCG ATC ACC TAC CGT GTC CGC 1143
Thr Leu Aap Hie Zle Oly Arg Aan Ala Arg Zle Thr Tyr Arg Val Arg
220 225 230
CTO CAA TGC GCC GTT ACC TAC TAC AAC ACG ACC TCC ACG ACC TTC TGC 1191
Val Gin eye Ala Val Thr Tyr Tyr Aen Thr Thr Cya Thr Thr Phe Cya
235 240 245 250
CGT CCG CCG GAC GAT CAG TTC GCT CAC TAC CCC TGC GCC TCC GAG GGT 1239
Arg Pro Arg Aap Aap Gin Phe Gly Hie Tyr.Ala eye Gly Ser du Gly
255 260 - 265
CAG AAG CTC TGC CTG AAT GGC TGG CAG GGC GTC AAC TGC GAG GAG GCC 1287
Gin Lye Leu Cya trau Aon Cly Trp Gin Cly Val ton Cya Glu Glu Ala
270 275 280
ATA TCC AAC CCG CGC TCC GAC CCC CTC CAC GCC 1320
Zle Cys Lyn Ala Gly Cya Aap Pro V&X Hin cly
285 290
(2) INFORMATIONS SUR LA SEQ ID NO : 4
140
(i) CARACTERISTIQUES DE LA SEQUENCE :
(A) LONGUEUR : 293 acides aminés
5 (B) TYPE : acide aminé
(D) TOPOLOGIE : inconnue
(ii) TYPE DE MOLECULE : protéine
10 (xi) DESCRIPTION DE LA SEQUENCE : SEQ ID NO : 4
Met Phe Arg Lys Ris Phe Arg Arg Lya Pro Ala Thr Ser Set Ser Leu
1 5 10 IS
Glu Ser Thr Zle Glu Ser Ala Asp Ser Leu Gly Met Ser Lys Lys Thr
20 25 30
Ala Thr Lya Arg Gin Arg Pro Arg Hia Arg Val Pro Lys Zle Ala Thr
35 40 45
Leu Pro Ser Thr Zle Arg Aap Cye Arg Ser Leu Lye Ser Ala eye Aen
50 55 60
Leu Zle Ala Leu île Leu zle Leu Leu Val Hie Lys Zle Ser Ala Ala
65 70 75 80
Gly Aan Phe Glu Leu Glu lie Leu Glu lie ser Aan Thr Aan ser Hia
85 90 95
Leu Leu Aan Gly Tyr Cys Cye Gly Het Pro Ala Glu Leu Arg Ala Thr
100 105 110
Lye Thr Zle Gly Cye Ser Pro Cys Thr Thr Ala Phe Arg Leu Cys Leu
115. 120 125
Lya Glu Tyr Gin Thr Thr Glu Gin Gly Ala ser Zle Ser Thr Gly Cys
130 135 140
Ser Phe Cly Asn Ala Thr Thr Lya Zle Leu Gly Gly Ser Ser Phe Val
145 150 . 155 160
Leu Ser Asp Pro Gly Val Gly Ala Zle Val Leu Pro Phe Thr Phe Arg
165 170 175
Trp Thr hve Ser Phe Thr Lou Zle Leu Gin Ala Lou Aep Met Tyr Aan
180 185 190
Thr Ser Tyr Pro Aep Ala Glu Arg I*u Zle Glu Glu Thr Ser Tyr Ser
195 200 205
Cly Val Zle Leu Pro Ser Pro Glu Trp Lya Thr Leu Aep Hia Zle Cly
210 215 220
141
Arg Aen Ala Arg Zle Thr Tyr Arg Val Arg Val ein Cya Ala Val Thr
225 230 235 240
Tyr Tyr Asn Thr Thr Cya Thr Thr Phe Cys Arg Pro Arg Aep Asp Gin
245 250 255
Phe Gly Hie Tyr Alar-'Cye Gly Ser Glu Cly Gin Lya Leu eye Leu Asn
260 265 270
Gly Trp Gin Oly Val Aen Cys Glu Olu Ala lie Cys lye Ala Gly Cys
275 280 285
Aap Pro Val Hie Gly
29Q
(2) INFORMATIONS SUR LA SEQ ID NO : 5 :
5 (i) CARACTERISTIQUES DE LA SEQUENCE :
(A) LONGUEUR : 267 paires de bases
(B) TYPE : acide nucléique
(C) BRIN : double
10 (D) TOPOLOGIE : inconnue
(ii) TYPE DE MOLECULE : ADNc
(xi) DESCRIPTION DE LA SEQUENCE : SEQ ID NO : 5 :
15
COGTCQACTT CCTTCGTGTA TTGCTGCCAG OCCTCGGGAA CGGGGGGTAA CACTCAAAGG 60
TCGAGTACCC ATTTCCGTCA TAACGGGTTG GTC6CCCCCT AGGGCTCGGA GTCAGGTGGA 120
CGGCAGGTCG ACAACGCCCG GGGGACGGGT CGTACATGCT GTAACGTCTT TACCGGACCG 180
GGCAAACGOO TCACACCGAA AGCGGTGAAC GGTAACTACC GGCTCGTCCT GCCCCTCCAT 240
CGAGTCTCGT AAGAGGGTCG CCTTAAC 267
(2) INFORMATIONS SUR LA SEQ ID NO : 6 :
20 (i) CARACTERISTIQUES DE LA SEQUENCE :
(A) LONGUEUR : 574 paires de bases
142
(B) TYPE : acide nucléique
(C) BRIN : double
(D) TOPOLOGIE : inconnue
5 (ii) TYPE DE MOLECULE : ADNc
(xi) DESCRIPTION DE LA SEQUENCE : SEQ ID NO : 6 :
GAATTCCTTC CATTATACGT GACTTTTCTG AAACTGTAGC CACCCTAGTG TCTCTAACTC 60
CCTCTGGAGT TTCTCACCTT TCGTCTTTTC AAACACCAGG CTCTCTTCAA CCTCCTTAAT 120
GCGGGCATGC TCCAGTTTGO TCTCCGTCTC AAGATCACCT TTCCTAATTG ATTCTTCTTC 180
AACCCGGAAC TGAACÇCTGG CTCTCACCCT CTAGGCAGAG CAGCAATTCC GACCTGGATC 240
TOTTAOATGT GAATGTCCGT GCCCCA6ATG GCTGCACCCC ATTGATCTTG GCTTCTCTCC 300
GAGGAGGCAC CTCAGATTTC ACTGATGAAC ATCAAGATCC AGACGACTGT TCTGCTAACA 360
TCATCACAGA CTTCGTCTAC CACCCTCCCA GCCTCCAGNC CAGACAGACC CGACTCOTCA 420
OATOGCCCTG CACCTTCCAO CCCGCTACTC ACCGGCTGAT CCTGCCAAGC GTCTCCTGCA 480
TCCAGGTGCA GATGCCAATG CCCAGGACAA CATCGCCCCC TCTCCACTCC ATGCTGCACT 540
CGCAC6TGAT GCCAAGGTGT ATTCAGATCT CTTA 574
10
(2) INFORMATIONS SUR LA SEQ ID NO : 7 :
(i) CARACTERISTIQUES DE LA SEQUENCE :
15 (A) LONGUEUR : 295 paires de bases
(B) TYPE : acide nucléique
(C) BRIN : double
(D) TOPOLOGIE : inconnue
20 (ii) TYPE DE MOLECULE : ADNc
(xi) DESCRIPTION DE LA SEQUENCE : SEQ ID NO : 7 :
143
TCCAGATTCT CATTCGCAAC CCACTAACTG ATCTAGATGC CAOGATGAAT GATGOTACTA 60
CACCCCTGAT CCTCGCTGCC CCCCTGCCTC TGGAGCGAAT CCTGCCAGAA CTGATCAACT 120
GCCAAGCGGA TGTGAATCCA CTGCATGACC ATGGAAAATC TCCTCTTCAC TCGCCAGCTO . 180
CTOTCAATAA TGTGCACCCA ACTCTTTTGT TGTTGAAAAA TGCGGCCAAC COAGACATOC 240
AGGACAACAA GGAACAGACA CCTCTGTTTC TTGCTCCCCC CGAGGAGCTA TAAOC 295
(2) INFORMATIONS SUR LA SEQ ID NO : 8 :
5 (i) CARACTERISTIQUES DE LA SEQUENCE :
(A) LONGUEUR : 248 paires de bases
(B) TYPE : acide nucléique
(C) BRIN : double
10 (D) TOPOLOGIE : inconnue
(ii) TYPE DE MOLECULE : ADNc
(xi) DESCRIPTION DE LA SEQUENCE : SEQ ID NO : 8 :
15
20
CAATTCCATT CAGGAGGAAA CCGTCGGCAC AGAAGCACCC ACCCACTTTC CCGTCCCTGG 60
ACTCOTTCCC AGGTGCCTCC ACCGCCAGCT GTGACCGCCG CAOGTGCCGG CGGAGTGCCA 120
TTCAGAAAAT TCCACAAAAC CCCTACCCCA ACTCGGACGC CAACCTCACA CCCGTGCCTA 180
GCAACTGGCA CACAAACACC CAGCGTGTCT GGGGCACGGG GGGATGGCAC CCCCTCCAGG 240
CACACCTG 248
(2) INFORMATIONS SUR LA SEQ ID NO : 9 :
(i) CARACTERISTIQUES DE LA SEQUENCE :
(A) LONGUEUR : 323 paires de bases
(B) TYPE : acide nucléique
25 (C) BRIN : double
(D) TOPOLOGIE : inconnue
144
(ii) TYPE DE MOLECULE : ADNc
(xi) DESCRIPTION DE LA SEQUENCE : SEQ ID NO : 9 :
5
TACGTATCTC OAGCACAGAC ACCTGACOTA CACTTTTNNA OTGCGACGGA CATTCGTCCG 60
ACCAGTACGA ACATTTAGGC TCAGTACGGT AGCTCCATGG CCAAGACTAG GAGACGTAGG 120
CAGCTACAGG TCCCCCTCGC TAAACTCGGA CCACTGAAAC CTCCGGTCGA CAOTCGCTAA 180
GCGAACAAGA GGGCCAGATC TTAGAGAAGG TGTCGCGGCG AGACTCGGCC TCGGGTCAGG 240
CCGCCTTAAC GACGTCGGGC CCNNNACGTC ATCAAGATCT CGNCNCGCCG GGCGCCACCT 300
COAGGHCCAA AACAAGGGAA ATC 323
(2) INFORMATIONS SUR LA SEQ ID NO : 10 :
10 (i) CARACTERISTIQUES DE LA SEQUENCE :
(A) LONGUEUR : 3234 paires de bases
(B) TYPE : acide nucléique
(C) BRIN : double
15 (D) TOPOLOGIE : inconnue
(ii) TYPE DE MOLECULE : ADNc
(ix) CARACTÉRISTIQUE :
20
25
(A) NOM/CLE : CDS
(B) LOCALISATION : 1..3234
(xi) DESCRIPTION DE LA SEQUENCE : SEQ ID NO : 10
TGC CAG GAG GAC GCG GGC AAC AAG GTC TGC AGC CTO CAO TGC AAC AAC 48
Cya Gin Glu Aep Ala Cly Aan Lye Val Cye Ser Leu Cln Cys Asn Asn
1 S 10 15
145
CAC GCG TGC GGC TGG GAC GGC GGT GAC TGC TCC CTC AAC TTC AAT GAC 96
Hie Ala Cys Cly Trp Aap Gly Gly Aep Cye Ser Leu Aon Phe Asn Aep
20 25 30
CCC TGG AAC AAC TCC ACC CAG TCT CTG CAG TGC TCC AAC TAC TTC AGT 144
Pro Trp Lys Asn Cys Thr Oln 3er Leu Gin Cys Trp Lys Tyr Phe Ser
35 40 45
CAC GCC CAC TCT GAC AOC CAG TCC AAC TCA CCC CGC TCC CTC TTC GAC 192
Aap Gly Hls Cys Asp Ser Gin Cys Aan Ser Ala Gly Cya Leu Phe Aap
50 55 60
GGC TTT GAC TGC CAG CGT GCG GAA GGC CAG TGC AAC CCC CTG TAC GAC 240
Cly Phe Aap Cya.Gin Arg Ala Clu Cly Gin Cya Aen Pro Leu Tyr Asp
65 70 75 80
CAG TAC TGC AAG GAC CAC TTC AGC GAC GGG CAC TGC GAC CAG CGC TCC 288
Cln Tyr Cys Lys Asp His Phe Ser Asp Cly His Cys Asp Gin Cly Cye
85 90 9S
AAC ACC GCG GAG TGC CAG TGG GAC GCG CTC GAC TGT CCG GAG CAT CTA 336
Asn ser Ala Glu cyo Glu Trp Aap Gly Leu Asp cya Ala Glu Hia val
100 10S 110
COC GAG ACG CTO CCG GCC CGC ACG CTG CTC GTG GTG GTG CTG ATC CCG 384
Pro Clu Arg Leu Ala Ala Oly Thr Leu Val Val Val Val Leu Het Pro
115 120 225
CCG GAG CAG CTG CGC AAC AGC TCC TTC CAC TTC CTG CCG GAG CTC AGC 432
Pro Olu Gin Leu Arg Asn Sor Ser Phe His Phe Leu Arg Glu Leu Ser
130 135. 140
CGC GTC CTG CAC ACC AAC GTC GTC TTC AAG CGT GAC GCA CAC CGC CAG 480
Arg Val Leu His Thr Asn Val val Phe Lye Arg Asp Ala Hia Gly Gin
145 150 155 160
CAG ATG ATC TTC CCC TAC TAC GGC CGC GAG GAG GAG CTC CGC AAG CAC 528
Gin Met Zle Phe Pro Tyr Tyr Gly Arg Glu Clu Glu Leu Arg Lys Hia
16S 170 17S
CCC ATC AAC CCT GCC GCC GAG GGC TCC GCC CCA CCT GAC CCC CTG CTG 576
Pro Zle Lya Arg Ala Ala Glu Cly Trp Ala Ala Pro Aap Ala Leu Leu
180 185 190
GGC CAG GTG AAG GCC TOG CTG CTC CCT GCT GGC ACC GAG GGT GGG CCG 624
Gly Cln Val Lya Ala Sar Leu Leu Pro Gly Gly Ser Glu Gly Cly Arg
195 200 205
CCG CCG AGG GAG CTG GAC CCC ATG GAC GTC CGC CGC TCC ATC GTC TAC 672
Arg Arg Arg Clu Leu Aap Pro Het Asp Val Arg Gly Ser Xle Val Tyr
210 215 220
CTG GAG ATT GAC AAC CGC CAG TGT CTG CAG GCC TCC TOS CAO TGC TTC 720
Leu Clu Zle Asp Asn Arg Gin Cys Val Cln Ala Ser Ser Gin Cys Phe
225 230 235 240
CAG AGT GCC ACC CAC GTG GCC GCA TTC CTC GGA GCC CTC GCC TCC CTC 768
Gin Ser Ala Thr Asp val Ala Ala Pha Leu Gly Ala Leu Ala Ser Leu
245 250 255
GGC AGC CTC AAC ATC CCC TAC AAG ATC GAC GCC CTG CAO ACT GAC ACC 816
Gly Ser Leu Aen Ile Pro Tyr Lys Zle Glu Ala val Gin ser Glu Thr
260 265 270
CTG GAC CCG CCC CCG CCG GCG CAG CTG CAC TTC ATG TAC CTG GCO GCG 864
val Glu Pro Pro Pro Pro Ala Gin Leu His Pha Hat Tyr val Ala Ala
275 280 285
146
GCC GCC TTT GTG CTT CTC TTC TTC GTG GGC TGC GCG GTG CTC CTG TCC 912
Ala Ala Phe Val Leu Leu Phe Phe Val Cly Cys Cly Val Leu Leu Sor
290 295 300
CGC AAG CGC CGC CGG CAG CAT GCC CAG CTC TGC TTC CCT CAC CGC TTC 960
Arg Lye Arg Arg Arg Cln His cly Gin Leu Trp Phe Pro clu Gly Phe
305 310 315 320
AAA CTG TCT GAG GCC ACC AAC AAG AAG CCC CGG GAG CCC CTC GGC CAG 1008
Lya val Ser Clu Ala ser Lya Lys Lya Arg Arg Glu Pro Leu cly Clu
32S 330 33S
CAC TCC GTG GGC CTC AAG CCC CTG AAG AAC GCT TCA CAC GGT GCC CTC 1056
Asp Ser Val Gly Leu Lye Pro Leu Lys Asn Ala ser Asp Gly Ala Leu
340 345 350
ATG GAC GAC AAC CAG AAT GAG TGG GCG GAC GAG GAC CTG GAG ACC AAG 1104
Met Asp Asp Aan Gin Aan Glu Trp Gly Asp Clu Asp Leu Glu Thr Lye
355 360 365
AAO TTC CGG TTC GAG GAG CCC GTG GTT CTG CCT GAC CTG GAC GAC CAG 1152
Lye Phe Arg Phe Glu Glu Pro Val Val Leu Pro Asp Leu Asp Asp Gin
370 375 380
ACA GAC CAC CGC CAC TGG ACT CAG CAG CAC CTC CAT CCC CCT GAC CTC 1200
Thr Asp His Arg Gin Trp Thr .Cln Gin His Leu Asp Ala Ala Asp Leu
385 390 395 400
CGC ATG TCT GCC ATG GCC CCC ACA CCG CCC CAG CCT GAG GTT GAC GCC 1248
Arg Het Ser Ala Met Ala Pro Thr Pro Pro Cln Gly Glu val Aap Ala
405 410 415
GAC TGC ATG GAC GTC AAT GTC CGC CGG CCT GAT GCC TTC ACC CCG CTC 1296
Aap Cyo Het Asp Val Asn Val Arg Gly Pro Asp Gly Phe Thr Pro Leu
420 425 430
ATG ATC GCC TCC TGC AGC GCG GGC GGC CTC GAG ACG GGC AAC AGC GAG 1344
Het Zle Ala 6er Cye Ser Gly Gly Gly Leu Clu Thr Gly Asn Ser Glu
435 440 445
GAA GAG GAC GAC GCG CCG GCC GTC ATC TCC GAC TTC ATC TAC CAG GCC 1392
Glu Glu Glu Asp Ala Pro Ala Val lie Ser Asp Phe Zle Tyr Gin Gly
450 455 460
GCC AGC CTG CAC AAC CAG ACA GAC CGC ACC GCC GAG ACC GCC TTG CAC 1440
Ala Ser Leu Hie Asn Gin Thr Asp Arg Thr Gly Glu Thr Ala Leu His
465 470 475 480
CTG CCC GCC CGC TAC TCA CGC TCT GAT GCC GCC AAG CCC CTG CTG GAG 1488
Leu Ala Ala Arg Tyr Ser Arg Ser Asp Ala Ala Lys Arg Leu Leu Glu
485 490 495
GCC ACC CCA CAT CCC AAC ATC CAG GAC AAC ATC CGC CGC ACC CCC CTG 1536
Ala Ser Ala Asp Ala (Aan Zle Gin Aep Asn Het Gly Arg Thr Pro Leu
500 SOS 510
vCAT CCG GCT GTC TCT GCC GAC GCA CAA CGT GTC TTC CAG ATC CTG ATC 1584
Hia Ala Ala Val Ser Ala Aap Ala Gin Gly Val Phe Gin Zle Leu Ile
SIS 520 525
CGG AAC CGA GCC ACA GAC CTG GAT GCC CGC ATC CAT GAT GGC ACG ACG 1632
Arg Aen Arg Ala Thr Aap Leu Asp Ala Arg Het Hia Aap Gly Thr Thr
530 535 540
CCA CTG ATC CTG GCT CCC CGC CTC GCC GTG CAG CGC ATG CTC GAG GAC 1680
Pro Leu Zle Leu Ala Ala Arg Leu Ala Val Glu Gly Ket Leu Glu Aap
545 550 555 560
CTC ATC AAC TCA CAC CCC GAC GTC AAC GCC CTA GAT GAC CTG CGC AAC 1728
Leu Zle Aan Ser Hia Ala Aap val Asn Ala Val Asp Asp Leu Gly Lya
565 570 575
147
TCC GCC CTG CAC TGG GCC GCC CCC CTC AAC AAT CTG GAT CCC CCA GTT 1776
Ser Ala Leu Bis Trp Ala Ala Ala Val Asn Asn Val Asp Ala Ala Val
580 . SCS 590
GTG CTC CTO AAG AAC CGG CCT AAC AAA CAT ATG CAG AAC AAC ACG CAG 1824
Val Leu Leu Lye Asn Oly Ala Asn Lys Asp Met Gin Asn Aan Arg Glu
595 600 60S
GAC ACA 'CCC- CTG TTT CTC GCC GCC CGC .GAC CGC ACC TAC GAG ACC CCC 1872
Clu Thr Pro Leu Phe Leu Ala Ala Arg Glu Gly Ser Tyr Glu Thr Ala
610 615 620
AAC CTG CTG CTC GAC CAC TTT GCC AAC CCG GAC ATC ACC CAT CAT ATC 1920
Lya Val Leu Leu Asp Ris Phe Ala Aon Arg Asp lie Thr Asp Hie Het
625 630 635 640
OAC CGC CTO CCG CGC CAC ATC GCA CAO GAG CGC ATG CAT CAC GAC ATC 1968
Aop Arg Leu Pro Arg Aep Zle Ala Cln Clu Arg Het Hia Hia Asp Zle
645 650 655
CTC AGO CTG CTC GAC CAO TAC AAC CTC GTG CGC AGC CCG CAO CTG CAC 2016
Val Arg Leu Leu Aap Clu Tyr Aan Leu Val Arg Ser Pro Gin Leu Hie
660 565 670
GCA CCC CCC CTG CCC CCC ACG CCC ACC CTG TCG CCC CCG CTC TGC TCC 2064
Gly Ala Pro Leu Gly Gly Thr Pro Thr Leu Ser Pro Pro Leu Cys Ser
673 680 685
CCC AAC CGC TAC CTC CCC ACC CTC AAC CCC CCC CTC CAC CGC AAC AAC 2112
Pro Asn Cly Tyr Leu Cly Ser Leu Lya Pro Cly Val Oln Gly Lya Lys
690 69S 700
CTC CCC AAC CCC ACC ACC AAA OOC CTO CCC TGT GGA A0C AAO CAS GCC 2160
Val Arg Lya Pro Ser Ser Lye Cly Leu Ala Cys Cly Ser Lyo Clu Ala
705 710 715 720
AAG CAC CTC AAC CCA CCG AGC AAG AAG TCC CAG CAT CGC AAG GGC TGC 2208
Lys Aap Leu Lys Ala Arg Arg Lya Lys Ser Cln Asp Cly Lyo Gly Cya
725 730 735
CTO CTO CAC AGC TCC CCC ATG CTC TCG CCC CTG GAC TCC CTG GAG TCA 2256
Leu Leu Asp Ser Ser Gly Ket Lau Ser Pro Val Asp Ser Leu Clu Ser
740 745 750
CCC CAT CGC TAC CTG TCA GAC GTG GCC TCG CCC CCA CTG CTG CCC TCC 2304
Pro His Gly Tyr Leu ser Asp Vol Ala Ser Pro Pro Leu Leu Pro S«r
755 760 765
CCG TTC CAC CAC TCT CCC TCC CTC CCC CTC AÀC CAC CTG CCT CGC ATC 2352
Pro Phe Gin Gin Ser fro Ser val Pro Leu Aon Hia Leu Pro Cly Hot
770 77S 760
CCC CAC ACC CAC CTC CCC ATC CCC CAC CTO AAC CTC CCC CCC AAC CCC 2400
Pro Aap Thr Hia Leu Gly IIa Cly Hie Leu Aan Val Ala Ala Lya Pro
785 790 795 800
GAC ATO GCO GCO CTO CCT COG GGC CGC CGO CTO OCC TTT OAO ACT GGC 2448
Glu Hat Ala Ala Leu Cly Gly Cly Cly Arg Leu Ala Phe Glu Thr Cly
80S BIO 815
CCA CCT CGT CTC TCC CAC CTC CCT GTG GCC TCT GGC ACC AGC ACC GTC 2496
Pro Pro Arg Lou Ser His Leu Pro Val Ala Ser Gly Thr Ser Thr val
820 825 830
CTC CGC TCC ACC ACC GGA CCC GCC CTG AAT TTC ACT CTC CGC GCC TCC 2544
Leu Gly Ser Ser Ser Oly Oly Ala Leu Asn Phe Thr Val Gly Gly ser
835 840 845
ACC ACT TTC AAT CCT CAA TGC CAC TCG CTC TCC CCG CTC CAC AGC GCC 2592
Thr ser Leu Aan Cly Gin eye clu Trp Leu ser Arg Leu Cln Ser Cly
8S0 855 860
ATC GTG CCC AAC CAA TAC AAC CCT CTC CGG GGG AGT GTC GCA CCA GGC 2640
Het Val Pro Aen Cln Tyr Aon Pro Leu Arg Cly Ser Val Ala Pro. cly
865 870 875 680
148
CCC CTG AGC ACA CAG GCC CCC TCC CTC CAC CAT GGC ATG GTA GCC CCG 2688
Pro Leu Ser Thr Gin Ala Pro Ser Leu Gin Hia Gly Het Val Gly Pro
885 890 895
CTG CAC AGT ACC CTT CCT GCC AGC GCC CTG TCC CAC ATG ATG ACC TAC 2736
Leu Hie ser Ser Leu Ala Ala Ser Ala Leu Ser Gin Het Het Ser Tyr
900 905 910
CAG CGC CTG CCC AGC ACC CGG CTO GCC ACC CAO CCT CAC CTO OTG CAG 2784
Oln Gly Leu Pro Ser Thr Arg Leu Ala Thr Gin Fro Hia Leu Val Gin
915 920 925
ACC CAO CAO GTG CAO CCA CAA AAC TTA CAG ATC CAO CAC CAG AAC CTO 2832
Thr Cln Gin Val Gin Pro Gin Asn Leu Gin Hot Gin Cln Cln Asn Leu
930 935 940
CAG CCA GCA AAC ATC CAC CAC CAC CAA ACC CTG CAO CCC CCA CCA CCA 2880
Gin Pro Ala Aan Zle Gin ein ein Gin Ser Leu Gin Pro Pro Pro Pro
945 950 955 960
CCA CCA CAG CCC CAC CTT CGC GTG AGC TCA GCA CCC AGC OOC CAC CTC 2928
Pro Pro Gin Pro His Leu Gly Val Ser Ser Ala Ala Ser Cly His Leu
965 970 975
CGC CCO ACC TTC CTO AGT GGA OAG CCC AGC CAC CCA CAC GTG CAG CCA 2976
Gly Arg Ser Phe Leu Ser Gly Clu Pro Ser Gin Ala Asp Val Gin Pro
980 985 990
CTC CGC CCC AGC AGC CTG CCG GTG CAC ACT ATT CTG CCC CAG GAC AGC 3024
Leu Gly Pro Ser Ser Leu Ala Val Hie Thr Zle Leu Pro Cln Glu Ser
995 1000 100S
CCC GCC. CTG CCC ACG TCG CTG CCA TCC TCG CTG CTC CCA CCC GTG ACC 3072
Pro Ala Leu Pro Thr Ser Leu Pro Ser Ser Leu Val Pro Pro Val Thr
1010 10 IS 1020
GCA GCC CAG TTC CTC ACG CCC CCC TCC CAC CAC AGC TAC TCC TCG CCT 3120
Ala Ala Gin Phe Leu Thr. Fro Pro Ser Oln His Ser Tyr Ser Ser Pro
1025 1030 1035 1040
GTC GAC AAC ACC CCC AGC CAC CAG CTA CAC CTG CCT GTT CCT CTA ATG 3168
Val Asp Asn Thr Pro Ser Hie Oln Leu Cln Val Pro Val Pro Val Het
1045 105O 1055
GTA ATG ATC CGA TCT TCG GAT CCT TCT AAA GGC TCA TCA ATT~TTC ATC 3216
Val Hat Zle Arg Ser Ser Asp Pro Ser Lys Gly Ser Ser Zle Leu Zle
1060 1065 1070
GAA CCT CCC GAC TCA TGG 3234
Olu Ala Pro Aap Ser Trp
1075
(2) INFORMATIONS SUR LA SEQ ID NO : 11 :
(i) CARACTERISTIQUES DE LA SEQUENCE :
(A) LONGUEUR : 1078 acides aminés
(B) TYPE : acide aminé
(D) TOPOLOGIE : inconnue
10
(ii) TYPE DE MOLECULE : protéine
149
(xi) DESCRIPTION DE LA SEQUENCE : SEQ ID NO : 11
Cye Gin Glu Asp Ala Gly Aan Lys Val Cya Ser Leu Gin Cya Asn Aan
1 S 10 is
Rie Ala Cye Gly Trp Asp Gly Ci y Asp Cys Ser Leu Aan Phe Aan Aep
20 25 30
Pro Trp Lye Asn Cys Thr Cln Ser Leu Gin Cya Trp Lye Tyr Phe Ser
35 40 45
Aep Cly Rie Cys Asp Ser Cln Cye Aan Ser Ala Gly Cye Leu Phe Asp
50 SS 60
Gly Phe Aep Cya Cln Arg Ala Cl« Gly Gin Cya Aen Pro Leu Tyr Aep
65 70 75 80
Cln Tyr Cye Lys Asp Hie Phe Ser Aap Cly Hie cya Aap Cln Gly Cye
85 90 95
Aen Ser Ala Clu Cys Glu Trp hap Gly Leu Asp Cya Ala Glu Rie Val
100 105 110
Pro Glu Arg Leu Ala Ala Cly Thr Lett Val Val Val Val Leu Met Pro
115 120 125
Pro Glu Gin Leu Arg Aen Ser Ser Phe His Phe Leu Arg Clu Leu Ser
130 135 140
Arg Val Leu Rie Thr Aen Val Val Phe Lya Arg ABp Ala Rie Giy Cln
145 150 ISS 160
Gin Het Zle Phe Pro Tyr Tyr Gly Arg Glu Clu Glu Leu Arg Lye Ria
165 170 175
Pro lie Lys Arg Ala Ala Glu Cly Trp Ala Ala Pro Asp Ala Leu Leu
ISO 185 190
Gly Cln Val Lye Ala Ser Leu Leu Pro Gly Cly Ser Clu Cly Gly Are
195 200 205
Arg Arg Arg Glu Leu Aep Pro Met Aap Val Arg Gly Ser Ile Val Tyr
210 215 220
Leu Clu lie Aep Aen Arg Gin Cye Val Gin Ala ser Ser Gin Cya Phe
225 230 235 240
Gin Ser Ala Thr Aep Val Ala Ala Phe Leu Cly Ala Leu Ala Ser Leu
245 250 255
Gly Ser Leu Asn Zle Pro Tyr Lya Zle Clu Ala Val Gin Ser Glu Thr
260 265 270
Val Clu Pro Pro Pro Pro Ala Cln Leu Hia Phe Het Tyr Val Ala Ala
275 280 285
Ala Ala Phe Val Leu Leu phe Phe Val Cly Cys Gly Val Leu Leu Ser
290 295 300
Arg Lya Arg Arg Arg Gin His Cly cln Leu Trp phe Pro Glu Gly Phe
305 310 315 320
150
Lye Val Ser Glu Ala Ser Lya Lya Lye Arg Arg Glu Pro Leu Gly clu
325 330 335
Aap Ser Val Cly Leu Lye Pro Leu Lys Asn Ale Ser Aap Cly Ala Leu
340 345 350
Het. Aap Aap Aan Cln Aan Glu Trp Gly Aap Glu Asp Leu Clu Thr Lya
355 360 365
Lye Phe Arg Phe clu clu Pro Val val Leu Pro Aap Leu Aap Aap oln
370 375 380
Thr Aap His Arg Gin Trp Thr Gin Gin His Leu Asp Ala Ala Asp Leu
385 390 395 400
Arg Met ser Ala Het Ala Pro Thr Pro Pro ein Cly clu val Aep Ala
405 410 415
Aep Cya Hei Aep Vol Aen Val Arg Giy Pro Aep Oly Phe Thr Pro Leu
420 42S 430
Met lie Ala Ser Cye Ser Gly Gly Gly Leu Glu Thr Cly Asn Ser Glu
435 440 445
Glu Clu Clu Aep Ala Pro Ala Val Zle ser Aap Phe lie Tyr Gin Gly
450 ' 455 460
Ala Ser Leu Ria Asn Cln Thr Aap Arg Thr Cly Clu Thr Ala Leu Hie
465 470 475 480
Leu Ala Ala Arg Tyr Ser Arg Ser Aep Ala Ala Lye Arg Leu Leu Glu
485 490 49S
Ala ser Ala Aep Ala Aen Ile Gin Aap Asn Met Gly Arg Thr Pro Leu
500 SOS 510
Rie Ala Ala Val ser Ala Asp Ala Cln Gly Val Phe Cln Zle Leu Zle
515 520 525
Arg Aen Arg Ala Thr Aap Leu Asp Ala Arg Het Hie Asp Gly Thr Thr
530 535 540
Pro Leu Zle Leu Ala Ala Arg Leu Ale Val Clu Gly Met Leu Glu Asp
545 550 5S5 560
Leu zie Aan Ser Hie Ala Aep Val Aan Ala val Asp Aap Leu Cly Lye
S6S 570 575
Ser Ala Leu His Trp Ala Ala Ala Val Aan Aen val Aap Ala Ala Val
580 585 590
Val Leu Leu Lye Aen Cly Ala Asn Lya Aap Met Gin Aan Asn Arg Glu
595 600 60S
Glu Thr Pro Leu Phe Leu Ala Ala Arg Clu Cly Ser Tyr Glu Thr Ala
610 61S 620
Lye Val Leu Leu Aap Hie Phe Ala Asn Arg Aap lie Thr Asp Hia Het
625 630 635 640
Aap Arg Leu Pro Arg Aep Zle Ala Gin Glu Arg Hat Hie Hia Aap Zle
645 650 655
Val Arg Leu Leu Aap Glu Tyr Aan Leu Val Arg Ser Pro Gin Leu Hie
660 665 670
151
Oly Ala Pro Leu cly Giy Thr Pro Thr Leu ser Pro Pro Leu eye Ser
675 680 685
Pro Aen Gly Tyr Leu Cly Ser Leu Lys Pro Gly Val Gin Gly Lys Lya
690 695 700
Val Arg Lye Pro ser Ser Lye Gly Leu Ala Cye Gly Ser Lye Glu Ala
705 710 71S 720
Lye Aep Leu Lye Ala Arg Arg Lye Lye Ser Gin Asp Gly Lye Gly eye
72S 730 735
Leu Leu Aep Ser Ser Gly Met Leu Ser Pro Val Asp Ser Leu Clu Ser
740 745 750
pro Hie Gly Tyr Leu ser Aep Val Ala Ser Pro Pro Leu Leu Pro Ser
755 760 765
Pro Phe oln Gin Ser Pro Ser Val Pro Leu Asn Hie Leu Pro Gly Met
770 775 780
Pro Aep Thr Hie Leu Cly Zle Cly His Leu Aen Val Ala Ala Lye Pro
785 790 795 600
Glu Met Ala Ala Leu Gly Gly Gly Gly Arg Leu Ala Phe Glu Thr cly
805 810 81S
Pro Pro Arg Leu Ser Hie Leu Pro Val Ala Ser Gly Thr Ser Thr Val
820 825 830
Leu Gly Ser Ser Ser Gly Gly Ala Leu Aen Phe Thr Val Gly Gly Ser
835 840 845
Thr Ser Leu Aen Gly Gin Cys Olu Trp Leu Ser Arg Leu Gin Ser Giy
850 855 860
Met Val Pro Aen Cln Tyr Asn Pro Leu Arg Gly Ser Val Ala Pro Gly
665 870 875 880
Pro Leu Ser Thr Gin Ala Pro ser Leu Gin His Gly Met Val Gly pro
885 890 895
Leu Rie Ser Ser Leu Ala Ala Ser Ala Leu Ser Gin Met Met Ser Tyr
900 905 910
Cln Cly Leu Pro Ser Thr Arg Leu Ala Thr Gin Pro Hie Leu- Val Cln
915 920 925
Thr Gin Gin Val Gin Pro Gin Aan Leu Cln Met Cln Gin Cln Aen Leu
930 935 940
Gin Pro Ala Asn Zle Gin Gin Gin Gin Ser Leu Gin Pro Pro Pro Pro
945 950 955 960
Pro Pro Gin Pro Hie Leu Gly Val Ser ser Ala Ala Ser Gly Hia Leu
965 970 975
Gly Arg ser Phe Leu Ser Gly Glu Pro ser Gin Ala Asp Val Gin Pro
980 985 990
Leu Gly Pro Ser Ser Leu Ala Val Hia Thr Zle Leu Pro Gin Glu Ser
995 1000 1005
152
Pro Ala Leu Pro Thr Ser Leu Pro Ser ser Leu Val Pro Pro Val Thr
1010 1015 1020
Ala Ala Gin Phe Leu Thr Pro Pro Ser Gin His Ser Tyr Ser Ser Pro
1025 1030 1035 1040
Val Aep Asn Thr Pro Ser Hie Gin Leu Cln Val Pro Val Pro Val Met
1045 1050 105S
Val Met Zle Arg Ser Ser Asp Pro Ser Lya Gly Ser Ser lie Leu He
1060 1065 1070
Glu Ala Pro Asp Ser Trp
1075
(2) INFORMATIONS SUR LA SEQ ID NO : 12 :
5 (i) CARACTERISTIQUES DE LA SEQUENCE :
(A) LONGUEUR : 4268 paires de bases
(B) TYPE : acide nucléique
(C) BRIN : double
10 (D) TOPOLOGIE : inconnue
(ii) TYPE DE MOLECULE : ADNc
(ix) CARACTÉRISTIQUE :
15
20
(A) NOM/CLE : CDS
(B) LOCALISATION : 2..1972
(xi) DESCRIPTION DE LA SEQUENCE : SEQ ID NO : 12
G CAC GTC GAT GTC TTA CAT CTG AAT GTC CGT GCC CCA CAT CGC TCC 46
Glu Val Aap Val Leu Aap Val Asn Val Arg Gly Pro Asp Gly Cyo
15 10 15
ACC CCA TTG ATG TTC GCT TCT CTC CGA CGA GGC ACC TCA CAT TTC ACT 94
Thr Pro Leu Het Leu Ala Ser Leu Arg Gly Gly Ser Ser Aap Leu ser
20 25 30
GAT GAA GAT GAA GAT GCA GAG OAC TCT TCT GCT AAC ATC ATC ACA GAC 142
Aap clu Aep Glu Aap Ala Clu Aap Ser Ser Ala Aen Zle zle Thr Aap
35 40 45
153
TTC GTC TAC CAG GGT GCC AGC CTC CAG GCC CAG ACA GAC CGG ACT GCT 190
Leu val Tyr Gin Gly Ala Ser Leu Gin Ala Gin Thr Aap Arg Thr Oly
50 55 60
GAG ATG GCC CTG CAC CTT OCA GCC CGC TAC TCA CGG GCT CAT GCT GCC 238
Olu Met Ala Leu His Leu Ala Ala Arg Tyr Ser Arg Ala Asp Ala Ala
65 70 75
AAG CCT CTC CTO GAT GCA GCT GCA GAT GCC AAT GCC CAG GAC AAC ATG 266
Lye Arg Leu Leu Asp Als Gly Ala Asp Ala Asn Ala Cln Asp Asn Het
80 85 90 95
GCC CGC TGT CCA CTC CAT CCT CCA GTC GCA CCT CAT CCC CAA CGT OTC 334
Gly Arg Cys Pro Leu His Ala Ala Val Ala Ala Asp Ala Cln Gly Val
100 105 110
TTC CAG ATT CTC ATT CGC AAC CGA GTA ACT GAT CTA GAT CCC AGG ATG 382
Phe Cln Zle Leu lie Arg Aan Arg Val Thr Asp Leu Asp Ala Arg Het
115 120 125
AAT CAT CGT ACT ACA CCC CTC ATC CTG GCT GCC CCC CTG GCT GTG GAC 430
Aon Asp Gly Thr Thr Pro Leu Zle Leu Ala Ala Arg Leu Ala Val Glu
130 135 140
6UA ATG GTG GCA GAA CTO ATC AAC TGC CAA GCG GAT GTG AAT GCA CTC 478
Gly Met Val Ala Glu Leu Zle Asn Cys Gin Ala Asp Val Aan Ala Val .
145 150 155
GAT GAC CAT GGA AAA TCT GCT CTT CAC TGG GCA GCT CCT GTC AAT AAT 526
Aap Asp His Cly Lys Ser Ala Leu His Trp Ala Ala Ala Val Asn Aon
160 165 170 175 .
GTG GAG GCA ACT CTT TTG TTG TTG AAA AAT GGG GCC AAC CGA GAC ATG S74
Val Glu Ala Thr Leu Leu Leu Leu Lys Asn Gly Ala Asn Arg Asp Het
180 185 190
CAG GAC AAC AAG GAA GAG ACA CCT CTG TTT CTT GCT GCC CGG GAG GCG 622
Gin Aap Aan Lye Glu Clu Thr Pro Leu Phe Leu Ala Ala Arg Glu Cly
195 200 205
ACC TAT CAA CCA GCC AAC ATC CTC TTA GAC CAT TTT GCC AAT CCA CAC 670
Ser Tyr Glu Ala Ala Lye Zle Leu Leu Asp Hia Phe Ala Aan Arg Aap
210 215 220
ATC ACA GAC CAT ATC CAT CGT CTT CCC CGC GAT CTC CCT CCG GAT CGC 718
lie Thr Aap Hie Het Aap Arg Leu Pro Arg Asp val Ala Arg Aap Arg'
225 230 235
ATC CAC CAT CAC ATT CTG CGC CTT CTG CAT GAA TAC AAT CTG ACC CCA 766
'Het Hie Hia Aap Zle val Arg Leu Leu Asp Glu Tyr Aan val Thr Pro
240 245 250 255
ACC' CCT CCA CGC ACC CTG TTC ACT TCT GCT CTC TCA CCT CTC ATC TGT 614
Sex Pro Pro Gly Thr Vsl Leu Thr ser Als Leu ser Pro Val Zle Cya
260 265 270
CGG CCC AAC AGA TCT TTC CTC ACC CTC AAG CAC ACC CCA ATC CGC AAG 662
Gly Pro Asn Arg Ser Phe Leu ser Leu Lys His Thr Pro Met- Gly Lya
275 380 285
AAG TCT AGA CGG CCC AGT GCC AAG AGT ACC ATG CCT ACT AGC CTC CCT 910
Lya Ser Arg Arg Pro Ser Ala Lya Ser Thr Hat Pro Thr Ser Leu Pro
290 295 300
AAC CTT GCC AAG GAG GCA AAG GAT GCC AAG GCT ACT AGG AGG AAC AAG 958
Aan Leu Ala Lya Glu Ala Lya Asp Ala Lya Gly Ser Arg Arg Lya Lye
303 310 315
TCT CTC AGT GAG AAG GTC CAA CTC TCT GAG AGT TCA GTA ACT TTA TCC 1006
Ser Leu ser Glu Lya val Cln Leu Ser Clu Ser Ser Val Thr Leu Ser
320 325 330 335
154
CCT CTT GAT TCC CTA GAA TCT CCT CAC ACG TAT GTT TCC CAC ACC ACA 10S4
Pro Val Aap Ser Leu Olu Ser Pro Hls Thr Tyr val Ser Asp Thr Thr
340 345 350
TCC TCT CCA ATG ATT ACA TCC CCT CGC ATC TTA CAC GCC TCA CCC AAC 1102
Ser Ser Pro Het Zle Thr Ser Pro Gly Zle Leu Cln Ala Ser Pro Asn
3SS 360 365
CCT ATG TTC CCC ACT GCC CCC CCT CCT CCC CCA GTC CAT CCC CAC CAT 1150
Pro'Het Leu Ala Thr Ala Ala Pro Pro Ala Pro Val His Ala Cln His
370 375 380
CCA CTA TCT TTT TCT AAC CTT CAT GAA ATC CAG CCT TTG GCA CAT GCG 1198
Ala Leu Ser Phe Ser Asn Leu Hls Clu Het Gin Pro Leu Ala His Gly
385 390 39S
GCC AGC ACT GTG CTT CCC TCA GTG AGC CAC TTG CTA TCC CAC CAC CAC 1246
Ala Ser Thr Val Leu Pro Sex Val Ser Gin Leu Leu Ser Hia Hia Hia
400 40S 410 415
ATT GTG TCT CCA GGC ACT GGC AGT CCT GGA AGC TTC AGT ACC CTC CAT 1294
lie Val Ser Pro Gly Ser Gly Ser Ala Cly ser Leu Ser Arg Leu Hia
420 42S 430
CCA GTC CCA GTC CCA GCA OAT TGG ATG AAC CGC ATG GAG GTG AAT GAG 1342
Pro Val Pro Val Pro Ala Asp Trp Hat Asn Arg Het Glu Val Aen Glu
435 440 445
ACC CAG TAC AAT GAG ATG TTT GGT ATG CTC CTC GCT CCA GCT GAC GGC 1390
Thr Oln Tyr Asn Glu Het Phe Oly Het Val Leu Ala Pro Ala Glu Gly
4S0 455 460
ACC CAT CCT GGC ATA CCT CCC CAG AGC AGG CCA CCT GAA GCG AAC CAC 1438
Thr His Pro Cly Zle Ala Pro Gin Sor Arg Pro Pro Glu Gly Lys His
465 470 475
ATA ACC ACC CCT CCCTgAC CCC TTG CCC CCC ATT GTG ACT TTC CAG CTC 1486
Zle Thr Thr Pro Arg Glu Pro Leu Pro pro He Val Thr Phe Gin Leu
480 485 490 495
ATC CCT AAA CGC AGT ATT CCC CAA CCA GCG GCG CCT CCC CAC CCT CAC 1534
Zle Pro Lya Gly ser Zle Ala Gin Pro Ala Gly Ala Pro Gin Pro Gin
500 505 510
TCC ACC TGC CCT CCA GCT GTT GCC GCC CCC CTG CCC ACC ATG TAC CAC 1582
Ser Thr Cye Pro Pro Ala Val Ala Gly Pro Leu Pro Thr Het Tyr ein
SIS 520 525
ATT CCA CAA ATC GCC CGT TTC CCC AGT GTC CCT TTC CCC ACT GCC ATC 1630
lie Pro Glu Het Ala Arg Leu Pro Ser Val Ala Phe Pro Thr Ala Het
530 535 540
ATC CCC CAG CAG GAC GGG CAC GTA GCT CAG ACC ATT CTC CCA CCC TAT 1678
Met Pro Gin Gin Aap Gly Gin val Ala Gin Thr lie Leu Pro Ala Tyr
S45 550 5SS
CAT CCT TTC CCA CCC TCT CTC GGC AAG TAC CCC ACA CCC CCT TCA CAG 1726
Hia Pro Phe Pro Ala Ser Val Gly Lye Tyr Pro Thr Pro Pro Ser Gin
S60 565 570 575
CAC ACT TAT CCT TCC TCA AAT CCT CCT CAG CGA ACA CCC AGT CAC AGT 1774
Hie Ser Tyr Ala ser ser Asn Ala Ala Glu Arg Thr Pro ser Hie Ser
580 585 590
OCT CAC CTC CAO CGT GAC CAT CCC TAC CTG ACA CCA TCC CCA GAG TCT 1822
Gly Hia Leu Gin Gly Glu Hia Pro Tyr Leu tm Pro ser Pro Glu ser
595 600 60S
CCT GAC CAO TGG TCA AGT TCA TCA CCC CAC TCT GCT TCT CAC TGG TCA 1870
Pro Aap Cln Trp Ser Ser Ser Ser Pro Hia Ser Ala Ser Aap Trp Ser
610 61S 620
155
CAT CTG ACC ACC AGC CCT ACC CCT GCC CCT CCT GCA GGA GCT CAG CGG 1918
Aap Val Thr Thr Sex Pro Thr Pro Gly Gly Ala Oly Cly Gly Gin Arg
625 630 635
GCA CCT GCG ACA CAC ATG TCT CAC CCA CCA CAC AAC AAC ATC CAG GTT 1966
Oly Pro Gly Thr His Met Ser Olu Pro Pro His Asn Asn Met Gin Val
640 64S 650 655
TAT GCG TOAGAGAGTC CACCTCCAGT OTACAGACAT AACTGACTTT TGTAAATGCT 2022
Tyr Ala
CCTGACCAAC AAATCAAGCT CATCCGGCAG AGAAATCAAC AAATCTCTCC AGCCAGCTTC 2082
TACAGCTAGG AAAGACAACA TGTTCTTATT CAGATAATCC AAGACAACCA ATTCGTCAGT 2142
TTCACTCGGT ATCTCCAACC CTTATTGATT ATTCTAATCT AATAAGACAA CTTTGTCGAA 2202
ATGCAAGATG AATACAAGCC TTCGGTCCAT 6TTTACTCTC TTCTATTTGO AGAATAACAT 2262
GGATGCTTAT TGAAGCCCAG ACATTCTTCC ACCTTCGACT CCATTTTAAG CCCTCCACGC 2322
TTCTCCCATA TCCATGAGAA CATTCTACAC TAGCGTCCTC TTCCGAATTA TGCCCTCCAA 2382
TTCTCCCTCA ATTGACCTAC GCATCTCCTC CTCCTTGGAC ATTCTTTTGT CTTCATTTCG 2442
TCCTTTTGGT TTTGCACCTC TCCGTGATTG TAGCCCTACC AGCATGTTAT AGGGCAAGAC 2502
CTTTGTCCTT TTGATCATTC TGGCCCATCA AACCAACTTT CCTCTCCTTT CCGCTCCTCT 2562
CTTCCCC6TA TCCCTTGCAG TCTCACAACG TTTACTTTGG TATGCTTCTC ACCACAAACC 2622
TTTCAACTAT GTTCTTTCTT TCGAAAATGG ACATACTCTA TTCTCTTCTC CTCCATATAT 2682
CATTCCTGCA GAGAGAACCG GAGAACAATA CTTTTCTTCA ACAAATTTTG GGGCCAGCAG 2742
ATCCCTTCAA GAGGCTGCAC CTTAATTTTT CTTGTCTGTC TGCAGGTCTT CATATAAACT 2802
TTACCACGAA CAAGCCTGTG AGTTTGTTCT TTTTCTGTGT ATGGCCCTCC TCAGTGTAAA 2862
GTTTTATCCT TGATAGTCTA GTTACTATGA CCCTCCCCAC TTTTTTAAAA CCAGAAAAAG 2922
0TTTC6AATG TTGCAATGAC CAACAGACAA CTTAACTCCT GCAAGAGCCA GTTACCCACC 2982
CACAGCTCCC CCTACTTCCT CCCAAGCATT CCATTCACTC CCTCTATCCA ACACATTTCT 3042
CCCAGATCTG AGCATTCTAG GCCTGTTTCA CTCACTCACC CAGCATATGA AACTAGTCTT 3102
AACTCTTCAG CCTTTCCTTT CATATCCACA CAACACACTC TCTCAAAT6T TCTACCCTTG 3162
CCATTTAGGA CTGAACTTTC CTTAGCCCAA GGGACCCAGT GACAGTTGTC TTCCGTTTGT 3222
CAGATCATCA CTCTCTACfC ATTATCTTGC TCCTTAAACG CCT6CTCACC AATCTTTCTT 3282
TCACACCGTG TCCTCCGTGT TACTGGTATA CCCAGTATCT TCTCACTCAA CRCATCGACT 3342
TTATATGTTC AACTGCA60A ATTCCAAACT TCGACTTOTT TTCTATCATC CAAAACACCC 3402
CTATAAGAAG CTTGCAAAAC GAGGAACTAT ATACCAGCCT TTCCTATTTT CTGCTACCAT 3462
TTCTTTTCCT CTOAAGCCCC CATCACATTC CCTTTCCCAA CTAACGTAGA AACTCAACAG 3522
AACATTTTCC TTTCCTAGAC TCACCTTTTA CATGATAATC GACAACTATA CACTTCCTCA 3582
TTGTTCAGAC TGATTGCCCC TCACCTGAAT CCACTCTCTC TATTCATGCT CTTCGCAATT 3642
TCTTTOACTT TCTTTTAACG CCACAAGCAT TTTACTTAAT TGTAOATAAA CAATAGTTTT 3702
CTTCCTCTTC TCCTTGCCCC ACTTAATAAT TGGTCCATOG CTACACTCCA ACTTCCGTCC 3762
AGTCCTGTCA TGCCCATGAC ACCTGCAAAA TAAGTTCTGC CTGCGÇATTT TCTAGATATT 3822
10
15
156
AACACCTGAA TTCCCCACTC TTTTCCTTTC AATGACACTT CTCATTCCTT CTATCCCTCC 3882
AAGTATGCAT CAGTGCTTCC CACTTACCTG ATTTGTCTGT CGGTGGCCCC ATATGGAAAC 3942
CCTGCCTGTC TGTTGCCATA ATAGTTTACA AATCGTTTTT TCAOTCCTAT CCAAATTTAT 4002
TGAACCAACA AAAATAATTA CTTCTGCCCT GAGATAAGCA GATTAACTTT GTTCATTCTC 4062
TGCTTTATTC TCTCCATGTG GCAACATTCT CTCACCCTCT TTCATACTCT CCAAACATT7 4122
TATCATTCTA AATGGTGACT CTCTGCCCTT GCACCCATTT ATTATTCACA GATCCGCACA 4182
ACCTATCTGC ATGCACCCTC ACCATCCTCT GTCCAGCACA CACAGTGCAG GGACCCAGTG 4242
GCGATGGCGA - TGACTTTCTT CCCCTG 4268
(2) INFORMATIONS SUR LA SEQ ID NO : 13 :
(i) CARACTERISTIQUES DE LA SEQUENCE :
(A) LONGUEUR : 657 acides aminés
(B) TYPE : acide aminé
(D) TOPOLOGIE : inconnue
(ii) TYPE DE MOLECULE : protéine
(xi) DESCRIPTION DE LA SEQUENCE : SEQ ID NO : 13 :
Glu Val Acp val Leu Aap Val Asn Val Arg Gly Pro Asp Gly eye Thr
1 5 10 15
Pro Leu Met Leu Ala Ser Leu Arg Gly Gly Ser Ser Aep Leu Ser Aep
20 2S 30
Glu Asp Glu Aep Ale Glu Aap Ser Ser Ala Aan Zle Zle Thr Aep Leu
3S 40 45
val Tyr Gin Gly Alo Ser Lau Gin Ala Gin Thr Aep Arg Thr Gly Glu
50 55 60
Met Ala Leu Rie Leu Ala Ala Arg Tyr Ser Arg Ala Aap Ala Ala Lya
.65 70 75 80
Arg Leu Leu Aep Ala Gly Ala Aep Ala Aan Ala Gin Aap Aan Met Cly
85 90 95
Arg Cys pro Leu His Ala Ala Val Ala Ala Aep Ala Gin Gly Val Phe
100 105 110
Gin Zle Leu Zle Arg Aen Arg Val Thr Aap Leu Aap Ala Arg Met Aen
115 120 125
157
Aep Gly Thr Thr Pro Leu Zle Leu Ala Ala Arg Leu Ala Val Glu Gly
130 135 140
Met val Ala Glu Leu île Asn Cye Gin Ala Aep val Asn Ala Val Aep
145 150 155 160
Aep Hie Gly Lye Ser Ala Leu His Trp Ala Ala Ala Val Aan Aan Val
165 170 175
Glu Alà Thr Leu Leu Leu Leu Lye Asn Gly Ala Asn Arg Aap Met ein
180 18S 190
Aap Aen Lye Glu Glu Thr Pro Leu Phe Leu Ala Ala Arg- Glu Gly Ser
195 200 205
Tyr Glu Ala Ala Lya lie Leu Leu Aep Hia Phe Ala Asn Arg Aap zle
210 225 220
Thr Asp Bis Met Aep Arg Leu Pro Arg Aep val Aia Arg Aep Arg Met
225 230 235 240
Rie Hie Aep Zle Val Arg Leu Leu Aap Glu Tyr Aan Val Thr Pro Ser
245 250 25S
Pro Pro Gly Thr val Leu Thr ser Ala Leu ser Pro val lie Cya Gly
260 265 270
Pro Asn Arg Ser Phe Leu Ser Leu Lya Hie Thr pro Met Gly Lye Lye
275 280 265
Ser Arg Arg Pro ser Ale Lye Ser Thr Met Pro Thr Ser Leu Pro Aen
290 295 300
Leu Ala Lye Glu Ale Lya Aap Ala Lya Gly ser Arg Arg Lya Lya ser
305 310 315 320
Leu ser Clu Lye Val Cln Leu ser clu ser ser val Thr Leu ser Pro
325 330 335
Val Asp Ser Leu Glu Ser Pro Bis Thr Tyr Val Ser Aep Thr Thr Ser
340 34S 350
Ser Pro Met Zle Thr Ser Pro Gly Zle Leu Gin Ala ser Pro Aen Pro
355 360 36S
Met Leu Ala Thr Ala Ala Pro Pro Ala Pro Val Hia Ala Gin Hie Ala
370 375 380
Leu Ser Phe Ser Aen Leu Hie Glu Met Gin Pro Leu Ala His Gly Ala
385 390 395 400
Ser Thr Val Leu Pro Ser Val Ser Gin Leu Leu ser Bis Ria His Zle
405 410 415
Val Ser Pro Gly Ser Gly ser Ala Gly Ser Leu ser Arg Leu Hie Pro
420 425 430
Val Pro Val Pro Ala Aap Trp Met Asn Arg Met clu Val Aen Glu Thr
435 440 445
Gin Tyr Asn Glu Met Phe Gly Het Val Leu Ala Pro Ala clu Gly Thr
450 455 460
158
Rie Pro Gly Zle Ala Pro Gin Ser Arg Pro Pro Glu Cly Lye Hie Zle
465 470 475 480
Thr Thr Pro Arg Clu Pro Leu Pro Pro Zle Val Thr Phe ein Leu Zle
485 490 495
Pro Lye Gly Ser Zle Ala Cl» Pro Ala Gly Ala Pro Gin Pro Gin Ser
500 505 510
Thr Cye Pro Pro Ale Val Ala Gly Pro Leu Pro Thr Met Tyr Gin Ile
SIS S20 525
Pro Olu Met Ala Arg Leu Pro Ser Val Ala Phe Pro Thr Ala Met Met
530 535 540
Pro Gin Gin Aep Gly Gin val Ala Gin Thr He Leu Pro Ala Tyr Ria
545 550 S5S 560
Pro Phe Pro Ala Ser Val Giy Lys Tyr Pro Thr Pro Pro Ser Cln Hie
565 570 575
Ser Tyr Ala Ser Ser Asn Ala Ala Glu Arg Thr Pro Ser Hie Ser Gly
580 565 S90
Rie Leu Gin Oly Glu Rie Pro Tyr Leu Thr Pro Ser Pro Glu Ser Pro
595 600 605
Aep Cln trp Ser ser Ser Ser Pro Hie Ser Ala Ser Aap Trp ser Asp
610 615 620
Val Thr Thr Ser Pro Thr Pro Gly Cly Ala Cly Cly Cly Cln Arg Gly
625 630 635 640
Pro Gly Thr Rie Met Ser Glu Pro Pro Rls Asn Asn Met Gin Val Tyr
645 650 655
Ala
(2) INFORMATIONS SUR LA SEQ ID NO : 14 :
5 (i) CARACTERISTIQUES DE LA SEQUENCE :
(A) LONGUEUR : 77 acides aminés
(B) TYPE : acide aminé
(C) BRIN : simple
10 (D) TOPOLOGIE : inconnue
(ii) TYPE DE MOLECULE : peptide
(xi) DESCRIPTION DE LA SEQUENCE : SEQ ID N0 : 14
159
5
Olu Aep Zle Aep Clu Cye Aap Cln Gly Ser Pro eye clu Hie Aen Gly
1 5 10 15
Zle Cye Val Aen Thr Pro Gly Ser Tyr Arg Cye Asn Cye Ser Gin Gly
20 25 30
Phe Thr Gly Pro Arg Cys Clu Thr Aen zle Aan Clu Cye Glu Ser Rie
35 40 45
Pro Cya Gin Aen Glu Gly Ser Cye Leu Aap Aap Pro Gly Thr Phe Arg
50 55 60
Cye Val Cye Met Pro Gly Phe Thr Cly Thr Gin Cye Clu
65 70 75
(2) INFORMATIONS SUR LA SEQ ID NO : 15 :
(i) CARACTERISTIQUES DE LA SEQUENCE
(A) LONGUEUR : 78 acides aminés
(B) TYPE : acide aminé
10 (C) BRIN : simple
(D) TOPOLOGIE : inconnue
(ii) TYPE DE MOLECULE : peptide
15 (xi) DESCRIPTION DE LA SEQUENCE : SEQ ID NO : 15
Asn Aep val Asp Glu eye Ser Leu Gly Ala Asn Pro Cya Glu »le oly
15 10 15
v
Giy Arg Cye Thr Asn Thr Leu Giy Ser Phe Gin Cye Asn Cye Pro Gin
20 25 30
Gly Tyr Ala Gly Pro Arg Cye Glu Zle Aap Val Aen Glu Cys Leu Ser
35 40 45
Aen Pro Cye Gin Aen Aep Ser Thr eye Leu Aep Cln Ile Gly Clu Phe
50 55 S0
Gin Cye lie cys Met Pro Gly Tyr Glu Gly Leu Tyr Cya Glu
65 70 75
(2) INFORMATIONS SUR LA SEQ ID NO : 16 :
160
10
(i) CARACTERISTIQUES DE LA SEQUENCE :
(A) LONGUEUR : 654 acides aminés
(B) TYPE : acide aminé
(C) BRIN : simple
(D) TOPOLOGIE : inconnue
(ii) TYPE DE MOLECULE : peptide
(xi) DESCRIPTION DE LA SEQUENCE : SEQ ID NO : 16
Thr Pro Pro Cln Gly Glu Zle Clu Ala Aap Cya Met Aap Val Aan Val
1 5 10. 15
Arg Cly Pro Aap Gly Phe Thr Pro Leu Met lie Ala Ser Cya ser Gly
20 25 30
Cly Gly Leu Glu Thr Gly Aan Ser Glu Glu Clu Glu Aap Ala ser Ala
35 40 45
Asn Met Zle Ser Aap Phe Zle Gly Cln Gly Alo Gin Leu Rio Aon Cln
50 55 60
Thr Aap Arg Thr Cly Glu Thr Ala Leu Hie Leu Ala Ala Arg Tyr Ala
65 70 75 80
Arg Ala Aep Ala Ala Lye Arg Leu. Leu Glu Ser Ser Ala Asp Ala Aan
85 90 95
Val Gin Aep Aen Met Cly Arg Thr Pro Leu His Ala Ala Val Ala Ala
100 10S 110
Aap Ala Cln Gly Val Phe Gin He Leu He Arg Aan Arg Ala Thr Asp
US 120 125
Leu Aap Ala Arg Met Phe Asp Cly Thr Thr Pro Leu Zle Leu Ala Ala
130 135 140
Arg Leu Ala val Glu Gly Met Val Glu Glu Leu lie Asn Ala Ria Ala
145 150 15S 160
Aap Val Aen Ala Val Asp Glu Phe Cly Lye Ser Ala Leu His Trp Ala
165 170 175
Ala Ala Val Aan Aan vel Aap Ala Ala Ala val Leu Leu Lya Aen Ser
180 185 190
Ala Aen Lya Asp Met Gin Asn Asn Lya Glu Glu Thr Ser Leu Phe Leu
195 200 205
161
N
Ale Ale Arg Glu Gly Ser Tyr Glu Thr Ala Lya Val Leu Leu Asp Hie
210 215 220
Tyr Ala Aen Arg Aap Zle Thr Aap Hie Met Asp Arg Leu Pro Arg Asp
225 230 235 240
Zle Ala Cln Glu Arg Met Hie Hia Asp Zle Val Hia Leu Leu Asp Glu
245 250 255
Tyr Aen Leu Val Lys Ser Pro Thr Leu Mis Asn Cly Pro Leu Giy Ala
260 265 270
Thr Thr Leu Ser Pro Pro Zle Cyo Ser Pro Aen Gly Tyr Met Gly Aen
275 280 285
Met Lys Pro Ser Val Gin Ser Lya Lys Ala Arg Lye Pro Ser Xle Lye
290 295 300
Gly Aen Giy Cys Lys Clu Ala Lys Glu Leu Lya Ala Arg Arg Lye hve
305 310 31S 320
Ser Gin Aep Gly Lye Thr Thr Leu Leu Aep Ser Gly Ser Ser Gly Val
325 330 33S
Leu Ser Pro Val Aep Ser Leu Glu Ser Thr His Gly Tyr Leu Ser hep
340 345 350
Val Ser Ser Pro Pro Leu Met Thr Ser Pro Phe Gin Gin ser Pro Ser
355 360 365
Met Pro Leu Aen His Leu Thr ser Met Pro Clu Ser cln Leu Gly Met
370 375 380
Aen Hie Zle Aan Met Ala Thr Lye Gin Glu Met Ala Ala Gly Ser Aen
385 390 39S 400
Arg Met Ala Phe Aep Ala Met Val Pro Arg Leu Thr Hia Leu Aan Ala
405 410 415
Ser Ser Pro Asn Thr He Met ser Asn Giy Ser Met Hie Phe Thr Val
420 425 430
Gly Gly Ala Pro Thr Met Aen ser Gin Cya Asp Trp Leu Ala Arg Leu
435 440 44S
Gin Aen Giy Met Val Gin Aen Gin Tyr Asp Pro lie Arg Aen Gly Zle
4S0 455 460
Gin Gin Gly Aan Ala Gin Gin Ala Gin Ala Leu Gin Ria Gly Leu Met
465 470 475 480
. Thr Ser Leu Hie Aon Gly Leu Pro Ala Thr Thr Leu Ser Gin Met Het
485 490 495
Thr Tyr Gin Ala Met Pro Asn Thr Arg Leu Ala Asn Gin Pro Rie Leu
500 505 510
Met Gin Ala Gin Gin Met Gin ';<..> Gin Gin Aan Leu Gin Leu Rie Gin
515 V,3 525
Ser Met Gin Gin Cln Hie Hie Asn Ser Ser Thr Thr ser Thr Hie Zle
530 535 540
162
Aen Ser Pro Phe Cye Ser Ser Asp Zle Ser Cln Thr Aep Leu Gin Gin
545 550 SS5 560
Met Ser Ser Aan Aen 21e Hie Ser Val Met Pro Cln Aep Thr Cln Zle
565 570 575
Phe Ala Ala Ser Leu Pro ser Aan Leu Thr Gin Ser Met Thr Thr Ala
580 S8S 590
Gin Phe Leu Thr Pro Pro Ser Cln Kis Ser Tyr Ser Ser Pro Met Aep
595 600 60S
Aen Thr Pro Ser Ris Cln Leu Cln Val Pro Aep Rle Pro Phe Leu Thr
610 615 620
Pro Sex Pro Glu Ser Pro Aap Gin Trp Ser ser Ser Ser Pro Ris Ser
625 630 635 640
Asn Met Ser Asp Trp Ser Glu Gly He ser Ser Pro Pro Thr
645 650
(2) INFORMATIONS SUR LA SEQ ID NO : 17 :
5 (i) CARACTERISTIQUES DE LA SEQUENCE :
(A) LONGUEUR : 666 acides aminés
(B) TYPE : acide aminé
(C) BRIN : simple
10 (D) TOPOLOGIE : inconnue
(ii) TYPE DE MOLECULE : peptide
(xi) DESCRIPTION DE LA SEQUENCE : SEQ ID N0 : 17
15
Thr Pro Pro Gin Cly Clu Val. Aap Ala Aap cyo Het Aap Val Aen Val
15 10 15
Arg Cly Pro Aap Gly Phe Thr Pro Leu Met He Ala Ser Cys Ser Gly
20 25 30
Gly Cly Leu Glu Thr Gly Aen Ser Glu Clu Clu Clu Aap Ala Pro Ala
35 40 45
Val Zle Ser Aep phe He Tyr Gin Gly Ala Ser Leu Hia Aan Cln Thr
50 55 60
163
Aap Arg Thr Gly Glu Thr Ala Leu His Leu Ala Ala Arg Tyr Ser Arg
65 70 75 80
Ser'Asp Ala Ala LyB Arg Leu Leu clu Ala Ser Ala Aep Ala Aen Zle
85 90 95
Gin Aep Asn Met Gly Arg Thr Pro Leu His Ala Ala Val Ser Ala Aep
100 105 110
Ala Gin Gly Val Phe Gin 11e Leu Leu Arg Aan Arg Ala Thr Aep Leu
115 120 12S
Aep Ala Arg Met Hie Asp Giy Thr Thr Pro Leu Zle Leu Ala Ala Arg
130 135 140
Leu Ala val Clu cly Met Leu Glu Aap Leu He Aan ser Ris Ala Asp
14S ISO 155 160
Val Asn Ala Val Asp Asp Leu Gly Lye Ser Ala Leu Hia Trp Ala Ala
165 170 176
Ala Val Aen Asn Val Aep Ala Ala val val Leu Lau Lye Aen Gly Ala
160 185 190
Aen Lye Asp Met Gin Aen Asn Lys Olu clu Thr Pro Leu Phe Leu Ala
195 200 205
Ala Arg clu cly ser Tyr Glu Thr Ala Lya val Leu Leu Asp Rie Phe
210 21S 220
Ala Asn Arg Asp Zle Thr Asp Ris Het Asp Arg Leu Pro Arg Asp Zle
225 230 235 240
Ala Gin Clu Arg Met His Hie Asp Zle Val Arg Leu Leu Aep Clu Tyr
245 250 255
Aen Leu Val Arg Ser Pro Cln Leu Hia Oly Thr Ala Leu Cly Cly Thr
260 265 270
Pro Thr Leu Ser Pro Thr Leu Cyo Ser Pro Aen Cly Tyr I^u Cly Aen
275 280 285
Leu Lye Ser Ala Thr Cl» Gly Lya Lys Ala Arg Lys Pro Ser Thr Lys
290 295 300
Cly Leu Ala Cys Ser Ser Lya Clu Ala Lys Aap Leu Lye Ala Arg Arg
305 310 315 320
Lya Lys Ser Gin Asp Gly Lya Cly Cya Leu Leu Aep Ser Ser Ser Met
325 330 335
Leu Ser Pro Val Aep Ser Leu Glu Ser Pro Ria Gly Tyr Leu Ser Aep
340 345 350
Val Ala Ser Pro Pro Leu Pro Ser Pro Phe Gin Cln Ser Pro Ser Met
3S5 360 36S
Pro Leu Ser Hia Leu Pro Gly Met Pro Asp Thr Hia Leu Gly Zle Ser
370 375 380
Hia Leu Aan Val Ala Ala Lya Pro Glu Het Ala Ala Leu Ala Gly oly
385 390 395 400
ser Arg Leu Ala Phe Clu Pro Pro Pro Pro Arg Leu Ser His Leu Pro
405 410 415
164
Val Ala Ser Ser Ala Ser Thr Val Leu Ser Thr Aan Gly Thr Gly Ala
420 425 430
Met Aen Phe Thr Val Gly Ala Pro Ala Ser Leu Aan Gly Gin Cye Glu
435 440 445
Trp Leu Pro Arg Leu Gin Aen Cly Met val Pro Ser Gin Tyr Aen Pro
450 455 460
Leu Arg Pro Cly Val Thr Pro Cly Thr Leu Ser Thr Cln Ala Ala Gly
465 470 47S 480
Leu oln Hie cly Met Met Ser Pro zie His ser Ser Leu Ser Thr Asn
485 490 495
Thr Leu ser Pro Zle Zle Tyr Gin Cly Leu Pro Asn Thr Arg Leu Ala
500 505 510
Thr Gin Pro Hie Leu Val Gin Thr Gin Gin Val Gin Pro Gin Aen Leu
515 520 525
Gin Zle Gin Pro Gin Aen Leu Gin Pro Pro Ser Gin Pro Hie Leu Ser
530 535 540
Val Ser Ser Ala Ala Aen Gly Ris Leu Gly Arg Ser Phe Leu Ser Gly
545 550 555 560
Glu Pro Ser Gin Ala Aep Val Gin pro Leu Gly Pro ser ser Leu Pro
565 570 575
Val Ris Thr Zle Leu Pro Gin Glu Ser Gin Ala Leu Pro Thr Ser Leu
580 585 590
Pro Ser Ser Met Val Pro Pro Met Thr Thr Thr Gin Phe Leu Thr Pro
595 600 605
Pro ser Gin Hia ser Tyr ser ser Ser Pro val Asp Aen Thr Pro Ser
610 615 620
Hls Gin Leu Gin Val Pro Glu Ris Pro Phe Leu Thr Pro Ser Pro Glu
625 630 635 640
Ser Pro Asp Gin Trp Ser Ser Sex ser Arg Rie Ser Asn Zle ser Asp
645 650 655
Trp Ser Glu Gly zie Ser Ser Pro Pro Thr
660 665
(2) INFORMATIONS SUR LA SEQ ID NO : 18 :
5 (i) CARACTERISTIQUES DE LA SEQUENCE :
(A) LONGUEUR : 681 acides aminés
(B) TYPE : acide aminé
(C) BRIN : simple
10 (D) TOPOLOGIE : inconnue
165
(ii) TYPE DE MOLECULE : peptide
(xi) DESCRIPTION DE LA SEQUENCE : SEQ ID NO : 18 :
Thr Pro Pro Gin Gly Glu Val Asp Ala Asp Cye Met Aep val Aen Val
1 5 10 15
Arg Gly Pro Aep Gly Phe Thr Pro Leu Met He Ala Ser cys Ser Gly
20 25 30
Gly Gly Leu Glu Thr Gly Asn Ser Glu Glu Glu Glu Aap Ala Pro Ala
35 40 45
Val Zle Ser Aep Phe Zle Tyr Gin Cly Ala Ser Leu Hie Aen Gin Thr
50 5S 60
Asp Arg Thr Gly Glu Thr Ala Leu His Leu Ala Ala Arg Tyr Ser Arg
65 70 75 80
Ser Asp Ala Ala Lys Arg Leu Leu Glu Ala Ser Ala Asp Ala Aen Zle
85 90 95
Gin Aep Aen Met Cly Arg Thr Pro Leu Hie Ala Ala val Ser Ala Aep
100 105 110
Ala Gin Gly Val Phe Cln Zle Leu Zle Arg Aen Arg Ala Thr Aep Leu
115 120 125
Aep Ala Arg Met Hie Aep Cly Thr Thr Pro Leu Zle Leu Ala Ala Arg
130 135 140
Leu Ala Val Glu Gly Met Leu Glu Aap Leu Zle Aen Ser Rie Ala Asp
145 ISO 155 160
val Aen Ala val Asp Aep Leu Gly Lye ser Ala Leu His Trp Ala Ala
165 170 175
Ala Val Aen Aen Val Asp Ala Alâ Val Val Leu Leu Lye Asn Cly Ala
180 185 190
Aen Lye Asp Met Gin Aen Aen Arg Glu Glu Thr Pro Leu Phe Leu Ala
195 200 205
Ala Arg Glu Gly Ser Tyr Glu Thr Ala Lys Val Leu Leu Aep Ris Phe
210 21S 220
Ala Asn Arg Aep lie Thr Aep His Met Asp Arg Leu Pro Arg Aep Zle
225 230 235 240
Ala Cln Clu Arg Met Hie His Aap He Val Arg Leu Leu Aep Glu Tyr
245 2S0 255
Aen Leu Val Arg Ser Pro Gin Leu Hie Gly Ala Pro Leu Gly Gly Thr
260 265 270
166
Pro Thr Leu ser Pro Pro Leu Cye Ser Pro Aan Cly Tyr Leu Cly ser
275 280 285
Leu Lye Pro Cly Val Cln Gly Lys Lys Val Arg Lya Pro Ser Ser Lya
290 29S 300
Cly Leu Ala Cys Gly ser Lye clu Ala Lya Aap Leu Lya Ala Arg Arg
305 310 315 320
Lya Lye Ser Gin Asp Gly Lys Gly Cys Leu Leu Asp Ser Ser Cly Met
32S 330 335
Leu Ser Pro Val Aop Ser Leu Glu Ser Pro His Cly Tyr Leu Ser Aep
340 345 350
Val Ala Ser Pro Pro Leu Leu Pro Ser Pro Phe Gin Gin Ser Pro Ser
355 360 365
Val Pro Leu Aen Hie Leu Pro Cly Met Pro Aap Thr Hie Leu Gly Zle
370 375 380
Oly Rie Leu Aen Vol Ala Ala Lye Pro Clu Met Ala Ala Leu Gly Oly
385 390 395 400
Gly Gly Arg Leu Ala Phe Glu Thr Gly Pro Pro Arg Leu Ser Hie Leu
405 410 415
Pro Val Ala Ser Gly Thr Ser Thr Val Lou Cly Ser Ser Ser Cly Gly
420 425 430
Ala Leu Aen Phe Thr Val Gly Gly Ser Thr Ser Lou Aen Cly Cln Cys
435 440 445
Glu Trp Leu Ser Arg Leu Cln Ser Gly Met Val Pro Asn Gin Tyr Aen
450 455 460
Pro Leu Arg Cly ser Val Ala Pro Gly Pro Leu Ser Thr Gin Ala Pro
465 470 475 480
Ser Leu cln Hie cly Met val Gly Pro Leu His Ser Ser Leu Ala Ala
485 490 495
Ser Ala Leu Ser Gin Met Met Ser Tyr Cln Cly Leu Pro Ser Thr Arg
S00 SOS 510
Leu Ala Thr Oln Pro Hie Leu Val Gin Thr Cln Oln Val Cln Pro Gin
515 520 S2S
Aan Leu Gin Met Cln Gin Gin Aan Leu Cln Pro Ala Aen Zle Gin Gin
530 53S 540
Gin Gin Ser Lent Gin Pro Pro Pro Pro Pro Pro Gin Pro Hie Leu Gly
545 SS0 555 560
Val Ser Ser Ala Ala Ser Cly His Leu Cly Arg Ser Phe Leu Ser Oly
565 S70 S7S
Clu Pro ser Gin Ala Asp Val Gin Pro Leu Cly Pro Ser Ser Leu Ala
580 S SS S90
Val Hie Thr Zle Leu Pro Cln Glu Ser Pro Ala Leu Pro Thr Ser Leu
595 600 60S
167
Pro Ser Ser Leu Val Pro Pro Val Thr Ala Ala Gin Phe Leu Thr Pro
610 615 620
Pro ser Cln Hie Ser Tyr ser Ser Pro Val Glu Asn Thr Pro Ser Rie
62S 630 63 S 640
Gin Leu cln Val Pro clu Hia Pro Phe Leu Thr Pro Ser Pro Clu Ser
64S 650 6S5
Pro Aap Gin Trp Ser Ser Ser Ser Pro Hia Ser Aen Val Ser Asp Trp
660 665 670
ser Glu Gly Val Ser Ser pro Pro Thr
675 680 .
(2) INFORMATIONS SUR LA SEQ ID NO : 19 :
5 (i) CARACTERISTIQUES DE LA SEQUENCE :
(A) LONGUEUR : 2471 acides aminés
(B) TYPE : acide aminé
(C) BRIN : simple
10 (D) TOPOLOGIE : inconnue
(ii) TYPE DE MOLECULE : peptide
(xi) DESCRIPTION DE LA SEQUENCE : SEQ ID NO : 19
15
Met Pro Ala Leu Arg Pro Ala Leu Leu Trp Ala Leu Leu Ala Leu Trp
1 5 ~ 10 IS
Leu Cye Cye Ala Ala Pro Ala Hie Ala Leu Gin Cys Arg Asp Gly Tyr
20 25 30
Glu Pro Cye val Aen Glu Gly Met Cys val Thr Tyr Hie Asn Gly Thr
35 40 45
Gly Tyr Cys Lye Cye Pro Glu Gly Phe Leu Cly Glu Tyr Cys Gin Hie
SO 55 60
Arg Aap Pro Cye Glu Lys Aen Arg Cya Cln Aan Cly Gly Thr Cyo Val
65 70 75 80
Ala Gin Ale Met Leu Gly Lye ALa Thr Cys Arg Cys Aia Ser Gly Phe
85 90 95
Thr Gly Glu Aep Cye Gin Tyr Ser Thr Ser Hie Pro Cye Phe Val Ser
100 105 110 .
168
Arg Pro Cye Leu Aen Gly Gly Thr Cys Ris Met Leu Ser Arg Aep Thr
115 120 125
Tyr Glu Cys Thr Cye Gin Val Gly Phe Thr Gly Lye Glu Cye Gin Trp
130 135 140
Thr Aep Ala Cys Leu Ser Hie Pro Cys Ala Asn Gly Ser Thr eye Thr
145 150 155 160
Thr Val Ala Aen Gin Phe Ser Cya Lys Cys Leu Thr Gly Phe Thr Gly
165 170 175
Gin hye eye Clu Thr Asp val Asn Clu Cya Asp Zle Pro Gly Hie Cye
180 185 190
Gin Hie Cly Gly Thr Cye Leu Asn Leu Pro Gly Ser Tyr Gin Cye Oln
195 20O 205
Cys Pro Gin Gly Phe Thr Gly Gin Tyr Cys Asp Ser Leu Tyr Val Pro
210 215 220
Cye Ala Pro ser Pro Cye Val Aen Gly Gly Thr Cys Arg Gin Thr Cly
225 230 235 240
Aap Phe Thr Phe Glu Cye Asn eye Leu Pro Gly Phe Glu Gly Ser Thr
245 250 2SS
Cye Glu Arg Aan Zle Aep Aep Cys Pro Aen Hie Arg Cys Gin Asn Cly
260 265 270
Cly Val eye Val Asp Gly Val Aen Thr Tyr Asn Cye Arg Cys Pro Pro
275 280 285
Gin Trp Thr Gly Gin Phe Cye Thr Glu Aap Val Aep Glu Cye Leu Leu
290 295 300
cln Pro Asn Ala Cys C'.n Asn Cly Gly Thr Cye Ala Aen Arg Aen Gly
305 -10 315 320
Gly Tyr 61y eye Val Cye val Aen Gly Trp Ser Gly Aap Aap Cye Ser
325 330 335
Glu Aen lie Aap Aap Cys Ala Phe Ala ser Cys Thr Pro Gly Ser Thr
340 345 350
Cys He Asp Arg Val Ala Ser Phe Ser Cye Met eye Pro Glu Gly Lye
355 360 365
Ala Gly Leu Leu Cye Hie Leu Aep Aap Ala Cye He Ser Aen Pro eye
370 375 380
Hie Lys Cly Ala Leu Cye Aap Thr Asn Pro Leu Asn Cly Gin Tyr Zle
385 390 395 400
Cye Thr Cys Pro Cln Gly Tyr Lye Cly Ala Aap Cye Thr Glu Aep Val
405 410 415
Aap Clu Cyo Ala Met Ala Aen Ser Aen Pro Cya Glu Hie Ala Oly Lye
420 425 430
Cye Val Aen Thr Aap Gly Ala Phe Rie Cya Glu Cye Leu Lye Gly Tyr
435 440 445
169
Ala Gly Pro Arg Cya Glu Met Aap He Aan Olu Cys Rie Ser Aep Pre
450 455 460
Cye Gin Aen Aep Ala Thr Cys Leu Aap Lye He Gly Gly Phe Thr eye
465 470 475 480
Leu Cyo Net Pro Gly Phe Lya Gly Val His Cya Clu Leu Glu Zle Aan
485 490 495
Glu Cya Gin ser Asn Pro cys val Asn Aan Gly Gin Cya Val Asp Lya
500 505 510
Val Asn Arg Phe Gin Cye Leu Cys Pro Pro Cly Phe Thr Gly Pro Val
SIS 520 525
Cya Gin lie Asp lie Asp Asp Cys Ser Ser Thr Pro Cya Leu Aon Gly
530 53S 540
Ala Lye Cya He Asp His Pro Aan Gly Tyr Glu Cya Gin Cye Ala Thr
545 550 5SS 560
Gly Phe Thr Gly Val Leu cya Glu Clu Asn He Aap Aen Cys Asp Pro
565 S70 575
Asp Pro Cya Hie Ria Gly Cln Cys Cln Aep Gly Zle Asp Ser Tyr Thr
SSO 585 590
Cya Zle Cys Aan Pre Gly Tyr Met Cly Ala He Cys Ser Aap Cln Zle
595 600 60S
Aep Glu Cys Tyr Ser Ser Pro Cye Leu Aen Aap Cly Arg Cye lie Asp
610 615 620
Leu val Aen Gly Tyr Gin Cya Asn Cys Gin Pro Cly Thr Ser Gly val
625 630 635 *40
Aen Cya Glu He Aen Phe Asp Asp Cys Ala ser Asn Pro cys He Hie
645 650 655
Gly Zle Cys Met Aap Gly He Aan Arg Tyr Ser Cys Val eye Ser Pro
660 665 670
Gly Phe Thr Gly Gin Arg Cys Asn Zle Aap zle Asp Glu Cye Ala Ser
67S 680 685 .
Aen Pro eye Arg Lye Gly Ala Thr Cya He Aan Gly val Aen Gly Phe
690 695 700
Arg Cye He cya Pro Glu Gly Pro Hie Hie Pro Ser Cye Tyr Ser Gin
70S 710 715 720
Val Aen Glu Cya Leu Ser Aan Pro Cye He His Giy Aan Cys Thr Giy
725 730 735
Gly Leu Ser Cly Tyr Lys Cye Leu Cye Asp Ala Gly Trp Val Gly Zle
740 745 750
Aen Cye Glu Val Asp Lya Asn Glu Cye Leu Ser Aen Pro Cye Cln Asn
755 760 765
Cly Cly Thr Cya Aap Aen Leu Val Aan Oly Tyr Arg Cys Thr Cys Lya
770 775 780
Lye Gly Phe Lys Gly Tyr Asn Cya Gin val Aan Zle Asp Clu Cya Ala
765 790 795 800
170
Ser hen Pro eye Leu Aan ein cly Thr cys Phe Asp Asp Ile ser Gly
805 810 815
Tyr Thr Cya Rie Cye Val Leu Pro Tyr Thr Gly Lys Aan Cya Cln Thr
820 825 830
Val Leu Ala Pro Cye Ser Pro Asn Pro Cys Glu Aan Ala Ala Val Cye
835 840 845
Lys Clu Ser Pro Aen Phe Clu Ser Tyr Thr Cya Leu Cys Ala Pro Gly
8S0 855 860
Trp Cln Cly Gin Arg Cye Thr Zle Aap lie Aap Clu Cys Zle Ser Lya
865 870 *_ 87S 880
Pro eye Met Asn Ris Gly Leu Cya Hia Asn Thr Gin Gly Ser Tyr Met
885 890 895
Cye Glu Cya Pro Pro Gly Phe Ser Cly Met Aap Cya Glu Clu Asp Zle
900 905 910
Aep Aep Cys Leu Ala Asn Pro Cya Gin Aen Cly Gly ser Cye Met Aap
9IS 920 925
Gly Val Aen Thr Phe Ser Cys Leu cya Leu Pro Gly Phe Thr Gly Aap
,930 :. 93S 940
Lye Cye cln Thr Asp Met Asn Glu cys Leu Ser Clu Pro cye Lye Aen
945 'tan 950 955 960
Gly Giy Thr cys Ser Asp Tyr Val Aan ser Tyr Thr Cya Lys Cys cln
vir 965 970 97S
Ala Gly Phe Asp Cly Val Ria Cys Glu Aan Asn He Aan Glu cya Thr
980 985 990
Glu Ser Ser Cya Phe Asn Gly Gly Thr Cys Val Aap Gly He Asn Ser
995 1000 1005
Phe Ser Cys Leu Cys Pro Val Gly Phe Thr Gly ser Phe Cye Leu Hie
1010 1015 1020
Olu Ile Aan Clu Cys Ser Ser Ris Pro Cys Leu Asn Clu Cly Thr Cye
1025 1030 1035 1040
Val Aap Oly Leu Cly Thr Tyr Arg Cya Ser Cye Pro Leu Gly Tyr Thr
104$ 1050 1055
Gly Lye Asn Cye Gin Thr Leu Val Aan Leu Cya Ser Arg Ser Pro Cye
1060 - 1065 1070
Lye Aen Lye Gly Thr Cye Val Gin Lya Lya Ala Glu sar Gin Cys Leu
1075 1080 1085
Cye Pro Ser Cly Trp Ala Gly Ala Tyr Cye Aep Val Pro Aen val Ser
1090 1095 1100
Cya Aep Zle Ala Ala Ser Arg Arg Cly Val Leu Val Clu Hie Leu Cye
1105 1110 1115 1120
Gin Hie Ser Gly Val Cye He Aen Ala Gly Aan Thr Hia Tyr Cye Gin
1126 1130 1135
171
eye Pro Leu Gly Tyr Thr Cly Ser Tyr eye Olu Glu Cln Leu Aep Olu
1140 1145 11S0
Cye Ala Ser Aen Pro Cye Gin Ria Gly Ala Thr eye Ser Aep Phe Zle
1155 1160 1165
Gly Gly Tyr Arg Cys Clu Cys Val Pro Oly Tyr Gin Gly Val Aen Cys
1170 1175 1160
Clu Tyr Clu Val Asp clu Cys Gin Aan Gin Pro Cys Cln Asn Gly Gly
1185 1190 119S 1200
Thr Cys Zle Asp Leu val Asn Hie Phe Lye Cys ser Cye Pro Pro Gly
1205 1210 1215
Thr Arg Gly Leu Leu Cye Glu Glu Asn Zle Aap Asp Cye Ala Arg Gly
1220 122S 1230
Pro Hie Cya Leu Aan Gly Cly Gin Cys Met Aap Arg He oly Gly Tyr
1235 1240 1245
Ser Cya Arg Cye Leu Pro Cly Phe Ala cly clu Arg Cya Clu Cly Aep
1250 1255 1260
Zle Aen Clu Cys Leu Ser Aan Pro Cye Ser Ser Glu Cly Ser Leu Aep
1265 1270 1275 1280
Cya Zlo Cln Leu Thr Asn Aap Tyr Leu Cya Val Cye Arg Ser Ala Phe
12SS 1290 1295
Thr Gly Arg Hie cya Clu Thr Phe Val Aap val eye Pro Gin Met Pro
.1300 1305 1310
Cye Leu Aen Gly Gly Thr Cya Ala Val Ala Ser Aön Met Pro Asp Oly
1315 1320 1325
Phe Ile Cye Arg Cys Pro Pro Gly Phe Ser cly Ala Arg Cys Gin ser
1330 1335 1340
Ser Cys Gly Gin Val Lye cys Arg Lye Gly Clu Cln Cys Val Ria Thr
1345 1350 13S5 1360
Ala 5er Cly Pro Arg Cya Phe Cys Pro Ser Pro Arg Asp eye Glu Ser
1365 1370 137S
Cly Cya Ala Ser Ser Pro cya Gin Hie Cly Gly Ser Cys Hie Pro Gin
1380 1385 1390
Arg Cln Pro Pro Tyr Tyr Ser Cya Cln Cya Ala Pro Pro Phe Ser Gly
1395 1400 1405
Ser Arg eye Glu Leu Tyr Thr Ala Pro Pro Ser Thr Pro Pro Ala Thr
1410 1415 1420
Cye Leu Ser Gin Tyr Cye Ala Aap Lya Ala Arg Aap Cly Val Cye Aap
1425 1430 1435 1440
Glu Ala Cye Aen Ser Hie Ala Cye Gin Trp Aap Gly Cly Aep eye Ser
1445 1450 14S5
Leu Thr Met Glu Aen Pro Trp Ala Aan Cys Ser Ser Pro Leu Pro Cye
1460 1465 1470
172
Trp Asp Tyr Zle Asn Aen Cln Cye Aap Glu Leu Cys Asn Thr Val Glu
1475 1460 1485
eye Leu Phe Aep Aen Phe Glu Cys Gin Gly Asn Ser Lys Thr Cye Lye
1490 1495 1500
Tyr Aep Lya Tyr Cye Ale Aap Hls Phe Lys Aap Aan His Cys Aan Gin
1505 1510 ISIS 1S20
Oly cya Asn ser Glu Glu cya Gly Trp Aap Gly Leu Aap Cys Ala Ala
1525 1530 1535
Aap Gin. Pro Clu Aen Leu Ala Glu Gly Thr Leu Val lie Val Val Leu
1540 1545 1550
Met Pro Pro Clu Gin Leu Leu Cln Aep Ala Arg Ser Phe Leu Arg Ala
1555 1560 1S6S
Leu Cly Thr Leu Leu Hie Thr Aen Leu Arg He Lys Arg Asp Ser Gin
1570 1575 1580
Cly Clu Leu Met Val Tyr Pro Tyr Tyr Gly Clu Lya Ser Ala Ala Met
1585 1590 1595 1600
hye Lye Gin Arg Met Thr Arg Arg Ser Leu Pro Gly Glu Gin Glu Cln
1605 1610 1615
Clu Val Ala Cly Ser Lya Val Phe Leu Glu He Aap Aan Arg Gin Cye
1620 1625 1630
Val Cln Aep Ser Asp Hie Cya Phe Lys Aan Thr Aap Ala Ala Ala Ala
1635 1640 164S
Leu Leu Ala Ser Hia Ala He Gin Gly Thr Leu Ser Tyr Pro Leu Val
2650 16SS 1660
ser Val Val ser Glu Ser Leu Thr Pro Glu Arg Thr Gin Leu Leu Tyr
1665 1670 1675 1660
Leu Leu Ala Val Ala val Val He He Leu Phe He He Leu Leu Gly
1685 1690 1695
val He Met Ala Lye Arg Lye Arg Lys His Gly ser Leu Trp Leu Pro
1700 1705 1710
Glu Gly Phe Thr Leu Arg Arg Asp Ala Sar Aan Hia Lya Arg Arg Clu
1715 1720 1725
Pro Val Gly Gin Aap Ala Val Gly Leu Lya Aan Leu Ser Val Gin Val
1730 1735 1740
Ser. Glu. Ala Asn Leu He Gly Thr Gly Thr Ser Glu Ria Trp Val Aap
174S 1750 1755 1760
Asp Glu Gly Pro Gin Pro Lys Lys Val Lya Ala Glu Aap Glu Ala Leu
1765 1770 1775
Leu Ser Glu Glu Aap Aap Pro He Aap Arg Arg Pro Trp Thr Gin Cln
1780 1785 1790
Ria Leu Clu Ala Ala Aap He Arg Arg Thr Pro Ser Leu Ala Leu Thr
179S 1800 1805
Pro Pro Cln Ala Glu Cln Glu Val Aap Val Leu Aep Val Aen Val Arg
1810 1815 1820
173
Oly Pro Aap Cly Cys Thr Pro Leu Het Leu Ala Ser Leu Arg Oly Gly
1825 1830 1835 1840
ser Ser' Aap Leu Ser Aap Glu Aap Glu Asp Ala Clu Asp Ser Ser Ala
1845 1850 1855
Aen Zle Zle Thr Asp Leu Val Tyr ein Gly Ala ser Leu Gin Ale ein
I860 1865 1870
Thr Aep Arg Thr Gly Olu Met Ala Leu His Leu Ala Ala Arg Tyr ser
1875 1880 1885
Arg Ala Asp Ala Ala Lys Arg Leu Leu Aep Ala Cly Ala Aap Ala Aan
1890 189S 1900
Ala Gin Asp Aen Met Cly Arg Cye Pro Leu Hia Ala Ala Val Ala Ala
1905 1910 1915 1920
Asp Ala cln Gly val Phe Gin He Leu Zle Arg Asn Arg val Thr Asp
1925 1930 1935
Leu Aap Ala Arg Met Aen Asp Cly Thr Thr Pro Leu Zle Leu Ala Ala
1940 1945 1950
Arg Leu Ala Val Clu Gly Met Val Ala Clu Leu He Aan Cya Cln Ala
19S5 1960 196S
Asp Val Asn Ala Val Aap Aap His Cly Lys Ser Ala Leu Hie Trp Ala
1970 197S 1980
Ala Ala Val Asn Asn Val Glu Ala Thr Leu Leu Leu Leu Lye Asn Gly
198S 1990 199S 2000
Ala Aen Arg Aep Met Gin Asp Aan Lys Glu Clu Thr Pro Leu Phe Leu
2005 2010 2015
Ala Ala Arg Glu Gly Ser Tyr Clu Ala Ala Lys He Leu Leu Asp Hie
2020 2025 2030
Phe Ala Aan Arg Aep Zle Thr Asp Hia Het Asp Arg Leu Pro Arg Aep
2035 2040 2045
Val Ala Arg Asp Arg Met Hia Hia Asp Zle Val Arg Leu Leu Aap Glu
2050 2055 2060
Tyr Aen Val Thr Pro Ser Pro Pro Cly Thr Val Leu Thr Ser Ala Leu
2065 2070 2075 2080
Ser Pro Val He Cye Gly Pro Aan Arg Ser Phe Leu Ser Leu Lye Hie
2085 . 2090 2095
Thr Pro Met Gly Lya Lys Ser Arg Arg Pro Ser Ala Lys Ser Thr Met
2100 2105 2110
Pro Thr Ser Leu Pro Aan Leu Ala Lys Glu Ala Lya Aap Ala Lye Cly
211S 2120 2125
Ser Arg Arg Lya Lya Ser Leu Ser Clu Lye Val Cln Leu Ser clu Ser
2130 2135 2140
174
Ser Val Thr Leu Ser Pro val Aap Ser Leu Clu Ser Pro als Thr Tyr
2145 2150 2155 2160
Val Ser Aep Thr Thr Sex Ser Pro Het He Thr Ser Pro Cly Zle Leu
2165 2170 2175
Gin Ala Ser Pro Aan Pro Met Leu Ala Thr Ala Ala Pro Pro Ala Pro
2180 2185 2190
Val His Ala Cln Hia Ala Leu Ser Phe Ser Aan Leu His Glu Met Gin
219S 2200 220S
Pro Leu Ala Hia Gly Ala Ser Thr Val Leu Pro Ser Val Ser Cln Leu
2210 221S 2220
Leu Ser Hie Hie Hie He val Ser Pro Gly Ser Gly Ser Ala Gly Ser
222S 2230 223S 2240
Leu Ser Arg Leu Rie Pro Val Pro val pro Ala Aep Trp Met Aan Arg
2245 2250 2255
Met Glu val Aon Glu Thr Gin Tyr Asn Glu Met Phe Gly Met Val Leu
2260 226S 2270
Ala Pro Ala Olu Gly Thr Rie Pro Gly He Ala Pro Gin Ser Arg Pro
2275 2280 2285
Pro Glu Gly Lys Hie Zle Thr Thr Pro Arg Glu Pro Leu Pro Pro Zle
2290 2295 2300
Val Thr Phe Gin Leu Zle Pro Lys Sly Ser He Ala Gin Pro Ala Gly
2305 2310 2315 2320
Ala Pro Cln Pro Gin Ser Thr Cya Pro Pro Ala Val Ala Giy Pro Leu
2325 2330 2335
Pro Thr Met Tyr Gin Zle Pro Glu Met Ala Arg Leu Pro Ser Val Ala
2340 2345 2350
Phe Pro Thr Ala Met Met Pro Gin Cln Asp Gly Gin Val Ala Gin Thr
2355 2360 2365
He Leu Pro Ala Tyr Hie Pro Phe Pro Ala Ser Val Cly Lys Tyr Pro
2370 2375 2380
Thr Pro Pro Ser Gin His Ser Tyr Ala Ser Ser Aen Ala Ala Clu Arg
2385 2390 2395 2400
Thr Pro Ser Hie Ser Cly His Leu Cln Cly clu His Pro Tyr Leu Thr
2405 2410 2415
Pro Ser Pro Glu Ser Pro hep Cln Trp Ser Ser ser Ser Pro Hia Ser
2420 2425 2430
Ala Ser Asp Trp Ser Aep Val Thr Thr Ser Pro Thr Pro Gly Gly Ala
2435 2440 244S
Gly Cly Cly Gin Arg Cly Pro Gly Thr His Met Ser Glu Pro Pro Hie
2450 2455 2460
Asn Aen Met Gin Val Tyr Ala
2465 2470
[2) INFORMATIONS SUR LA SEQ ID NO : 20
175
10
(i) CARACTERISTIQUES DE LA SEQUENCE :
(A) LONGUEUR : 2556 acides aminés
(B) TYPE : acide aminé
(C) BRIN : simple
(D) TOPOLOGIE : inconnue
(ii) TYPE DE MOLECULE : peptide
(xi) DESCRIPTION DE LA SEQUENCE : SEQ ID NO : 20
Met Pro Pro Leu Leu Ala Pro Leu Leu Cys Leu Ala Leu Leu Pro Ala
1 S 10 is
Leu Ala Ala Arg Giy Pro Arg Cys Ser Gin Pro Gly Glu Thr Cye Leu
20 25 30
Aen Gly Gly Lye Cys Glu Ala Ala Asn Gly Thr Clu Ala Cys Val Cye
35 40 45
Gly Gly Ala Phe Val Gly Pro Arg Cys Cln Aap Pro Aen Pro Cya Leu
50 55 60
Ser Thr Pro cye Lye Aen Ala Gly Thr Cye Hie Val Val Aep Arg Arg
65 70 75 60
Oly Val Ala Aep Tyr Ala Cya Ser Cys Ala Leu Cly'Phe Ser Gly Pro
85 90 95
Leu Cys Leu Thr Pro Leu Asp Aen Ale Cya Leu Thr Aen Pro Cye Arg
100 105 no
Asn Gly Gly Thr Cye Aap Leu Leu Thr Leu Thr Glu Tyr Lya Cye Arg
115 120 125
Cye Pro Pro Gly Trp Ser Gly Lys Ser eye cln Cln Ala Aep Pro Cye
130 135 140
Ala ser Aen Pro eye Ala Aon Gly Gly Gin eye Leu Pro Phe Glu Ala
145 ISO 155 160
Ser Tyr Zle Cye Hie eye Pro Pro Ser Phe Hie Gly Pro Thr Cys Arg
165 170 175
Gin Aap Val Asn Glu cya Giy Gin Lys Pro Arg Leu eye Arg His Gly
ISO 185 190
176
Cly Thr eye Hls Asn clu Val Gly Ser Tyr Arg Cya Val Cye Arg Ala
195 200 205
Thr Hie Thr Gly Pro Aen Cye Glu'Arg Pro Tyr Val Pro Cya Ser Pro
210 215 220
Ser Pro Cya Cln Aan Cly Cly Thr Cya Arg Pro Thr Cly Aep Val Thr
225 230 235 240
Hia Glu Cya Ala Cya Leu Pro Gly Phe Thr cly cln Aan Cys Glu Clu
24S 250 255
Asn He Aep Aep Cys Pro Gly Asn Aan Cys Lys Asn Gly Gly Ala Cyi
260 265 270
Val Aap Gly Val Aan Thr Tyr Aan Cya Pro Cya Pro Pro Glu Trp Thi
27S 280 285
Gly Gin Tyr cys Thr Glu Aap Val Aap Clu Cya Gin Leu Met Pro Aai
290 295 300
Ala Cys Gin Aon Cly Gly Thr Cys Hia Aen Thr Hia Cly Gly Tyr Aar
305 310 31S 32C
Cya Val Cye Val Asn Gly Trp Thr Gly Glu Asp Cys Ser Glu Aan Zl«
325 330 335
Aap Aap Cya Ala Ser Ala Ala Cye Phe Hie Cly Ala Thr eye Hie Aep
340 345 350
Arg Val Ala Ser Phe Tyr Cya Glu Cys Pro Hia Gly Arg Thr Cly Leu
355 360 36S
Leu Cya Hie Leu Aan Asp Ala Cya Zle Ser Aan Pro Cya Aan Glu Cly
370 375 380
Ser Aen Cya Aap Thr Aan Pro val Aan Gly Lya Ala Zle Cye Thr Cya
385 390 395 400
Pro Ser Cly Tyr Thr Cly Pro Ala Cyo Ser Cln Asp Val Asp Clu Cye
405 410 415
Ser Xmu Gly Ala Asn Pro Cya Clu Hie Ala Cly Lya Cye Zle Aen Thr
420 425 430
Leu Cly Ser Phe Glu Cye cln Cya Leu Gin cly Tyr Thr Cly Pro Arg
435 440 44 S
eye Clu Zle Aap Val Asn Glu Cys Val Ser Aan Pro Cya Gin Aen Asp
450 455 460
Ala Thr Cya Leu Aap Gin Zle Oly Olu Phe Cln Cys Met Cys Met Pro
465 470 475 480
Gly Tyr Glu Cly Val Hio Cya Clu Val Asn Thr Asp Clu Cya Ala Ser
485 490 495
Ser Pro Cys Leu Hie Aen Gly Arg eye Leu Asp Lys Zle Aen clu Phe
50O 503 S10
Cln Cye Glu Cys Pro Thr Gly Phe Thr Cly His Leu eye Gin Tyr Aep
515 520 525
177
Val Asp Glu Cys Ala Ser Thr Pro Cya Lya Aan Gly Ala Lys Cys Leu
530 535 S40
Aap Cly Pro Aan Thr Tyr Thr Cya Val Cys Thr Clu Cly Tyr Thr Gly
545 550 555 560
Thr Hie Cye Glu Val Asp Zle Aap Glu Cys Asp Pro Aep Pro Cya Hie
S6S 570 575
Tyr Gly Ser Cys Lye Aep Gly Val Ala Thr Phe Thr eye Leu cya Arg
580 585 590
Pro Gly Tyr Thr Gly Rie Ris eye Clu Thr Asn He Aen Clu Cys Ser
595 600 605
Ser Cln Pro Cye Arg Leu Arg Cly Thr Cys Cln Aap Pro Aap Asn Ala
610 615 620
Tyr Lieu Cys Phe Cya Leu Lya Gly Thr Thr Gly Pro hen Cye Glu Zle
625 630 635 640
Aan Leu Asp Aap Cya Ala Sex Ser Pro Cys Aap Ser Cly Thr Cys Leu
645 650 655
Aap Lys Zle Aap Gly Tyr Olu Cya Ala Cya Glu Pro cly Tyr Thr Oly
660 665 670
Ser Met Cya Aen Ser Aen He Asp Clu Cye Ala Cly Aen Pro Cye Hia
675 680 68S
Aan Cly Cly Thr eye clu Aap Cly Zle Asn Gly Phe Thr Cya Arg Cys
690 695 700
Pro Glu Giy Tyr Rie Aap Pro Thr Cya Leu Ser Clu Val Aen Glu Cya
70S 710 715 720
Aen Ser Asn Pro eye Val Hia Giy Ala Cya Arg Aap Ser Leu Aan Cly
725 730 73S
Tyr Lyo Cya Asp eye Aep Pro Gly Trp 8er cly Thr Aen Cye Asp Zle
740 745 750
Aen Aen Aen clu cya Gl« ser Aen Pro Cya Val Asn Cly Gly Thr Cys
7SS 760 765
Lye Asp Met Thr Ser Gly zle val eye Thr Cya Arg Clu cly Phe Ser
770 775 780
Cly Pro Aen Cya Gin Thr Aan Ile Aen Glu Cya Ala Ser Aan Pro Cye
785 790 79S 800
Leu Aen Lye Gly Thr Cys Zle Aap Asp Val Ala Gly Tyr Lya Cye Aen
80S SlO SIS
Cye Leu Leu Pro Tyr Thr cly Ala Thr Cye Clu Val Val Leu Ala Pro
820 825 830
eye Ala Pro ser Pro Cya Arg Aen Cly Gly Glu eye Arg ein Ser Clu
835 S40 845
Aap Tyr Glu Ser Phe Ser Cye Val Cya Pro Thr Ala Cly Ala Lys Gly
850 855 860
178
Cln Thr Cye Glu Val Aep Zle Aen Clu Cys Val Leu Ser Pro Cye Arg
865 870 875 880
His Gly Ala Ser Cya Cln Aen Thr His Gly Cly Tyr Arg cya Hia Cya
885 890 895
Oln Ala Gly Tyr Ser Cly Arg Aan Cya Glu Thr Asp Zle Aap Aap Cya
900 905 910
Arg Pro Aan Pro Cye Hie Aen Gly Gly Ser Cya Thr Aap Cly He Aan
915 920 925
Thr Ala Phe Cyo Aep eye Leu Pro Cly Phe Arg Cly Thr Phe Cye Clu
930 935 940
Glu Aep tie Aen du eye Aia ser Aap pro Cys Arg Asn Gly Ala Aon
945 950 955 960
Cye Thr Aap Cye val Aep ser Tyr Thr Cya Thr Cya Pro Ala cly Phe
965 970 975
Ser Cly Zle Hie Cys Clu Asn Aen Thr Pro Aap Cya Thr clu Ser Ser
980 985 990
Cye Phe Asn Cly Cly Thr Cya Val Aap Gly He Aan Ser Phe Thr eye
995 1000 1005
Leu Cya Pro Pro Cly Phe Thr Cly Ser Tyr cya cln Hie Val Val Aen
1010 1015 1020
Glu eye Asp ser Arg Pro eye Leu Leu Gly Cly Thr Cya Cln Aap Gly
1025 1030 103S 1040
Arg Gly Leu Hie Arg Cye Thr Cye Pro Gin Gly Tyr Thr Gly Pro Aen
1045 1050 1055
Cye Oln Aen Leu Val Hie Trp Cys Aap Ser Ser Pro Cye Lye Aan Gly
1060 1065 1070
Cly Lys eye Trp Gin Thr His Thr Cln Tyr Arg eye clu Cye Pro ser
1075 1080 1085
Cly Trp Thr Cly Leu Tyr Cys Asp Val Pro Ser Val Ser Cye Clu Val
1090 1095 1100
Ala Ala Gin Arg Gin Cly Val Asp Val Ala Arg Leu eye Gin His cly
HOS 1110 1115 1120
Gly Leu eye val Asp Ala Oly Asn Thr Hia Hie Cya Arg Cye Cln Ala
1125 1130 J13S
Gly Tyr Thr Gly ser Tyr Cye Glu Aep Leu val Aep clu eye Ser Pro
1140 114S 11SO
Ser Pro eye Gin Aen Gly Ala Thr Cya Thr Asp Tyr Leu cly Cly Tyr
1155 1160 1165
Ser Cys Lya Cya Val Ala Oly Tyr Hie Gly Val Asn Cye Ser Glu Clu
1170 1175 1180
Zle Asp Clu Cys Leu Ser Hia Pro Cya Gin Aan Cly Oly Thr Cya Leu
1185 1190 119S 1200
Aap Leu Pro Aan Thr Tyr Lye Cys Ser Cyo Pro Arg Cly Thr Gin Oly
1205 1210 1215
179
Val Hie Cys Glu He Aen Val Asp Asp Cya Aan Pro Pro Val Aap Pro
1220 1225 1230
Val Ser Arg Ser Pro Lys Cya Phe Aan Asn Oly Thr cys Val Asp Gin
123S 1240 124S
Val Gly Gly Tyr Ser Cya Thr Cys Pro Pro Cly Phe Val Cly Glu Arg
1250 12SS 1260
Cye Clu Gly Aap Val Asn Clu Cys Leu Ser Aan Pro Cye Aap Ala Arg
1265 1270 1275 1280
Cly Thr Cln Aan Cya Val Cln Arg Val Asn Aap Phe His Cys Glu Cya
1265 1290 1295
Arg Ala Cly Hie Thr Gly Arg Arg Cya Glu Ser Val He Aen Gly Cys
1300 1305 1310
Lya Oly Lys Pro Cye Lye Aen Gly cly Thr Cya Ala Val Ala Ser Asn
1315 1320 1325
Thr Ala Arg Gly Phe He Cys Lys Cys Pro Ala Gly Phe Clu cly Ala
1330 1335 1340
Thr Cye Glu Aen Aap Ale Arg Thr Cye Gly Ser Leu Arg Cye Leu Asn
134S 1350. 1355 1360
Gly Gly Thr Cys Zle Ser Gly Pro Arg Ser Pro Thr Cye Leu Cye Leu
136S 1370 137S
Cly Pro Phe Thr Gly Pro Glu Cys Gin Phe Pro Ala Ser Ser Pro Cye
1380 1385 1390
Leu Cly Gly Asn Pro Cye Tyr Aen Gin Gly Thr Cya Glu Pro Thr Ser
1395 1400 1405
Glu Ser Pro Phe Tyr Arg Cya Leu Cya Pro Ala Lya Phe Asn Gly Leu
1410 141S 1420
Leu Cya Hie Zle Leu Asp Tyr Ser Phe Gly Cly Cly Ala Gly Arg Aep
142S 1430 .143S 1440
Zle Pro Pro Pro Leu Zle Clu Glu Ala Cys Glu Leu Pro Glu Cye Gin
144S 14SO 14SS
Glu Asp Ala Gly Aan Lys Val Cye Ser Leu Cln Cya Asn Aen Hie Ala
1460 1465 1470
Cye Gly Trp Asp Gly Cly Aap Cys Ser Leu Asn Phe Aan Aap Pro Trp
1475 1480 1485
Lys Aan Cya Thr Gin Ser Leu Gin Cys Trp Lya Tyr Phe Ser Aep Gly
1490 1495 1500
Hie Cys Asp ser Gin Cya Aan Ser Ala Cly Cya Leu Phe Asp Gly Phe
1505 1510 1515 1S20
Aep Cye Cln Arg Ala Clu Gly Cln cye Aan Pro Leu Tyr Aap Gin Tyr
1525 1530 1535
Cys Lys Aap BIb Phe Ser Aap Gly Hie Cys Asp Cln Gly Cya Asn Ser
1540 1545 1550
180
Ala Glu Cye Glu Trp Asp Cly Leu Aap Cya Ala Glu Hia Val Pro Clu
1555 1560 1S65
Arg Leu Ala Ala Cly Thr Leu Val Val Val Val Leu Met Pro Pro Clu
1570 1575 1580
Cln Leu Arg Aan Ser Ser Phe His Phe Leu Arg Clu Leu Ser Axg Val
1585 1590 159S 1600
Lent Hia Thr Aen Val Val Phe Lya Arg Asp Ala Hia Cly Cln Gin Net
1605 1610 1615
Zle Phe Pro Tyr Tyr Cly Arg Glu Glu Glu Lau Arg Lye Hia Pro Zle
1620 1625 1630
Lye Arg Ala Ala Olu Gly Trp Ala Ala Pro Asp Ala Leu Leu Cly Cln
163S 1640 1645
Val Lya Ala Ser Leu Leu Pro Cly Gly ser Glu Gly Cly Arg Arg Arg
16S0 1655 1660
Arg Glu Leu Aap Pro Met Aap Val Arg Cly Ser Ha Val Tyr Leu Clu
1665 1670 1675 1680
Zle Aap Aan Arg Gin Cya val ein Ala ser Ser Gin cya Phe Gin ser
1685 1690 1695
Ala Thr Aap val Ala Ala Phe Leu Gly Ala Leu Ala sex Leu Cly ser
1700 1705 1710
Leu Aon He Pro Tyr Lya He Clu Ala Val Gin Ser Clu Thr Val Clu
171S 1?20 172S
Pro Pro Pro Pro Ala ein Leu Hia Phe Met Tyr val Ala Ala Ala Ala
1730 1735 1740
Phe Val Leu Leu Phe Phe val Gly Cya Cly Val Leu Leu Ser Arg Lya
1745 17S0 1755 1760
Arg Arg Arg Oln Hia Cly Gin Leu Trp Phe Pro Clu Gly Phe Lys Val
I76S 1770 J775
Sex Glu Ala Ser Lya Lya Lye Arg Arg Clu Glu Leu Gly Clu Aap Ser
17SO 1785 1790
Val Cly Leu Lye Pro Leu Lya Aan Ala Ser Asp Cly Ala Leu Met Aep
1795 1800 1805
Aap Aan Gin Asn Clu Trp Cly Asp Clu Aap Leu Clu Thr Lye Lye Phe
1810 1815 1820
Arg Phe Glu Glu Pro Val Val Leu Pro Aap Leu Aap Aap Cln Thr Aep
1825 1830 1835 1840
Ria Arg Gin Trp Thr Gin Gin Hia Leu Aap Ala Ala Aap Leu Arg Met
184S 1850 1855
Ser Ala Met Ala Pro Thr Pro Pro Cln Cly Clu Val Aap Ala Asp Cys
i860 186S 1870
Met Asp Val Asn Val Arg cly Pro Aap Gly Phe Thr Pro Leu Met Zle
1875 1B80 1S85
Ala Ser Cya Ser Gly Gly Giy Leu Clu Thr Gly Aen Ser Glu Glu Glu
1890 189S 1900
181
Glu Asp Ala Pro Ala Val Zle ser Asp Phe He Tyr Gin Oly Ala Ser
1905 1910 1915 1920
Leu Hie Asn Cln Thr Aap Arg Thr Cly Glu Thr Ala Leu Hia Leu Ala
1925 1930 1935
Ala Arg Tyr Ser Arg Ser Aap Ala Ala Lys Arg Leu Leu Glu Ala Ser
1940 1945 1950
Ala Aap Ala Aen Zle Gin Aep Aen Met Cly Arg Thr Pro Leu His Ala
1955 1960 1965
Ala Val Ser Ala Aap Ala Gin Gly Val Phe Cln He Leu He Arg Asn
1970 1975 1980
Arg Ala Thr Aap Leu Aop Ala Arg Met Hia Aap Oly Thr Thr Pro Leu
1985 1990 199S 2000
Zle Leu Ala Ala Arg Leu Ala Vail Glu Gly Met Leu Glu Asp Leu Zle
200S 2010 201S
Aen Ser Hie Ala Aep Val Aan Ala Val Asp Aap Leu Gly Lys Ser Ala
2020 2025 2030
Leu Hia Trp Ala Ala Ala Val Aen Asn Val Asp Ala Ala Val Val Leu
2035 2040 2045
Leu Lya Aen Cly Ala Aan Lys Asp Met cln Aan Aen Arg Glu Glu Thr
2050 20SS 2060
Pro Leu Phe Leu Ala Ala Arg Glu Gly Ser Tyr Glu Thr Ala Lye Val
206S 2070 2075 2080
Leu Leu Aap His Phe Ala Aan Arg Aap Xle Thr Aap His Met Asp Arg
2085 2090 2095
Leu Pro Arg Aep zle Ala ein clu Arg Met Hie Hie Aap Zle val Arg
2100 2105 2110
Leu Leu Aep Glu Tyr Aen Leu val Arg sex Pro cln Leu Ria Gly Ala
2115 2120 2125
Pro Leu Gly Gly Thr Pro Thr Leu Ser Pro Pro Leu Cye Ser Pro Aen
2130 2135 2140
Oly Tyr Leu Oly Ser Leu Lya Pro Gly val Gin Gly Lye Lye Val Arg
214S 21S0 21S5 2160
Lya Pro Ser Ser Lye Gly Leu Ala Cya oly Ser Lye Olu Ala Lye Aap
216S 2170 217S
Leu Lye Ala Arg Arg Lye Lya Ser Gin Aap Gly Lya Cly Cys Leu Leu
2180 2185 2190
Aep Ser Ser Gly Het Leu Ser Pro Val Aap Ser Leu Glu Ser Pro Hie
2195 2200 2205
Cly Tyr Leu Ser Aep Val Als Ser Pro Pro Leu Leu Pro Ser Pro Phe
2210' 221S 2230
Gin Cln Ser Pro Ser Val Pro Leu Asn His Leu Pro Cly Met Pro Asp
2225 2230 2235 2240
Thr Hie Leu Gly Zle Gly Ris Leu Aen Val Ala Ala Lys Pro Clu Met
2245 2250 2255
5
182
Ala Ala Leu cly Gly Cly Gly Arg Leu Ala Phe clu Thr Cly Pro Pro
2260 2265 2270
Arg Leu ser Hie Leu Pro Val Ala Ser Gly Thr Ser Thr Val Leu Cly
2275 2260 2285
Ser Ser Ser Gly Oly Ala Leu Aan Phe Thr Val Oly Oly Ser Thr Ser
2290 229S 23Û0
L>eu Asn Gly Oln Cye Glu Trp Leu Ser Arg Leu Gin Ser Cly Met Val
2305 2310 2315 2320
Pro Aen Oln Tyr Aen Pro Leu Arg Cly Ser Val Ala Pro Gly Pro Leu
2325 2330 2335
Ser Thr Oln Ala Pro Ser Leu Oln Hia Gly Met Val Gly Pro Leu His
2340 2345 2350
ser ser Leu Ala Ala Ser Ala Leu Ser Gin Met Met Ser Tyr Gin Gly
2355 2360 2365
Leu Pro Ser Thr Arg Leu Ala Thr Gin Pro Hie Leu Val Gin Thr Gin
2370 2375 2360
Gin Val Cln Pro Cln Asn Leu cln Met Cln cln Cln Aan Leu Cln Pro
2385 2390 2395 2400
Ala Asn He Gin Gin Gin Gin ser Leu Gin Pro Pro Pro Pro Pro Pro
2405 2410 2415
Gin Pro Hie Leu Gly Val Ser Ser Ala Ala Ser Gly His Leu Gly Arg
2420 242S 2430
Ser Phe Leu Ser Gly Glu Pro Ser Gin Ala Aep Val Gin Pro Leu Gly
2435 2440 2445
Pro Ser Ser Leu Ala Val Ria Thr Zle Leu Pro Gin Glu Ser Pro Ala
2450 2455 2460
t
Leu Pro Thr Ser Leu Pro Ser Ser Leu Val Pro Pro val Thr Ala Ala
2465 2470 247S 2480
Cln Phe Leu Thr Pro Pro Ser Girt Hia Ser Tyr Ser ser Pro Val Clu
' 2485 2490 , 2495
Aan Thr Pro Ser Hie Oln Leu Gin val Pro Clu Hie Pro Phe Leu Thr
2500 2S0S 2510
Pro Ser Pro Glu Ser Pro Aep Cln Trp Ser ser Ser Ser Pro Ris Ser
2515 2520 2525
Aan Val Ser Asp Trp Ser Glu Cly Val Ser Ser Pro Pro Thr Ser Met
2530 2S35 2540
Gin Ser Gin Zle Ala Arg lie Pro Clu Ala Phe Lye
2545 2550 2555
(2) INFORMATIONS SUR LA SEQ ID NO : 21 :
(i) CARACTERISTIQUES DE LA SEQUENCE
183
(A) LONGUEUR : 9723 paires de bases
(B) TYPE : acide nucléique
(C) BRIN : double
(D) TOPOLOGIE : inconnue
5
(ii) TYPE DE MOLECULE : ADNc
(ix) CARACTÉRISTIQUE :
10 (A) NOM/CLE : CDS
(B) LOCALISATION : 10..7419
(xi) DESCRIPTION DE LA SEQUENCE : SEQ ID NO : 21
GGAATTCCG CCC GCC CTC CCC CCC GCT CTC CTC TCC CCC CTO CTG CCC 48
Pro Ala Leu Arg Pro Ala Leu Leu Trp Ala Leu Lau Ala
15 10
CTC TGG CTC TCC TCC CCG GCC CCC GCG CAT CCA TTG CAG TCT CGA GAT 96
Leu Trp Leu Cya eye Ala Ala Pro Ala His Ala Leu Gin Cys Arg Aap
15 20 25
GGC TAT GAA CCC TGT GTA AAT GAA GGA ATC TGT CTT ACC TAC CAC AAT 144
Oly Tyr Glu Pro Cys Val Aan Glu Gly Met Cye Val Thr Tyr His Asn
30 35 40 45
GGC ACA GGA TAC TGC AAA TCT CCA CAA CGC TTC TTC CGC CAA TAT TCT 192
Gly Thr Gly Tyr Cya Lys Cys Pro Glu Cly Phe Leu cly Glu Tyr Cya
50 55 60
CAA CAT CGA GAC CCC TGT CAG AAG AAC CGC TGC CAC AAT GCT CCG ACT 240
Gin Hie Arg Aap Pro Cya Glu Lya Aan Arg cya Gin Ab« Gly Gly Thr
65 70 75
15
TGT CTG GCC CAG GCC ATG CTG GGG AAA GCC ACG TGC CGA TGT GCC TCA 288
Cys Val Ala Gin Ala Met Leu Gly Lys Ala Thr Cys Arg Cys Ala Ser
184
80. 85 90
GCC TTT ACA COA CAO CAC TCC CAC TAC TCA ACA TCT CAT CCA TCC TTT 336
Cly Phe Thr Oly Glu Asp Cys Gin Tyr Ser Thr Ser Hie Pro Cyo Phe
9S 100 105
CTC TCT CGA CCC TGC CTC AAT GGC GGC ACA TGC CAT ATG CTC AGC CCG 384
Val ser Arg Pro Cys Leu Asn Gly Cly Thr Cya Hie Met Leu Ser Arg
HO HS 120 125
CAT ACC TAT GAC TOC ACC TCT CAA GTC CCG TTT ACA GGT AAG CAO TGC 432
Aep Thr Tyr Clu Cya Thr Cye Cln Val Gly Phe Thr Cly Lye Glu Cya
230 135 140
CAA TGG ACC GAT GCC TGC CTO TCT CAT CCC TOT OCA AAT CCA AGT ACC 480
Gin Trp Thr Asp Ala Cya Leu Sex His Pro Cys Ala Asn Gly Ser Thr
145 150 1SS
TOT ACC ACT GTO GCC AAC CAO TTC TCC TOC AAA TOC CTC ACA CGC TTC 528
Cya Thr Thr Val Ala Aen Gin Phe 5er Cys Lye eye Leu Thr Oly Phe
160 165 170
ACA GGG CAG AAA TGT GAG ACT GAT GTC AAT GAG TGT GAC ATT CCA GGA 576
Thr Cly Gin Lya Cya Clu Thr Aap Val Aan Glu Cya Asp Zle Pre Cly
175 180 IBS
CAC TGC CAG CAT GGT GGC ACC TGC CTC AAC CTG CCT GGT TCC TAC CAG 624
Rie Cya Gin Kis Cly Giy Thr Cya Leu Aan Leu Pro Gly Ser Tyr Gin
190 195 200 20S
TGC CAG TGC CCT CAG GCC TTC ACA GGC CAG TAC TCT GAC AGC CTO TAT 672
Cya Gin eye Fro Gin Gly Phe Thr cly ein Tyr Cya Aap Ser Leu Tyr
210 215 220
GTC CCC TOT GCA CCC TCA CCT TGT CTC AAT CCA GCC ACC TCT CCG CAG 720
val Pro Cya Ala Pro ser Pro cys Val Aan Gly Gly Thr Cya Arg Cln
225 230 235
ACT GGT GAC TTC ACT TTT GAC TGC AAC TCC CTT CCA CGT TTT GAA GGG 768
Thr Gly Aap Phe Thr Phe Glu cys Asn Cys Leu Pro Gly Phe Glu Gly
240 245 250
AGC ACC TGT GAG AGG AAT ATT GAT 6AC TGC CCT AAC CAC ACC TCT CAO 816
Ser Thr Cya Glu Arg Asn Zle Aap Aap Cys Pro Aan Hia Arg Cya Gin
255 260 265
AAT GGA GCG GTT TGT CTG GAT CGC CTC AAC ACT TAC AAC TGC CGC TOT 864
Aen Gly Gly Val Cye Val Asp Oly Val Aen Thr Tyr Asn Cys Arg Cyo
270 27S 280 285
CCC CCA CAA TGG ACA GGA CAC TTC TCC ACA GAG CAT GTC GAT CAA TGC 912
Pro Pro Gin Trp Thr Gly Gin Phe Cys Thr Clu Asp Val Asp Glu Cya
290 295 300
CTG CTC CAC CCC AAT CCC TGT CAA AAT CCG CGC ACC TCT CCC AAC CGC 960
Leu Leu Gin Pro Aan Ala Cya Gin Aan Oly Gly Thr cya Ala Aan Arg
305 310 315
AAT CGA CGC TAT CGC TGT GTA TGT CTC AAC CGC TGC ACT CGA GAT CAC. 1008
Asn Oly Oly Tyr Oly Cya val Cya Val Aan Gly Trp Ser Gly Aap Aap
320 325 330
TGC AGT GAG AAC ATT GAT OAT TOT CCC TTC GCC TCC TGT ACT CCA CGC 1056
Cya Ser Olu Asn Zle Aap Aap Cya Ala Phe Ala Ser cys Thr Pro Gly
335 340 34S
TCC ACC TGC ATC GAC CGT GTG GCC TCC TTC TCT TGC ATG TGC CCA CAG 1104
185
Sex Thr Cya Zle Aap Arg Val Ala Ser Phe Ser Cys Met Cys Pro Clu
350 355 360 365
GGO AAG GCA GGT CTC CTG TCT CAT CTG GAT GAT CCA TGC ATC ACC AAT 1152
Cly Lya Ala Cly Leu Leu Cya His Leu Asp Asp Ala Cys Ile Ser Asn
370 375 380
CCT TGC CAC AAG GGG GCA CTO TGT GAC ACC AAC CCC CTA AAT GGG CAA 1200
Pro Cys Bis Lye Gly Ala Leu Cys Asp Thr Asn Pro Leu Asn Gly Cln
385 390 39S
TAT ATT TGC ACC TGC CCA CAA GGC TAC AAA CGG GCT GAC TCC ACA GAA 1248
Tyr Zle Cys Thr Cye Pro Cln Cly Tyr Lys Cly Ala Asp Cys Thr Glu
400 40S 410
GAT CTG CAT GAA TOT CCC ATC CCC AAT ACC AAT CCT TGT CAO CAT CCA 1296
Aap Val Asp Glu Cya Ala Met Ala Aan Ser Asn Pro Cya Glu Hie Ala
415 420 425
GGA AAA TCT GTG AAC ACC CAT CGC CCC TTC CAC TCT CAC TCT CTC AAG 1344
Gly Lya Cya Val Aan Thr Aap Gly Ala Phe His Cys Olu Cys Leu Lya
430 435 440 445
GGT TAT CCA GGA CCT CGT TCT GAG ATG CAC ATC AAT CAO TCC CAT TCA 1392
Oly Tyr Ala Gly Pro Arg Cya Glu Met Asp lie Asn Clu Cys His Ser
450 455 460
CAO CCC TOC CAO AAT GAT OCT ACC TOT CTO CAT AAC ATT COA CCC TTC 1440
Aep Pro Cys Oln Aon Asp Ala Thr Cys Leu Asp Lye Zle Cly Oly Phe
465 470 475
ACA TOT CTG TGC ATQ CCA COT TTC AAA CCT GTC CAT TCT OAA TTA GAA 1488
Thr Cya Leu Cya Met Pro Gly Phe Lye Gly Val Hia Cya Glu Leu Glu
480 485 490
ATA AAT CAA TGT CAC ACC AAC CCT TCT GTC AAC AAT CGC CAO TGT CTC 1536
Zle Aan Glu Cye Gin Ser Asn Pro Cys Val Asn Asn Gly Oln Cye Val
495 S00 505
CAT AAA CTC AAT CCT TTC CAC TSC CTO TGT CCT CCT COT TTC ACT CGC 1S84
Asp Lys Val Aen Arg Phe Gin Cys Leu Cys Pro Pro Gly Phe Thr Gly
510 515 520 S25
CCA OTT TCC CAC ATT CAT ATT CAT GAC TGT TCC ACT ACT CCG TGT CTG 1632
Pro Val Cye Cln Zle Asp Zle Aep ABp Cys Ser Ser Thr Pro Cys Leu
530 535 540
AAT GGO GCA AAG TGT ATC GAT CAC CCC AAT CCC TAT OAA TOC CAG TGT 1680
Ann Gly Ala Lys Cys Zle Asp His Pro Asn Gly Tyr Clu Cys Gin Cys
545 SSO 555
GCC ACA COT TTC ACT GGT CTC TTC TOT OAO CAO AAC ATT CAC AAC TGT 1728
Ala Thr Gly Phe Thr Gly Val Leu Cys Clu Clu Asn He Asp Asn cya
560 S65 S 70
GAC CCC GAT CCT TCC CAC CAT CCT CAC TGT CAC GAT GCT ATT GAT TCC 1776
Asp Pro Asp Pro Cys Hie His Gly Cln Cys Cln Asp Cly lie Aap ser
575 580 585
TAC ACC TCC ATC TGC AAT CCC CGC TAC ATG CCC CCC ATC TGC AGT GAC 1824
Tyr Thr cys Ile eye Asn Pro oly Tyr Met Cly Ala lie cys sex Aep
590 595 600 605
CAC ATT CAT GAA TGT TAC ACC ACC CCT TCC CTO AAC GAT CCT CGC TCC 1872
Gin Zle Asp Glu Cya Tyr ser ser Pro cys Leu Aen Asp Gly Arg Cya
. 610 615 620
186
ATT GAC CTG GTC AAT CGC TAC CAG TGC AAC TGC CAG CCA GCC ACG TCA 1920
Zle Asp Leu val Asn cly Tyr Gin Cys Asn Cys Gin Pro Gly Thr Sex
625 «30 635
GGG GTT AAT TGT GAA ATT AAT TTT GAT GAC TGT GCA AGT AAC CCT TGT 1968
Gly Val Asn Cys Glu Zle Asn Phe Asp Asp Cys Ala Ser Aen Pro Cys
640 645 650
ATC CAT GGA ATC TGT ATG GAT GCC ATT AAT CGC TAC ACT TGT GTC TGC 2016
Zle His Oly Zle cys Het Asp oly Zle Asn Arg Tyr Ser Cye Val Cys
655 660 665
TCA CCA GCA TTC ACA GCG CAG ACA TGT AAC ATT CAC ATT CAT GAG TGT 2064
Ser Pro Gly Phe Thr Gly Gin Arg Cys Asn lie Asp Zle Asp Clu Cys
670 875 680 685 '
GCC TCC AAT CCC TGT CCC AAG GOT CCA ACA TGT ATC AAC GGT GTG AAT 2112
Ala Ser Asn Pro Cye Arg Lye Gly Ala Thr Cys Ile Asn Gly Val Asn
690 69S 700
GGT TTC CGC TGT ATA TGC CCC GAG GGA CCC CAT CAC CCC AGC TGC TAC 2160
Gly Phe Arg Cya Zle Cye Pro Clu Gly Pro His His Pro Ser cys Tyr
705 710 715
TCA CAG GTC AAC GAA TCC CTG AGC AAT CCC TGC ATC CAT GGA AAC TCT 2208
Ser Gin Val Asn Glu cya Leu Ser Asn Pro cys zie Hls Gly Asn Cys
720 725 730
ACT GCA CCT CTC ACT GGA TAT AAC TCT CTC TGT GAT GCA GCC TCG CTT 2256
Thr Gly Cly Leu Ser Gly Tyr Lys Cys Leu Cys Asp Ala Gly Trp Val
735 740 745
GGC ATC AAC TGT GAA GTG GAC AAA AAT GAA TGC CTT TCG AAT CCA TGC 2304
Cly Zle Asn Cys Glu Val Asp Lys Asn clu Cys Leu Ser Asn Pro Cys
750 755 760 76S
CAG AAT GGA GGA ACT TGT GAC AAT CTG GTC AAT GGA TAC AGG TGT ACT 2352
Gin Asn Gly Gly Thr Cys Aap Asn Leu Val Asn Gly Tyr Arg Cys Thr
770 775 780
TGC AAG AAG GGC TTT AAA GGC TAT AAC TGC CAG GTG AAT ATT GAT GAA 2400
Cys Lys Lys Gly Phe Lys Cly Tyr Asn Cys Cln Val Asn Zle Asp Clu
785 790 795
TGT GCC TCA AAT CCA TCC CTG AAC CAA GGA ACC TCC TTT CAT GAC ATA 2448
Cys Ala Ser Asn Pro Cys Leu Asn Cln Cly Thr Cys Phe Asp Asp Zle
800 805 810
AGT CGC TAC ACT TGC CAC TCT CTG CTC CCA TAC ACA CCC AAG AAT TCT 2496
Ser Gly Tyr Thr Cys His cys Val Leu Pro Tyr Thr Cly Lys Asn Cys
81S 820 825
CAG ACA CTA TTC GCT CCC TCT TCC CCA AAC CCT TGT CAG AAT GCT GCT 2544
Gin Thr Val Leu Ala Pro Cys ser Pro Asn Pro Cys Glu Asn Ala Ala
830 835 840 845
GTT TGC AAA GAG TCA CCA AAT TTT GAG ACT TAT ACT TGC TTC TGT GCT 2592
Val Cys Lys Glu Ser Pro Asn Phe Glu Ser Tyr Thr Cys Leu Cys Ala
850 85S 860
CCT GCC TGG CAA GCT CAO CCC TGT ACC ATT CAC ATT GAC GAG TCT ATC 2640
Pro Oly Trp Cln Oly Cln Arg Cye Thr Zlo Aep Zle Asp Clu Cya Zle
865 870 875
TCC AAG CCC TGC ATG AAC CAT GGT CTC TCC CAT AAC ACC CAG GGC ACC 2686
Ser Lys Pro Cys Met Asn His Gly Leu Cys His Asn Thr Gin Oly Ser
880 885 890
187
TAC ATC TGT GAA TGT CCA CCA GGC TTC ACT CCT ATG CAC TCT CAC CAG
Tyr Met Cye Glu cya Pro Pro Cly Phe ser Gly Met Aap Cya Glu Glu
89S 900 90S
2736
CAC ATT CAT GAC TGC CTT CCC AAT CCT TGC CAG AAT GGA GCT TCC TGT
Aap Zle Aap Aap Cya Leu Ala Aan Pro Cya Gin Aan Gly Gly ser Cyo
910 915 920 - 925
2784
ATG GAT CCA GTG AAT ACT TTC TCC TCC CTC TGC CTT CCG GGT TTC ACT
net Aap Gly val Asn Thr Phe Ser Cya Leu cys Leu Pro Oly Phe Thr
930 935 940
2832
CGC GAT AAC TCC CAG ACA CAC ATC AAT CAC TGT CTG ACT GAA CCC TGT 2880
Giy Aap Lys Cys cln Thr Aep. Het Aan clu Cys Leu ser Glu Pro Cye
9ÏS 950 955
AAG AAT GGA GGG ACC TGC TCT GAC TAC GTC AAC AGT TAC ACT TGC AAG 2928
Lya Aen Cly Gly Thr Cya Ser Aap Tyr Val Aan Ser Tyr Thr cye Lye
960 965 970
TGC CAG GCA GGA TTT GAT GGA GTC CAT TGT GAG AAC AAC ATC AAT GAG 2976
Cye Gin Ala Cly Phe Aap Gly Val His cya Clu Asn Aan Zle Aen Clu
975 980 985
TGC ACT CAG AGC TCC TCT TTC AAT GGT GGC ACA TGT GTT GAT GGC ATT 3024
Cya Thr Clu Ser Ser Cya Phe Aan Giy Gly Thr Cya Val Aap Gly Zie
990 995 1000 1005
AAC TCC TTC TCT TCC TTC TGC CCT GTC CGT TTC ACT GGA TCC TTC TCC 3072
Aan Ser Phe Ser Cye Leu Cya Pro Val Gly phe Thr Cly Ser Phe Cye
1010 1015 1020
CTC CAT GAG ATC AAT GAA TGC AGC TCT CAT CCA TGC CTC AAT GAC CGA 3120
beu Hia Glu Zle Aen Glu Cye Sex Sex »is Pro Cya Leu Aan Glu Cly
1025 . 1030 1035
ACG TCT CTT CAT CGC CTG GCT ACC TAC CCC TGC AGC TCC CCC CTG COC 3168
Thr Cya val Aap Gly Leu cly Thr Tyr Arg Cya ser Cya Pro Leu Gly
1040 1045 10S0
TAC ACT CGG AAA AAC TCT CAG ACC CTG GTC AAT CTC TGC AGT CGG TCT
Tyr Thr Gly Lys Asn Cya Gin Thr Leu Val Asn Leu Cya Ser Arg Ser
105S 1060 1065
3216
CCA TGT AAA AAC AAA GCT ACT TGT CTT CAG AAA AAA CCA GAG TCC CAG 3264
Pro Cya Lya Aan Lye Gly Thr Cys Val Oln Lys Lys Ala olu Ser Oln
1070 107S 1080 1085
TGC CTA TOT CCA TCT GGA TOO CCT CGT GCC TAT TGT GAC GTG CCC AAT 3312
Cya Leu Cya Pro Ser Cly Trp Ala Gly Ala Tyr Cya Aap Val Pro Asn
1090 1095 1100
GTC TCT TGT GAC ATA GCA GCC TCC AGG AGA CGT GTG CTT GTT GAA CAC 3360
Val Ser Cya Asp Zle Ala Ala ser Arg Arg Cly Val Leu Val Glu Hia
1105 1110 1115
TTG TGC CAG CAC TCA GGT CTC TGC ATC AAT CCT CSC AAC ACG CAT TAC 3408
Leu Cya Gin Hia Sex Gly Val Cys Zle Asn Ala Gly Asn Thr His Tyr
1120 1125 1130
TOT CAG TGC CCC CTG CGC TAT ACT GGO ABC TAC TGT GAG GAG CAA CTC 3456
Cye Gin eye Pro Leu Gly Tyr Thr Gly Ser Tyr cya Glu Glu Cln Leu
1135 1140 1145
CAT GAG TGT GCC TCC AAC CCC TGC CAG CAC GCG GCA ACA TCC AGT GAC 3504
Aap Glu Cye Ala sar Aan Pro eye ein Nia Gly Ala Thr Cya Ser Asp
1150 1155 1160 1165
188
TTC ATT GOT GOA TAC AGA TOC GAC TGT GTC CCA CCC TAT CAG COT CTC 35S2
Phe Zle Oly Gly Tyr Arg Cye Olu Cya val Pro Cly Tyr Gin Cly Val
1170 1175 1180
AAC TGT GAG TAT GAA GTG GAT CAG TGC CAG AAT CAC CCC TCC CAG AAT 3600
Aan Cya Glu Tyr Glu Val Aap Glu Cya Gin Aan Gin Pro eye Cln Aan
1185 1190 1195
GGA GGC ACC TGT ATT GAC CTT OTO AAC CAT TTC AAG TGC TCT TCC CCA 3648
Oly Gly Thr Cya Zle Aap Leu Val Asn His Phe Lya Cya Ser Cya Pro
1200 1205 1210
CCA GGC ACT CGC GGC CTA CTC TGT CAA GAG AAC ATT GAT GAC TGT GCC 3696
Pro Cly Thr Arg Gly Leu Leu Cye Clu Glu Asn lie Asp Asp Cye Ala
1215 1220 1225
CGG GCT CCC CAT TGC CTT AAT GGT GGT CAG TGC ATG GAT ACG ATT GGA
Arg Oly Pro Hie Cya Leu Asn Gly Gly «In Cys Het Aap Acg XL« Gly
1230 1235 1240 1245
3744
GCC TAC AGT TGT CCC TGC TTG CCT CGC TTT OCT CCG OAG CCT TCT GAG 3792
Cly Tyr Ser Cye Arg eye Lou pro Gly Phe Ala Cly Glu Arg Cye Glu
1250 1255 1260
GGA GAC ATC AAC GAG TOC CTC TCC AAC CCC TCC AGC TCT GAO GGC ACC 3840
Cly Aap Zle Aan Olu Cya Leu ser Aan Pro Cya Ser Ser Glu Gly Ser
1265 1270 127S
CTC CAC TCT ATA CAG CTC ACC AAT GAC TAC CTG TCT CTT TGC CCT ACT
Leu Asp Cya Zle Gin Leu Thr Asn Asp Tyr Leu Cys Val Cye Arg Ser
1280 1265 1290
3888
GCC TTT ACT GGC CGG CAC TGT GAA ACC TTC CTC GAT CTC TGT CCC CAG
Ala Phe Thr Gly Arg Hia Cya Olu Thr Phe Val Asp Val Cys Pro Gin
1295 1300 1305
3936
ATG CCC TGC CTG AAT GGA GCG ACT TOT GCT CTC GCC ACT AAC ATG CCT 3984
Met Pro Cya Leu Aan Cly Gly Thr Cys Ala Val Ala Ser Aen Het Pro
1310 13 IS 1320 132S
CAT CGT TTC ATT TCC CGT TCT CCC CCG CGA TTT TCC GGG GCA AGG TGC 4032
Asp Cly Phe Zle Cys Arg Cye Pro Pro Oly Phe Ser Cly Ala Arg Cya
1330 1335 1340
CAG AOC AGC TGT GCA CAA GTG AAA TGT AGC AAG GGG GAC CAG TCT GTC
Gin Ser Ser cys Gly Gin Val Lya cys Arg Lya Gly Glu Cln Cya Val
1345 1350 13SS
4080
CAC ACC GCC TCT GCA CCC CGC TGC TTC TGC CCC AOT CCC CGG GAC TGC 4128
Hie Thr Ala Ser Gly Pro. Arg Cya Phe Cya Pro Ser Pro Arg Aap Cys
1360 1365 1370
GAG TCA GGC TGT GCC AGT AOC CCC TGC CAG CAC 000 OOC AGC TOC CAC 4176
Clu Ser Cly Cya Ala Ser Ser Pro Cya Gin Hia Gly Gly Ser Cye Hia
137S 1380 1385
CCT CAO CGC CAG CCT CCT TAT TAC TCC TCC CAG TCT CCC CCA CCA TTC 4224
Pro Gin Arg Gin Pro Pro Tyr Tyr Ser Cyo Oln Cyo Ala Pro Pro Phe
1390 1395 1400 1405
TCG CCT ACC CGC TGT GAA CTC TAC ACC GCA CCC CCC ACC ACC CCT CCT 4272
Ser Gly Ser Arg Cye Glu Leu Tyr Thr Ala Pro Pro Ser Thr Pro Pro
1410 1415 1420
GCC ACC TGT CTC ACC CAC TAT TCT GCC GAC AAA CCT CGC GAT GGC GTC
Ala Thr Cya Leu ser Cln Tyr Cye Ala Asp Lya Ala Arg Asp Gly val
142S 1430 1435
4320
189
TGT GAT GAG GCC TGC AAC AGC CAT CCC TGC CAC TGG GAT GGG GGT CAC
Cye Aep. Glu Ala Cye Aan Ser Hls Ala Cys Cln Trp Asp Cly oly Asp
1440 1445 14S0
4368
TOT TCT CTC ACC ATG GAG AAC CCC TGG GCC AAC TGC TCC TCC CCA CTT 4416
Cya Ser Lau Thr Met Clu Aan Pro Trp. Ala Asn Cya Ser Ser Pro Leu
14S5 1460 146S
CCC TGC TGG GAT TAT ATC AAC AAC CAC TGT GAT GAG CTC TCC AAC ACG 4464
Pro Cya Trp Asp Tyr Zle Aen Aan Gin Cys Asp Glu Leu Cys Aan Thr
1470 1475 1480 1485
GTC GAG TGC CTG TTT GAC AAC TTT GAA TCC CAC CGC AAC ACC AAC ACA 4512
Val Clu Cya Leu Phe Asp Asn Phe Glu Cys Gin Cly Asn Ser Lya Thr
1490 1495 1500
TGC AAG TAT GAC AAA TAC TGT CCA GAC CAC TTC AAA CAC AAC CAC TOT 4S60
Cys Lys Tyr Asp Lya Tyr Cye Ala Asp His Phe Lys Asp Asn Hls Cys
1S0S 1510 ISIS
AAC CAC GCG TGC AAC AGT CAG CAG TCT GCT TCC GAT GCG CTG GAC TOT 4608
Aan Qln Gly Cya Aan Sex Glu Glu Cye Gly Trp Asp Gly Leu Aap Cya
1520 1525 1530
GCT CCT CAC CAA CCT GAG AAC CTG CCA CAA GGT ACC CTG GTT ATT GTG 4656
Ala Ala Aap Gin Pro Glu Aan Leu Ala Glu Gly Thr Leu Val Zle Val
1535 1540 1545
GTA TTG ATG CCA CCT GAA CAA CTO CTC CAC CAT CCT CGC AGC TTC TTC 4704
Val Leu Met Pro Pro Glu Gin Leu Leu Cln Aap Ala Arg Ser Phe Leu
1550 1SSS 1560 1565
CGC GCA CTG GGT ACC CTO CTC CAC ACC AAC CTG CGC ATT AAG CGG GAC 4752
Arg Ala Leu Gly Thr Leu Leu Hie Thr Asn Leu Arg lie Lya Arg Aap
2570 1575 lSaO
TCC CAG GGO OAA CTC ATG GTG TAC CCC TAT TAT 6GT CAC AAG TCA GCT 4800
Ser Gin Gly Clu Leu Het Val Tyr Pro Tyr Tyr Gly Glu Lys Ser Ala
1585 1590 1595
GCT ATG AAG AAA CAG AGG ATG ACA CGC AGA TCC CTT CCT GGT GAA CAA 4848
Ala Met Lye Lya Gin Arg Ket Thr Arg Arg ser Leu Pro Gly Glu Cln
1600 1605 1610
GAA CAG GAG CTG GCT GGC TCT AAA GTC TTT CTG CAA ATT GAC AAC CGC
Clu Gin Glu Val Ala Gly 8er Lys Val Phe Leu Clu Ile Aap Asn Arg
1615 1620 1625
4896
CAG TOT OTT CAA GAC TCA GAC CAC TCC TTC AAC AAC ACC CAT CCA CCA
Gin Cye Val Gin Asp Ser Aap His Cys Phe Lya Asn Thr Asp Ala Ala
1630 1635 1640 2645
4944
OCA GCT CTC CTG GCC TCT CAC GCC ATA CAC CC« ACC CTO TCA TAC CCT
Ala Ala Leu Leu Ala ser His Ala Zle Gin Gly Thr Leu ser Tyr Pro
16SO 1655 1660
4992
CTT GTG TCT CTC GTC AGT GAA TCC CTG ACT CCA GAA CCC ACT CAC CTC
Leu Val Ser Val Val Ser Glu Ser Leu Thr Pro Clu Arg Thr Cln Leu
1665 1670 167S
S040
CTC TAT CTC CTT GCT GTT GCT GTT GTC ATC ATT CTG TTT ATT ATT CTC
Leu Tyr Leu Leu Ala Val Ala Val Val Zle Ile Leu Phe Zle Zle Leu
1680 1685 1690
508B
CTC CGG CTA ATC ATC GCA AAA CGA AAG CCT AAG CAT GGC TCT CTC TGG
Leu Gly Val Zie Het Ala Lya Arg Lys Acg Lya His Gly Ser Leu Trp
1695 1700 1705
S136
190
CTG CCT GAA GGT TTC ACT CTT CGC CCA CAT CCA AGC AAT CAC AAC CGT 5184
Leu Pro Clu Cly Phe Thr Leu Arg Arg Asp Ala ser Aan His Lya Arg
1710 . . 1715 1720 172S
CCT CAG CCA GTC GGA CAG CAT CCT GTG GGG CTG AAA AAT CTC TCA CTG 5232
Arg Glu Pro Val Cly Cln Aap Ala Val Cly Leu Lya Aan Leu Ser Val
1730 173S 1740
CAA CTC TCA GAA CCT AAC CTA ATT GGT ACT GCA ACA ACT GAA CAC TGG
Cln Val Ser Glu Ala Aan Leu Zle Gly Thr Gly Thr Ser Glu Hia Trp
1745 1750 1755
5280
GTC GAT GAT GAA CGG CCC CAC CCA AAG AAA GTA AAC GCT GAA GAT CAG
Val Aep Aap Glu Giy Pro Gin Pro Lys Lys Val Lys Ala Glu Asp Glu
1760 1765 1770
5328
Gec tta erre TCA CAA GAA CAT GAC CCC ATT GAT CCA CCO CCA TGG ACA
Ala Leu Leu Ser Glu Glu Asp Aap Pro Zle Asp Arg Arg Pro Trp Thr
177S 1780 1785
S376
CAG CAG CAC CTT GAA GCT GCA GAC ATC CCT ACG ACA CCA TCG CTG GCT 5424
Gin Gin Hia Leu Glu Ala Ala Aap Zle Arg Arg Thr Pro Ser Lau Ala
1790 1795 1800 1805
CTC ACC CCT CCT CAG GCA GAG CAG GAG GTG GAT GTG TTA GAT GTG AAT 5472
Leu Thr Pro Pro Gin Ala Glu Gin Glu Val Aap Val Leu Aap Val Aan
1810 1815 1820
GTC CGT GGC CCA GAT GGC TGC ACC CCA TTC ATG TTG GCT TCT CTC CGA 5520
Val Arg Cly Pro Aap Gly cya Thr Pro Leu Het Leu Ala Ser Leu Arg
1825 1830 1835
GGA CCC AGC TCA GAT TTG ACT CAT CAA GAT GAA GAT GCA GAG OAC TCT
Gly Gly Ser Ser Aap Leu Ser Aap Glu Aap Clu Asp Ala Glu Aap Ser
1840 1845 1850
5568
TCT CCT AAC ATC ATC ACA CAC TTC GTC TAC CAG GCT GCC ACC CTC CAG
Ser Ala Aen Ile Ile Thr Asp Leu Val Tyr Gin Oly Ala Ser Leu Cln
18SS 1860 1865
5616
GCi SAG ACA GAC CGG ACT GGT GAG ATG GCC CTG CAC CTT CCA CCC CGC S664
A.-.© ein Thr Aap Arg Thr Gly Glu Met Ala Leu Hia Leu Ala Ala Arg
If. 3 1875 1880 1885
TAC TCA CGC GCT GAT GCT GCC AAG CGT CTC CTG GAT GCA GGT GCA GAT S712
Tyr Ser Arg Ala Aap Ala Ala Lya Arg Leu Leu Aap Ala Cly Ala Aap
1890 1895 ... 1900
GCC AAT CCC CAG GAC AAC ATC GGC CGC TCT CCA CTC CAT CCT CCA GTC
Aia Aan Ala Gin Aap Aan Met Cly Arg eye Pro Leu Hia Ala Ala Val
1905 1910 1915
S760
CCA CCT OAT CCC CAA CCT GTC TTC CAO ATT CTB ATT CGC AAC CCA CTA
Ala Ala Aap Ala Gin Gly Val Phe Gin Zle Leu Zle Arg Asn Arg Val
1920 192S 1930
S808
ACT GAT CTA GAT CCC AGG ATC AAT CAT GGT ACT ACA CCC CTG ATC CTG
Thr Aap Leu Aap Ala Arg Met Asn Aap Gly Thr Thr Pro Leu Zle Leu
193S 1940 194 S
5856
GCT GCC CGC CTG GCT GTG GAG GGA ATG CTG GCA CAA CTG ATC AAC TCC 5904
Ala Ala Arg Leu Ala Val Olu Gly Ket Val Ala Olu Leu Zle Aan Cya
2950 1955 1960 1965
CAA CCG GAT GTG AAT GCA GTG GAT CAC CAT GGA AAA TCT GCT CTT CAC 5952
Oln Ala Aep Val Asn Ala Val Asp Asp Hie Gly Lys Ser Ala Leu Hia
1970 197S 1980
191
TOO GCA GCT GCT CTC AAT AAT GTC GAC GCA ACT CTT TTC TTC TTG AAA
Trp Ala Ala Ala Val Aen Asn Val Glu Ala Thr Leu Leu Leu Leu Lya
1985 1990 1995
6000
AAT GCO GCC AAC CCA GAC ATC CAO CAC AAC AAO CAA CAO ACA CCT CTO 6048
Aan Gly Ala Asn Arg Asp Met Cln Asp Aan Lys Glu Clu Thr Pro Leu
2000 2005 2010
TTT CTT GCT CCC CCG GAG GGO AGC TAT GAA GCA GCC-AAG ATC CTG TTA 6096
Phe Leu Ala Ala Arg Glu Cly Ser Tyr Clu Ala Ala Lya lie Leu Leu
2015 2020 2025
CAC CAT TTT GCC AAT CGA CAC ATC ACA CAC CAT ATC CAT COT CTT CCC
Aep Hie Phe Ala Asn Arg Asp Zle Thr Asp His Met Asp Arg Leu Pro
2030 2035 2040 2045
6144
CGG GAT GTG GCT CCG GAT CGC ATC CAC CAT GAC ATT GTC CCC CTT CTG
Arg Asp Val Ala Arg Asp Arg Het His His Asp Zle Val Arg Leu Leu
2050 20SS 2060
6192
CAT GAA TAC AAT GTC ACC CCA AGC CCT CCA GGC ACC CTG TTG ACT TCT
Aap Clu Tyr Aan Val Thr Pro Ser Pro Pro Gly Thr Val Leu Thr Ser
2065 2070 2075
6240
GCT CTC TCA CCT GTC ATC TGT GGG CCC AAC AGA TCT TTC CTC ACC CTG
Ala Leu Ser Pro Val Zle Cya Gly Pro Aen Arg Ser Phe Leu Ser Leu
2080 2085 2090
6288
AAG CAC ACC CCA ATG CGC AAG AAC TCT ACA CGG CCC ACT CCC AAC ACT 6336
Lys Hie Thr Pro Met Gly Lys Lys Ser Arg Arg Pro Ser Ala Lys Ser
2095 2100 2105
ACC ATC CCT ACT ACC CTC CCT AAC CTT GCC AAG GAG GCA AAC GAT CCC 6384
Thr Met Pro Thr Ser Leu Pro Asn Leu Ala Lys Clu Ala Lys Asp Ala
2110 2115 2120 212S
AAG GGT AGT AGG AGO AAG AAG TCT CTC AGT CAO AAG GTC CAA CTC TCT 6432
Lye Gly Ser Arg Arg Lya. Lya Ser Leu ser Glu Lys Val Gin Leu Ser
2130 2135 2140
GAG AGT TCA GTA ACT TTA TCC CCT GTT CAT TCC CTA CAA TCT CCT CAC
Glu ser Ser Val Thr Leu Ser Pro Val Asp Ser Leu Glu Ser Pro Hia
214S 2150 2155
6480
AOO TAT GTT TCC CAC ACC ACA TCC TCT CCA ATC ATT ACA TCC CCT GGG
Thr Tyr Val Ser Aep Thr Thr Ser Ser Pro Mae lis Thr Ser Pro Cly
21SO 2165 2170
6528
ATC TTA CAG 0CC TCA CCC AAC CCT ATC TTG GCC ACT OOC GCC CCT CCT
Zle Leu Gin Ala Ser Pro Asn Pro Met Leu Ala Thr Ala Ala Pro Pro
2175 2180 2185
6576
GCC CCA GTC CAT GCC CAG CAT GCA CTA TCT TTT TCT AAC CTT CAT GAA
Ala Pro Val His Ala Gin Hia Ala Leu sex Phe Ser Asn Leu Hia Glu
2190 2195 2200 2205
6624
ATG CAG CCT TTG GCA CAT CGG GCC AGC ACT GTG CTT CCC TCA CTC AGC
Met Gin Pro Leu Ala His Gly Ala Ser Thr Val Leu Pro Sex Val Ser
2210 2215 2220
6672
CAG TTC CTA TCC CAC CAC CAC ATT GTG TCT CCA CGC ACT CCC ACT CCT 6720
Gin Leu Leu Ser Hie Hie His Zle Val Ser Pro Cly Ser Cly ser Ala
2225 . 2230 2235
GGA AGC TTC AGT ACG CTC CAT CCA GTC CCA CTC CCA'CCA CAT TGC ATC 6768
Gly Sex Leu Ser Arg Leu His Pro val Pro Val pro Ala Asp Trp Met
2240 2245 2250
192
AAC CGC ATG GAG GTG AAT GAG ACC CAG TAC AAT GAG ATC TTT GCT ATG 6816
Aen Arg Met Glu Val Aen Olu Thr Cln. Tyr Aan Glu Met Phe Cly Het
22SS 2260 226S
CTC CTG OCT CCA GCT CAO GGC ACC CAT CCT GGC ATA OCT CCC CAO ACC ? 6864
Val Leu Ala Pro Ala Clu Cly Thr Hia Pro Cly Zle Ala Pro Cln Ser
2270 2275 2280 2285
AGG CCA CCT GAA GGG AAG CAC ATA ACC ACC CCT CGC GAC CCC TTG CCC 6912
Arg Pro Pro Glu Gly Lya Hia Zle Thr Thr Pro Arg Glu Pro Leu Pro
2290 2295 2300
CCC ATT CTO ACT TTC CAO CTC ATC CCT AAA CCC AGT ATT GCC CAA CCA 6960
Pro Zle Val Thr Phe Cln Leu lie Pro Lya Cly Ser Zle Ala Gin Pro
2305- 2310 2315
GCG CGC CCT CCC CAO CCT CAC TCC ACC TCC CCT CCA OCT GTT CCC G0C 7008
Ala Gly Ala Pro Gin Pro Oln ser Thr Cya Pro Pro Ala Val Ala Gly
2320 2325 2330
CCC CTO CCC ACC ATC TAC CAO ATT CCA CAA ATG CCC CGT TTC CCC ACT 70S6
Pro Leu 'Pro Thr Met Tyr Gin Zle Pro Clu Met Ala Arg Leu Pro Ser
2335 2340 2345
GTC CCT TTC CCC ACT GCC ATG ATG CCC CAG CAG GAC GGG CAG GTA GCT 7104
Val Ala Phe Pro Thr Ala Met Met Pro Gin Gin Asp Gly cln val Ala
2350 2355 2360 2365
CAC ACC ATT CTC CCA CCC TAT CAT CCT TTC CCA CCC TCT GTC GGC AAG 7152
Gin Thr Zle Leu Pro Ala Tyr Hia Pro Phe Pro Ala sex Val Gly Lya
2370 2375 2380
TAC CCC ACA CCC CCT TCA CAS CAC AGT TAT GCT TCC TCA AAT GCT GCT 7200
Tyr Pro Thr Pro Pro Ser Gin Hia ser Tyr Ala Ser ser Aen Ala Ala
2385 2390 2395
GAG CCA ACA CCC ACT CAC ACT GGT CAC CTC CAG GGT GAG CAT CCC TAC 7248
Glu Arg Thr Pro Ser Hia ser Gly His Leu cln Cly Glu Hia Pro Tyr
2400 2405 2410
CTG ACA CCA TCC CCA GAC TCT CCT GAC CAG TGC TCA AGT TCA TCA CCC 7296
Lttu Thr Pro Sor Pro Glu ser Pro Aap Gin Trp Ser Ser Ser Ser Pro
241S 2420 2425
CAC TCT GCT TCT GAC TGG TCA GAT GTC ACC ACC AGC CCT ACC CCT GCG 7344
Bio Ser Ala Ser Aep Trp ser Aap val Thr Thr Ser Pro Thr Pro Cly
2430 2435 2440 2445
GCT GCT CGA GGA GCT CAC CCC CCA CCT CCG ACA CAC ATG TCT GAG CCA 7392
Gly Ala Cly Gly Gly Gin Arg Gly Pro Cly Thr Hie Met Ser Glu Pro
24SO 2455 2460
CCA CAC AAC AAC ATG CAG GTT TAT GCG TGAGAGAGTC CACCTCCAGT 7439
Pro Hia Aan Aan Met Cln val Tyr Ala
2465 2470
GTAGAGACAT AACTGACTTT TGTAAATGCT GCTCAGGAAC AAATGAACCT CATCCGCGAO 7499
AGAAATGAAG AAATCTCTGG AGCCACCTTC TACAGGTACG AAAGAGAAGA TCTTCTTATT 7559
CAGATAATGC AAOAGAAGCA ATTCGTCAGT TTCACTGGGT ATCTGCAACG CTTATTGATT 7619
ATTCTAATCT AATAAGACAA GTTTGTGGAA ATGCAAGATG AATACAAGCC TTCGGTCCAT 7679
CTTTACTCTC TTCTATTTGC AGAATAAGAT CGATCCTTAT TCAAGCCCAG ACATTCTTCC 7739
AGCTTGCACT CCATTTTAAC CCCTGCAGCC TTCTCCCATA TCCATCAGAA CATTCTACAC 7799
193
TAGCOTCCTC TTGGGAATTA TGCCCTGGAA TTCTCCCTCA ATTGACCTAC CCATCTCCTC 78S9
CTCCTTGGAC ATTCTTTTGT CTTCATTTCG TCCTTTTCCT TTTCCACCTC TCCGTCATTC 7919
TAGCCCTACC ACCATGTTAT AOGCCAACAC CTTTGTGfcTT TTGATCATTC TGGCCCATGA 7979
AAGCAACTTT GGTCTCCTTT CCCCTCCTCT CTTCOCGGTA TCCCTTCGAO TCTCACAAGG 8039
TTTACTTTCC TATCGTTCTC AGCACAAACC TTTCAACTAT OTTCTTTCTT TCCAAAATGG 8099
ACATACTGTA TTGTGTTCTC CTCCATATAT CATTCCTCGA GAGACAACGG OAGAAGAATA 8159
CTTTTCTTCA ACAAATTTTC GGCGCACCAG ATCCCTTCAA GACCCTCCAC CTTAATTTTT 8219
CTTCTCTGTÇ TCCACCTCTT CATATAAACT TTACCAGCAA GAACCGTGTG AGTTTOTTGT 8279
TTTTCTCTOT ATGG6CCTGG TCAGT6TAAA GTTTTATCCT TCATAGTCTA CTTACTATGA 8339
CCCTCCCCAC TTTTTTAAAA CCAGAAAAAO OTTTCGAATO TTOOAATOAC CAACAOACAA 8399
CTTAACTC6T CCAA6ACCCA CTTACCCACC CACACGTCCC CCTACTTCCT CCCAAGCATT 84S9
CCATTGACTC CCTCTATCGA ACACATTTCT CCCAGATCTG AGCATTCTAC CCCTCTTTCA 8519
CTCACTCACC CAGCATATGA AACTACTCTT AACTGTTGAG CCTTTCCTTT CATATCCACA 8579
GAAGACACTG TCTCAAATGT TGTACCCTTG CCATTTACGA CTGAACTTTC CTTACCCCAA 8639
GGGACCCAGT GACAGTTGTC TTCCGTTTGT CAGATCATCA GTCTCTACTC ATTATCTTGC 8699
TCCTTAAACG CCTCCTCACC AATCTTTCTT TCACACCGTC TCCTCeCTCT TACTCCTATA 8759
CCCAOTATGT TCTCACTCAA GACATOGACT TTATATOTTC AACT0CA6GA ATTGGAAAGT 8819
TCGACTTGTT TTCTATGATC CAAAACAGCC CTATAAOAAC CTTCGAAAAG GACGAACTAT 8879
ATAOCAOCCT TTOCTATTTT CTOCTACCAT TTCTTTTCCT CTGAACCCOC CATCACATTC 8939
CCTTTG6CAA CTAAOGTAGA AACTCAACAG AACATTTTCC TTTCCTAGAG TCACCTTTTA 8999
OATGATAATO GACAACTATA GACTTGCTCA TTOTTCAOAC TOATTCCCCC TCACCTGAAT 90S9
CCACTCTCTG TATTCATGCT CTTGOCAATT TCTTTGACTT TCTTTTAAGG GCAGAACCAT 9119
TTTAGTTAAT TGTAGATAAA GAATAGTTTT CTTCCTCTTC TCCTTGGGCC AGTTAATAAT 9179
TGGTCCATGG CTACACTGCA ACTTCCCTCC AGTCCTCTGA TCCCCATGAC ACCTCCAAAA 9239
TAAGTTCTCC CTCCGCATTT TCTACATATT AACACCTCAA TTCCCCACTC TTTTCGTTTC 9299
AATGACACTT CTCATTCCTT CTATCCCTOC AACTATCCAT CAGTCCTTCC CACTTACCTG 9359
ATTTGTCTGT CGGT06CCCC ATATGCAAAC CCTGCGTgTC TGTTGGCATA ATAGTTTACA 9419
AATCCTTTTT TCACTCCTAT CCAAATTTAT TCAACCAACA AAAATAATTA CTTCTGCCCT 9479
CAGATAACCA GATTAAGTTT GTTCATTCTC TCCTTTATTC TCTCCATCTO CCAACATTCT 9S39
GTCACCCTCT TTCATAOTCT GCAAACATTT TATCATTCTA AATGGTOACT CTCTCCCCTT 9599
G6ACCCATTT ATTATTCACA GATGGGOAGA ACCTATCTGC ATGGACCCTC ACCATCCTCT 9659
GTCCAGCACA CACAOTGCAG GOACCCACTG GCG ATCCCCA TCACTTTCTT CCCCTGGOAA 9719
TTCC 9723
194
REVENDICATIONS
1. Composition pharmaceutique comprenant un anticorps de
neutralisation anti-Notch, et un excipient
pharmaceutiquement acceptable.
5 2. Composition pharmaceutique comprenant un fragment ou
dérivé d'un anticorps à une protéine Notch contenant
l'idiotype de l'anticorps ; et un excipient
pharmaceutiquement acceptable.
10 3. Utilisation d'une composition comprenant une molécule
qui s'oppose à la fonction d'une protéine Notch, pour la
fabrication d'un médicament destiné au traitement d'une
condition cancéreuse ou pour empêcher la progression d'un
état pré-néoplasique ou non malin en un état néoplasique
15 ou malin, dans laquelle la molécule est choisie dans le
groupe constitué d'un acide nucléique antisens Notch, un
anticorps de neutralisation anti-notch, un fragment
contenant le domaine de liaison d'un anticorps dirigé
contre Notch, et une protéine comprenant l'ELR-11 et
20 l'ELR-12 Notch.
4. Utilisation selon la revendication 3, dans laquelle la
condition cancéreuse ou l'état néoplasique ou malin est
un cancer du col de l'utérus, un cancer du sein ou un
25 cancer du côlon.
5. Utilisation d'une molécule, laquelle s'oppose à la
fonction d'une protéine Notch, pour la fabrication d'un
médicament pour le traitement chez un sujet d'une
30 malignité, ladite malignité étant caractérisée par (i)
195
une activité Notch accrue ou (ii) une expression accrue
d'une protéine Notch ou (iii) une expression accrue d'un
dérivé Notch capable d'être lié par un anticorps anti-
Notch, relativement à ladite activité ou expression Notch
5 dans un échantillon non malin analogue, dans lequel la
molécule est choisie dans le groupe constitué d'un acide
nucléique antisens Notch, d'un anticorps de
neutralisation anti?Notch, d'un fragment contenant le
domaine de liaison d'un anticorps dirigé contre Notch, et
10 d'une protéine comprenant l'ELR-11 et ELR-12 Notch.
6. Utilisation selon la revendication 5, dans laquelle le
sujet est un être humain.
15 7. Utilisation selon la revendication 4, dans laquelle la
molécule est un anticorps de neutralisation anti-Notch ou
une portion dudit anticorps contenant le domaine de
liaison de celui-ci.
20 8. Utilisation selon la revendication 4, dans laquelle la
protéine comprenant l'ELR-11 et 1'ELR-12 Notch est un
fragment Notch comprenant le domaine extracellulaire
d'une protéine Notch ou sa portion capable de se lier à
un ligand Notch.
25
9. Utilisation selon la revendication 4, dans laquelle la
protéine comprenant l'ELR-11 et 1'ELR-12 Notch est un
fragment Notch comprenant la reproduction Notch.
30 10. Utilisation selon la revendication 4, dans laquelle
la protéine comprenant l'ELR-11 et 1'ELR-12 Notch est un
10
196
fragment Notch comprenant un fragment adhésif d'une
protéine Notch.
11. Utilisation selon la revendication 4, dans laquelle
l'acide nucléique antisens Notch est un oligodinucléotide
qui (a) consiste en au moins six nucleotides ; (b)
comprend une séquence complémentaire à au moins une
portion d'un transcrit d'ARN d'un gène Notch ; et (c)
peut être hybride au transcrit d'ARN.
12. Utilisation d'un anticorps de neutralisation anti-
Notch d'un médicament pour la prévention ou le traitement
d'une malignité chez un sujet.
15 13. Utilisation selon la revendication 12, dans laquelle
l'anticorps est monoclonal.
14. Procédé de diagnostic d'une malignité, caractérisé
par une quantité accrue d'une protéine Notch ou d'un
20 dérivé Notch capable d'être lié par un anticorps anti-
Notch, comprenant la mesure de la quantité d'une protéine
Notch, ou d'un dérivé Notch capable d'être lié par un
anticorps anti?Notch, dans un échantillon contenant ou
suspecté de contenir des cellules malignes, prélevé sur
25 un patient, dans lequel une augmentation de la quantité
de protéine Notch ou du dérivé Notch capable d'être lié
par un anticorps anti-Notch, dans l'échantillon,
relativement à ladite quantité trouvée dans un
échantillon analogue de cellules non malignes, indique la
30 présence de la maladie ou du trouble chez le patient.
197
15. Procédé selon la revendication 14, dans lequel la
malignité est un cancer du col de l'utérus.
16. Procédé selon la revendication 14, dans lequel la
5 malignité est un cancer du sein.
17. Procédé selon la revendication 14, dans lequel la
malignité est un cancer du côlon.
10 18. Procédé selon la revendication 14, dans lequel la
quantité de protéine ou de dérivé Notch est mesurée par
un procédé comprenant la mise en contact de l'échantillon
avec un anticorps anti-Notch, de sorte que la liaison
immunospécifique puisse avoir lieu, et la mesure de la
15 quantité de n'importe quelle liaison immunospécifique de
l'anticorps qui pourrait survenir.
19. Composition comprenant une quantité thérapeutiquement
efficace d'une molécule qui s'oppose à la fonction d'une
20 protéine Notch, à utiliser comme médicament, dans
laquelle la molécule est choisie dans le groupe constitué
d'un acide nucléique antisens Notch, d'un anticorps de
neutralisation anti-Notch, d'un fragment contenant le
domaine de liaison d'un anticorps dirigé contre Notch, et
25 d'une protéine comprenant l'ELR-11 et 1'ELR-12 Notch.
198
EP O 662 827 B1
GAATTCGGAG GAATTATTCA AAACATAAAC ACAATAAACA ATTTGAGTAG TTGCCGCACA 60
CACACACACA CACAGCCCGT GGATTATTAC ACTAAAAGC& ACACTCAAÎC CAAAAAATCA 120
GCAACAAAAA CATCAATAAA C ATG CAT TGG ATT AAA TGT TTA TTA ACA GCA I7l
Het His Irp Ile Lys Cys Leu Leu Thr Aio
15 10
TTC ATT JX TTC ACA GTC MC GTG CAG GTT CAC AGT KC GCC AGC JU 219
Phe Ile Cys Phe Thr Vûl lie Vol Gin Val His Ser Ser Gly Ser Phe
15 20 25
GAG TTG CGC CTG AAG TAC TTC AGC AAC GAT CAC GGG CGG GAC AAC GAG 267
Glu Leu Arg Leu Lys Tyr Phe Ser Asn Asp His Gly Arg Asp Asn Glu
30 35 40
GGT CGC TGC TGC AGC GGG GAG TCG GAC GGA GCG ACG GGC AAG TGC CTG 315
Gly Arg Cys Cys Ser Gly Glu Ser Asp Gly Alo Thr Gly Lys Cys Leu
45 50 55
GGC AGC TGC AAG ACG CGG TTT CGC GTC TGC CTA AAG CAC TAC CAG GCC 363
Gly Ser Cys Lys Thr Arg Phe Arg Val Cys Leu Lys His Tyr Gin Ala
60 65 .70
ACC ATC GAC ACC ACC TCC CAG TGC ACC TAC GGG GAC GTG ATC ACG CCC 411
Thr Ile Asp Thr 7hr Ser Gin Cys Thr Tyr Gly Asp Vol lie Thr Pro
75 80 85 90
ATT CK GGC GAG AAC TCG GTC AAT CTG ACC GAC GCC CAG CGC TTC CAG 459
lie Leu Gly Glu Asn Ser Val Asn Leu Thr Asp AU Gin Arg Phe Gin
95 100 105
AAC AAG GGC TTC ACG AAT CCC ATC CAG TTC CCC TTC TCG TTC TCA TGG 507
Asn Lys Gly Phe Thr Asn Pro Ile Gin Phe Pro Phe Ser Phe Ser Trp
110 115 120
FIG.1A
120
BNSDOCID:<EP 066282781 I >
199
EP O 662 827 B1
CCG GGT ACC TTC TCG CTG ATC GTC GAG GCC TGG CAT GAT ACG AAC AAT 555
Pro Gly Thr Phe Ser Leu Ile Vol Glu Ala Tro His Asp Thr Asn Asn
125 130 135
AGC GGC AAT GCG CGA ACC AAC AAG CK CTC ATC CAG CGA CK TTG GTG 603
Ser Gly Asn A(q Arg Thr Asn Lys Leu Leu He Gin Arg Leu Leu VqI
140 I45 150
CAG CAG GTA CTG GAG GTG TCC TCC GAA TGG AAG ACG AAC AAG TCG GAA 651
Gin Gin Vol Leu Glu Vol Ser Ser Glu Trp Lys Thr Asn Lys Ser Glu
155 160 165 170
TCG CAG TAC ACG TCG CTG GAG TAC GAT TTC CGT GTC ACC TGC GAT CTC 699
Ser Gin Tyr Thr Ser Leu Glu Tyr Asp Phe Arg Val Thr Cys Asp Leu
175 180 185
AAC TAC TAC GGA TCC GGC TGT GCC AAG TTC TGC CGG CCC CGC GAC GAT 747
Asn Tyr Tyr Gly Ser Gly Cys Ala Lys Phe Cys Arg Pro Arg Asp Asp
190 195 200
TCA TTT GGA CAC TCG ACT TGC TCG GAG ACG GGC GAA ATT ATC TGT TTG 795
Ser Phe Gly His Ser Thr Cys Ser Glu Thr Gly Glu lie lie Cys Leu
205 210 215
ACC GGA TGG CAG GGC GAT TAC TGT CAC ATA CCC AAA TGC GCC AAA GGC 843
Thr Gly Trp Gin Gly Asp Tyr Cys His He Pro Lys Cys Ala Lys Gly
220 225 230
TGT GAA CAT GGA CAT TGC GAC AAA CCC AAT CAA TGC GTT TGC CAA CTG 891
Cys Glu His Gly His Cys Asp Lys Pro Asn Gin Cys Val Cys Gin Leu
235 240 245 250
GGC TGG AAG GGA GCC TTG TGC AAC GAG TGC GTT CTG GAA CCG AAC TGC 939
Gly Trp Lys Gly Ala Leu Cys Asn Glu Cys Vol Leu Glu Pro Asn Cys
255 260 265
FIG. IB
121
BNSDOCID: <EP 0662827B1 I >
200
EP 0 662 827 B1
ATC CAT GGC ACC TGC AAC AAA CCC TGG ACT TGC ATC TGC AAC GAG GGT 987
He His Gly Thr Cys Asn Lys Pro Tro Thr Cys lie Cys Asn Glu Gly
270 275 280
TGG GGA GGC TTG TAC TGC AAC CAG GAT CÎG AAC TAC TGC ACC AAC CAC 1035
Trp Gly Gly Leu Tyr Cys Asn Gin Asp Leu Asn Tyr Cys Thr Asn His
285 290 295
AGA CCC TGC AAG AAT GGC GGA ACC TGC TTC AAC ACC GGC GAG GGA TTG 1083
Arg Pro Cys Lys Asn Gly Gly Thr Cys Phe Asn Thr Gly Glu Gly Leu
300 305 310
TAC ACA TGC AAA TGC GCT CCA GGA TAC AGT GGT GAT GAT TGC GAA AAT 1131
Tyr Thr Cys Lys Cys Ala Pro Gly Tyr Ser Gly Asp Asp Cys Glu Asn
315 320 325 330
GAG ATC TAC TCC TGC GAT GCC GAT GTC AAT CCC TGC CAG AAT GGT GGT 1179
Glu lie Tyr Ser Cys Asp Aio Asp Val Asn Pro Cys Gin Asn Gly Gly
335 340 345
ACC TGC ATC GAT GAG CCG CAC ACA AAA ACC GGC TAC AAG TGT CAT TGC 1227
Thr Cys He Asp Glu Pro His Thr Lys Thr Gly Tyr Lys Cys His Cys
350 355 360
GCC AAC GGC TGG AGC GGA AAG ATG TGC GAG GAG AAA GTG CTC ACG TGT 1275
Ala Asn Gly Trp Ser Gly Lys Met Cys Glu Glu Lys Val Leu Thr Cys
365 370 375
TCG GAC AAA CCC TGT CAT CAG GGA ATC TGC CGC AAC GTT CGT CCT GGC 1323
Ser Asp Lys Pro Cys His Gin Gly He Cys Arg Asn Val Arg Pro Gly
380 385 390
TTG GGA AGC AAG GGT CAG GGC TAC CAG TGC GAA TGT CCC ATT GGC TAC 1371
Leu Gly Ser Lys Gly Gin Gly Tyr Gin Cys Glu Cys Pro He Gly Tyr
395 400 405 410
FIG. 1C
122
BNSDOCID: <EP 0662827B1 I >
201
EP O 662 827 B1
AGC GGA CCC AAC TGC GAT CK CAG CTG GAC AAC TGC AGT CCG AAT CCA 1419
Ser Gly Pro Asn Cys Asp Leu Gin Leu Asp Asn Cys Ser Pro Asn Pro
415 420 425
TGC ATA AAC GGT GGA AGC TGT CAG CCG AGC GGA AAG TGT ATT TGC CCA 1467
Cys Ile Asn Gly Gly Ser Cys Gin Pro Ser Gly Lys Cys Ile Cys Pro
430 . 435 440
GCG GGA TTT TCG GGA ACG AGA TGC GAG ACC AAC ATT GAC GAT TGT CTT 1515
Ala Gly Phe Ser Gly Thr Arg Cys Glu Thr Asn He Asp Asp Cys Leu
445 450 455
GGC CAC CAG TGC GAG AAC GGA GGC ACC TGC ATA GAT ATG GTC AAC CAA 1563
Gly His Gin Cys Glu Asn Gly Gly Thr Cys He Asp Met Val Asn Gin
460 465 470
TAT CGC TGC CAA TGC GTT CCC GGT TTC CAT GGC ACC CAC TGT AGT AGC 1611
Tyr Arg Cys Gin Cys Val Pro Gly Phe His Gly Thr His Cys Ser Ser
475 480 485 490
AAA GTT GAC TTG TGC CTC ATC AGA CCG TGT GCC AAT GGA GGA ACC TGC 1659
Lys Val Asp Leu Cys Leu Ile Arg Pro Cys Ala Asn Gly Gly Thr Cys
495 500 505
TTG AAT CTC AAC AAC GAT TAC CAG TGC ACC TGT CGT GCG GGA TTT ACT 1707
Leu Asn Leu Asn Asn Asp Tyr Gin Cys Thr Cys Arg Ala Gly Phe Thr
510 515 520
GGC AAG GAT TGC TCT GTG GAC ATC GAT GAG TGC AGC AGT GGA CCC TGT 1755
Gly Lys Asp Cys Ser Val Asp He Asp Glu Cys Ser Ser Gly Pro Cys
525 530 535
CAT AAC GGC GGC ACT TGC ATG AAC CGC GTC AAT TCG TTC GAA TGC GTG 1803
His Asn Gly Gly Thr Cys Met Asn Arg Vol Asn Ser Phe Glu Cys Vol
540 545 550
FIG. 1D
123
BNSDOCID: <EP 0662827B1 I >
202
EP 0 662 827 B1
TGT GCC AAT GGT TTC AGG GGC AAG CAG TGC GAT GAG GAG TCC TAC GAT 185I
Cys Aio Asn Gly Phe Arg Gly Lys Gin Cys Asp Glu Glu Ser Tyr Asp
555 560 565 570
TCG GTG ACC TTC GAT GCC CAC CAA TAT GGA GCG ACC ACA CAA GCG AGA 1899
Ser Vol Thr Phe Asp Ala HiS-GIn Tyr Gly Aio Thr Thr Gin Ala Arg
575 580 585
GCC GAT GGT TTG ACC AAT GCC CAG GTA GTC CTA ATT GCT GTT TTC TCC 1947
Aio Asp Gly Leu Thr Asn Ala Gin Val Val Leu He Ala Val Phe Ser
590 595 600
GTT GCG ATG CCT TTG GTG GCG GTT ATT GCG GCG TGC GTG GTC TTC TGC 1995
Val Ala Met Pro Leu Val Ala Val He Ala Ala Cys Val Val Phe Cys
605 610 6I5
ATG AAG CGC AAG CGT AAG CGT GCT CAG GAA AAG GAC GAC GCG GAG GCC 2043
Met Lys Arg Lys Arg Lys Arg Ala Gin Glu Lys Asp Asp Ala Glu Alo
620 625 630
AGG AAG CAG AAC GAA CAG AAT GCG GTG GCC ACA ATG CAT CAC AAT GGC 209I
Arg Lys Gin Asn Glu Gin Asn Ala Val Ala Thr Met His His Asn Gly
635 640 645 650
AGT GGG GTG GGT GTA GCT TTG GCT TCA GCC TCT CTG GGC GGC AAA ACT 2139
Ser Gly Vol Gly Val Ala Leu Ala Ser Alo Ser Leu Gly Gly Lys Thr
655 660 665
GGC AGC AAC AGC GGT CTC ACC TTC GAT GGC GGC AAC CCG AAT ATC ATC 2187
Gly Ser Asn Ser Gly Leu Thr Phe Asp Gly Gly Asn Pro Asn He lie
670 675 . 680
AAA AAC ACC TGG GAC AAG TCG GTC AAC AAC ATT TGT GCC TCA GCA GCA 2235
Lys Asn Thr Trp Asp Lys Ser Val Asn Asn He Cys Ala Ser Ala Ala
685 690 695
FIG. IE
124
BNSDOCID: <EP 0662827B1 I >
203
EP 0 662 827 B1
GCA GCG GCG GCG GCG GCA GCA GCG GCG GAC GAG TGT CTC ATG TAC GGC 2283
A(q Alo Ala Ala Ala Ala Ala Alo Ala Asp Glu Cys Leu Met Tyr Gly
700 705 7I0
GGA TAT GTG GCC TCG GTG GCG GAT AAC AAC AAT GCC AAC TCA GAC TTT 2331
Gly Tyr Val Ala Ser Vol Ala Asp Asn Asn Asn Ala Asn Ser Asp Phe
715 . 720 725 730
TGT GTG GCT CCG CTA CAA AGA GCC AAG TCG CAA...ÔAG CAA CTC AAC ACC 2379
Cys Val Alo Pro Leu Gin Arg Alo Lys Ser Gin Lys Gin Leu Asn Thr
735 740 745
GAT CCC ACG CTC ATG CAC CGC GGT TCG CCG GCA GGC AGC TCA GCC AAG 2427
Asp Pro Thr Leu Met Hfs Arg Gly Ser Pro Ala Gly Ser Ser Ala Lys
750 755 760
GGA GCG TCT GGC GGA GGA CCG GGA GCG GCG GAG GGC AAG AGG ATC TCT 2475
Gly Ala Ser Gly Gly Gly Pro Gly Alo Ala Glu Gly Lys Arg He Ser
765 770 775
GTT TTA GGC GAG GGT TCC TAC TGT AGC CAG CGT TGG CCC TCG TTG GCG 2523
Vol Leu Gly Glu Gly Ser Tyr Cys Ser Gin Arg Trp Pro Ser Leu Alo
780 785 790
GCG GCG GGA GTG GCC GGA GCC TGT TCA TCC CAG CTA ATG GCT GCA GCT 2571
Ala Ala Gly Vol Ala Giy Ala Cys Ser Ser Gin Leu Met Ala Ala Ala
795 800 805 .810
TCG GCA GCG GGC AGC GGA GCG GGG ACG GCG CAA CAG CAG CGA TCC GTG 2619
Ser Ala Ala Gly Ser Gly Ala Gly Thr Ala Gin Gin Gin Arg Ser Val
815 820 825
GTC TGC GGC ACT CCG CAT ATG TAACTCCAAA AATCCGGAAG GGCTCCTGGT 2670
Val Cys Gly Thr Pro His Met
830
AAATCCGGAG AAATCCGCAT GGAGGAGCTG ACAGCACATA CACAAAGAAA AGACTGGGTT 2730
GGGTTCAAAA TGTGAGAGAG ACGCCAAAAT GTTGÎTGTTG ATTGAAGCAG TTTAGTCGTC 2790
ACGAAAAATG AAAAATCTGT AACAGGCATA ACTCGTAAAC TCCCTAAAAA ATTTGTATAG 2850
TAATTAGCAA AGCTGTGACC CAGCCGTTTC GATCCCGAAT TC 2892
FIG.1F
125
BNSDOCID: <EP <lfifK>R?7R1 I >
204
EP O 662 827 B1
l.pMINMg
2.ASph
3.ACIo
4.AEGF(7-17)
5.AEGF(9-26)
6.AEGF(17-30)
7.AEGF(7-9)
8.AEGF(9-17)
9.AECF(17-26)
lOAEGF(26-30)
11.AEGF(9-30)
12-AEGF(7-26)
13-ACIo+EGF(9-17)
14.ACIa+EGF(17-26)
15.SPUT
l6-ACIo+EGF(9-13)
SP
EGF
a
% AGGREGATION ->>
TM WITH Dl WITH Ser
edelO PA opo
llllll YA H I 40 21
I
32
7 31
rrrnnnj_________jnn
7 17
iïlIP^
mmmm.
26
n
17 3i
O
79
iiiiimiiiiii/imii/miiiiimifii
9 17___________
iïMinn^iiiMiiiiiiiiii i
_________17 26_____
iiiiiiiiiiiiiiiiiiii^jniDnr
?26 3\
"iiiiiiiiiiiiiiiiiiiiiiim^fiïnrr
______9
ff.
31
7 26
ErDmni________
7 9 17 31
11 iiiiimjTnnni______fTnrf~r
7 17 26 31
II Illlllll____ßMlJMTT
14
iiiiimiiiiiimiiiiiiiiiiiiiniiiiiia
7 913 31
rnnnnuniL._______inn:
YA H I 0
VA H I 5
VA n 1 0 nt
YA n I 0 nl
llllll YA H I 0 ni
M H I 0 nt
mm va ri i 22 nt
'm » ' 20 14
HIG.2A
""" m n i io 8
mm va m i 0 nt
YA O I 0 nt
YA H I 35 20
llllll YA H 1 0 nl
llllll YA H I 42 nt
YA Q I 47 25
J
126
BNSDOCID: <EP 0662827B1 I >
205
EP 0 662 827 B1
7 1115 31
17.AClo+EGF(11-15) OMUniU^JinEE
7 '3 17 31
i8.acio+egf(i3-i7) mnni^jiü^jim
7IO13 31
i9.acio+egf(io-i3) mnniuiL__
7II13 31
20.ACIo+EGF(11-13) CIinHJIL^^^
7IO12 31
21.ACIo+EGF(10-l2) rmnnyn______nwr
7IO11 31
22.ACIa+EGF(lO-1l) mnDUL_______1QIIEE
7IO12 31
23.ACIo+EGF{10-12) mimqjn "______mnrrr
7II12 ^
24.ACIa+EGF(il-l2) rrmn\jm_____fnrnr
25. AEGF
1 9 17
26.AEGF+EGF(9-I7) El f» _ JE
1 913
27.AEGF+EGF(9-13) Dl^IinL___Jin
1 10,3
28.AEGF+EGF(10-13) ul^jC^^JEI
1 ,012
29.AEGF+EGF(10-12)
30.AECN
1
10
13
31.AECN+EGF(10-13) W^ßL^_JBX
1 »o12
32.AECN+EGF(10-12)
7 ©O 31
33. i^lo+XEGF(10-l3)rJ3fflin^jrJIL^^injT^
m va » ' 0 0 ">
VA H I 0 ni
»"» M n 1 56 23
YA 0 f 0 nt
» VA » i 0 nt
YA H I 0 nt
llllll YA n I 45 nt
YA O I 11 nt
mm va n 1 0 nt
llllll YA D I 24 nt
SFIG.2B
llllll VA U I 40 nt
YA H I 45 23
YA H I 48 nt
YA D I 0 nt
llllll YA H I 26 nt
YA 0 I 47 22
VA ' O ) 42 20 J
127
BNSDOCID: <EP 0662827B1 I >
206
EP 0 662 827 B1
ro
tZ
O.


è>
I
o
ui
CD
O
o
I
o

e>
o
ÎZ

o
o
T

ro
O
ó
I "fo T o PO* T T o T O T o T
u. UJ -?-o u. o UJ ?+-o u. p UJ + o u. o UI -¥ O U. p UI o U. UJ .o
<3 co o «3 < o < o <
cri o CM CN cvi CM CN CN
128
BNSDOCID: <EP 0662827B1 I >
207
EP 0 662 827 B1
IUI UJI
?? UJ
ite-ëi
»IW M
*|Ê!j t_>l
[Cï-----£751
ig___L3
o
a cu
OST Ijul
<= X
129
BNSDOCID: <EP 06S2827B1 I >
208
EP O 662 827 B1
in
r
CJ H-
K- <r
<i »?
cd ??
<r <c
<r cj
«x <t
i? <:
CJ CJ
o «x
cj <t
«ac ??
<t «i
<_) i_D
»? i?
CD O
h? e?
CJ CD
f? CD
w
CJ «X
CJ I?
cj <r
LD <t
<x <x
CJ CJ
LD CD
O CJ
«r ??
<t CJ
<r o
CJ CJ
<c <r
<r cj
<r ??
cj <c
«x CJ
<C CD
<c <r
CD CJ
<T CJ
I? <c
<X <t
<t CJ
<: cj
<r ld
CJ CJ
CD »?
CD «I
H- CD
LD «X
£3
<t <t
CD H-
?? ^
CD <C
CD I?
cj <r
cd <r
<x <x
CD *?
cj «x
t? <:
CJ CJ
CD CJ
CD O
CJ o
cj <r
cd <r
cj ??
CD CJ
«i <x
CD *?
CJ «X
f? CJ
CD <C
<E CJ
CD CD
cj «r
cj <r
CD CJ
«x H-
i? <t
O CJ
»? CJ
CD l?
<ac cj
<x <r
CJ <z
o <z
<C CJ
cd <r
«x «x
cj <r
CJ CD
?? CJ
<r cj
cj <r
cd <r
<E LD
cj ??
?? CD
?? <x
«x cd
i? <:
^ CJ
CD CJ
CJ ??
CJ <x
CD «X
CD CJ
ru «o- vis
?? ru o
O o
CJ ?
CD «X
O C.
CJ -C
<: ??
cd in
<x >s
<t _j
cD in
<r >s
<t _i
CJ c
CJ CL»
*? ts>
LD -t-»
I? O»
<c z:
<r >%
CD ?
CD CD
CD 3
H- 0/
CJ ?I
CJ c
CD Q>
<: t^>
cj o.
« Ul
«x o
cj ?
cd <t
«x c
CJ di
H- CO
«x 3
«x ?
CD CD
»? ?'
<r c
<C ??
<t c
CJ (L<
h- CO
CD 3
<t ?
CD CD
CD 3
»? O*
?? ?J
CD C
CJ Oi
t? co
CD C
CJ o»
»? co
00
« 3
«?I a»
«? ??i
CD' 3
IO*
CJ
<:
« ?
«X 3
H-l Ol
l? I <u
H- I ?
«x'~
«x|3
L3I-2
ldi«:
l!i
I? I____»
cj, c
« I \A
<t|<t
CJ'in
U|>s
H- O
CJ «9
cdI<:
c
It-O
' »n
l>»
CJl
CD
<:
<r
<r
3

U-l
<ric
CJ'Oi
I?ic<o
CD C
CJ <E
h- I in
LD, >s
H- ICJ
>?i Q.
«X1 m
CDI«X
CJ CD
CD C
cj,«:
vO
"V
o in <C 0; <t c CJ ? CJ >«.
<r ? >» f? ? ?* CJ SI »? ö CD ?»
<C _J cm ;<£ *~ <z *- LD > CD CD
*-> fc =*=<=2 ^ y «= *? en ?? C
CJ -C <: >^ <: m CD C <r ut
<r »? <: -j ?«t <c cj <r <E 4
CJ C3 CJ c CJ c CJ c CD 3
CJ ? cj ^: «X >s <c >» v? a*
LD <T <X i~ H^ >^ t? h- CJ _J
CD OÎ CJ c CD ??-» CJ C CJ Ul
ID C CJ .c t? a» CJ -C LD >s
<C <C <c »? «x s: <t 1? »? CJ
»? 3 CJ o >? Q. cj a» CJ 3
t? di lë<l <r u> ?? ? >? Oj
CJ _J cd <r <r ? CJ __J
<r 3 LJ c CD 3 LD O) cd m
<c ? <t UI *? a* CD C «X >>
CD CD <r «x H- _l CJ -X <: ?j
CD O CJ >» CD O CD O O c
CJ ? CD ? CJ ? CJ ? <: ?
cd <: CD CD C3 <C CD <t CJ CD
<L. O ?? 0/ L3 C CJ C t? >s
CJ c *? s: «X ? ^ m CD ?
CJ du 1? Q- CJ LD <x ?« CD LD
CD ?+* CD C CD 3 CD en CD 3
1? 0/ CJ O) t? 0/ O c <£ ?
<t s: H- CO CJ _J CJ <c CD CD
CJ >. ?? m <x CU LD >^ CJ i.
tD ? LD >n »? ?» LD ? CJ 0/
CD CD K? CJ <: ? CD CD H- CO
cj in CJ >. CD 3 cj a» CJ >»
o >* CD ? ?? CU y? ? LD ?
f- CJ O CD CJ _J <c ? CD O
cj in O C LD C cj m cj m
U3 >- CJ JC. CJ -C ?« ? CD >%
»? CJ <c »? ?«X »? cj 3: H- CJ
H- i- CJ c >? Q; CJ CL CJ o
<r >- CJ CD ?? X <t U) CJ ?
t? t? H- {/"J ?? o_ CD <X CD «X
CJ >- <r a* LD C LD 3 CJ c
LD ? i? ?? CJ Oi »? e* -X >>
CD CD <c ? CJ c H- CO CD U) I C_J _ 1 t? t?
CJ c "13 C' 1 ru in j
<r ui CD ai ^ >* CJ sz <c ?
?X <E «X co <t _J 1 <E h? 1 loi 1
CJ 3 CJ es o c CD m ?? >s
?? cu CJ ? cj s: «X >* LD ?
CJ _l o <c <E l? <C _J CD CD
<r 3 ?? >» CD Q. CD Q. CJ tXß
?? <Li o ? L3 C O C ?? X
CJ _J CD CD 1? t? ?? 1? >? a.
i? \n CD C *~ c^«-. CD 3 CD C
<c ? <t ? o c 12 «X ? <X ?
CJ X CJ CD CJ <C =»«=0 o CJ CD
CJ c CD 3 »? a» CD O *? a.
CD QJ <E ? ?? -C CJ L. ?x m
<t to W l-DL 't: °- cj a. CD «X
CJ C 18 il CD c CD C cj a.
<£ <n CJ JZ . CJ O; , « in
<t <: <c ?? <r- | CD «x
v*^ ?^
CVI *r 3 ao o
r«. oo CTN O cu
130
BNSCX3CI0: <EP 0662S27B1 I >
209
EP O 662 827 B1
co
CD CJ CJ CD C
4<ÜU b
CD I? I? »? CO
«X CD CD CD c
O <Z CD CJ X
UUl- <(-
< < Ol? CS
«: CJ l? CJ ?
«x cj o cd <r
« H» ?? <£? O
<t <C »? CJ c
.CJ CJ H- CJ Q.
«X cd «x «x in
?« <: cj « >s
? <X CJ <X «X _J
CJ »? ?? CD C
<t <r »? cj <c
<Ü4G O)
CD ?? <t CD C
?? «x cd cj «x
CD <E CJ ?? O»
HCOK£
CD <r <C l? Q_
<n cd cj h- ui
<: <x cj <: ?
uauui
l-ÜO<t Ifl
ÜH-H« >»
CD «X CD CD CJ)
<T <C CD CD L-
<r <t <: <x «x
CD CJ «X ?? CU
t-UKI- Q.
CD <T ?« L3 -M
<r <:<:?? a»
«ai- <: z
CJ CJ CJ «X
*? <r cd <c
<r <x cd <:
»? <C L3 CJ
cj ?« *? <z
cj cj «x ??
o <: cj cd
cj <c <x »?
a<ct-<
<cu « <
CJ CJ CJ CD
H- «E CD <C
« « H? CJ
CJ <C CJ CJ
<x <r ?? cj
<t cj «x cj
«<cu
?« <x <: cd
u<tcy
<uu<
i-ou«
V
ro n ro en co
co m n r»» _m m a^
in CT» ^-"* "~? ru cu eu
CJ (Li CJ c CJ c t? Q, CD o o a: CJ >s
t?, ? t CJ X CJ X *? X CJ c CD c CD ?
*£. <t H- <r h- H- ÛL CJ Q. cj <r CD CD
CD| Cl ?? e LD C CJ o CD 3 __ CD o cj m
u,x. « in <t ? CJ c t? Qj ^? CJ c <L ?
«xl»? 1 <: « CJ CD ^ o^ CJ _l =»fe<_> Q_ CJ x
LDi Ci <r c CJ C LD 3 <r a» h- as CJ ?
cj! qj' . cj Q; <Z. >s »? a» h? ?' CD C I? o
£"# 1? c/ï H- ?? CJ _J <X ?« cj <r CD >
CJ CU CD 3 O ? L3 ? cj m O O
CJ c »? ? <c ? t? O >? a i CD >» 1 »? CJ i CJ c 1 cj a.
cj a. «r ~ O CD CD > CD >
CD 3 « 3 ?- 13 W >? fe CJ >. '?ud-txt r u a
?? Qi <r ? =*= <t >h h- ? CD ? H- X « Ul
CJ _J CD O ?X _J <C ? CD CD ?? a. CD «
CJ C <r 3 LD 3 CJ O CD C CJ c CJ Ul
CJ X ?? a> ?? ai CJ ? CJ 0/ CJ x CD >n
<r ?? i? _J CJ _l CD «X t? CO <: »? l? CJ
ca a « Qj cj «n « >» CJ c CD C CJ >>
CJ ?» ?? ?* LD >s CD ? <r >> CJ X CD ?
O «X «X ? ?? CJ LD CD H- ?? <r t? CD LD
CJ O <r 3 CD 3 CD ? «x c CJ Ul 1 CD O
H? ?' <x ? ?? a, ?? O cj a» L3 >» CJ ?
<c ? LD LD CJ .J CD > ?? C^> *? CJ CD «X
<: in CD 3 LD O) t? >» «x c CJ c CD Ul
<c >* 1? CU LD C LD ? CJ X CJ X «X >»
<r _j CJ _J CJ <L CD O <X f? <t K- <: _j
CJ o CD 3 CJ a> CD O <r 3 CD C cj m h
CJ c <X ? 1 h- X 1 CJ C <x ? CJ X LD >»W
cj a. CD CD Ihq-I cj a. CD CD <X H- ?? cjB
«x ? CJ 0/ « d i? a. CD 3 cj c «x eu
»? ö *? X CJ ? <: in <E ? *Z Ul i? ?
LD > ?? Q_ LD «X CD <Z CD CD <t -« <t ?
CD O cj c LD C CJ c i? a* CJ c cj a
CD C « in CJ X LD Oi y~m ?^ «X >s CJ ?
CJ <C <C «X <Z t? <C CO <C ? >?» ^^ CD <X
»?- in t? >-. CD C CJ 3 <X 3 CJ c CD 3
« ? CD ? CJ X i? ai »? a» <r >s <t ?
CJ =c CDJJ_ ?« 1? CJ _l t? _J ?? H* CD CD
CD O) ??rol cj in CD ? cd en CJ c CD 3
CD C tJi-* CD >» ?? ö CD C CJ X <C ?
<r «x cDl<r 1 H- CJ CD >? <: <: «X t? O CD
o o <c, o , «X O H- Ol CD 3 ^_ ?* cj in
CJ c CJl ? 1 CJ c H- X <r ? ?? Ö CD >»
CJ Q. cdi<t CJ Q. h- a. CD CD CD > »? CJ
*? o> CJ1 c CD C U X cd a CJ o CJ c
O c CJl Qj CJ 0/ 1 CD Oil CJ ? CJ ? <t m
CJ ^ *?y> H- CO <: to CD <C cd <: <t «X
CD e <r cu cj in CJ c >? Q. cj in CJ ?
« ?» »? i?' CD >» CJ eu « m CD >% ?? o
CJ CD <cl~ *? CJ t? CO L3 <C ?? CJ CD =>
CD O) CDi W CJ >s CJ >N <X O <C C CJ >»
CD C <xl >* CD ? CD ? CJ 4- <c ? CD ?
<x <x <T|_J CD CD LD LD cj a. CJ CD LD CD
<r w H-' in <r 0/ }? >* K? c CD ? CD C
<c >» <C| ? 1---------- CD ?' <C 3k i? a <C -*
<x _j UI <: ? CD CD >? >? o > CJ CD
<r c CJ ? CD C \_D 3 CJ c CD O) CD Ql
cj x cd!> 1 CJ X »? a* CJ Oi CD C O C
<x »? «X h- CJ ?1 I? CO cj <r h? H-
J
^r
LO
O
131
BNSDOCID:<EP 0662827B1 I >
210
EP O 662 827 B1
O
Ul
CC
O
O
O
ro

UI
ac
o
o
o
m

r
co
o
o *-
K>
CN
UO
132
BNSDOCID: <EP 0662827B1 I >
211
EP O 662 827 B1

o
CD
O
o
o
O)
o
oo
O
CD
ro
CD
CD

ro *©
CD'
uo
oo
CM
CD
OO
? CD
ID
OO
CD
? CD
»/o
I
OJ
14
Ä 5
UD
OO
UO
UO
t
Ô
m.
§
uo
|?1
CD
CD
CD .
UO
UD
UO
(O
I
>?

ca
SE?
Il
O
^5
C/1
UJ
CJ
LO CO
PS?
33
CJ CJ
I I
ÜO ÛO
?O (N
II II
.ac -a«
(»O CM
S3 o £5
f? o o
SS
R o o
?"O *x óo
.' ' ?
ü"> *C KO
UO
CD
(0
£2 CD
__ -J CD.
*~ < UO
.. II *°
UJ C9
UO
UO
3< CO
LU
11
II
II
.at
CM
II
ts ?* «»
SQ ^ o*
133
BNSDOCIO: <EP 0662827B1 I >
212
EP O 662 827 B1
l GAATTCCGCT GGGAGAATGG TCTGAGCTAC CTGCCCGTCC TGCTGGGGCA TCAATGGCAA
6I GTGGGGAAAG CCACACTGGG CAAACGGGCC AGGCCATTTC TGGAATGTGG TACATGGTGG
iai GCAGGGGGCC CGCAACAGCT GGAGGGCAGG TGGACTGAGG CTGGGGATCC CCCGCTGGTT
18I GGGCAATACT GCCTTTACCC ATGAGCTGGA AAGTCACAAT GGGGGGCAAG GGCTCCCGAG
241 GGTGGTTATG TGCTTCCTTC AGGTGGC
FIG.8A
1 GAATTCCTTC CATTATACGT GACTTTTCTG AAACTGTAGG CACCCTAGTG TCTCTAACTC
61 CCTCTGGAGT TTGTCAGCTT TGGTCTTTTC AAAGAGCAGG CTCTCTTCAA GCTCCTTAAT
121 GCGGGCATGC TCCAGTTTGG TCTGCGTCTC AAGATCACCT TTGGTAATTG ATTCTTCTTC
181 AACCCGGAAC TGAAGGCTGG CTCTCACCCT CTAGGCAGAG CAGGAATTCC GAGGTGGATG
241 TGTTAGATGT GAATGTCCGT GGCCCAGATG GCTGCACCCC ATTGATGTTG GCTTCTCTCC
301 GAGGAGGCAG CTCAGATTTG AGTGATGAAG ATGAAGATGC AGAGGACTGT TCTGCTAACA
361 TCATCACAGA CTTGGTCTAC CAGGGTGCCA GCCTCCAGAC CAGACAGACC GGACTGGTGA
421 GATGGCCCTG CACCTTGCAG CCCGCTACTC ACGGGCTGAT GCTGCCAAGC GTCTCCTGGA
481 TGCAGGTGCA GATGCCAATG CCCAGGACAA CATGGGCCGC TGTCCACTCC ATGCTGCAGT
541 GGCACGTGAT GCCAAGGÎGT ATTCAGATCT GTTA
FIG.8B
l TCCAGATTCT GATTCGCAAC CGAGTAACTG ATCTAGATGC CAGGATGAAT GATGGTACTA
61 CACCCCTGAT CCTGGCTGCC CGCCTGGCTG TGGAGGGAAT GGTGGCAGAA CTGATCAACT
121 GCCAAGCGGA TGTGAATGCA GTGGATGACC ATGGAAAATC TGCTCTTCAC TGGGCAGCTG
181 CTGTCAATAA TGTGGAGGCA ACTCTTTTGT TGTTGAAAAA TGGGGCCAAC CGAGACATGC
241 AGGACAACAA GGAAGAGACA CCTCTGTTTC TTGCTGCCCG GGAGGAGCTA TAAGC
FIG.8C
134
BNSDOCID:<EP 0862B27B1 I >
213
EP O 662 827 B1
l GAATÎCCATÎ CAGGAGGAAA GGGTGGGGAG AGAAGCAGGC ACCCACTTTC CCGTGGCTGG
61 ACTCGTTCCC AGGTGGCTCC ACCGGCAGCT GTGACCGCCG CAGGTGGGGG CGGAGTGCCA
121 TTCAGAAAAT TCCAGAAAAG CCCTACCCCA ACTCGGACGG CAACGTCACA CCCGTGGGTA
181 GCAACTGGCA CACAAACAGC CAGCGTGTCT GGGGCACGGG GGGATGGCAC CCCCTGCAGG
241 CAGAGCTG
FIG.9A
1 CTAAAGGGAA CAAAAGCNGG AGCTCCACCG CGGGCGGCNC NGCTCTAGAA CTAGTGGANN
61 NCCCGGGCTG CAGGAATTCC GGCGGACTGG GCTCGGGCTC AGAGCGGCGC TGTGGAAGAG
121 ATTCTAGACC GGGAGAACAA GCGAATGGCT GACAGCTGGC CTCCAAAGTC ACCAGGCTCA
181 AATCGCTCGC CCTGGACATC GAGGGATGCA GAGGATCAGA ACCGGTACCT GGATGGCAÏG
241 ACTCGGATTT ACAAGCATGA CCAGCCTGCT TACAGGGAGC GTGANNTTTT CACATGCAGT
301 CGACAGACAC GAGCTCTATG CAT
FIG.9B
135
BNSOOCID:<EP 0662827B1 I >
214
EP O 662 827 B1
U A 5 = U A
+ U S2 H S2
o u O * H TT O o H ^2
15
+ H »J
O
S
io
O + U
ro OU
H
L>
H >

bi
O * < "Z
(N <
* o
y*
u
o * 8
»H
o u
H
U
U
U
O + U cO
oo H
Ö U
* O
Ö
o * u
o
u
* s
O Se
H
o +
U
U
iD U
+ H
U <
U
O * < 3C
in (j
H A
<
U
O * H tu
r-l
< >*
* O
S
bei
<3 ^
15 2
O * H
en
^ U
L5 U
H
* < O
U
O
H ^
(J
O * H
cn O «O
P
O
15
U H
o * o U
S2
* o
5
ü 3:
O * H
o
r-l U
U Dj
U
U A
Ó + 9
u
+ H J
U
Û U
O *
CD
15
U
.8"
8 to H
O H
* 15

8 to
O + <c
VD
r-l u
â o
H
* S u
u
o * u
m {j iD
-< 15
u
* s
o
136
BNSDOCID: <EP 0662827B1 I >
215
EP O 662 827 B1
i
O * O A
TT < Q
fN 15
CJ
< >*
W V
CJ
U
O * u O*
ro u
eg
CJ
ä
* u
iD CJ
H
15
< O»
O * CJ
CN
CN O
O cj
CJ
U
O
CJ <
O
O * H
i-H CJ? CC
CN U
e>

o
o cj
ÖA
CJ
O * < Q
o c3
CN
H
* CJ
CJ CJ
CJ
CJ
* u
CJ CJ
CJ
CJ
< a
o * U
OO
CN CJ
SD
* CJ CJ
H
CJ
öx
O * CJ
r- O O
CN CJ
CJ
? âD
CJ to
<
(J
O + ^ Im
VO H
CN
u
dx
* CJ
Sx
CM CJ
CJ u
u
* < >-?
f-»
CJ
H
O * CJ
CO < W
CO
CJ
CJ

.8
CJ CJ
H
U
O * < Q
CN
CO
u
H »J
U
U
S -g
CJ
a
3:
<3
Ö u
H
o + (J
O < W
CO CJ
CJ
U <
* CJ
U
CJ to
<
u _
O * < Z
o <
(V
CJ A
CJ Û4
U
CJ
o * H S
CO <
ro
CJ
H »J
CJ
+ iD ^
CJ
H >
O * CJ

ro t5
H >
CJ
CJ
* H >
CJ
H »J
U
O * CJ
Vu U H
ro <
CJ
CJ
8"
CJ
O * CJ <
in O
co
U
Soi
CJ
O * CJ
ro u
CJ Cu
U
O
137
BNSOOCID: <EP 0662827B1 I >
216
EP O 662 827 BI
Ö co O + CJ A 5 6° ïâ * H J
o * < U
co
TT U u * CJ CJ
U i 8° s* CJ
15 u o o: o * CJ O * CJ
* gW Öx uo (J
CM
8 oj © * 5 *c in cj f-» J CJ . 5°
u r» O CJ
V
O * iD u CJ H
cm H hJ ÖQ *ÖU U Dj U
ü * H _^ CJ i+
H Cu cj o: sw o * Q <
* H CJ vo (J
uo
U u ? O * CJ CJ
öx o * < vo in <J H«
CJ O * M u. K1" a cc H
*r
CJ CJ CO * H > O cj LJ CJ
H CJ CJ o * C5 m
ö co CJ u m iD
H > O + < >* S"
< CJ O H
in
u O * CJ U U
3 2 o * < * 8-*
o
^ S OJ U * CJ CJ
O H CJ Qi 8*
u * < CJ
«J CJ CJ O * t-»
* Üa 6* H tu en ««? o od in cj
CJ CJ rr U CJ
Öa H M < * S*
O * CJ CJ w ? CJ
en «e£ u co CJ H > CJ rf H M
CJ H o: O U
CJ Qi 0° O* UÛ/
* CJ CJ co d
o
o
uo
BNSDOCID: <EP 0662827B1 I >
138
217
EP O 662 827 B1
S& CJ A rf >* O + L) A CM H lu CJ A
u o * < H r- H U
-. > r-
CJ vo U CJ CJ + CJ
o * Ö CJ H > U to
CM CJ * H H
CD
h* CJ ü ~ U
CJ CJ + H M < a U rf
CJ rf u O * CJ vo
* CJ CJ CJ l> (J
Öu CJ to o * CJ to H iJ
H r-l H CJ
r-
O to o * vo CJ CJ U u co
O * rf vo cj H
rH
CD M 8 ai u * U rf
S ü * 8* § °
r-» o CJ O * CJ
4r CJ CJ H > o * S uo Hh3
CJ CJ r- u
o
H u r- CJ u
U Ou o * 3° H > H Cu
CJ in CJ * H
vo
O * U CJ H rf
o H i-J H S * O U CJ rf
vo U < H o
CJ * CJ CJ CJ ^
H m3 CJ tu 3° o ? u rf
' * CJ u ?xr O
r^
CJ u en O oS CJ
CJ to s° H >
u. o * vo cj O
U vo CJ CJ + CJ
o * 8* . 5S 3Q
in
CJ CJ CJ U
S5*2 « gw 0° CJ t-« O * rf co
* ^ w CJ H r- U
H > CJ CC O * H M U rf
CJ rf co rf vo CJ
CJ o * t? os CJ H
5° ro gM * CJ CO
O * vo u rf
ao
in CJ ö oc * o CJ
CJ CJ CJ ?Ir 3°
O
BNSDOCID:<EP 0662827B1 I >
139
218
EP O 662 827 B1
* CJ £ 8â CJ A O * CJ A
u co VO H U*
< CJ en O en H
CJ CJ CJ
5" O * CJ rf VD O OO CJ * 8°
O + H CJ CJ CJ
«H CJ CO H > * H iJ 3M
co rf CJ CJ
CJ * CJ CJ H
. Ö° rf :m H > O * O O*
H CJ uo o
en
CJ tf - O * CJ O CJ CJ U
y t> H S H Cu
CJ O * rf UO en cj H
CJ O * CJ rf O CJ co CJ plu CJ CJ 8 3: H
OO
<2 * 5 = CJCJ CJ U o * cj
* u CJ CJ o» CJ
rf CJ O * H > en tJ 3a LU
CJ O * CJ 00 CJ r> O
rf iet O * rf ?o- rf O oo CJ £* * Ou ?
en O
r- O CJ * u F-» ^»
rf N* . 8-* £Cu 3* . Ll.
CJ CJ CJ O * CJ
+ CJ Cu CJ 04 H »J co rf O en cj
U CJ O * CJ
00
CJ CJ o * o cc 00 Pa CJ CC
rf ro u co u * u
O * O u CJ O a: u
? 32 U Ou CJ * H > CJ
CJ * CJ CJ o* P Cu o * cj ce;
* U u H CM CJ
CJ CO rf CJ O * U CJ
rf co O * CJ r- cj rf co CJ â«
CM
O * CJ CJ oo C5 u * CJ
H > U < cj os
r- cj r* CJ * CJ u
140
BNSDOCID:<EP 0662827B1 I
219
EP O 662 827 B1
CJ A
3"

o * u
§ o
^1 CJ Cu
U
? g M
8 o:
o
g* S«
<n cj
cj
CJ
o co « 3*
en C5 tO rf
* 8-CJ
O * 3W
r*
en o to H
* H > CJ
bt:
U A
?k H J
CJ

cj
O * H
in CJCJ
o O
* CJ
9 co
H .
S* 8*
3 S*
H ^
o * u
ro
,H O Cu
O
CJ
Ba
U
2*
o * cj H
o «
o *
CM
o
CJ
H >
* CJ
CJ
<J CO
H
q
o
CJ
CO
O
O
en
o CJ
5
CO
CJ
o * 15
oo CJ
O H
CJ
3:
CJ
CJ
?* 3°*
o
* CJ

CJ
O * CJ
VO
o ÜM
.H H S
rf
O A
O * Ü
in
rH O
CJ
Sa
u
O * CJ
^r rf O
rH CJ
.H
H Ä
CJ Û4
* CJ
H »J
U
. f:
O * H >
CO O
H >
CJ
* U
CJ ÛJ
u
CJ
o
CM
«3
w
CJ
co
CJ
CJ ccT
O
o * V r
CJ ..
*S
LU
O
141
BNSDOCID: <EP 0662827B1 I >
220
EP 0 662 827 B1
o + o CM È2Û CJ 8ft CJ CJ A U CJ 5 A
tH 4r 3° ?k CJ 3° CJ CJ Di U 0 ro * U CJ rf CO
O + CJ O en CM * CJ U H rf »H CJ 2
O * en U U rf CJ CM rH CJ tH U H Cu * H * 0 8 CJ
tH iH 3° * CJ CJ CJ CJ CJ CJ CJ O ro * CJ CJ rf h«
* CJ U CJ 3° O CO (M H * 3° ro tH CJ 3 co
O * 3* O * co CM u CJ Dj CJ »H CJ Ou U ?k CJ 0 »j
ao .H r-4 CJ Ö° w-K * CJ CJ Ou U O CJ CJ 8 CJ CJ CD
* ACT CAG T Q O * CM CCC ACA P T O r-CM rH CJ et * u CJ O CM ro rH * * 8 CJ 8 CJ CJ CJ O CD LU
O * r-fH CJ CJ £ H CM »H 8« * Ü2 8 rf co
rH * CJ 5° * CJ rf CJ O tH ro * CJ CJ u
<3 _ cj ds CJ O * 8< O VO CM * CJ 3° H CJ CJ H to
o * VD CJ tH CM tH H CJ to tH + rf ?k CJ cj <: CJ
tH tH u rf Q CJ * h r rf u CJ CJ H O O * CJ H rf M
+ rf 8 Di U O UO U + rf O CJ ro tH CJ H rf 22
142
BNSDOCID- «FP nKK?B57Rl I ?.
221
EP O 662 827 B1
8A
CJ
O + CJ
en
ro o
~ 3°
U
* rf >*
H
U
H M
rf
O + CJ
co f-« Cu
co {-*
tH
CJ
* 3°
CJ
CJ co
H
o ? %&
TT u
tH
CJ
H >J
?» M
CJ
U <
CJ
U
O * U f-»
CO rf
rr
rH CJ
3"
CJ A
rf U)
CJ
U
ü3
CJ
O * CJ
co
CJ
CJ
CJ H
O * rf
CM
ö o:
u
CJ
U rf
CJ
O * CJ
r- U rf
v CJ
* r-«
U
CJ
CJ O*
U
o * cj
co u H
uo rf
rH
8 Di
* CJ

CJ
O * H S
CM rf
UO
?H CJ
2.
5
o * ro CJ rf tH CJ cc u * f-l 3Q * CJ 3°
rH CJ ?fc 3° o to O rH «3°
* CJ U rf CJ rf o vo ?fc 0 ut: UO rH U H rH rf
CJ
O Cu
O * CJ
vo
ro CJ
CJ
*5
cj
O * CJ
in rf co
ro CJ
co
O * CJ
? 3°
tH
CJ
o
CJ
O * H »H*
o u
8
to
* u
u rf
CJ
co
* CJ
rf X
H
cj od
o * cj
in
rr CJ
r* U <
CJ
CJ
* U rf
CJ
CJ
H rH"
U
* M2
CJ
8"*
O * H
O rf Q
uo i3
8
to
o
o * u rf
en CJ
O
143
BNSDOCID: <EP 0662827B1 I >
222
EP O 662 827 B1

rf
CJ
O * H *J
co CJ
UO
rH CJ
H M
rf
* o

CJ
H Cu
o * H
r?
uo CJ
rH H >
O
H
* g"

O *
co
m
CJ
.3°
o * CJ to
in H
uo

cj
O -fc CJ
uo H

o * rf
ro
vo CJ
rH UH
rf

O * H
CM
VD
CM rf X
* rf
y cc
u
u ^
o * o rf
*8
vo
.H H

* CJ
O
CJ
0*5
o
vo rf
.h Dy
rf
CJ
*8
S o:
u
o * cj _
00 < s:
uo
5
c?ct
+ u
O * U A
co < Û
VD CJ
rH
CJ
* öu
Sa
u
O ? H S
r» rf
vo
*"* Ho
+ CJ
O * CJ
vo
VD L>
?k H r4
U
O Ctî
U
O + L>
m u rf
VD CJ
.8"
CJ .
CJ
O + H M
<«? rf
vo
tH C5
H rJ
u
5 Ou
CJ A

Sa
O * U
CM
r- U
- 3D
H
* 3°
o « u ^
S 8-=

s>
CJ
u
g* 3°
r-
.h CJ
rf
8
?fc U
to
o *
en
vo CJ
?k
CJ
* H M
rf
Sa

0*0
r- cj rf
8
« 3°
S>
CJ
H
O * rf 2
vo rf
r-
S
+ CJ ^
CJ
0*0
uo
CJ ^
O -fc CJ
CJ
H »J
* CJ

CJ
u
O * CJ co
co H
r*
O
144
BNSOOCID: <EP 0662827 B1 I >
223
EP O 662 827 B1
CJ A o A o fc CJ A U A
3" CJ rf CM H S H M
O ?fc o en rf rf
r- tH
O ? CM 8 tc rf CD tH o u rf H * öx ?fc U 3°
co rH CJ CJ r-« CJ
22 ?fc 3 CO 3° O vo ?fc 3X
fc CJ o CJ en b -
S2 rf >?» O tH en * U f-rf tH 5X
O * CJ 3° O VO OO ?fc 8 rf to tH CJ H M rf ?fc CJ
rH rH
CO rH Sr rf -fc § CJ * u 3° 8 c: CJ
* 3° CJ 3 CO o o * 8 tc o UO en rH ?fc C5 3"
2 *: O m OO * 8 CJ cC en r-l 52 ?k C5 3°
O * tj rH U u-- rf
o CO S2 8 rf * 8* 4 **
tH H ?fc U H U
.-fc 8* 8 rf H Cu H O en -fc H M rf
CJ CJ o -Ir CJ ?H U
Ö CJ O -k CJ en co 0 = 3°
TT iH
O * en o 52 OO tH H Cu * CJ 3° ?k 8 tc u
rH CJ CJ ^ , CJ
g* ?fc H ?J H rJ CJ Ou
U U O CO ?k CJ
* CJ O CJ en CJ
H rJ CJ CU o * H i4 tH H »J
u U co co U U
CJ H rJ O CO «fc 3 t- tH CJ H > -fc 8 CC
O * CJ 00 rf CJ U
CD tH
r» CJ CJ ?fc ü ~ CJ
?-« H > CJ ?fc 3 co â* 5°
CD
145
BNSDOCID:<EP 0562827BI I >
224
EP O 662 827 B1
CJ
H rH*
u
O -fc CJ
?S 3°
CM
O
CJ 04
* u
O co
rf
O ?* CJ tù
O u
o
CM C5
H >
CJ
+ CJ
H J
CJ
o * rf
en
en L)
rH rf X
CJ
CJ

O * CJ ,
oo H »J
CT> (J
tH
CJ
H iJ
* CJ
8 Di
rf
CJ
O ?» H >
r- CJ
en
o *
vo
O
CM
CJ A
CJ co
H
8 CJ
CJ
H rJ
CJ
* CJ
CJ Ou
CJ
O *
uo
o
CM
O *
rr
O
<M
O
CJ Ou
u
CJ
CJ co
H
CJ
H iJ
U
ü
U H
rf
(J
CJ OU
CJ
CJ
CJ H
rf
CJ
o -fc Q
ro Ö
O
cm CJ
CJ
?fc CJ
U 04
U
ü
O * CJ
CM
CM CJ CJ

O * rf
»H
,H CJ ^
.go
CJ
O * CJ
O H >
rH CJ
CM
8 CJ
u
CJ D*
CJ
CJ
O * rf «
en rf
o
cm CJ
CJ
8 tO
rf
SCJ
00
O CJ
CM H »J
CJ
Ü
* rf >??
CJ
O *
o
CM
^2
CJ
CJ Ou
u
O -fc 8â
vo
rH CJ
CM
CJ
?fc 3"
CJ
2*
o * 8 co
in rf
CM rf
ö °
CJ CJ
H
O
O * CJ
w CJ
CM H «-3
CJ
? g CJ
rf »
O « CJ
ro CJ co
»h rf
CM
CJ to
* <
o
CJ Cd
u
CJ
O * rf «
CM rf
«H
CM CJ
o os
u
* L>
H >
CJ
CD
146
BNSDOCID: <EP (VK7R27B1 I >
225
EP O 662 827 B1

H
* CJ
ö O
O
rf tt
O * rf
o
CM CJ
CM Ö CJ
H
* s°
CJ

CD * V
en CJ tO
rH f-»
CM
CJ
o * 8 cc
co rf
a 8*
U
* rf .
O * CJ
r-
rH CJ ,
CM H »4
CJ
Ü
* 3°
CJ
?fc 9 co
H
CJ
Öw
UO H »-3
CM CJ
CM
CJ
U co
* H
CJ
O * H >
5T CJ
CM
<M CJ
O Ou
CJ
? CJ
yto
.8

CJ
o
CJ co
CO
CM rf
CM
e-
O * H *i
rH (J
CM
CM
O *
O
ro
CM
O *
en
CM
CM
U A
CJ co
H
o
CJ Di
CJ
ü ,
CJ
<3 ,
H rJ
U
CJ Di
CJ
C5
CJ 04
CJ
U CO
H

O ?
co
CM
CM
O *

CM
CM
CJ
8

9 w
H
W ,
U
Ü
8 o
o * 3x
vo
CM CJ
CM u tu
u
o *
ro
CM
O * <
in
ro CJ
cm ÖÜ
cj a*
u
u
g*
3-
Sa
u
CJ
CJ D.
CJ
s>
CJ
u
CJ to
H
CJ
CJ Ou
CJ
H
CJ co
o *
ro
ro
CM
O *
CM
ro
CM
O *
r-l
CO
CM
CJ
3
CJ
3
Ü
a
tu
CJ
CJ 0»
CJ
CD
147
BNSD0CID:<EP 0662827B1 I >
226
EP O 662 827 B1
O
O

CM
O
en
ro
CM
O
CO
ro
CM
o
r*
ro
CM
O
vo
ro
CM
* CJ A
CJ Ou
CJ
CJ
O

CJ
* 8*
H >
CJ
?fc CJ
CJ
H »4
* CJ
CJ
se
CJ
CJ
H M
rf
CJ
o
H ^
$x
CJ
* CJ H
rf
CJ
5
* CJ
CJ Ou
CJ
A
2H
CJ
.
CM P tu
H
CJ ^.
* 8*
CJ
H »4
CJ
co O CC
TT CJ
CM
8 cj
* CJ
8 cj
O * Q CJ
CM CJ
CM H

?fc CJ
CJ
CJ
0*0
iH
rr CJ
cm ij rf
CJ
* H S
rf
CJ
3"
O *
en
TT
CM
O *
CD
rr
CM
O *
r*
TT
CM

CJ
CJ
U H
rf
O co
rf
CJ
CJ H
rf
8 cj
cj co
H
CJ .
8
<3 w
H >
CJ
H
CJ CU
U
CJ
H rJ
CJ
CJ
O +
uo
CM
O *
ro
uo
CM
o +
CM
in
CM
CJ A
U co
H
o
CJ
CJ
H >
CJ
U H
<
O
H Cu
H
H
CJ
H r-ü
U
U .
8
CD
CJ r-
u
CJ CJ to O * 8 co
H rH UO rf
O -fc U CM CJ co rf
vo 0*
CM
*-* _ ?fc u
CJ CC CJ to
?fc CJ H CJ Ou f-» 8 cj
u O O * O
O * 3 Dj in CM
m U U
«T
CM
148
8NS0OCID: <EP 0662827B1 I >
227
EP O 662 827 B1
CJ A
8 CJ
O * CJ
en
in Q
cm cj co
rf
CJ
* 3°
CJ
H rJ
ü
O * CJ
co Cj 0Î
in u
CM
U
U co
* H
C5
H ^
CJ
.8
O * CJ î£
uo
CM CJ
rf CO
CJ CJ
O * CJ
vo
m H
cm cj CJ
*S2
CJ
o * H
uo cj co
uo <
CM
o
U H
* rf
o *
rr
vo
CM
8 cj
CJ
* u
Cu
o *
ro
vo
CM
o ?*
<M
vo
CM
CJ
H >
CJ
F->
CJ co
<
8 cj
CJ
cj cc;
CJ
CJ
H rJ
U
H
CJ Ou
CJ
CJ .
5
o *
rH
VO
CM
CJ
O -fc
o
vo
CM

CJ
S2
CJ
U Ou
o
CJ
H >
CJ
CJ
o *
oo
vo
CM
CJ A
CJ Cu
U
CJ
3>
CJ
CJ
o *
r*
vo
CM
O *
VO
CO
CM
CJ
CJ

CJ
U
CJ
u co
H
CJ
CJ cu
CJ
8
CJ
o *
uo
vo
CM
s-
8 CO
rf
CJ
H »J
CJ
CJ
CJ Cu
CJ
o
ro
r-
CM
O *
CM
r-
CM
O *
CM
O *
O
CM
o *
en
vo
CM
U A
rf >*
H
8 co
rf
CJ
CJ
CJ
Ö°
o
o co
CJ
CJ

8 co
rf
CJ


8*
8 to
rf
F-»
CJ CO
<
u
Ös
CJ
CJ
CD
149
BNSDOCID: <EP 0662827B1 I >
228
EP O 662 827 B1
Ö°
O + H >
oo C5

CM CJ
H iJ
U
+ CJ
5 =
H
CJ Dj
O * CJ
r-
r- cj
~ 3°
U
* CJ H
rf
CJ
8
O * CJ
vo H »J
p» U
CM
8 tc
?fc (J
CJ
2H
.8
O -fc CJ to
in rf
CM CJ
CJ OU
CJ
H r4
CJ
SCJ
CM rf O
O + CJ
CO
co CJ
CM rf 2
Sa §' 3
3
CJ
*3
CJ
O
O * CJ
CM rf O
CO CJ
CM
H S
* rf
CJ
3a
co
CM CJ
s
a
5 tu
O * CJ
o
eo CJ
CM rf O

CJ
O * CJ
? 3°
CM
CJ
CJ fH
* rf
CO U Ou
CO (J
CM
5 Dl
* CJ
CJ Ou
CJ
CJ
O * U Ou
r- u
co
CM C5

*Sa
O
CJ co
O * rf
vo
oo rf
CM rf Cf
CJ
CJ
3a O * O en.
O * CJ CM
uo co 3°
CM
CJ *
H M
« rf
%*
Cf o *
oo
CM
5 Cu
u
* CJ


CJ
* o
Öx
SCJ
CM
<T» CJ
CM CJ tO
rf
O ^
* 8**
o * rf
rH CJ CO
en H
CM
cj to
* rf
f-« >
CJ
CJ
Pa
CJ
CJ
CJ Ou
O + u
en
00 S2 ,-*
cm go
?fc O Cu
CJ
9 cu
u
.3
u
CJ
5
O * CJ
r- H
en cj
CM
O
. 3
CJ
O * rf
vo U
en
CM
8
rf
CJ
CJ
o * 9
in
en rf
cm CJ
O * CJ
en h
CM
8
* rf
8
CJ
o * 8
co C5
en
CM
A
QU
O
Cf
to
* CJ
O Ou
co
CJ
CD
H
* CJ CO
C5
H
CJ
CO
CC
CJ
150
BNSDOCID: <EP 0662827B1 I >
229
EP O 662 827 B1
CJ «o 8£ O * h» A
CM U Ou
rf O < ' < iH. ro CJ
CJ o CJ CJ
O * 3" co f- > CJ co
CM CJ ?» ' H
O
ro CJ CJ CJ
5° fc '? CJ Ou CJ co
u H
?fc CJ u tu 9 Ou o * CJ < >*
u U ?H tH fi
CJ O -fc U ro 8 co
H rJ vo H>
O * CJ o CJ rf
rH CO
O. £h C5 ?fc u
ro H rJ Ö*
rf ?fc CJ
H CJ CJ
?fc rf CJ co H o * o 3°
CJ CJ rH CJ
sx o * m o U CO ro CJ co H
o * o s> CO 9 Ou ?fc CJ O Dj
o CJ CJ CJ
co
C5 * CJ O
8** H iJ U Ou
-fc U CJ
CJ CJ O * CJ
H rJ U CO CT» CJ H
u o * TT H O ro rf
CJ to O CJ CJ
o * ro CJ H H »j
en rf rf ?k U
en
CM O to rf CJ U
?*> CJ Cu u fc*4
* CJ CJ CJ
CJ Ql H rJ O * ö°
CJ CJ CO
o
Cj O * CJ ro CJ
o * ö ° ro o 8« 8*
co ro
en CJ CJ * 3«
CM H »J U Cu
(J -ir CJ CJ
CD
151
BNSDOCID: <EP 066282781 I >
230
EP O 662 827 B1

rf
* < ^
CJ
H
CJ tu
O * CJ
vo
»H
CO
CJ
H
CJ tu
u
H >
CJ
O -fc CJ
2 3
co
O +
ro
rH
ro
O
CJ Cu
CJ
?fc H H
<
o * H
»H Eh M
CM rf
ro
9 CO
+ H
9 CO
O -fc
O
CM
ro
CJ
tt
rf ?fc H
H r-J CJ CO
* CJ H
CJ H
3° o * <n CJ Cu U
CJ tH H
o * rf SC ro 3Q
fH
co CJ CJ co CJ
-k cj to
rf H
CJ

S>
CJ
H
CJ to
oo cj er;
»H U
ro
CJ
H H
O * H >
I? CJ
tH
CO

H
O * CJ
CO H
CM
ro CJ
CO
* CJ
CJ tu
U
O * C5
CM
CM rf
ro rf CO
152
BNSDOCID: <EP 0662827B1 I >
231
EP O 662 827 B1
G GAG GTG GAT GTG TTA GAT GTG AAT GTC CGT GGC CCA GAT GGC TGC 46
Glu Val Asp Val Leu Asp Val Asn Vol Arg Gly Pro Asp Gly Cys
15 10 15
ACC CCA TTG ATG TTG GCT TCT CTC CGA GGA GGC AGC TCA GAT TTG AGT 94
Thr Pro Leu Met Leu Ala Ser Leu Arg Gly Gly Ser Ser Asp Leu Ser
FÖ 25 50
GAT GAA GAT GAA GAT GCA GAG GAC TCT TCT GCT AAC ATC ATC ACA GAC 142
Asp Glu Asp Glu Asp Ala Glu Asp Ser Ser Ala Asn He Ile Thr Asp
35 40 45
TTG GTC TAC CAG GGT GCC AGC CTC CAG GCC CAG ACA GAC CGG ACT GGT 190
Leu Vol Tyr Gin Gly Ala Ser Leu Gin Alo Gin Thr Asp Arg Thr Gly
50 55 60
GAG ATG GCC CTG CAC CTT GCA GCC CGC TAC TCA CGG GCT GAT GCT GCC 238
Glu Het Ala Leu His Leu Ala Ala Arg Tyr Ser Arg Ala Asp Ala Ala
65 70 .75
AAG CGT CTC CTG GAT GCA GGT GCA GAT GCC AAT GCC CAG GAC AAC ATG 286
Lys Arg Leu Leu Asp Ala Gly Ala Asp Ala Asn Ala Gin Asp Asn Met
80 85 90 95
GGC CGC TGT CCA CTC CAT GCT GCA GTG GCA GCT GAT GCC CAA GGT GTC 334
Gly Arg Cys Pro Leu His Ala Ala Val Ala Ala Asp Ala Gin Gly Val
100 105 110
TTC CAG ATT CTG ATT CGC AAC CGA GTA ACT GAT CTA GAT GCC AGG ATG 382
Phe Gin lie Leu lie Arg Asn Arg Val Thr Asp Leu Asp Ala Arg Met
115 120 125
AAT GAT GGT ACT ACA CCC CTG ATC CTG GCT GCC CGC CTG GCT GTG GAG 430
Asn Asp Gly Thr Thr Pro Leu He Leu Ala Ala Arg Leu Ala Vol Glu
130 135 140
FIG. 11A
153
BNSDOCID: <EP 0662827B1 I >
232
EP O 662 827 B1
GGA ATG GTG GCA GAA CTG ATC AAC TGC CAA GCG GAT GTG AAT GCA GTG 478
G(y Met Val Ala Glu Leu Ile Asn Cys Gin Ala Asp Val Asn Ala Val
145 150 I55
GAT GAC CAT GGA AAA TCT GCT CTT CAC TGG GCA GCT GCT GTC AAT AAT 526
Asp Asp His Gly Lys Ser Ala Leu His Trp Ala Ala Ala Vol Asn Asn
160 165 17.0 175
GTG GAG GCA ACT CTT TTG TTG TTG AAA AAT GGG GCC AAC CGA GAC ATG 574
Val Glu Ala Thr Leu Leu Leu Leu Lys Asn Gly Ala Asn Arg Asp Met
180 185 190
CAG GAC AAC AAG GAA GAG ACA CCT CTG TTT CTT GCT GCC CGG GAG GGG 622
Gin Asp Asn Lys Glu Glu Thr Pro Leu Phe Leu Ala Ala Arg Glu Gly
195 200 205
AGC TAT GAA GCA GCC AAG ATC CTG TTA GAC CAT TTT GCC AAT CGA GAC 670
Ser Tyr Glu Ala Alo Lys He Leu Leu Asp His Phe Ala Asn Arg Asp
210 215 220
ATC ACA GAC CAT ATG GAT CGT CTT CCC CGG GAT GTG GCT CGG GAT CGC 718
He Thr Asp His Met Asp Arg Leu Pro Arg Asp Val Ala Arg Asp Arg
225 230 235
ATG CAC CAT GAC ATT GTG CGC CTT CTG GAT GAA TAC AAT GTG ACC CCA 766
Met His His Asp lie Val Arg Leu Leu Asp Glu Tyr Asn Vol Thr Pro
240 245 250 255
AGC CCT CCA GGC ACC GTG TTG ACT TCT GCT CTC TCA CCT GTC ATC TGT 814
Ser Pro Pro Gly Thr Val Leu Thr Ser Ala Leu Ser Pro Val He Cys
260 265 270
GGG CCC AAC AGA TCT TTC CK AGC CTG AAG CAC ACC CCA ATG GGC AAG 862
Gly Pro Asn Arg Ser Phe Leu Ser Leu Lyn His Thr Pro Met Gly Lys
275 280 285
FIG. 11B
154
BNSDOCID: <EP 0662827B1 I >
233
EP O 662 827 B1
AAG TCT AGA CGG CCC AGT GCC AAG AGT ACC ATG CCT ACT AGC CTC CCT 910
Lys Ser Arg Arg Pro Ser Ala Lys Ser Thr Met Pro Thr Ser Leu Pro
290 295 300
AAC CTT GCC AAG GAG GCA AAG GAT GCC AAG GGT AGT AGG AGG AAG AAG 958
Asn Leu AIq Lys Glu Alo Lys Asp Alo Lys Gly Ser Arg Arg Lys Lys
305 310 315
Kl CTG AGT GAG AAG GTC CAA CTG TCT GAG AGT TCA GTÀ ACT TTA TCC 1006
Ser Leu Ser Glu Lys Val Gin Leu Ser Glu Ser Ser Val Thr Leu Ser
320 325 330 335
CCT GTT GAT TCC CTA GAA TCT CCT CAC ACG TAT GTT TCC GAC ACC ACA 1054
Pro Val Asp Ser Leu Glu Ser Pro His Thr Tyr Val Ser Asp Thr Thr
340 345 350
TCC TCT CCA ATG ATT ACA TCC CCT GGG ATC TTA CAG GCC TCA CCC AAC 1102
Ser Ser Pro Met He Thr Ser Pro Gly Ile Leu Gin Ala Ser Pro Asn
355 360 365
CCT ATG TTG GCC ACT GCC GCC CCT CCT GCC CCA GTC CAT GCC CAG CAT 1150
Pro Met Leu Alo Thr Alo Alo Pro Pro Alo Pro Vol His Alo Gin His
370 375 380
GCA CTA TCT TTT TCT AAC CTT CAT GAA ATG CAG CCT TTG GCA CAT GGG 1198
Ala Leu Ser Phe Ser Asn Leu His Glu Met Gin Pro Leu Ala His Gly
385 390 395
GCC AGC ACT GTG CTT CCC TCA GTG AGC CAG TTG CTA TCC CAC CAC CAC 1246
Ala Ser Thr Val Leu Pro Ser Val Ser Gin Leu Leu Ser His His His
400 405 410 415
ATT GTG TCT CCA GGC AGT GGC AGT GCT GGA AGC TTG AGT AGG CTC CAT 1294
He Vol Ser Pro Gly Ser Gly Ser Ala Gly Ser Leu Ser Arg Leu His
420 425 430
CCA GTC CCA GTC CCA GCA GAT TGG ATG AAC CGC ATG GAG GTG AAT GAG 1342
Pro Val Pro Val Pro Alo Asp Trp Met Asn Arg Met Glu Vol Asn Glu
435 440 445
FIG. 11C
155
BNSDOCID: <EP 0662827B1 I >
234
EP 0 662 827 B1
ACC CAG TAC AAT GAG ATG TTT GGT ATG GTC CTG.GCT CCA GCT GAG GGC 1390
Thr Gin Tyr Asn Glu Het Phe Gly Met Vol Leu Aio Pro Alo Glu Gly
450 455 460
ACC CAT CCT GGC ATA GCT. CCC CAG AGC AGG CCA CCT GAA GGG AAG CAC 1438
Thr His Pro Gly lie Alo Pro Gin Ser Arg Pro Pro Glu Gly Lys His
465 470 475
ATA ACC ACC CCT CGG GAG CCC TTG CCC CCC ATT GTG ACT TTC.CAG CTC I486
lie Thr Thr Pro Arg Glu Pro Leu Pro Pro He Vol Thr Phe Gin Leu
480 485 490 495
ATC CCT AAA GGC AGT ATT GCC CAA CCA GCG GGG GCT CCC CAG CCT CAG 1534
He Pro Lys Gly Ser He Ala Gin Pro Ala Gly Ala Pro Gin Pro Gin
500 505 510
TCC ACC TGC CCT CCA GCT GTT GCG GGC. CCC CTG CCC ACC ATG TAC CAG 1582
Ser Thr Cys Pro Pro Ala Vol Alo Gly Pro Leu Pro Thr Met Tyr Gin
515 520 525
ATT CCA GAA ATG GCC CGT TTG CCC AGT GTG GCT TTC CCC ACT GCC ATG 1630
He Pro Glu Met Alo Arg Leu Pro Ser Vol Ala Phe Pro Thr Ala Met
530 535 540
ATG CCC CAG CAG GAC GGG CAG GTA GCT CAG ACC ATT CTC CCA GCC TAT 1678
Met Pro Gin Gin Asp Gly Gin Val Alo Gin Thr He Leu Pro Alo Tyr
545 550 555
CAT CCT TTC CCA GCC TCT GTG GGC AAG TAC CCC ACA CCC CCT TCA CAG 1726
His Pro Phe Pro Alo Ser Val Gly Lys Tyr Pro Thr Pro Pro Ser Gin
560 565 570 575
CAC AGT TAT GCT TCC TCA AAT GCT GCT GAG CGA ACA CCC AGT CAC AGT 1774
His Ser Tyr Ala Ser Ser Asn Ala Alo Glu Arg Thr Pro Ser His Ser
580 585 590
GGT CAC CTC CAG GGT GAG CAT CCC TAC CTG ACA CCA TCC CCA GAG TCT 1822
Gly His Leu Gin Gly Glu His Pro Tyr Leu Thr Pro Ser Pro Glu Ser
595 600 605
FIG.11D
156
0662827B1 I >
235
EP O 662 827 B1
CCT GAC CAG TGG TCA AGT TCA TCA CCC CAC TCT GCT TCT GAC TGG TCA I870
Pro Asp Gin Trp Ser Ser Ser Ser Pro His Ser Alo Ser Asp Trp Ser
610 615 620
GAT GTG ACC ACC AGC CCT ACC CCT GGG GGT GCT GGA GGA GGT CAG CGG 1918
Asp Vol Thr thr Ser Pro Thr Pro Gly Gly Alo Gly Gly Gly Gin Arg
625 630 635
GGA CCT GGG ACA CAC ATG TCT GAG CCA CCA CAC AAC AAC ATG CAG GTT 1966
Gly Pro Gly Thr His Met Ser Glu Pro Pro His Asn Asn Met Gin Vol
640 645 650 655
TAT GCG TGAGAGAGTC CACCTCCAGT GTAGAGACAT AACTGACTTT TGTAAATGCT 2022
Tyr Alo
GCTGAGGAAC AAATGAAGGT CATCCGGGAG AGAAAÎGAAG AAATCTCTGG AGCCAGCTTC 2082
TAGAGGTAGG AAAGAGAAGA TGTTCTTATT CAGATAATGC AAGAGAAGCA ATTCGTCAGT 2I42
TTCACTGGGT ATCTGCAAGG CTTATTGATÎ ATTCTAATCT AATAAGACAA GTTTGTGGAA 2202
ATGCAAGATG AATACAAGCC TTGGGTCCAÎ GTTTACTCTC TTCTATTTGG AGAATAAGAT 2262
GGATGCTTAT TGAAGCCCAG ACATTCTTGC AGCTTGGACT GCATTTTAAG CCCTGCAGGC 2322
TTCTGCCATA TCCATGAGAA GATTCTACAC TAGCGTCCTG TTGGGAATTA TGCCCTGGAA 2382
TTCTGCCTGA ATTGACCTAC GCATCTCCTC CTCCTÎGGAC ATTCTTTTGT CTTCATTTGG 2442
TGCTTTTGGT TTTGCACCTC TCCGTGATTG TAGCCCTACC AGCATGTTAT AGGGCAAGAC 2502
CTTTGTGCTT TTGATCATTC TGGCCCATGA AAGCAACTTT GGTCTCCTTT CCCCTCCTGT 2562
CTTCCCGGTA TCCCTTGGAG TCTCACAAGG TTTACTTTGG TATGGTTCTC AGCACAAACC 2622
TTTCAAGTAT GTTGTTTCTT TGGAAAATGG ACATACTGTA TTGTGTTCTC CTGCATAÎAT 2682
CATTCCTGGA GAGAGAAGGG GAGAAGAATA CTTTTCTTCA ACAAATTTTG GGGGCAGGAG 2742
ATCCCTTCAA GAGGCTGCAC CTTAATTTTT CTTGTCTGTG TGCAGGTCTT CATATAAACT 2802
FIG.11E
157
BNSDOCID: <EP 0662M7B1 i >
236
EP 0 662 827 B1
TTACCAGGAA GAAGGGTGTG AGTTTGTTGT TTTTCTGTGT ATGGGCCTGG TCAGTGTAAA 2862
GTTTTATCCT TGATAGTCÎA GTTACTATGA CCCTCCCCAC TTTTTTAAAA CCAGAAAAAG 2922
GTTTGGAATG TTGGAATGAC CAAGAGACAA GTTAACTCGT GCAAGAGCCA GTTACCCACC 2982
CACAGGTCCC CCTACTTCCT GCCAAGCATT CCATTGACTG CCTGTATGGA ACACATTTGT 3042
CCCAGATCTG AGCATTCTAG GCCTGTTTCA CTCACTCACC CAGCATATGA AACTAGTCTT 3102
AACTGTTGAG CCTTTCCTTT CATATCCACA GAAGACACTG TCTCAAATGT TGTACCCTTG 3162
CCATTTAGGA CTGAACTTTC CTTAGCCCAA GGGACCCAGT GACAGTTGTC TTCCGTTTGT 3222
CAGATGATCA GTCTCTACTG ATTATCTTGC TGCTTAAAGG CCTGCTCACC AATCTTTCTT 3282
TCACACCGTG TGGTCCGTGT TACTGGTATA CCCAGTATGT TCTCACTGAA GACATGGACT 3342
TTATATGTTC.AAGTGCAGGA ATTGGAAAGT TGGACTTGTT TTCTATGATC CAAAACAGCC 3402
CTATAAGAAG GTTGGAAAAG GAGGAACTAT ATAGCAGCCT TTGCTATTTT CTGCTACCAT 3462
TTCTTTTCCT CTGAAGCGGC CATGACATTC CCTÎTGGCAA CTAACGTAGA AACTCAACAG 3522
FIG.11F
158
BNSDOCID: <EP 0662827B1 I >
237
EP 0 662 827 B1
AACATTTTCC TTTCCTAGAG TCACCTTTTA GATGATAATG GACAACTATA GACTTGCTCA 3582
TTGTTCAGAC TGATTGCCCC TCACCTGAAT CCACTCTCTG TATTCATGCT CTTGGCAATT 3642
TCTTTGACTT TCTTTTAAGG GCAGAAGCAT TTTAGTTAAT TGTAGATAAA GAATAGTTTT 3702
CTTCCTCTTC TCCTTGGGCC AGTTAATAAT TGGTCCATGG CTACACTGCA ACTTCCGTCC 3762
AGTGCTGTGA TGCCCATGAC ACCTGCAAAA TAAGTTCTGC CTGGGCATTT TGTAGATATT 3822
AACAGGTGAA TTCCCGACTC TTTTGGTTTG AATGACAGTT CTCATTCCTT CTATGGCTGC 3882
AAGTATGCAT CAGTGCTTCC CACTTACCTG ATTTGTCTGT CGGTGGCCCC ATATGGAAAC 3942
CCTGCGTGTC TGTTGGCATA ATAGTÜACA AATGGTTTTT TCAGTCCTAT CCAAATTTAT 4002
TGAACCAACA AAAATAATTA CTTCTGCCCT GAGATAAGCA GATTAAGTTT GTTCATTCTC 4062
TGCTTTATTC TCTCCAT6TG GCAACATTCT GTCAGCCTCT TTCATAGTGT GCAAACATTT 4122
TATCATTCTA AATGGTGACT CTCTGCCCTT GGACCCATTT ATTATTCACA GATGGGGAGA 4182
ACCTATCTGC ATGGACCCTC ACCATCCTCT GTGCAGCACA CACAGTGCAG GGAGCCAGTG 4242
GCGATGGCGA TGACTTTCTT CCCCTG 4268
FIG.11G
159
BNSDOCID: <EP 0662827B1 I >
238
EP O 662 827 B1
CO
UJ O
O. A
T^à
CM
,\^V
?V-\V
\s\\
XS.S
A\
?>\
V> *>J
N '-^
CM
o
160
BNSDOCID: <EP 0662827B1 I >
239
EP 0 662 827 B1
U3 LO LO LO L3
« ><C «ec uo «
ae a* a* =^ ac
?? <r « S «
« «c 2 «c «
Ol
i

i
o
L5>
Ci
C?
I
O
i
oc oc oe os os
o uo uo «r ïr
^ >» >? >- u.
Kaoeoçoc
aléaiési
?j _j ?i _j _i
<; « «X -«C UO
a5553
OOOOl-
_J __J .__I _J _J
£ô i^lrtO UJ
«E <t «t <E «X
0013 130
oaogo
- -? >- L3 «
- c? u_ __i
?. -a a C3 es
>-(/ll/IHr1
süss
UO I I I ??
uo i i uo uo
ca i i i i
uao. i i
kJUlO
__S3S
oc tt lo lo oc
a!xxxx
0.0.0.0.0-
85555
Q «t ë ë §
io ao
?.? ^k «w ^^
S S SE « S
ca a ea uj «
uj Ui uj uj £
G» i > i l
UJ till
?* «-3 \3 Ö J.
? poB<
o. S. o. o. o.
3uuu u
Suoo
uj uj uj uj uj
S <r <c «c «x
_i ?j ?> ?j s
7 S.g.S.5. a.
? og oe og H qç
*£ s ^ S Ä
ca ca a ca se
EisScS'ea' g*
gsis s

uo uo se 2
-loao __
u _l -i x L3
uo >->->- a;
QCOOOO
zzzz«
0.0.0.0.(0
VJ» uo uo uo ?
ë
O. O. O. O. (k
uo uo UO UO O.
« w- ?? »? o
uo au o. i
; §§3 S
t- « ?- o se
oî3o zn
! 555É
a. a es ?- es
a. a_ o. o. a.
uo uo uo uo uo

I ÛQ
| CM
I ?
1 O
Uo ? ll
£
I
'4
U. U. U. U. u.
1533 S
§§§§ s
eâPQâ
«r <x «r « «
< co m < <
*? ü ^ S =»
O. O. O. CL. Q.
feg S S s s
W3 W3 ta S O
=* z z
ssâ

J
0.0-0.0.0.
m

uo uo uo uo uo
ÜOOOO
ssls
o. o. o. uo o.
Su
a* x:
uo uo uo uo
=» _l _J _(
ftîiî
O* Q- Q* *-»lz
'i«
a.a.O. o-l«:
uo UO UO UO UO
i I i L3j?_
i ? i loi a:
«ssslâi
UJ L3 O Q «ÇC
uo ca aca
a«: a« a<to
OC oe Sla.
-Be-acJ5£j ?
CM
o

UO
LS
a«!
£S
É
i LO
ac ^ ag Çj
WC aCia<
r i ?r
' LO LO
L3 uo
UO UO UO LO I?
Q. O. Q. Q. S
? ac v: a* z
oc ? te ? uo
uo »? «b: «c «a
»c a*e M x u
oaou)u)
xoooa
SE
o r^ w» PO
?jj t/-i to oo
&£ fc£
o s
z z
Z
<_> co s
zs tx.
_ O o. o
1 SE o a
S?Ô z c?
£ £S t. X O
ç^ (7\ (g** 0s
-gss
j« i Zoiji
z^-SwCc
JC h= C X O
S e» ir» î£S
C3 ca
ru OJ CXI OJ
5 3=

rs O
a: z z
LO -a £
1 z O. O 8
IT) Z o
i s e UJ X oc o
UT» -c oo

rucu «mm
z =c
<_> «J

B C3
? z ^

o uo a:
-|2è

-»* i a: ca lo
3 S "5 UJ oc
161
BNSDOCID: <EP 0662827B1 I >
240
EP O 662 827 B1
u_ <r «r <r o.
LO
="= -S S
SI ca ea
5g S
?«&?=?
I SE LO
a's? è
o_ ^ z
Z C? LO
°- °- fix
?gas-
?Cj.n ta
z cf
Z LH
s s
lo ca
Ui is
LO _J
LS LO
©, L9
LO S
û. o_ O-
i C3 U
8:
i
o. o. es ac
L3
UO
G Ä
I
o.
LO LO
a_ o.
LO
S
5 ex cîi ai &i &c
5. Sl O- Q_ c£i C_>
<-=» oe =-
o- o- o.
uo Sï uo
uo uo uo
"E?
LO
3C LO LO
f K«
0.00
sis? stf
<ijz
> « <E
«? « «
O. LO LO
O- UO UO
?- VD LO
O. O. O.
LO
Q_
LO
?-? ca
ca Q.
LO L*>
LO C5»
LO C3
LO L3
?? <:
*- LO
UO U3
LO U.
r? Q_ O- O. <C
O. O- O. O- Q_
. LO UO UO LO UO
?? UO UO UO C9
> 3 5 ou
.ca ui uj uj uj
LO LO UO *^> LO
d
LO LO
ö
LO
i
S
l^>
s s: 2
o.
uo uo uo
LO UO CO
.£S5
?LO UO LO
ILO UO LO
.LO LO LO
UO UO ^
lig
- ~ OL
LO
.UJ UJ UJ
'CU CL O.
LO LO LO)
O- O- Q.
fe
LO
?
Z 2
LO LO
z a: ,
o. o-
UO LO ?
LO LO
LO LO
LO LO
g
O. O-
LO LO '
O. CU
_j _j ca
S
«ec ou
LO
u z z
< ao
cu 5 @s
e» S ö
xxl 12
uj uj uj sa ca
o i i I l
.o O- o. o____i
^£5cS ~ "
C3 __i _j
O
CU
ce
o
I
uu
Q.
es
LO
<Ö <" <ö Z I
« "-S <c cu cu
U3 U LO J?J O-
55 LO LO <£j LO
LO
O.
U3
i
o.
g
ÜE C3I
5hC Ca C9 CS O
_i> >xo.
SSSffi-ï
;iisi
O. O. O. O- LO
UJ _l _J _J tx>
oc oe cc oe o
O- ?? ?? ?? o.
?? uo z Z O-
?? o. o. o. <:
? _j _i £ -J
---- G» O ?
I LO
UJ
&
?I
LO
uj 5e ? 5e oo
Q.O o. o z
LO <« ?«
OO O** "W "">
? ca ? co
OJ c\j cu CU
ru rw ru ru
ea ru f».
m V »r
ru ru
oj ru
ru co
ru ru
_l _l CU
^y v ro i/o
UO "«r «O- ON
ro co ro «^
ru ru oj ru
ibO C3 CS CT UO ÜO ca ?i 3C a= LO CS
O. O. CU o. o-

!? z z z z
f?
?UO LO UO UO 1
? LO LO UO LO 1
.«II 1 1 1
'?>->- ^ ^^ I
|LO UO LO LO LO
'ca es Cs Z 3C O CS c_>
IOO uo uo cu o. a. LO LO O. LO CNI
:o_ o- a. O. CU
??; ?? _^p
5K" _J"_I _) _J ?*
>- u_ u_ L.. >. « ?
BÏS SS O
uo »? »? ?? ?«
«s =* ac o. o. o. 3C CS UO CS u.
U. O- CU SI
CU 2*. 9m
X -IX WO >- LO LO Z LO
« LO LO LO LO
Ou O. O. O. o.
__l _l _l _J LO
?- LO LO LO _l
cs al eü Si
<C __1 _l u. ».?
^ «K S ?? LO
S feS O O-
H? LO
O UJ UJ a lo
CS 1 J ? 1
es ca o a ls
O. B. O. O. LO
3C bJ m^j ac se
»? LO
«iflC h*? H^ LO LO
f 3= =
O. =» =»» ... ^.^
U; <C Q. ^ ^ ?J il ;
=k LO UO LO 1
LO LO LO LO LO
co «??> V© ON
?^r ru ? ON
?v ^ «W I/O
eu ru ru ru
<_>
t5£
uo __
z: «ec
.? uo
-7= S
z f» ss
O UJ

§ §
uo ac
=3 au
je » _ cg uq
mz «'ZD
z 2 o uj oe
â
C3 uo
________ -»^ SE C3
Z « e uj oe
£ »? U X <=a
162
BNSDOCID: <EP 06S2B27B1 I >
241
EP O 662 827 B1
hum N
TAN-1
Xen N
hum N
Ton-l
Xen N
Dros N
hum N
TAN-1
Xen N
Oros N
Potential signal cleovoge site
MP-
]
iyp-
w>-
----ALRPAL LWALLALWLC CA-----APA HA-
--------PL LAPLLCLALL PA-----LAA RG-
RICLAVLLCS LP-----VIT OG-
"N
Oros N MQSQRSRRRS RAPNTWICFW INKMHAVA5L PASLPLLLLT LAfANLPNIV RGTOTALVAA.
I MLGKATCRCA SGFTGEDCQY STSHPCFVSR PCtNGGTCKM LSROT-YECT CQVGFTGKEC
i GVAOYACSCA LGFSGPLCLT PLDNAC-LTN PCRNGGTCOL IT-LTEYKCR CPPGWSGKSC
i NAIDFICHCP VGFTDKVCLT PVDNAC-VNN PCRNGGTCEL LNSVTEYKCR CPPGWTGOSC
i CRPCISCKCP LCFDESLCEl AVPNAC-OHV TCLNGCTCQl KT-IEEYTCA CANCYTCERC
' NLPGSYQCfX PQGFTGQYCD SLYVPCAPSP CVNGGTCROT GOFTFEOCL PGFEGSTCER
? NEVGSYRCVC RATHTGPNCE RPYVPCSPSP CQNGGTCRPT GDVTHECACL PGFTGQNCEE
? NEFGSYRCTC ONRFTGRNCO EPYVFWSP aNGGTCROT DOTSYDCTCL PGFSGQNCEE
NTHGSYfXM: PTGYTGKDCD TKYNPCSPSP CCNAGICRSN G-LSYECKCP KGFEGKN?Q
r
J
r
?<
EGF-like Repeots
QCRfJGYEPCV NEGMCVTYHN GTGYCKCPEG FLGEYCQHRD PCE-KNRCQN GGTC?VAOA
RCSQPGETCL NGGKCEA-AN GTEACVCGGA FVGPRCODPN PCL-STPCXN AGTCHWDRR
RCTQTAEUCL NGGRCEMTPC CTCVCLCGNL YFCERCQFPN PCTIKNfXMN FGTCEPVLCG
SCTSVG-CQ NGGTCVTQLN GKTYCACDSH YVGDYCEHRN PCN-SMRCQN GGTCOVTFRN
83
80
90
117
QWTOACLSHP CANGSTCTTV -ANQFSCKC LTCFTGQKCE TDVNEC-OIP GHCQHGGTCL 199
OOADPCASNP CANGGQCLPF ?EASYICHC PPSFHGPTCR QOVNEOGQKP RLCRHGGTCH 196
QQADPCASNP CANGGKCLPF ?EIOYICKC PPGFHGATCK QOINEC-S-Q NPCKNGGQCl 195
ETKNLCASSP CRNGATCTAL AGSSSFTCSC PPGFTGDTCS YD1EEC-Q-S NPCKYGG1CV 233
NÎDDCPNHRC QNGGVCVDGV NTYNCRCPPO WTGGfCTEOV OECLLQPNA- CQNGGTCANR 318
NJDDCPGNNC KNGGACVDGV NTYNCPCPPE WTGQYCTEDV OECaMPNA- CONGGTCHNT 315
NJDDCPSNNC RNGGTCVDGV NTYNCOCPPO WTGOYCTEOV DECQLMPNA- CONGGTCHNT 314
NYOOCLGHLC QNGGTCÏCGI SOYTCRCPPN FTGRFOQDOV DECAQROHPV CQNGATCTNT 352
v.
FIG.13A
163
BNSDOCID: <EP 086282781 I >
242
EP O 662 827 B1
hum N iNGGYGCVCVN GWSCODCSEN IDDCAFASCT PGSTCIORVA SFSCMCPEGK AGLLCHLOOA
TAN-1 .HGGYNCVCVN GWTGEOCSEN IDDCASAACF HGATCHDRVA SFYCECPHGR TGLLCHLNDA
Xen N YGGYNCVCVN GWTGEOCSEN IOOCANAACH SGATCHORVA SFYCECPHGR TGLLCHLONA
Dros.N .HGSYSC1CVN GWAGLOCSNN TDDCKQAACF YGATCtDGVC SFYCQCTKGK TCLLCHLDQA
humN -AFHCECLKGY AGPRCEMDIN ECHSDPCOND ATCLDXIGGF TaCWPGFKG VHCELEINEC
TAN-1 :SFECQCLQGY TGPRCEIDVN ECVSNPCQND ATCLOQIGEF QCMCMPGYEG VHCEVNTOEC
Xen N SFQCNCPOGY AGPRCEIDVN ECLSNPCOND STCLOOIGEF ttICNFGYEC LYCtTNIDEC
OrosN SYRCNCSQGF TGPRCETN1N ECESHPCONE GSCLODPGTF RCVCMPGFTG TQCE1D1DEC
humN ATGFTGVLCE ENIONCDPOP CHHGfXQDGl DSYTCICNFG YMGAICSOQI OECYSSPCLN
TAN-1 TECYTGTHCE VD1DECOPDP CHYGSCKDGV ATFTaCRPC YTGHHCETN1 NECSSQPCRL
Xen N TEGFTGRHCE QOINECIPDP CHYGTCKDGI ATFTCLCRPG YTGRLCONDI NECLSKPCLN
Oros N PPGYTGTSCE IN1NDCDSNP CHRGKCIDOV NSFKCLCDPG YTGY1CQKOI NECESNPCQF
."\
r
L
??<
CISNPCHXGA LCDTNPLNGO Y1CTCPQGYK CADCTEOVDE CAMANSNPCE HAGKCVNTDG " 438
CISNPCNEGS NCONPVNGK. A1CTCP5GYT GPACSQDVDE CSIG-ANPCF. HAGKCINTLG 434
CISNPCNEGS NCDTNPVNGK A1CTCPPGYT GPACNNDVOE CSLG-ANPCE HGGRCTNTLG ? 433
CTSNPCHADA 1CDTSP1NGS YACSCATGYK GV0CSEO1OE COQG-SPCE HNGICVNTPG 470
QSNPCVNNGQ CVDKVNRFQC LCPPGFTGPV COIOIOOCSS TPCLNSAKCI OHPNCYECQC 558
ASSPCLHNCR CL0K1NEFCC ECPTGFTGHl COYOVDECAS TPCKNGAKCl DGPNTYTCVC 554
ASNPCLHNGK C1DKINEFRC DCPTGFSGNt COHDFDECTS TPCKNGAKCL DGPNSYTCCC 553
QSNPCLNQGT CHQK1NGFKC SCALGFTGAR CQ1N1DDCQS QPCRNRCICH OSlACYSCEC 590
DGRC1D1VNG YOCNCQPGTS GVNCEiNFDO CASNPCIHG- ICMDGINRYS CVCSPGFTGQ 677
RGTCODPONA YLCFCLKGTT GPNCEINLOO CASSPCOSG- TCLOKIOGYE CACEPGYTGS 673
GCOCTDRENG YICTCPKGTT GVNCETKIDO CASNLCDNG- KC10KIDGYE CTCEPGYTGK 672
OGHCODRVGS YYC0CQAGT5 GKNCEVNVNE CHSNPCNNGA TC10GINSYK COCVPGFTGO 710
FIG.13B
164
BNSDOCID: <EP 0662827B1 I >
243
EP O 662 827 B1
hum N ! RCNIOIDECA SNPCRKGATC INGVNGFRCI CPEGPHHPSC YSQVNECLSN PCl-HGNCTG
TAN-1 ! MCNSNIDECA GNPCHNGCTC EOG1NGFTCR CPEGYHJPTC LSEVNECNSN PCV-HGACRD
Xen N . LCNININECD SNPCRNGGTC KDOINGFTCV CPOGYHDHMC LSEVNECNSN PCI-HGACW)
Dros N j HCEKNVDECI SSPCANNGVC 1DQVNGYKCE CPRGFYPAHC LSOVDECASN PCVNEGRCEO
hum N ?? OECASNPCLN QGTCFDDJSG YTCHCVLPYT GKNCOTVLAP CSPNPCENAA VCKESPNFES
TAN-1 ! NECASNPCIN KGTC1DDVAG YKCNCLLPYT GATCEWLAP CAPSPCRNGC ECRQSEDYES
Xen N ! NECSSNrUN HGTCIDDVAG YKCNCMLPYT GAI?AVLAP CAGSPCKNGG RCKESEOFET
Dros N ? DDCVTNPCGN GGTCIDKVNG YKCVCKVPFT GRDCESKMP CASNRCKNEA KCTPSSNFLD
-^
H
hum N
TAN-1
Xen N
Dros N
CLANPCQNGG SCMDGVNTFS CLCLPGFTGD KCOTONMECL SEPCKNGGTC SDYVNSYTCK
CRPNPCHNSG SCTDGINTAF CDCLPGFRGT FCEED1NECA SOPCRNGANC TDCVDSYTCT
CQPNPCHNCG SCSDGIIWT CNCPAGFRGP KCEEDJNECA SNPCKNGANC TDCVNSYTCT
CASTPCONGG TCLDGIGDYS CLCVDGFDGK HCETDINECl SfKONGATC SOYVNSYTCT
J
V
J
r
L
GLSGYKCLCO AGWVCINCEV DKNECLSNPC GNGGTCONLV NGYRCTCKKG FKGYNCQVNI 796
SLNGYKCDCO PGWSGTNCDI NNNECESNPC VNGGTCKDMT SGIVCTCREC F9GPNCOTNI 792
GVNGYKCOCE AGWSGSNCOl NNNECESNPC MNGGTCKDMT GAYICTCKAG FSCPNCQTNf 791
C1NEFICHCP PGYTGKRCEL DIOECSSNPC QHGGTCYDKl NAFSCCCMPG YTCQKCETN) 830
YTCLCA-PGW QGQRCTIDID EC-1SKPCMN HGLCHNTQGS YMCECPPGFS GMDCEEDIDD 914
FSCVCPTAGA KGQTCEVDIN EC-VLSPCRH GASCQNTHGG YRCHCQAGYS GRN?TDIDD 911
FSCECP-PGW CGOTCEIDMN EC-VNRPCRN GATCQNTNGS YKCNCKPGYT GRNCEMDIDD 909
FSCTCK-LGY TGRYC0E01O ECSLSSPCRN GASCLNVPGS YRCLCTKGYE GR0CA1NTQD 949
CQAGFDGVHC ENNINECTES SCFNGGTCVD GINSFSCLCP VGFTGSFCLH EirCCSSHPC'1034
CPAGFSGIHC ENNTPOCTES SCFNCGTCVD GINSFTCLCP PGFTGSYCQH WNECDSRPC-1031
CQPGFSG1HC ESNTPDCTES SCFNGGTCID GINTFTCOCP PGFTGSYCOH DINECOSKPC 1029
CPLGFSGINC OTNOEDCTES SCLNGGSCIO G1NGYNCSCL AGYSGANCQY KINKCDSNPC 1069
FIG.13C
165
BNSDOCID: <EP 066282781 I >
244
EP O 662 827 B1
hum N LNEGTCVDGL GTYRCSCPLG YTCKNCOTLV NLCSRSPCKN KGTCVOKKAE SQCLCPSGWA
TAN-1 LLGGTCOOGR GLHRCTCPQG YTGPNCONLV HCOSSPCKN GGKOïOTHTO YRCECPSCWT
Xen N : LNGGTCQDSY GTYKCTCPOG YÎGLNCQNLV RWCDSSPCKN GGKCWOTNNF YRCECKSCWT
Dros N iLNCATCHEQN NEYTCHCPSG FTCKQCSEYV OWCGQSPCEN GATCSOMXHQ FSCKCSACWT
humN iSNPCQHGATC SDFIGCYRCE CVPGYQGVNC EYEVDECONQ PCQNGGTCID LVNHFKCSCP
TAN-1 IPSPCQNGATC TDYLGGYSCK CVAGYHGVNC SEEIDEaSH PCQNGGTCLD LPNTYKCSCP
Xen N IPNPCONGATC TOYLGGYSCE CVAGYHGVNC SEEINEaSH PCQNGGTCID LINTYKCSCP
Dros N iSQPCONGGTC RDL1GAYECQ CRQGFCGONC ELN1DDCAPN PCQNGGTCHD RVMNFSCSCP
humN .CLSNPCSSEG SLDCIQLTND YLCVCRSAFT GRHCETFVDV CPOMPCLNGG TCAVASNMPO
TAN-1 CLSNPCDARC TQNCVORVND FHCECRAGHT GRRCESVING CKOCPCKNGG TCAVASNTAR
Xen N CLSNPCDSRG TQNCIQLVND YRCECRQGFT GRRCESWDG CKGMPCRNGG TCAVASNTER
Dros N ;CLSNPCSNAG TLDCVaVNN YHCICRPGHM GRHCEHKVDF CAOSPCWGG NCNÏ?ROS
>v
f-,
j
-<
FIG. 13D
J
rCAYCOVPNVS CDJAASRRGV LVEHLCQHSG VCJNAGNTHY CQCPLGYTGS YCEEQLOECA 1154
GLYCOVPSVS CEVAAOROGV DVARLCQHGG LCVDAGNTHH CRCQAGYTGS YCEOLVOECS 1151
GVYCDVPSVS CEVAAKQQGV DIVHLCRNSG MCVDTGNTHF CRCQAGYTGS YCEEOVDECS 1149
GfaCOVQTlS CÛDAADRKGL SLROLC-NNG TCKDYGNSHV CYCSQGYAGS YCQKEIOECQ 1188
PCTRGLLCEE NIDDCAR----------------GPHCLN GGQCMDRIGG Y5CRCLPGFA GERCEGDINE 1267
RGTQGVHCEI NVDDCNPPVD PVSRSPKCFN NGTCVDQVGC YSCTCPPGFV GERCEGOVNE 1271
RGTQGVHCEI NVDDCTPFYD SFTLEPKCFN NGKCIDRVGG YNCICPPGFV GERCEGOVNE 1269
PCTMG1ICE1 NKDDCKP------------------GACHN NGSCtORVGC FECVCQPGFV GARCECD1NE 1300
GFICRCPPGF SGARCQS? SCGQVKCRKG ECCVHTAS- GPRCFCPSP- --K0CES-? 1376
GFICKCPAGF EGATCENDAR TCGSLRCLNG GTCISGPR- SPTCLCLGPF TCPECQFPAS 1389
GFICKCPPGF DGATCEYDSR TCSNLRCQNG GTCISVLT- SSKCVCSECY TGATCQYPVI 1387
v CHHC1CNNGF YGKNCELSGQ OCOSNPCRVG -NCWAOEGF GYRCECPRCT LCEHCEIDTL 1415
166
BNSDOCID: <EP 0662B27B1 I >
245
EP O 662 827 B1
hum N -GC-ASSPCQ HGGSCHPQRQ PPYYSCQCAP PFSGSRCEL- -YTAPP------------S----------TPP
TAN-1 SPCLGGNPCY NQGTCEPTSE SPFYRCLCPA KFNGLLCHIL DYSFGG------------GAGRDIPPP
Xen N SPC-ASKPCY NGGTCQFFAE EPFFQCFCPK NFNGLFCHIL OYEFPG------------GLGKNITPP
Dros N :OEC-SPNPCA CGAACEDLLG D-YECLCPS KWKGKRCDIY DANYPCWGG SG9GNDRYAA
humN NN-CCOELCN TVECLFONFE CQGNSKTCK- -YOKYCADHF KDWCNQGCN SEECGWOGLD
TAN-1 SOGHCOSQCN SAGCLFOGFD CQRAEGQCNP LYDOYCKOKF SDC4CD0GCN SAECEWOGLD
Xen N iNOGKCDSQCN NTGCLYOGFO CQKVEVQCNP LYDOYCKOKF OOGHCDQGCN NAECEWDGLO
Dros N 'KNGKCNEECN NAACHYDGHD CERKLKSCDS LFDAYCQXHY COCFCDYCCN NAECSM3GLD
hum N YYCEKSAAW KQ-R----------------------------------------MTRRSL PGEO----------E OEVAGSKVFL
TAff-1 YYGREEELRK HPIKRAAEGW AAPDALLGQV KASLLPGGSE GGRRRRELOP MDVRGSJVYL
Xen N YYGNEEELKK HHIKRSTDYW SDAPSAI----------FSTMKESIL LGRHRRELDE MEVRGS1VYL
Oros N WKONVRVPE! EOTOFARKNK ILYTQQVHQ----------------------------------------------------TGIQIYL
>k
h
J
r
LNR (Notch/lin-12 Repeots)
r
u
J
A?Ta SQYCAOKARD GVCOEACNSH ACOWDGGDCS LTMENPWANC SSPLPCWDY! 1476
LIEE?ACE LPECQEDAGN KVCSLCCNNH ACGWDGGDCS LNFNDPWKNC TfÄLQCWKYF 1501
ONDD?ICE NEQCSELADN KVCNANCNNH ACCWOGGDCS LNFNDPWKNC TQSLQCWKYF- 1498
OLEQQRÀMCD KRGCTEKQGN C1C0SDCNTY ACNFDGNDCS LCl-NPWANC TAN-EXWNKF 1531
CAADQPEN-t AEGTLVIWL MPPECUQDA R-SFLRALGT LLHTNIRIKR DSfJGELMVYP 1591
CAEHVPER-L AAGTL-WW LMPPEQLRNS SFHFLRELSR VLHTNWFKR DAHGQQMIFP 1619
C-ANMPEN-L AEGTLVLWL MPPERLKNNS V-NFLRELSR VLHTNWFKK DSKGEYKIYP 1615
CENKTQSPVL AEGAMSWML MNVEAFREIQ A-OFLRWSH MLRTTVRLKK OALGHDIIIN 1650
TM
EIDNROCVOD SDHCFKNTDA AAALLASHAI CG?TLSYP LVSWSESLT PERT-Q-LLY 1680
EIDNROCVOA SSQCFOSATD VAAFLGALAS LGSL-NIPYK IEAVQSETVE PPPPAQ-tHF 1737
EIDNRCCYKS SSQCFNSATD VAAFLGALAS LGSLDTLSYK IEAVKSEWr£ TPKPST-LYP 1730
EIONRKCTEC FTHAVEAAEF LAATAAKHQL RNDFO-IHSV RG1KNPGDED NGEPPANVKY 1745
FIG.13E
167
BNSDOCID: <EP 0662827B1 I >
246
EP O 662 827 B1
"N
hum N LLAVAWI IL f l ILLGVIMA KRKRK-HGS LWLPEGFTLR RDASNHKRRE PVGQDAVCLK
TAN-1 :MYVAAAAFVL LFFVGCGVLL SRKRRRQHGQ LWFPEGFKV- SEASKKKRRE ELGEDSVCLK
Xen N IMLSMLV.PLL IIFVFVWVIV NKKRRREHDS FGSPTALFQK NPA-KRAGET PrHDSVGLK
Dros N 'V1TGI1LVI1 ALAFFCMVL!- STQRKRAHGV TWFPEGFRAP AAVMSRRRRD PHGCEMRNLN
COC-IO/Ankyrin Repeots
hum N PTDRRPWTQQ HLEAADIRRT PSLALTPPQA EQEVOVLOVN VRGPDGCTPL MLASLRGCSS
TAN-1 QTDHRCWTQQ HLOAADL-RM SAMAPTPPQG EVDADCMDVN VRGPDGFTPL MIASCSGGGL
Xen N KTDPRQWTRQ HLDAADL-fll SSMAPTPPOG EIEADCMDVN VRGPDGFTPL MIASCSGGGL
Oros N EADORVWSQA KLDWDV-R- AIM-TPP-A HQDGGKHQVD ARGPCGLTPL MlAAVRGGGL
hum'N ANAQDNMGRC PLHAAVAADA QGVFQILIRN RVTDLDARUN DG TT PL IL AA RLAVECMVAE
TAN-1 ANIQDNMGRT PLHAAVSADA QGVFQILIRN RATDLDARMH DGTTPL1LAA RLAVEGMLED
Xen N ?A^M3DNOTPLHMVAADA QGVFQILIRN RATOLDARWf DGTTPLILAA RLAVEGMVEE
Dros N iANCQDNTGRT PLHAAVAADA MGVFQILLRN RATNLNARMH DGTTPLILAA RLA1ECMVEO J
r
j
^NLSVQVSEAN LIGTGTSEHW VDDE-
PLK-NASOGA LMDDNQNE-» GÛED-
PIK-WMTOGS FMDDNQNE-W GDEET------------------------
KQVAMOSQGV GQPGAH?W SDDESDMPLP KRORSDPVSG VGLGNNGGYA SOHÎMVSEYE
G POPKKVKAEO EALLSE-EDD 1782
- LETKKFRFEE PWIPCHOD 1837
- LENKRFRFEE QVILPELVDD 1831
1861
?<
DLSOEOEDAE OSSANIITOL VYCGASLOAQ TORTGEMALH LAARYSRADA AKRLLOAGAD 1902
ETGNSEEE-E DAPA-VISDF JYOCASLHNQ TDRTGETALH LAARYSRSDA AKRLLEASAD 1954
ETGNSEEE-E DASANMISOF IGQGAOLHNO TDRTGETALH LAARYARADA AKRLLESSAD 1949
DTGEDIENNE DSTAQVISOL LAOGAELNAT MDKTGETSLH LAARFARADA AKRLLOAGAD 1976
LINCQADVNA VDDHGKSALH WAAAVNNVEA TLLLLKMSAN ROMQDNKEET PLFLAAREGS 2022
LINSHADVNA VDDLGKSALH WAAAVNNVDA AWLLKNGAN KDMONNREET PLFLAAREGS 2074
LINAHADVNA VDEFCKSALH WAAAVNNVDA AAVLLKNSAN KOMQNNKEET SLFLAAREGS 2069
LITADADINA ADNSGKTALH WAAAVNNTEA VN1LLMHHAN RDAQDDKDET PLFLAAREGS 2096
FIG.13F
168
BNSDOCID: <EP 0662827BI I >
247
EP O 662 827 B1
^
hum N
TAN-I
Xen N
Dros N
hum N
TAN-1
Xen N
Dros N
hum N
TAN-1
Xen N
Dros N
r
L.J
YEAAKILLDH FANRDITOHM DRLPROVARD RMHHDIVRLL OEYNVTPSPP -CTVL-TS
YETAKVLLOH FANRDITOHM DRLPROIAQE RMHHDIVRLL DEYNLVRSPQ LHGAPIGGTP
YETAKVLLOH YANRDITDHM DRLPROIAQE RMHHDIVHLL OEYNLVKSPT LHNGPLGAT-
:YEACKALLON FANREITDrftl DR L PRO VASE RLHHDIVRLL OE-HVPRSPQ MLSMTPQAMI
NLS CK II cdc2 cdc2
GSRRKKSLSE KVQLSÊ-SS VTL5PVDSLEISPHTYVSOTT iSSPM------------
A-flRKKSQOG KGCLLD-SS GML5PV0SLE ïSPHGYLSDVA !SPa:-----------
A-RRKKSQDG KTTILDSGSS GVLSPVDSLEISTHGYLSDVS iSPPL----------------------------------
GS-PDNGLDA TCStffiRJWSS KKTSAASKKA ANLNGLNPGO LTCGVSGVPG VPPTNSAAQA
BNTS
>?
-------------------------------------------------------------ITSPCILOAS PNPML?ATA APPAPVHAOH
-------------------------------------------------------------LRSPF-QOS PSVPLNHLPC MPDTHLGfGH
?--------------------------------------------------------M15PF-QQS PSMPLNHLTS fcPESOLGMNH
[YEDCIKNAOS MOSLQGNGLD MIKLONYAYS MGSPF-OQE ILNGCGLGMN GNGQRNGVGP
CK II cdc2 J

r
--------------ICGP NRSFLSLKHT PMGKKSRRPS AKSTMPTSLP NLAKEAKDAK 2127
--------------LCSP NGYLGSLKPG VOGKKVRKPS SKGLACGS------------KEAKOLK 2178
--------------ICSP ^CYMGNMKPS VOSKKARKPS IKGfCC---------------KEAKELK 2170
GSPPPGOQQP QLITQPTV1S AGNGGNNGNG NASGKQSNOT AKOKAA---------------KKAKLIE 2208
ALSPV-
TLSPP-
TLSPP-
------------------------------------------------------------------------------------------------ 2169
----------------------------------------------------------------------------------------------------------------------------- 2219
--------------------------------------------------------------------------------------------------------------------------. 2213
AAAAAAAVAA MSHELEGSPV GVGMGGNLPS PYDTSSMYSN AMAAPLANGN PNTGAKOPPS: 2327
ALSFSNLHEM Q------------------------------------------PLAHGASTV LPSVSQLLSH HHIVSPGS? 2235
LNVAA-KPEM AALGGGGRLA FETGPPRLSH LPVASGTSTV LGSSSGGALN FTVGGSTSLN 2306
IMVIAT-KQEM AA-CSNRMA FDAMVPRLTH L-NASSPNTI MS?NGSMH FTVGGAPTMN 2294
GVLPGGLCGM GCLSGAGNCN SHEQGLSPPY SNQSPPHSVO SSLALSPHAY LGSPSPAKSR 2445
v.
FIG.13G
169
BNSDOCID: <EP 0662827B1 I >
248
EP O 662 827 B1
hum N
TAN-1
Xen N
Oros N
hum N
TAN-1
Xen N
Dros N
GSAGSLSRLH FW/PADW- MNRMfVNETQ YNEMFGMVLA PAEG-THPG! APQSRPPEGK
GQCEWLSRLQ SGMVPNQYNP LRGSVAPGPL STQAPSLOHG -MVCPLHSSL AASALSOVMS
SQCOWIARLQ NGMVONQYDP IRNGIQQGN- AQQAQALQHG LMTS-LHNGL PATTLSQVWÏ
PSLPTSPTHI QAMÖWTQQK QFGGSNLNSL LGGANGGGW GGGGGGGGGV GQGPQNSPVS
APQPQSTCPP AVAGPLPTMY QIP----------EM ARL-PSVAFP TAWPTJQDGQ VAQTJLPAYH
PPOPHLGVSS AASGHLGRSF LSGEPSQADV QPLGPSSLAV HTILPQ-ESP ALPTSLPSSL
MOQQHHN-SS TTSTHINSPF CSSDISQTDL QQM-SSNNI HSVMPO-OTQ IFAASLPSNL
QQQLGGLEFG SAGLOLNG-F CGSPDSFHSG QMNPPS? l QSSMSG-SSP STNMLSPSSQ
y
hum N : SOWSDVTTSP TRGGAGGGQR GPGÎHMSEPPHNN MQVYA
TAN-1 i SDWSEGVSSP PT----------SMQ SQIARIPEAFK
Xen N ! SOWSEGISSP PT----------SMQ PQRTHIPEAFK
Dros N ? SOWSEGVQSP AANNLYISGG HQANKGSEAIYI
J
r
j
r
ITTPRE PLPP-IV-TF QLIPKGSIAQ PAG----------=------- 2320
------------YQGLPSTRL ATQPHLVQTO QVOPQNIQMO QQNLQPANIQ QQQSLQPPPP 2414
------------YQAUPNTRL ANQPHLMQAQ QMQQQQN-------------------LQLHQS 2384
LGIISPTGSO MGIMLAPPOS SXNSAIMOTI SPQOOÛOOÛO OOOOOHOCOQ ÛQOOOOOQQO 2565
U
PEST -contoinino Region
PFPASVGKYPiTPPSQHSYAS SNAAERTPSH SGHLQGEHPY LTPSPESPDQ WSSSSPHSA- 2433
VPPVTAAQFL ÎTPPSQHSY-S S-PVENTPSH QLQVP-EGPF LTPSPESPDQ WSSSSPHSNV 2530
TQSMTTAQFLITPPSQHSY-S S-PMDNTPSH QLQVP-OHPF LTPSPESPDQ WSSSSPHSM4 2497
HNQQAFYOYLITPSSQHS--------------CGHTPQH LVOTL-D-SY PTPSPESPGH WSSSSPRSN- 2671
v^
2471
2556
2523
2703
FIG.13H
170
BNSDOCID: <EP 0662827B1 I >
249
EP O 662 827 B1
«n **Vx

*-*«&? ;*.*v
.A

&



FI6.14
BNSDOCID: <EP 0662827B1 I >
171
250
EP O 662 827 B1
FIG. 15A
172
BNSDOCID: <EP 0862827B1 I >
251
EP O 662 827 B1
FIG. 15B
173
BNSDOCID: <EP 0662827B1 I >
252
EP O 662 827 B1
r«T» t
«f 7*.

'V, '-.?'. i's/F' ,
??,; ?**..
r.
6
. v
FI6. Î6A
BNSDOCID: <EP 0662827B1 I >
174
253
EP O 662 827 B1
%. V
FIG. 16B
175
BNSDOCID: <EP 0662827B1 I >
254
EP O 662 827 B1
10 20 30 40 50 60' 70 80 90
ii » t * » ? i ?
GGAATTCOCC CCGCCCTGCG CCCCGCTCIG CTCTGGGCCC TGCTGGCGCT CTGGCTCTGC TGCGCGGCCC CCGCGCATGC ATTGCACTGT
PALR PAL L Hf A LLAl V i C CAA PAHA NO
100 110. 120 130 140 150 160 170 160
« ?«??«»«.
CGAGATGGCT ATGAACCCTG TGTAAAIGAA GGAATGTGTG ÏTACCTACCA CAATGGCACA GGATACTGCA AATGTCCAGA AGGCTTCTTG
ROG YEPC V N E CMC VTYH NGT CYC KCPE GFL>
190 200 210 220 230 240 250 260 270
? ? ? ? I I ? I ?
GCGGAATATT CTCAACATCG ACACCCCTCT GAGAACAACC CCTCCCAGAA TGGTGGGACT TCTCTGCCCC AGGCCATGCT GGGCA/WGCC
GEY COHR DPC EKN RCQN GGT CVA QAUL GKA>
280 230 300 310 320 330 ' 340 350 360
? tiitiiii
ACCTGCCGAT GTGCCTCAGG GTTTACAGGA GAGGACTGCC AGTACTCAAC ATCTCATCCA TGCTTTGTGT CTCGACCCTG CCTGAATGGC
TCR CASG FTG EOC OYST SHP C f V SRPC LNG>
370 380 390 400 410 420 430 440 450
? ?**?????
GGCACATGCC ATATGCTCAG CCGGGATACC TATGAGTGCA CCTGTCAAGT CGGGIÎÎACA GGTAAGGAGÏ GCCAATGGAC GGATGCCTGC
GTC HMLS ROT YEC TCQV GTT GKE COWT DA O
460 470 480 490 500 510 520 530 540
? ??iiiiii
CTCTCTCAFC CCTGTGCAAA TOCAAGTACC TGTACCACTG TGGCCAACCA GnCTCCTGC AAATGCCTCA CAGGCTTCAC ACGGCACAAA
LSH PCAN GST CTl VANQ FSC KCL TGFT G0K>
550 560 570 580 590 600 610 620 630
? ?????? i«
TGTGAGACTG ATGTCAATGA CTGTGACATT CCACGACACT GCCAGCAÎGG TGGCACCTGC CTCAACCIGC CTGGTTCCTA CCACTGCCAC
CET OVNE COJ PGH COHC CIC LNL P G S Y 0C0>
640 650 660 670 680 690 700 710 720
? ? * * « ? ? ? ?
TGCCCTCAGG GCTTCACAGG CCAGTACTGT GACAGCCTGT ATGTCCCCTG TGCACCCTCA CCTTCTGICA ATGCAGGCAC CTGTCGGCAG
CPO GfTG OYC OSL YVPC APS PCV NGGT CRQ>
730 740 750 760 770 780 790 800 810
? ??«iii ti
ACTGCÏGACT TCACTTTTGA CTGCAAC7GC CTTCCAGGTT TTGAAGGCAG CACCTCTGAC AGCAAMTTC ATGACTGCCC TAACOOGC
TGO FIFE CNC LPG FECS ÎCE RNI OOCP NHR>
FIG.17A
176
BNSDOCID: <EP 0662827B1 I >
255
EP O 662 827 B1
820 830 840 850 860 870 880 890 900
? ?????? i i
TGICACAAIG GAGGGGTTTG rCTGGATGGG GTCAACACTT ACAACÎGCOC CIGTCCCCCA CMTGCACAC GACAGTTCTC CACAGAGGAT
CON CCVC VDG VNT YNCR CPP O W T GOFC T E 0>
. 910 920 930 940 950 960 970 980 990
? ????????
GIGGATGAAT GCCTGCTGCA GCCCAATGCC TGTCAAAATG GGGGCACCTG TGCCAAOXC AATGGAGGCT ATGGCTGTGT ATGTGTCAAC
VOECLLO PNA CON CGÎCANR NGG YGCV C V N>
1000 1010 1020 1030 1040 1050 1060 1070 1080
? * ? ?? * * * *
GGCTGGACTG GAGATGACTC CACTGAGAAC AÎTGAÏGATT GIGCCTTOGC CTCCTGIACT CCAGGCTCCA CCIGCATCGA CCCTCTGGCC
GWS GODC SEN IDO CAFA SCT PGS TCID RVA>
1090 1100 1110 1120 1130 1140 1150 1160 1170
? » ? ? t i « ? «
TCCITCTCTT CCATCTGCCC AGAGGGGAAC GCAGGTCTCC TGTGTCATCT GGATGATGCA TGCATCACCA ATCCTIGCCA CAACCGCGCA
SFS CMCP [CK AGL LCHL O O A CIS NPCH KGA>
»180 1190 1200 1210 1220 1230 1240 1250 1260
? ? i i » ? ? ? ?
CTGTGTGACA CCAACCCCCT AAATGGGCAA TATATTTGCA CCTCCCCACA AGGCTACAAA CGGGCTCACT GCAWCAAGA TGTGGATGAA
LCD TNPL NCO YIC TCPQ GYK GAD CTEO V D E>
1270 1260 1290 1300 1310 1320 1330 1340 1350
? ?««???i*
TGTGCCATGG CCAATAGCAA TCCTTGTGAG CATGCAGGAA AATGTCTGAA CACGGATGGC GCCTTCCACT GTGAGTGTCT GAAGGGTTAT
CAM ANSN PCE HAG KCVH 10 C AFH CECL KCY>
1360 1370 1380 1390 1400 1410 1420 1430 1440
? »»???»??
GOIGCACCTC GTTGTGAGAT GGAGATCAAT CACTGCCATÎ CAGACCCCTG CCAGAATGAT GCTACCTGTC TGGAIAAGAT TGGAGCCTTC
AGP RCEM OIN ECH SOPC QNO ATC LOKI GGF>
1450 1460 1470 1480 1490 1500 1510 1520 1530
? ??iii»»«
ACATGÎCFCT GCATCCCAGC TTTCAAACGT CTGCATTGIC AATTACAAAT AAATCAATGT (ÄAGCAACC CTTGÎGTGAA CAATGGCCAG
ICL CMPC FKG VHC ELEI NEC OSN PCVN NCO>
1540 1550 1560 1570 1580 1590 1600 1610 1620
? ?????? ??
TGTGIGGAIA AAGTCAAT? TTTCCAGTCC CTGTCÎCCTC CIGGTTTCAC TGGGCCAGTT TGCCAGATTG ATAÏTGATGA CTCTTCCAGT
CVD KVNR FOC ICP PGFI GPV COI DlOO C S S>
FIG.17B
177
BNSDOCID: <EP 066282781 I >
256
EP O 662 827 BI
1630 1640 1650 1660 1670 1680 1690 1700 1710
« » * ? ? ? «i«
Acrcccicrc tcaatgggcc AAAGTCTATC GATCACCCGA ATGGCTATGA ATGCCAGTGT GCCACAGCTT TCACTCCTGT GTTCTCTGAG
TPC LNGA KCl OHP NGYE COC ATG Fï.GV LCE>
1720 1730 1740 1750 1760 1770 1780 1790 1800
? ? ?????? ?
GAGAACATTG ACAACTGTGA ccccgatcct TGCCACCATG CTCACTGTCA GGATGGTATT GATTCCTACA cctgcatctg CAATCCGCGG
ENI ONCD POP.CHH GOCQ OCI OSY TCIC NPO
1810 1820 1830 1840 1850 I860 1870 1880 1890
? ????????
TACATGGCCG CCATCTCCAG TGACCAGATT GATGAAÎGTT ACACCACCCC TTGCCIGAAC GATGGTCGCT GCATTGACCT GGTCAATGGC
r y G AICS O Q I DEC YSSP CLN OCR CIOL VNO
1900 1910 1920 1930 1940 1950 1960 1970 1980
? iiiiiiit
TACCAGTGCA tfTKEACCC AGGCACGTCA CGGGITAAIT GTGAAATTAA TTTIGATCAC TGTGCAACTA ACCCTTGTAT CCATGGAAIC
YOC NCOP GÎS GVN CEIN FDD CAS NPCI HGI>
1990 2000 2010 2020 2030 2040 2050 2060 2070
? ???*????
TGTATCGATG GCATTAATCG CTACAGTTGT GTCTGCICAC CAGGATTCAC AGGGCACAGA TGTAACATTG ACATTGATGA GTGTGCCTCC
CUD GINR YSC VCS PGFT COR CNI DIDE C A S>
2080 2090 2100 2110 2120 2130 2140 2150 2160
? ??*????«
AATCCCTGTC GCAAGGGTGC AACATCTATC AACGGTGTGA ATGGTTTCCG CTGTATATGC (XXGAGGGAC CCCAÏCACCC CAGCTGCTAC
NPC RKGA TCI NCV NGFR.CIC PEG PHHP SCY>
2170 2180 2190 2200 2210 2220 2230 2240 2250
? ? ? ? i i » » ?
TCACAGGTGA ACGAATGCCT GAGCAATCCC TGCATCCAIC GAAACTGTAC TGGAGGTCTC AGÎGGATATA AGTCTCTCTG ÎGATGCAGCC
SOV NECL SNP CIH GNCI GGL SGY KCLC DAG>.
2260 2270 2280 2290 2300 2310 2320 2330 2340
** » » » » » ??
TGCGTTGCCA TCAACTGIGA AGTGGACAAA AATGAATGCC TTTCGAATCC ATGCCAGAAT GGAGCAACTT GTGACAATCT CCTCAATGCA
WVC INCE VDK NEC LSNP CON GGT CDNL VNO
2350 2360 2370 2380 2390 2400 2410 2420 2430
i « i « ? « ? ? ?
TACAGGTGTA CTTGCAAGAA CGGCTTfAM GGCJATAACT GCCAGGFCAA TAÏÏGA7CAA ÎGTGCCTCAA ATCCATGCC1 GA4CCAAGGA
YRC TCKF CFK GYN COVN IOE CAS NPC; NOG>
FIG.17C
178
BNSDOCID: <EP 0662827B1 I >
257
EP O 662 827 B1
2440 2450 2460 2470 2480 2490 2500 2510 2520
? ??????» ?
ACCrCCmC AfCACAIAAG TGGCTACACT TGCCACTCTG TGCTCCCATA CACACCCAAG AATTCTCAGA CACTATTGGC TCCCTGTTCC
TCF DOIS CYÎ CHC VLPY ÏGK NCO TVIA PCS>
2530 2540 2550 2560 2570 2580 2590 2600 2610
? «??«???t
CCAAACCCTT GTGAGAATGC TCCTGTTTGC AAAGAGTCAC CAAATTTTGA GAGTTATACT TGCTTGTGTG CTCCTGGCTG GCAAGGTCAG
PNP CENA AVC KES PNFE SYT CLC APCW QG0>
2620 2630 2640 2650 2660 2670 2680 2690 2700
? ?«*«?*»»
CGCTCTACCA TTGACATTGA CGACTGTATC TCCAAGCCCT CCATGAACCA TGCTCTCTGC CATAACACCC AGGGCAGCTA CATCTCTGAA
RCT 10 10 ECI SKP CMNH GLC HNT OGSY MCE>
2710 2720 2730 2740 2750 2760 2770 2780 2790
i ? ? ? « ? « * «
TCTCCACCAC GCTTCACTGG TATGGACTGT GAGGAGGACA TTGATGACTG CCTTGCCAAT CCTTGCCACA ATGGAQGTTC CTGTATGGAT
CPP GFSG M O C EEO IDDC LAN PCO NGGS CMD>
2800 2810 2820. 2830 2840 2850 2860 2870 2880
» » ? i « ? » ? «
GGAGIGAATA CTTTCTCCIG CCTCTGCCTT CCGGGTTTCA CTGGGGATAA GTGCCAGACA GACATGAAIG AGTGTCTGAG TGAACCCTGT
GVN TfSC LCL PCF TGDK COT OMN ECLS EPO
2890 2900 2910 2920 2930 2940 2950 2960 2970
AAGAATGGAG GGACCTGCTC TGACTACGTC AACAGITACA CTTGCAAGIG CCAGGCAGGA TTTCATGCAG TCCATTG7GA GAACAACATC
KNG CTCS OYV NSY TCKC.OAG FOC VHCE NN|>
2980 2990 3000 3010 3020 3030 3040 3050 3060
? ????»???
AATGAGTGCA CTGAGAGCTC CTGTTICAAT ?TGGCACAÏ CTCTTCATCG CATTAACTCC TTCTCTTGCT TGICCCCTCT GGCTTTCACF
NEC TESS CFN CGT CVDG INS FSC LCPV GFT>
3070 3080 3090 3100 3110 3120 3130 3140 3150
» i ? ? ? ? ? ? »
GGATCC7ICT GCCTCCAÎGA GATCAATGAA TCCAGCTCTC AlCCATGCCT GAATCAGCCA AOGTGICTTC ATGGCCTGGG TACCTACCGC
GSF CLHE INE CSS HPCL NEG TCV OCLC TYR>
3160 3170 3180 3190 3200 3210 3220 3230 3240
« « » « i ? ? ? ?
TGCAGCTGCC CCCTGCGCIA CACTGGGAAA AACTGTCAGA CCCTGGTGAA TCTCTGCAGT CGGICTCCAT GTAAAAACAA ACGTACTTCT
CSC PLGY TGK NCO TLVN LCS RSP CKNK GTO
FIG. 170
179
BNSDOCID: <EP 0662827B1 I >
258
EP O 662 827 B1
3250 3260 3270 MO 3290 3300 3310 3320 3330
»»»??»?»?
GTTCAGAAAA AACCAGAGTC CCAGTCCCTA TGTCCATCTG GATGGGCIGG TGCCTAÏÏGT GACGTGCCCA ATCTCTCTTG TGACATACCA
VOK KAES-QCL CPS GWAG AYC DVP NVSC 0IA>
3340 3350 3360 3370 3380 3390 3400 3410 3420
? ««??? » » «
GCCTCCAGGA GAGGTGIGCT TGTTGAACAC TTGTGCCAGC ACTCASGTCT CTGCATCAAT CCTCGCAACA CGCATTACTG TCACTGCCCC
ASR RCV. L VEH LCQ H S G Y CIN AGN THYC QCP>
3430 3440 3450 3460 3470 3480 3490 3500 3510
? ? ? i ? ? i ? ?
CTCGGCTATA CTGGGAGCTA CTGTGAGGAG CAACTCGATG AGTGTGCGTC CAACCCCTGC CAGCACGCGC CAACATGCAG TGACTTCATT
LGY TGSY CEE OLD ECAS NPC QHG ATCS 0F|>
3520 3530 3540 3550 3560 3570 3580 3590 3600
? »*??« »»»
GGTGGATACA GATGOGAGTG TGTCCCAGGC TATCAGGGTG TCAACTGTGA GTATGAACTG GATGAGTCCC AGAATCAGCC CTGCCAGAAT
CCY RCEC VPC YOC VNCE YEV OEC QNQP C O K>
3610. 3620 3630 3640 3650 3660 3670 3680 3690
? ????»?»?
GGAGGCACCT GTATTCACCT TGTGAACCAT TTCAACTCCF CTJGCCCACC AGGCACTCGG GGCCTACTCT CTGAAGAGAA CATTGATGAC
GGT CIDL VNH FKC SCPP GTR CLL CEEN IDO>
3700 3710 3720 3730 3740 3750 3760 3770 3780
? ?????*» ?
TGTGCCCGGG GTCCCaïTG CCTTAATGGT GGTCAGTGCA TGGATAGGAT TGGAGGCTAC AGTTGTCCCT GCTTGCCTGG CTTTGCTGGG
CAR CPHC LNG GQC MDRIGGY SCR ClPG FAO
3790 3800 3810 3820 3830 3840 3850 3860 3870
» ? ? i i ? » ? »
GAGCCTTGTC AGGGAGACAT CAACGASTGC CTCTCCAACC CCTGCAGCTC TGAGGCCAGC C7GGACTGTA TACAGCICAC CAATGACTAC
ERC EGDI NEC LSN PCSS EGS LOC IQLT H O r>
3880 3890 3900 3910 3920 3930 3940 3950 3960
? « i ? ? ? ? ? ?
CIGTGIGTTT GCCGTAGTGC CTTTACTGCC CGGCACTGTG AAACCTTCGT CGATGTGTGT CCCCAGATGC CCTGCCTGAA ÏGGAGGGACf
LCV CRSA FTG RHC ETFV OVC PQM PCLN GG1>
3970 3980 3990 4O00 4010 4020 4030 4040 4050
? » » * » * * ? ?
TGTGCÎGTGG CCAGTAACAÎ GCCTGATGGT TTCATTTGCC GITGICCCCC GGGATTTTCC CCGGCAAGGT GCCAGAGCAG CTGTGGACAA
CAV ASNM POG FIC RCPP CfS GAR COSS CGO
FIG.Î7E
180
BNSDOCID: <EP 0662827B1 I >
259
EP O 662 827 B1
4060 4070 4080 4090 4100 41 IO 4120 4130 4140
? i ? « $ ? i « » »
CTGAAAICTA GCAAGGCCCA GCAGTGTGTG CACACCCCCT CICCACCCCC CIGCTTCTGC OXAGTCCCC GCCACTGCCA GTCAGCCTGT
V-KC RKGE OCV HTA SGPRCFC PSP RDCE SCO
.. ...J.J50 ...4160 -4170 4180 4190 4200 4210 4220 4230
? ??»?ii ? ?
. GCCAGTAGCC ?TGCCAGCA ?GGGGCAGC IGCCAJXCTC AmCAGCC ICCTTATTAC TCCTGCCAGT GTGCCCCACC ATTCTCGGCT
ASS PCOH GGS CHP QRQP PYY SCQ CAPP FSO
4240 4250 4260 4270 4280 4290 4300 4310 4320
? * « « ? * ? ? ?
AGCCGCTGTG AACTCTACAC GGCACCCCCC AGCACCCCTC CTGCCACCTG TCTGAGOCAG TATTCTGCCG ACAAAGCTCG GGATGGCCTC
SRC ELYT APP STP PATC ISO YCA OKAR DGV>
4330 4340 4350 4360 4370 4380 4390 4400 4410
? ?????? ? ?
TGTGATGAGG CCTGCAACAG CCATCCCTGC CAGTGGGATG GGGGTGACTG TTCTCTCACC ATGGAGAACC ?TGGGCCM CTGCTCCTCC
COÈ ACNS HAC OWD GGDC SL.T HEN PWAN C S 5>
4420 4430 4440 4450 4460 4470 4480 4490 4500
»*»*i»* *?
CCACTTCCCT GCTCGGATTA TATCAACAAC CAGTGTGATG AGCTGTGCAA CACGGTCGAG TGCCTGTTTG ACAACTTTGA ATGCCAGGGG
PLP CHDY INN QCO ELCNTVE CLF ONFE COO
4510 4520 4530 4540 4550 4560 4570 4580 4590
? ».« ? i ? « * ?
AAOGCAAGA CATCCAAGTA 7GACAAATAC TGTGCAGACC ACTTCAAAGA CAACCACTGT AACCAGGGGT GCAACAGTGA GGAGTG7GGT
NSK TCKY DKY CAO HFKD NHC NOG CNSE ECO
4600 4610 4620 4630 4640 4650 4660 4670 4680
? i i ? i » ? ? <
TGGGATGGGC TGGACTGTGC TGCIGACCAA CCTGAGAACC TGGCAGAAGG TACCCTGGTT ATTGTGGTAT IGATGCCACC TGAACAACTG
WDG LOCA ADQ PEN LAEG TLV IVV LHPP E0L>
4690 4700 4710 4720 4730 4740 4750 4760 4770
? ?»???? ? ,
CTCCAGGATG CÎCGCAGCÎT CTTGCGGCCA CTGGGTACCC TGCTCCACAC OWCCTGCGC AnAAGCGGG tfTCCCAGGG GCAACTCATG
LOD ARSFLRA IGT LLHTNLR IKR 0 S O C ELU>
4780 4790 4800 4810 4820 4830 4840 4850 4860
? * « » ? * * « ?
GTGTACCCCT ATTATGGTGA CAACTCAGCT GCTATGAAGA AACAGAGGAT GACACGCAGA TCCCTTCCTG CTGAACAAGA ACAGGAGGTG
VYP YYGE KSA A U K KQRM IRR SLP GEOE 0EV>
FIG.17F
181
BNSDOCID: <EP 0662827B1 I >
260
EP O 662 827 B1
4870 4860 4890 4900 4910 . 4920 4930 4940 4950
? t * »r » » ? ? ?
GCTGCCTCTA AAGTCTTTCT GGAAAÎTGAC AACCGCCAGT GIGTTCAAGA CTCAGACCAC TGCTTCAAGA ACACCGATGC ACCAGCAGCT
AGS KVFL EIO NRQ CVQO SOH CFK NTDA AAA>
4960 4970 4980 4990 5000 5010 5020 5030 5040
? » « i * » » ? ?
CÎCCTGCCCT CTOCGCCAT fOOffla CTGTCATACC CICTTCTGTC TGTCCTCAGT GAATCCCTGA CICCAGAACC CACTCACCTC
LLA SHAI OCT LSY PLVS VVS ESL TPER TQL>
5050 5060 5070 5080 5050 ' 5100 5110 " 5120 5130
? ? i i ? ? ? ? ?
CTCTATCÎCC TTCCTGTTGC TCTTCTCAÏC AÏTCTGTTTA ITATTCTGCT GGGGCTAATC ATGGCAAAAC GAAAGCCTAA GCATCGCTCT
LYL LAVA VVI I l F IILL GVI MAKRKRK HGS>
5140 5150 5160 5170 5180 5190 5200 5210 5220
? ? ? « ?? * ? ?
CTCTGGCTGC CTGAAGGTTT CACTCTTCGC CGAGATGCAA GCAATCACAA GCGTCGTGAG CCAGTGGCAC AGGATGCTGT GCGGCTGAAA
l ». I PEGF TLR ROA SNHK RRE PVG OOAV G l K>
5230 5240 5250 5260 5270 5280 5290 5300 5310
? »?? ? » * ? ? ?
AATCTCTCAG TGCAAGTCTC AGAAGCTAAC CTAATTGGTA CÏGGAACAAG TC^ACACTGG GTCGATGATG AAGGGCCCCA GCCAAAGAAA
NLS VOVS EAN LIG TGTS EHW VOD EGPO PKK>
5320 5330 5340 5350 5360 5370 5380 5390 5400
? ? i » «i » ? »??
GTAAAGGCTG AAGATGAGGC CTTACTCTCA GAAGAAGATG ACCCCATTGA TCCACGGCCA TCGACACAGC AGCACCTTGA ACCTGCACAC
VKA EDEA LLS EEO DPIORRP WTO OHLE AA0>
5410 5420 5430 5440 5450 5460 5470 5480 5490
i ? ? ? i i i ? «
ATCCGTAGGA CACCATCCCT GGCTCTCACC CCTCCTCAGC OGAGCAGGA GCTGGATCÎG TTAGATCTCA ATCTCCGIGC CCCAGATGGC
JRR TPSl ALT PPO AEOE VDV LDV NVRC PD O
5500 5510 5520 5530 5540 . 5550 5560 5570 5580
? ? ? ? ? ? ? ?? ?
TGCACCCCAT TGATGTTGGC TTCTCTCCGA GQ\GGCAGCT CAGATTTGAG TGATGAAGAT GAAGATGCAG AGGACTCTTC TGCTAACATC
CTP LMLA SLR GGS SOLS 0 E O EDA EOSS ANI>
5590 5600 5610 5620 5630 5640 5550 5660 5670
? * » ? ? ? ? ? ?
ATCACAGACT TGGTCTACCA GGCTGCCAGC CTCCACGCCC AGACAGACCC GACTGGTGAG ATGGCCCTGC ACCÏÏGCAGC CCGCTACTCA
I î D LVYO CAS LOA OTDR IGE MAL HLAA RYS>
FIG.17G
182
BNSDOCID: <EP 0862827B1 I >
261
EP O 662 827 B1
5680 5690 5700 57I0 5720 5730 5740 5750 5760
? ? ii ? * » ? ?
CGGGCTGATG CTGCCAAGCG TCÏCCÏGCAÏ GCAGGTGCAG ATGCCAATGC CCAGCACAAC ATGGGCCGCT GTCCACTCCA TGCTGCAGTG
.RAO AAKR LLD AGA OANA ODN MGR CPLH AAV>
5770 5780 5790 5800 5810 5820 5830 5840 5850
» ? » i ? . i . ? ? ?
GCÀGCTGAÏG CCCAAGGTGT CTTCCAGATT CTGATICGCA ACCGAGTAAC TGATCTAGAT GCCACGATGA ATGATGGTAC TACACCCCTG
AAOAOGV FOI LlRNRVI DLD ARK NDGT ! P l>
5860 5870 58B0 5890 5900 5910 5920 5930 5940
? ? ?»?*? ??
ATCCTGCCTG CCCGCCTGGC TGTGGAGGGA AIGGTGGCAG AACTGATCAA CTGCCAAGCG GATGTGAATG CAGTGGATGA CCAIGGAAAA
ILA ARLA VEG MVA ELIN COA OVN AVDO HU
5950 5960 5970 5980 5990 6000 6010 6020 6030
? » ???????
ICTGCTCTTC ACTGCGCAGC TCCTGTCAAT AATCTGGACG CAACTCTTTT CTTGTTGAAA AATGCGGCCA ACCGAGACA1 GCAGCACAAC
SAL HWAA AVN NVE ATLL LLK NGA HDV 00N>
6040 6050 6060 6070 6080 6090 6100 6110 6120
? »*??*???
AAGGAAGAGA CACCTCTGTT TCTTGCTGCC CGGGAGGGGA GCTATGAAGC ACCCAAGAfC CJGTTAGACC ATÏÏTGCCAA TCGAGACATC
Kil 1 P L F IAA REG SYEA AKJ LLO HFAN ROI>
6130 6140 6150. 6160 6170 6180 6190 6200 6210
i ? ? ? ?? ? -i ?
ACAGACCA1A 1GGATCGTCT TCCCCCGGAT GTGGCTCGGG AICGCATGCA CCATGACATT GTGCGCCTTC TGGATGAATA CAATGTGACC
TOK UDRL PRO VAR ORMH HOI VRL LOEY NVT>
6220 6230 6240 6250 6260 6270 6280 6290 6300
? » *??»» it
CCAACCCCÎC WXIACCGT GTTGACTÎCT GCTCTCTCAC CTGTCATCTG TGGGCCCAAC AGATCTTTCC ICAGCCIGAA CCACACCCCA
PSP PGTV LTS ALS PVIC CPN RSF LSLK HTP>
6310 6320 . 6340 6350 6360 6370 6380 6390 6400
? » ? » ? ? ? ? ?
AÎCQKMGA AGTCTAGACG CCCCAGTGCC AACAGTACCA TGCCTACTAG CCICCCTAAC CnGCCAAGC AGCCAAAGGA TCCCAAGGGT
MGK KSRR PSA KSÎ M.PTS LPN LAK EAKO AKO
6400 6410 6420 6430 6440 6450 6460 6470 6480
? ? ? ? » ? ? ? ?
AGTAGGAGGA AGAAGTCTCT GAGTGAGAAG GTCCAACTGT CIGAGAGTIC AGTAACTTTA ICCCCTGITG ATTCCCTAGA AÎCÎCCTCAC
SRR KKSl SEK VOL SESS VTL SPV OSLE SPH>
FIG.17H
183
BNSDOCID: <EP 0662827B1 I >
262
EP O 662 827 B1
6490 6500 6510 6520 6530 6540 6550 6560 6570
i ? ? i ? i ? ? «
ACGTATGTTI CfXACACCAC ATCCTCTCCA ATGATTACAT CCCCTCGGAT CTIACAGGCC KXCCAACC CTATGTÏGGC (XTGCCCCC
T Y V S D I î SSP MIT S P G I l Q A S P N P M.L A T A A>
6580 6590 6600 6610 6620 6630 6640 6650 6660
? ???iii«»
CCTCCTGCCC CAGTCCATGC CCAGCATGCA CTATCTTTTT CTAACCTTCA IGAAATGCAG CCTTTGGCAC ATCGGGCCAG CACTGTGCTÎ
P. PA PVHA OHA LSF SNLH E U 0 PLA H G A S TV L> -
6670 ' 6680 6690 6700 6710 6720 6730 6740 6750
? i « i i i i ? ?
CCCTCACTCA GCCACTTCCT ATCCCACCAC CACATTCTCT CTOACCCAC TGGCAGTGCT GGAAGCTTGA CTAGCCTCCA TCCAGTCCCA
PSV SOLL SHH HIV SPGS GSA GSL SRLH PVP>
6760 6770 6780 6790 6800 6810 6820 6830 6840
? ????»??i
GTCCCAGCAG ATTGGATGAA CCCCATGGAC GTGAATGAGA CCCAGTACAA TGAGATCTTT GGTATGGTCC TGGCTCCAGC TGAGGGCACC
VPA OWMN RME VNE TOYN E M F G M V LAPA EGT>
6850 6860 6870 6880 6890 6900 6910 6920 6930
? ? * » ? ? * ? ?
CATCCTGGCA TAGCTCCCCA (tfCCMJGCCA CCTGAAGCCA AGCACATAAC CACCCCTCGG GAGCCCTTGC CCCCCATTGT CACTTTCCAG
HPG IAPO SRP PEG KNIT TPR EPL PPIV TFQ>
6940 6950 6960 6970 6980 6990 7000 7010 7020
? ??*??!??
CTCATCCCTA AAGCCAGTAT TGCCCAACCA GCGGGGGCTC CCCAGCCTCA GTCCACCTGC CCTCCAGCTG TTCCCGCCCC CCTGCCCACC
LIP KGSI AOP AGA P 0 P 0. S ï C PPA VAGP LPI>
7030 7040 7050 706O 7070 7080 7090 7100 7110
? ????ii»!
ATGTACCAGA TTCCAGAAAT GCCCCGTTTG CCCAGTGTGG CTTTCCCCAC TGCCATGATG COCACCAGG AÛXGCACGT AGCTCAGACC
MYQ I P E M ARL PSV AFPT AMM POO DGQV A0T>.
7120 7130 7140 7150 7160 7170 7180 7190 7200
? ?? » ? ? ? ? ,
ATTCTCCCAG CCTATCAÎCC TTIOCAGCC TCTCTGGCCA AGTACCCCAC ACCCCCnCA CrïCACAGTT ATGCTÎCCTC AAATGCTGCÎ
ILP AYHP FPA SVG KYPÏ PPS QHS YASS NAA>
7210 7220 7230 7240 7250 7260 7270 7280 7290
? ?? ? »??»,
CAGCCAACAC CCAGTCACAG TGCTCACCTC CAGGGTGAGC ATCCCTACCT GACACCATCC CCAGACTCTC CTGACCAGTG GTCAAGTTCA
ERÏ PSHS CHL OGE HPYL TPS PES PDOW SSS>
FIG. 171
184
BNSDOCID: <EP 0662827B1 I >
263
EP O 662 827 B1
7300 73I0 7320 7330 7340 7350 7360 7370 7380
? ???????i
TCACCCCACT CTCCTTCTGA CTCCTCACAT GTGACCACCA GCCCTACCCC TGGGGGTGCT CGAGGAGGTC AGCGGGGACC TGGGACACAC
S P H S A..S O W S 0 VÎT S PIP GGA GGC OK" G ? H>
7390 7400 7410 7420 7430 7440 7450 7460 7470
??'?»' ? « «.i. ? » »
ATGTCTGAGC CACCACACAA CAACATGCAG GTTTATGCGT GAGAGAGTCC ACCÎCCACÎG TAGAGACÀTA ACTGACTTTT GTAAATGCÎC
MSE PPHN NMO VYA>
7480 7490 7500 7510 7520 7530 7540 7550 7560
» « ? ? $ ' « '?- « ? « »
CTGAGGAACA AATGAAGGTC ATCCGGGAGA GAAATGAAGA AATCTCTGGA GCCAGCTTCT AGAGGTAGGA AAGAGAAGAT GTTCTTATTC
7570 7580 7590 ' 7600 7610 7620 7630 7640 7650
? ? ? ? i i ? ? ?
AGATAATGCA AGAGAAGCAA TTCGTCAGTT TCACTGGGTA TCTGCAAGGC TTATTGATTA TTCTAATCTA ATAAGACAAG TTTGTGGAAA
7660 7670 7680 7690 7700 7710 7720 7730 7740
? ? » ? i ? ? ? ?
TGCAAGATCA ATACAAGCCT TGGC7CCATC TTTACTCTCT ICTATTTGGA GAATAAGATG GATGCTTATT (MXTCAGA CATTCTTGCA
7750 7760 7770 7780 7790 7800 7810 7820 7830
? » ? ? i ? ? ? ?
GCTTGGACTG CAnTTAAGC CCTGCACGCT TCTGCCATAT CCATGAGAAG AÏÏCTACACT ACCGTCCTGT TGGCAATTAT CCCCTGGAAT
7840 7850 7860 7870 7880 7890 7900 7910 7920
? » ? » i ? » ? i
ÎCTGCCTGAA TTCACCÎACC CATCTCCTCC TCCTTGGACA TTCTTTTCTC TTCAÎTTGCT GCnîTGCTÏ TTGCACCTCT CCGTGATTGT
7930 7940 7950 7960 7970 7980 7990 8000 8010
» ? ? ? i i ? « ?
ACCCCÎACCA GCATCTTATA CGGCAAGACC TTTCTGCTTT 7GATCATICT GCCCCATGAA AGCAACTTTC GTCTCCTTTC CCCTCCTGTC
8020 8030 8040 8050 8060 8070 8080 8090 8100
« « # » » ? » $ .
TTCCCGGTAT CCCTTGGAGT CTCACAAGGT ÎÏACÎTTGGÏ ATGGTTCTCA GCACAAACCT TTCAAGTATG nCTTTCTTT CGAAAATGGA
8110 8120 8130 8140 8150 8160 8170 8180 8190
? i « ii i » « ?
CATACTGTAT TGTGTTCTCC TGCATATATC ATTCCTGGAG AGAGAAGGGG AGAAGAATAC TTTTCTTCAA CAAATTTTGG GGGCAGGAGA
8200 8210 8220 8230 8240 8250 8260 8270 8280
? ? ? i ? ? ? ? i
ICCCTTCAAG AGCCTGCACC TTAATTTTTC TÎCTCTGTGT CCAGCTCTTC ATAIAAACTT TACCAGGAAG AAGGGTCTGA GTTTGTTCTT
FIG.17J
185
BNSDOCID: <EP 0662827B1 I >
264
EP O 662 827 B1
8290 8300 8310 8320 8330 8340 8350 8360 8370
? » * ? » «.. ? ? ?
TTTCTGTGTA TGGCCCTGGT CAGTGTAAAG TTTTATCCTT GATAGTCTAG TTACTATGAC CCTCCCCACT TTTTTAAAAC OtmUK
8380 8390 8400 8410 8420 8430 8440 8450 8460
» ? ? ? ? ? v ? ? *
ITTGGAATGT TGGAATGACC AAGACACAAG TTAACICGTG CAAGAGCCAC TTACCCACCC ACAGGTCCCC CTACTICCIG CCAAGCATFC
8470 8480 8490 8500 8510 8520 8530 8540 8550
» » * i * » i ? ?
CATTGACTGC CTGTAIGGAA CACATTTGTC CCAGATCTGA GCATTCTAGG CCTGTTTCAC TCACTCACCC AGCATATGAA ACTAGTCTTA
8560 8570 8580 8590 8600 8610 8620 8630 8640
? » i » * » » i ?
ACTGTTGAGC CTTTCCTTTC ATATCCACAG AAGACACTGT CTCAAATGTT GTACCCTTX CATTIAGGAC TGAACTTTCC TTAGCCCAAG
8650 8660 8670 8680 8690 8700 8710 8720 8730
» » ? ? » ? ? ? > »
GGACCCAGTG ACAGTTGTCT TCCGTTTGTC AGATGATCAG TCTCTACTGA TTATCTTGCT GCTTAAAGGC CTGCTCACCA ATCTTTCTTT
8740 8750 8760 6770 8780 8790 8600 8810 8820
? ?*???* i *
CACACCGTGT GCTCCGTGTT ACTGGTATAC CCAGTATGTT CTCACTGAAG ACATGGACTT TATATGTTCA ACTGCAGGAA TTGGAAAGTT
8830 8840 8850 8860 8870 8880 8890 8900 8910
? ???????i
GCACTTGTTT TCTATGATCC AAAACAGCCC TATAAGAAGG TTGGAAAAGC AGGAACTATA TACCAGCCÏT ÎGCTATTTTC TGCTACCATT
8920 B930 8940 8950 8960 8970 6980 8990 9000
»????????
TCTTTTCCIC ÎGAAGCGGCC ATGACAÏTCC CTTTGGCAAC TAACGTAGAA ACTCAACAGA ACATTTTCCT TTCCTAGAGT CACCTTTTAG
9010 9020 9030 9040 9050 9060 9070 9080 9090
? *??*????
ATGATAATGG ACAACTATAG ACTTGCTCAT ÎGTTCACACT GATTGCCCCT CACCTGAATC CACÏCTCTGT ATTCATCCTC TTGGCAATn
9100 9110 9120 9130 9140 9150 9160 9170 9180
? ????????
CTTTGACTTT CTTTTAAGGG CACAAGCATT TTAGTTAATT GTAGATAAAG AATAGTTTÏC TTCCTCÎTCT ?TTGGGCCA GTIAATAAÏÏ
9190 9200 9210 9220 9230 9240 9250 ' 9260 9270
? ???????i
GGTCCATGGC TACACTGCAA CTTCCGTCCA GTGCTGTGAT GCCCATGACA CCTGCAAAAT AAGTTCTGCC TGGCCATTTT GTAGATATTA
FIG.17K
186
BNSDOCID: <EP 0662827B1 I >
265
EP O 662 827 B1
9280 9290 9300 9310 9320 9330 9340 9350 9360
? « i ? ? i * ? ?
ACAGGTGAAT TCCCGACTCT TTTGGTTTGA ATGACASTTC TCATTCCTTC TATGGCTGCA AGTATGCATC AGTGCTTCCC ACTTACCTGA
9370 9380 9390 9400 9410 9420 9430 9440 9450
? * ? * ? i * ? ?
TTTGÎCTGTC ?TGCCCCCA TATGGAAACC CTCCCTGTCT GTTGGCATAA TAGTITACAA ATGGTTTTTT CAGTCCTATC CAAAITTATT
9460 9470 9480 9490 9500 9510 9520 9530 9540
« * ? ? » * » ? ?
OUCCAACAA AAATAATTAC TTCTGCCCTG AGATAAGCAG ATTAACniC TTCATTCTCT GCTTTAÎTCT CTGCATGTGG CAACATTCTG
9550 9560 9570 9580 9590 9600 9610 9620 9630
TCAGCCTCTT TCATAGTGTG CAAACATTTT ATCATTCTAA ATGGTGACTC ÎCTGCCCTTG GACCÜTTTA TTATTCACAG ATGGGGA5M
9640 9650 9660 9670 9680 9690 9700 9710 9720
? ????????
CCTATCIGCA TGGACCCTCA CCATCCTCTG TGCAGCACAC ACAGTGCAGG (MCCACTGC CCAÎGCCCAI GACTTTCTTC CCCTGGGAAT
TCC
FIG.17L
187
BNSDOCID: <EP 066282781 I >