Home / Information / Débuter / Notions de base / Allergologie moléculaire / Nomenclature et classification / Allergènes protéiques : nomenclature et classification
Allergènes protéiques : nomenclature et classification
Saturday 9 February 2008, by
L’identification des allergènes au sein d’un produit allergisant a débuté dans les années 1960.
Parmi les premières protéines isolées montrant une IgE-réactivité on trouve Gad c 1, la parvalbumine de morue, ou Amb a 1 l’allergène principal du pollen d’ambroisie (Ambrosia artemisiifolia).
A l’époque, ces protéines étaient dénommées par leurs auteurs, par exemple ici « allergen M » et « antigen E », respectivement.
Avec le rapide accroissement du nombre des allergènes identifiés, il est apparu que cette façon de dénommer était source de confusion : des protéines isolées par des équipes différentes et portant des noms différents pouvaient correspondre en fait à un même allergène.
C’est ainsi qu’est née l’idée d’attribuer à chaque allergène un nom répondant à une codification simple, à savoir numéroter les allergènes identifiés au sein d’un même organisme en rappelant le nom de l’organisme source par son nom latin . Par exemple, l’allergène Gad c 1 est une protéine d’une masse de 12 kDa trouvée dans la morue de l’Atlantique (Gadus callarias).
Un comité d’experts a été constitué au sein d’une instance internationale, l’IUIS, pour valider les dénominations des allergènes (http://www.allergen.org/Allergen.aspx). A l’heure actuelle c’est plus de 570 allergènes qui ont ainsi un nom officiel, une « dénomination IUIS ».
Malgré tout, il reste un nombre important de protéines IgE-réactives sans dénomination du tout ou avec un nom de type IUIS mais qui n’est pas avalisé par l’IUIS. Cela ne retire rien à la qualité d’allergène pour ces protéines et, dans Allerdata, comme dans la base Allergome (http://www.allergome.org/), ces protéines sont listées au même titre que les allergènes labellisés IUIS. On peut d’ailleurs se questionner sur la transparence des validations par le comité IUIS car pour un nombre non négligeable d’allergènes officialisés les résultats obtenus par les découvreurs de ces allergènes n’ont pas été rendus publics (ces derniers sont « unpublished »).
Le système IUIS est assurément très pratique mais peut être source de confusions. Par exemple, le nombre accompagnant l’allergène est tantôt une indication sur la famille moléculaire de cet allergène, et tantôt non : ainsi on trouve des profilines avec des numérotations aussi variées que Bet v 2, Phl p 12, Pru p 4, Ana c 1, Amb a 8, Ara h 5 ou Gly m 3 !
Le système IUIS est par ailleurs en partie instable et certains allergènes ont vu leur nom changer (Jun o 4 est devenu Jun o 2, Poa p 9 est devenu Poa p 5, etc..), si bien qu’il peut s’avérer parfois difficile de rapprocher 2 études publiées à distance l’une de l’autre. Art v 1, l’allergène principal du pollen d’armoise (Artemisia vulgaris), a d’abord été adoubé par l’IUIS puis s’est vu déclassé et remplacé par une autre protéine du même pollen ! .
Parallèlement à une codification des noms des allergènes, l’IUIS a cherché à normaliser les noms des isoformes d’allergènes. Le monde des protéines IgE-réactives ne se réduit pas, en fait, à des molécules formatées comme le sont des molécules médicamenteuses : par exemple, l’allergène du pollen de bouleau, Bet v 1, se présente à l’état naturel sous plus de 30 isoformes (cf. Allergènes : structure et homologies). Quand cela est important pour l’IgE-réactivité, pour le repérage des épitopes ou pour comprendre les réactivités croisées, les noms d’allergènes sont présentés de façon plus précise afin de distinguer telle ou telle isoforme.
La convention adoptée par l’IUIS consiste à décliner une numérotation après le chiffre de l’allergène. Pour Bet v 1 on a Bet v 1.01, Bet v 1.02, etc..., et au sein de Bet v 1.01 on a Bet v 1.0101, Bet v 1.0102, etc…
En pratique, ce niveau de finesse est peu employé dans les études cliniques car il génère une complexité n’apportant pas un bénéfice significatif pour la prise en charge des patients ou pour comprendre les réactivités immunologiques.
Dans quelques cas ces dénominations montrent une certaine utilité cependant : ainsi on peut distinguer Cor a 1.01, la protéine PR-10 du pollen de noisetier (Corylus avellana), de Cor a 1.04, la protéine homologue de Cor a 1.01 présente dans la noisette ; de même, la réactivité à Dau c 1.0201, une PR-10 de la carotte, est mieux corrélée avec un TPO positif pour la carotte que n’est la réactivité à une autre isoforme, Dau c 1.0104 .
Une autre convention consiste à préfixer les noms des allergènes selon qu’ils proviennent du produit naturel après purification ou qu’ils sont issus d’une transgénèse : dans le premier cas il est noté un « n » devant le nom (nBet v 1, par exemple), et dans le second cas un « r » est ajouté pour signaler que l’allergène est un recombinant (rBet v 1).
L’inventaire des allergènes actuellement connus est établi par d’autres organisations ou groupes de recherche que le comité IUIS.
- Les bases de données listant ces allergènes ont souvent comme objectif de permettre des comparaisons de séquence entre un allergène connu (et, éventuellement ses isoformes) et une protéine dont l’allergénicité est pour l’instant inconnue .
- C’est le cas pour les protéines issues d’une transgénèse (OGM) (cf. Prédictabilité des allergènes).
- Ces bases sont souvent incomplètes ou un peu en retard sur les derniers travaux, même si elles intègrent nettement plus d’allergènes que la base de l’IUIS.
- La base qui, en dehors d’Allerdata, est régulièrement à jour est Allergome.
Si l’on trouve plus de 1200 allergènes différents, sans compter les isoformes, dans Allerdata ou Allergome, combien de ces protéines sont des allergènes à part entière ?
La question peut surprendre mais, si l’on suit la définition donnée à un allergène par l’Académie Européenne d’Allergologie (EAACI) , un allergène est une molécule capable de susciter des signes cliniques d’allergie. [1]
- La base Allergome recense les niveaux d’IgE-réactivité des différents allergènes cela va d’une positivité in vitro (test sérique non quantitatif comme un immunoblot) à une réaction observée en conditions réalistes (un test de provocation).
- Il est clair que, même en incluant les recombinants actuellement disponibles, un petite fraction des « allergènes » a acquis la preuve d’une relevance clinique, c’est-à-dire d’une réactivité in vivo : environ 2% sur la base d’un test de provocation, et environ 16% si l’on inclut une positivité en tests cutanés.
Pour l’ensemble des autres « allergènes », la qualification de protéines IgE-réactives serait plus exacte dans l’attente de tests probants in vivo.
Cette restriction est à garder à l’esprit mais n’enlève en rien l’intérêt d’aborder l’allergologie sur un plan moléculaire.
- Ainsi, de même que les tests in vitro ne sont qu’un complément à une démarche qui se doit d’être en premier lieu clinique, de même la démonstration de l’IgE-réactivité d’une protéine suffit en pratique courante pour apporter un renseignement utile.
- Il n’est pas besoin d’élucider la relevance clinique de chacune des isoformes de Mal d 1 (PR-10 de la pomme) pour se servir de « Mal d 1 » collectivement dans la compréhension d’une allergie à la pomme initiée par une pollinose au bouleau.
La même restriction, et le même pragmatisme, concerne les protéines recombinantes :
- quand le recombinant rBet v 1 est utilisé dans un test d’IgE-réactivité sérique pour préciser la réalité d’une sensibilisation au pollen de bouleau, il est clair que cette protéine rBet v 1 provient de la transgénèse d’une seule sorte parmi les nombreuses isoformes de nBet v 1.
- On conçoit que, même si d’évidence l’isoforme choisie a montré une large IgE-réactivité parmi les polliniques au bouleau, une partie de la réactivité à nBet v 1 ne peut être retrouvée avec un test ne comportant qu’une variété des isoformes de nBet v 1.
Malgré tout, le gain obtenu avec un recombinant est supérieur à la petite perte de sensibilité du test :
- reproductibilité de fabrication,
- absence d’interférence des IgE anti-CCD,
- ciblage de la réactivité sur un allergène plus caractéristique d’une sensibilisation au produit suspecté d’être allergisant pour le patient.
Classification des allergènes protéiques
Le nombre des allergènes identifiés a suivi la croissance de nos connaissances sur les protéines comme le montre la figure ci-dessous.
Face à l’afflux des protéines nouvellement connues, il est apparu nécessaire d’aller au-delà de la classification basée sur leurs propriétés biochimiques et de trouver un mode de partage des données acquises le plus rapide possible.
L’informatique moderne a permis de relever ce défi à travers la création de bases de données accessibles par internet et la mise au point de méthodes mathématiques visant à rechercher les homologies et les parentés entre protéines : c’est la bio-informatique .
Avec cette approche, il n’est pas obligatoire que des protéines aient la même activité biochimique, enzymatique par exemple, pour qu’elles soient rangées ensemble dans un même groupe, dans une même « famille » de protéines.
Ce qui compte avant tout, c’est que la séquence en acides aminés des protéines en question montre un degré suffisant de ressemblance, on dit d’« homologie ».
Cette ressemblance est calculée en alignant les protéines les unes à côté des autres de sorte que le maximum d’acides aminés soient identiques au même endroit pour le plus grand nombre d’entre elles. On définit ainsi un « motif » composé de plusieurs acides aminés, souvent à distance les uns des autres sur la chaîne peptidique, et qui est reproduit dans toutes les protéines de la même « famille ».
Cette opération de comparaison de séquences est valorisée par un chiffre, un pourcentage d’identité (% identité). On prend une protéine comme modèle et on calcule les % d’identité des autres protéines de la famille.
La diversité des séquences peptidiques est immense parmi l’ensemble des êtres vivants. Le nombre des familles protéiques croît aussi vite au fil des ans que le nombre des séquences protéiques connues. Fin 2007 la base Pfam recensait plus de 9300 motifs (http://pfam.jouy.inra.fr/).
Bien sûr, la diversité des protéines dans une même famille est le résultat d’une modification progressive des génomes au cours de l’évolution. Plus 2 organismes vivants sont éloignés dans l’arbre de l’évolution et plus il est probable que les protéines d’une même famille dans ces 2 organismes seront différentes entre elles.
Ce glissement est plus ou moins important : certaines protéines ont un rôle vital dans les cellules et auront subi moins de modifications d’une espèce à l’autre au cours de l’évolution. Mais, d’une façon générale, il est très rare que 2 organismes, même proches phylogénétiquement, aient des protéines strictement identiques.
Ce point est à souligner car il n’est pas nécessaire que le même allergène X soit présent dans les produits A et B pour qu’une réactivité croisée soit possible entre A et B. C’est avant tout le degré d’homologie entre un allergène XA dans le produit A et un allergène XB dans le produit B qui va déterminer si les allergènes XA et XB sont doués de réactivité croisée (cf. Allergènes : structure et homologies).
La première conséquence de ce constat est que la classification des protéines va servir à la classification des allergènes : la réactivité croisée va se jouer principalement, mais non exclusivement (cf. Les CCD), entre protéines d’une même famille.
Dans Allerdata il est fait mention de « familles moléculaires » pour désigner les familles de protéines. Parler de « famille d’allergènes » serait possible, mais l’on sait que la plupart des familles de protéines où l’on trouve des allergènes comportent aussi des protéines non allergisantes (ou, en tout cas, non encore montrées IgE-réactives). Par exemple, les tropomyosines sont une famille de protéines musculaires. Toutes les tropomyosines ne sont pas allergisantes, notamment celles des vertébrés : un patient allergique à la tropomyosine de crevette peut manger de la viande de poulet ou de bœuf.
La réactivité vis à vis de certaines protéines d’une famille n’implique pas la réactivité à toutes les protéines de cette famille.
Allerdata recense près de 1300 molécules IgE-réactives.
Pour environ 15% d’entre elles, on n’a pas pu déterminer jusqu’à présent une appartenance à telle ou telle famille moléculaire. Les autres se répartissent dans près de 180 familles.
Le tableau suivant donne un aperçu des familles moléculaires regroupant le plus grand nombre d’allergènes.
Famille moléculaire | Nombre d’allergènes dans la famille |
---|---|
(au 12/12/07) | |
Profilines | 94 |
Tropomyosines | 77 |
LTP (Lipid Transfer Proteins) | 45 |
Bet v 1-like, protéines PR-10 | 40 |
Polcalcines | 35 |
Parvalbumines béta | 29 |
2S Albumines | 28 |
beta expansines | 27 |
Polygalacturonases | 22 |
Ag5, Antigènes 5 | 22 |
Albumines | 19 |
Caséines | 19 |
Lipocalines | 18 |
Groupe 5 des graminées | 18 |
11S Globulines | 17 |
7S Vicilin-like Globulines | 16 |
Groupe 4 des graminées | 16 |
cystéine protéases papain-like | 16 |
Phospholipases A1 | 15 |
serine protease inhibitors | 14 |
Hyaluronidases | 14 |
Chitinases de classe 1 | 13 |
Thaumatin-like protéines | 13 |
La proportion de familles contenant un ou plusieurs allergènes est faible comparativement à l’ensemble des familles de protéines, environ 2%.
Certains auteurs estiment qu’il existe un nombre fini de familles contenant des allergènes et que l’on pourra tôt ou tard en dresser la liste complète .
Mais une vision plus modeste s’impose : des protéines réputées non allergisantes et même prises comme modèle de non-allergènes peuvent s’avérer IgE-réactives un jour. C’est le cas pour la rubisCO, une protéine végétale trouvée dans toutes les plantes à chlorophylle .
La classification des protéines comporte enfin deux autres niveaux qu’il est intéressant de noter :
- certaines familles, bien qu’ayant des motifs différents, partagent quand même une certaine ressemblance.
- Ces familles peuvent avoir dérivé, au cours de l’évolution, d’un ancêtre commun. On parle de « superfamilles ».
- Un exemple souvent cité est celui de la superfamille des prolamines : celle-ci comprend
- les gliadines,
- les 2S albumines,
- les LTP,
- les inhibiteurs d’amylase/trypsine,
- les zéines,
- les puro-indolines, etc…
- Si cette notion de superfamille a un intérêt pour les phylogénéticiens, elle peut être aussi source de confusion si l’on s’en sert pour classer les allergènes car il n’y a pas de réactivité croisée entre familles d’une même superfamille.
- à l’inverse des regroupements de familles, on trouve aussi des homologies basées sur un niveau plus fin, celui des « domaines ».
- Un domaine est une portion de protéine qui se retrouve dans plusieurs familles de protéines.
- L’origine de ces domaines similaires est attribuée à une utilisation empirique (parcimonieuse ?) de blocs assemblés sous diverses combinaisons afin de construire des protéines ayant des actions biochimiques différentes. -** S’agissant de l’allergologie, la présence de domaines homologues parmi plusieurs protéines peut générer une réactivité croisée alors même que ces protéines ne sont pas rangées dans une même famille moléculaire.
- L’exemple le plus démonstratif de cette réactivité entre domaines homologues nous est donné avec le « syndrome latex-fruits exotiques ».
- Ici, un allergène du latex d’hévéa, l’hévéine (Hev b 6.02) est identique à la portion N-terminale d’un autre allergène du latex, la pro-hévéine (Hev b 6.01).
- Ni l’hévéine, ni la prohévéine n’ont une activité enzymatique de chitinase : elles sont classées comme une lectine et une protéine barwin-like respectivement.
- Pourtant ces allergènes croisent avec les chitinases de classe 1 présentes dans de nombreux fruits (banane, avocat, etc…). Le croisement a, en fait, lieu entre une portion de ces chitinases, leur domaine N-terminal qui est un domaine homologue à l’hévéine . On dit que ces chitinases ont un « domaine hévéine » (cf. Latex et aliments).
Au total, la classification des protéines est un moyen pratique pour nommer les allergènes qui ont des chances de croiser ensemble. Mais appartenir à une famille de protéines n’est ni une garantie d’IgE-réactivité, ni une garantie de réactivité croisée.
Le tableau ci-après résume les rapports entre classification et réactivité croisée :
ENTRE | REACTIVITE CROISEE | ||
---|---|---|---|
familles | d’une superfamille | non | |
allergènes | d’une famille | possible, dépend entre autres du % d’identité | cf. Allergènes : structure et homologies |
isoformes | d’un allergène | très fréquente | |
chaînes glucidiques | de glycoprotéines, quelles que soient leurs familles | possible, dépend de la présence de certains sucres | cf. Les CCD |
[1] « Antigens stimulating hypersensitivity mediated by an immunologic mechanism (defined as « allergy ») are referred to as allergens. Hypersensitivity causes objectively reproducible symptoms or signs, initiated by exposure to a defined stimulus at a dose tolerated by normal subjects »