De l'ADN moléculaire à l'ADN vibratoire
Alain Boudet
Dr en Sciences Physiques, Thérapeute psycho-corporel, Enseignant
3.
Architecture et structure de l'ADN|
Contenu de la troisième partie |
Annexes |
Résumé:
Les gènes de l'ADN, qui détiennent les
codes de fabrication des protéines qui régulent
notre corps, n'occupent que 10% environ de la totalité de
l'ADN. Les zones entre les gènes intriguent les
scientifiques par leur présence énigmatique.
Ayant
abandonné l'idée que ces zones sont
inutiles, ils commencent à émettre des
hypothèses sur leurs fonctions possibles. C'est ainsi que
les
introns, zones non-codantes incluses dans les
gènes, pourraient avoir des rôles de
régulation et
de
contrôle.
Les zones intergènes comportent des séquences
caractéristiques pour chaque individu, au point qu'elles ont
été retenues par la législation comme
base de
l'empreinte génétique. Il existe donc une
architecture
significative dans l'ADN. Par des méthodes d'analyse
statistique, des mathématiciens ont mis en
évidence un
ordre
qui varie selon le type d'ADN.
Dans la première partie de cette étude sur l'ADN, nous avons fait connaissance avec la molécule d'ADN au sein des noyaux des cellules, et nous avons découvert que certains fragments de cette molécule appelés gènes portent des instructions pour le fonctionnement et le développement physique du corps. L'ensemble de ces instructions est appelé le code génétique. Il contrôle la fabrication des protéines, grosses molécules qui sont les ouvrières du fonctionnement et de la croissance du corps. Mais nous avons remarqué que le code génétique n'occupe que 10% de la molécule d'ADN. Pourquoi alors la présence des autres 90%? Quelle est leur fonction? Dans cette troisième partie, nous allons mettre en évidence que la chaine est structurée par une sorte d'architecture, aussi bien dans les gènes qu'en-dehors d'eux.
Selon les conclusions de la première partie de cette étude (La molécule d'ADN et le code génétique), nos cellules renferment dans leur noyau 23 paires de chromosomes, qui sont chacun constitués d'un filament d'ADN, décoré d'autres éléments tels que les grosses protéines appelées histones. Un filament ou molécule d'ADN est formé de l'enroulement en hélice de 2 brins qui se font face. La totalité des filaments d'ADN de l'ensemble des chromosomes s'appelle le génome.
Chaque brin d'ADN est constitué de l'enchainement en grand nombre de nucléotides. Un nucléotide désigne l'assemblage d'une base azotée, du "pentagone" sur lequel elle est fixée (voir figure 1) qui représente le désoxyribose, et du groupement phosphate de la chaine centrale. Les bases azotées sont prises parmi 4 types qu'on représente par les lettres C (cytosine), A (adénine), T (thymine), G (guanine). Les deux brins du filament sont associés chimiquement par les bases face à face. Celles-ci se révèlent être complémentaires l'une de l'autre, car la base C s'associe à G et la base A s'associe à T.
![]() |
| Fig.1-
Schéma
d'un brin d'ADN. Il est composé d'une
chaine centrale, faite de l'assemblage linéaire de motifs
identiques (les pentagones oranges représentant le
désoxyribose, articulés par le
groupement phosphate P
),
sur laquelle sont fixés des groupements
C, A,
T et G Merci à G. Bourbonnais |
Si l'on considère les 2 brins assemblés, la molécule d'ADN est constituée d'un enchainement de paires de bases. Si donc on décrit l'enchainement des bases de l'un des brins, il est inutile de préciser l'autre, car il s'en déduit par complémentarité. On a donc coutume d'évaluer la longueur d'un segment d'ADN en nombre de paires de bases (ou bp).
Lorsque nous observons la molécule d'ADN et l'enchainement des nucléotides, aucune structure particulière ne se distingue. Par exemple, on ne constate aucune discontinuité dans la succession des nucléotides, qui pourrait mettre en évidence le début et la fin d'un gène. Ceux-ci sont seulement signalés par un code qu'il est nécessaire de connaitre pour pouvoir le repérer. Les bases se suivent dans un ordre qui peut sembler aléatoire, mais un comptage plus fin employant des méthodes statistiques se révèlera instructeur.
C'est seulement par leur rôle génétique que les gènes se révèlent, non par leur aspect. En effet, un gène est une portion du filament d'ADN qui commande la production d'une protéine déterminée, protéine qui joue un rôle indispensable au fonctionnement et à la croissance des cellules. On dit que le gène code pour la protéine.
Le code d'un gène pour la fabrication d'une protéine est donné par l'ordre de succession de ses nucléotides. Sachant qu'une protéine est faite de l'enchainement d'acides aminés, le code commande la fabrication successive de chacun des acides aminés. Le code pour un acide aminé est inscrit dans un groupe de 3 nucléotides successifs (un codon).
Si l'on comptabilise la totalité des gènes reconnus dans les chromosomes, ils n'occupent qu'une faible partie de l'ADN, environ 10 à 15% du génome chez l'homme (l'estimation varie selon les chercheurs). Entre les zones comportant des gènes, se trouvent de longues zones non-codantes. On ne leur a pas reconnu de fonction de fabrication d'une protéine. On les appelle zones intergènes ou encore séquences espaceurs. Elles représentent la plus grande partie du génome (85 à 90 % chez l’homme).
Mais ce n'est pas tout. A l'intérieur d'un gène, il existe aussi des zones non-codantes. Si l'on repère les suites de codons, il y a ceux qui codent pour les acides aminés, éléments de la protéine. Il y en a aussi quelques-uns qui codent pour des contrôles: un codon en tête pour repérer le début de fabrication et un autre en fin pour en marquer l'arrêt. Or tous ces codons n'occupent qu'une partie du gène. Insérés entre les codons, d'autres fragments ne codent pas pour des acides aminés. On les nomme des introns.
Nous avons repéré des petites régions non-codantes à l'intérieur des gènes (les introns) et de bien plus grandes entre les gènes (les espaceurs). Au total, elles représentent 95% de régions non-codantes. Il reste donc seulement une faible proportion de régions codantes dans un filament d'ADN, 5% environ. C'est très intrigant. Pourquoi la nature conçoit-elle ces régions non-codantes?
D'ailleurs sont-elles réellement non-codantes? Même si elles ne codent pas pour des acides aminés, il est possible qu'elles portent des codes qui contrôlent d'autres fonctions. Le mot code a un sens très général et très profond, beaucoup plus étendu que le simple fait de coder pour une protéine (voir article Code, information et mémoire). Lorsque nous employons un mot, il est important de sentir qu'il peut restreindre notre pensée à une habitude (voir article La puissance des mots).
Les scientifiques savent peu de choses sur les fonctions possibles des zones "non-codantes". Mais ils ont ouvert quelques pistes d'exploration dont nous allons prendre connaissance.
Les séquences de nucléotides dans les gènes ont tout d'abord été observées et analysées sur des bactéries, organismes composés d'une seule cellule, sans noyau (procaryotes). Ce sont ces observations qui ont conduit à démontrer que chaque groupe de 3, le codon, contrôle la fabrication d'un acide aminé, et que l'enchainement des acides aminés de la protéine est calqué sur l'enchainement des codons du gène. Or lorsqu'on s'est penché sur des organismes plus élaborés tel que l'être humain, dont les cellules comportent un noyau (organismes appelés eucaryotes), il est apparu que seules certaines parties du gène sont des séquences codantes. Le gène est constitué d'une suite alternée de séquences codantes (les exons) et de séquences non codantes (les introns).

Fig.2. En haut, le
gène d'ovalbumine
(protéine du blanc d'œuf) vu en microscopie
électronique. En bas, sa représentation
schématique: En bleu,
l'ADN du gène tel qu'il est vu en microscopie
électronique. En rouge,
l'ARN messager (mRNA) après excision des introns. Les
boucles I
à VII
sont des introns. Les fragment L, et 1 à 7 sont les exons. L
est le début de lecture du gène.
Reproduit de Martin E. Mulligan, Introns
Comment sait-on que les introns ne sont pas impliqués dans le codage des acides aminés? En suivant comment une protéine est élaborée à partir du gène.
Tout d'abord, le gène est transcrit en une copie moléculaire, à la façon d'une empreinte. La molécule de cette empreinte est de l'ARN (Acide RiboNucléique). Elle diffère de l'ADN, d'une part par une légère différence chimique dans le pentagone de la chaine centrale (fig.1) qui est ici un ribose au lieu d'un désoxyribose (d'où le R d'ARN au lieu du D d'ADN), et d'autre part par le remplacement de la thymine (T) par l'uranyle (U). Cette empreinte ARN a donc exactement la longueur du gène.
Observer cette empreinte d'ARN est un moyen de repérer le gène, ses extrémités et sa longueur. L'empreinte ARN est élaborée à partir du gène par complémentarité des bases. La base C du gène est reproduite en G et A est reproduite en U. Ainsi le codon CGA qui code l'alanine est reproduit en GCU.
Dans une deuxième étape, l'empreinte d'ARN est remaniée. Des fragments d'ARN sont découpés et éliminés (excision), puis les extrémités des fragments restants sont ressoudées. Ce mécanisme est nommé épissage.
L'ARN restant qui en résulte est envoyé en mission hors du noyau, dans l'usine de production de la cellule (les ribosomes) où il est décodé en acides aminés pour produire la protéine. On le nomme ARN messager. Les parties éliminées ne servent pas donc au codage de la protéine. Par définition, les introns sont les parties du gène qui sont éliminées lors de la formation de l'ARN messager (nommés ainsi par le biologiste américain Walter Gilbert en 1978).
En définitive, bien qu'il forme un ensemble compact avec deux extrémités, un gène est morcelé: des séquences qui sont traduites en protéines sont incorporées dans une matrice de régions silencieuses.
On retrouve de nombreux gènes analogues, qui codent pour la même protéine, dans des organismes variés, des plus simples tels que les bactéries, jusqu'aux plus élaborés tels que l'être humain. Or, leur teneur en introns est différente. Plus les organismes sont élaborés et plus ils contiennent d'introns. Par exemple, un gène analogue peut contenir 0 intron dans une levure (cellule eucaryote), et 5 à 50 chez l'homme.
Prenons l'exemple du gène de l'ovalbumine chez la poule. Il contient 7 introns, qui séparent 8 exons (voir fig.2). La longueur totale du gène est d'environ 7700 paires de bases, réparties en seulement 1870 environ dans les exons et 5830, soit 75% pour les introns. La longueur totale des introns est donc environ 3 fois celle des exons. C'est une partie importante du gène, et pas seulement quelques petits "blancs".
Autres exemples dans le génome humain: Le gène de la dystrophine a une longueur de 2,5 millions de nucléotides. Il comporte plus de 75 introns dont seulement environ 11000 nucléotides pour les exons, soit 0,5% d'exons et 99,5% d'introns. Le gène dont la déficience est responsable de la fibrose kystique comporte 98% d'introns. Les gènes humains sont composés en majorité d'introns.
La longueur d'un intron est typiquement de 65 à 20'000 nucléotides. Elle descend à 31 dans un gène du virus SV40 et atteint plus de 210'000 dans le gène humain de la dystrophine.
Sources: Pierre Chambon, les gènes en mosaïque. Des gènes aux protéines; dossier Pour la Science, éd. E. Belin, 1987. Jerry Bergman, The Functions of Introns: From Junk DNA to Designed DNA
Si les introns sont éliminés au cours du processus de fabrication de l'ARN messager, à quoi servent-ils? Ont-ils une fonction?
Certains chercheurs, n'entrevoyant aucun rôle apparent aux introns, en sont restés à cette apparence. Ils ont émis l'idée que ces introns ne servent à rien. Ces introns, disent-ils, sont des résidus de nos ancêtres. Ils se sont incorporés dans le génome à une lointaine époque. Ils y vivent par eux-mêmes, pour eux-mêmes, comme un parasite inoffensif. Ils l'ont donc qualifié d'ADN égoïste (tel que Richard Dawkins). Mais si c'était le cas, répondent d'autres, les exons qui sont séparés par ces introns colonisateurs du gène devraient correspondre à des sous-structures de la protéine codée par ce gène. Or c'est rarement le cas.
Source: A. Stoltzfus, D. Spencer, M. Zuker, J. Logsdon, Jr. W. Doolittle,Testing the Exon Theory of Genes: The Evidence from Protein Structure, Science, 265, 202, 1994
Ne pas entrevoir un rôle peut simplement venir du fait qu'on est aveugle ou mal-voyant. Nos appareils d'analyse, bien que très sophistiqués et conçus avec une merveille de technicité, restent bien rudimentaires en regard de tous les aspects de l'univers. A travers eux, nous ne pouvons explorer qu'une mince fenêtre de la réalité. La plupart des chercheurs à l'heure actuelle font preuve d'une plus grande humilité et admettent qu'il y a encore beaucoup de choses à découvrir et à comprendre dans le fonctionnement de l'être humain et de l'ADN.
C'est d'ailleurs tout à fait connu que certaines parties d'un gène codent pour des fonctions autres que la fabrication d'un acide aminé. C'est le cas des extrémités du gène. La tête indique tout simplement que c'est le début et la queue indique que c'est la fin. La tête est faite de quelques dizaines de nucléotides qui composent une zone de régulation, soit activatrice soit inhibitrice de la transcription en ARN, et un promoteur qui indique le début de la transcription. On dit que c'est le début du cadre de lecture. Quant à la fin, c'est un codon (3 nucléotides) qui dit "stoppez la lecture". Sur ce principe, de nombreux codes peuvent exister, commandant différentes fonctions qui peuvent survenir à des moments divers de la vie de la cellule.
Puisqu'il est inclus dans un gène, l'intron peut participer au bon fonctionnement de ce gène. Certains sont des amplificateurs qui augmentent ou diminuent le débit de la production de l'ARN messager. Ils ont un rôle de régulation de la production de la protéine.
Sur le modèle de la transmission du signal dans les télécommunications, le chercheur canadien Donald Forsdyke suggère que les introns ont des fonctions de détection d'erreurs dans la séquence des nucléotides après sa duplication au cours de la division des cellules. L'ADN peut se recourber sur lui-même et former des boucles, des épingles à cheveux, de telle sorte que des parties différentes du filament d'ADN peuvent coïncider. L'une des parties pourrait jouer le rôle d'un cadre de lecture contrôlant la conformité de l'autre. Les introns interviennent dans le cadre de lecture et dans la formation des boucles.
En 1995, des chercheurs américains ont découvert que certains introns ont la faculté de se transcrire en un fragment d'ARN qui peut s'insérer dans d'autres gènes identiques, à un emplacement homologue précis dépourvu d'introns. Pour ces chercheurs, une insertion aussi précise des introns pourrait constituer un procédé naturel pour créer de nouveaux gènes et de nouveaux codes d'information biologique. Pour d'autres, ce sont des exons qui sont transposés, mais ce phénomène est régulé par les introns qui leurs sont proches. Ces transpositions seraient à l'origine de la grande variabilité génétique des espèces.
Sources: Steven
Zimmerly, Huatao Guo, Phillip
S.
Perlman and Alan M. Lambowitz, "Group II Intron Mobility Occurs by
Target DNA-Primed Reverse Transcription", Cell, 1995, 82, 545. Jian
Yang, Steven Zimmerly, Peter Perlman and Alan
M. Lambowitz, "Efficient integration of an intron RNA into
double-stranded DNA by reverse splicing", Nature, 1996, 381, 332.
Cités dans Introns:
a Mystery
C.
Wills, "Exons, Introns, and Talking Genes: The Science Behind the Human
Genome Project", ed. Basic Books, 1991, 239, cité dans The
Functions of Introns: From Junk DNA to Designed DNA, par
Jerry Bergman
Constater qu'un intron est éliminé et ne sert à rien signifie seulement qu'il n'est pas employé à ce moment, mais pas qu'il ne sert à rien en permanence. Dans une usine, le chauffeur de camion est inoccupé tant que la fabrication des produits à livrer n'est pas terminée. Observer à ce moment son inactivité ne signifie pas qu'il n'a aucune fonction à un autre moment. De même un intron qui ne joue pas de rôle dans la production d'une protéine, peut en jouer un dans d'autres circonstances.
C'est le cas lorsque le gène se met à coder une autre protéine. Contrairement à ce que l'on croyait, on s'est aperçu que les gènes pouvaient coder la fabrication de plusieurs protéines, en induisant la transcription de plusieurs ARN messagers. Au départ, l'ARN empreinte du gène (le pré-ARN) est le même, mais il donne divers ARN messagers, selon les segments qui sont éliminés par excision. Un certain épissage conduit à un type d'ARN et à la protéine correspondante, et d'autres épissages conduisent à d'autres protéines. On appelle cela l'épissage alternatif.
Or si un intron est éliminé au cours de la synthèse de la protéine 1, mais pas de celle des protéines 2 ou 3, cela signifie qu'un intron n'est pas un intron en soi, mais seulement en rapport avec la production d'une protéine donnée. De même que l'ouvrier inoccupé est aussi chauffeur, l'intron peut se retrouver exon.
Grâce à l'épissage alternatif, un gène peut coder pour plusieurs protéines. Aujourd'hui, il est admis que près de 60% des gènes chez l'être humain subissent l'épissage alternatif. Selon les biologistes, la croissance et le fonctionnement du corps sont régis par un nombre considérable de protéines, elles-mêmes induites par les gènes. Comment le génome humain, qui ne contient que 26'000 gènes environ, peut-il gérer toutes ces fonctions? Peut-être parce que le phénomène de l'épissage alternatif permet de fabriquer bien plus de protéines. Mais il ne faut pas oublier le rôle des empreintes épigénétiques (voir L'ADN et ses modes d'expression).
D'autres fonctions possibles des introns, tout aussi intéressantes, ont été proposées. Comme elles sont communes à toutes les zones non-codantes, introns et régions intergènes,nous les examinons dans les sections suivantes.
Portons attention à l'enchainement des bases le long d'un brin d'ADN, sans nous soucier des délimitations des gènes et des codons. Rappelons que les deux brins de la molécule d'ADN étant complémentaires, la séquence de l'un se déduit de l'autre et qu'il suffit d'en décrire un seul.
Nous remarquons que de nombreuses sections du brin d'ADN sont
constituées de la répétition
de séquences plus ou moins
longues. Par exemple:
TTCCTTCCTCCCTTCCTTCCTTCCTTCCTTTCTTTCTTCCTTCC
On les trouve dans les génomes des eucaryotes (cellules avec noyau comme chez les animaux et les êtres humains) et aussi quelquefois dans les procaryotes (cellules sans noyau comme chez les bactéries). Ces sections sont situées dans les parties non-codantes, essentiellement dans les zones intergéniques. Mais on en trouve également dans les introns des gènes. Elles sont curieusement nommées satellites par les scientifiques. [Ordinairement, le mot "satellite" a le sens d'objet qui accompagne un autre objet principal]
Ces zones à répétitions présentent des structures variées. Les chercheurs les ont classées en catégories dont les plus étudiées sont les microsatellites et les minisatellites. D'autres zones à répétitions ne tombent pas dans ces catégories.
Les satellites sont constitués d'un motif
qui se
répète en tandem,
ce qui signifie par juxtaposition, en tête à
queue.
La
longueur de ce motif est de 1 nucléotide à une
centaine.
La répétition est plus ou moins stricte,
c'est-à-dire que le motif comporte quelques
variantes,
comme dans l'exemple ci-dessus que je réécris
avec des
blancs pour séparer les motifs et les rendre plus lisibles.
TTCC TTCC TCCC TTCC TTCC TTCC TTCC TTTC TTTC TTCC TTCC
Les microsatellites sont composés de motifs de 1 à 6 nucléotides, avec une moyenne de 4. Le nombre de répétition est de 2 à 10, quelquefois plus. On les appelle aussi STR (Short Tandem Repeats).
Les minisatellites sont des séquences de motifs qui comportent de 10 à quelques dizaines de nucléotides, en moyenne une vingtaine. Ils se répètent un grand nombre de fois, peut-être 5 à 50 ou plus, mais c'est très variable selon les individus. On les appelle aussi VNTR (Variable Number of Tandem Repeats).
Il existe aussi un certain nombre de répétitions géantes, dont le nombre de motifs peut être très grand. La taille de ces séquences peut aller de quelques dizaines à quelques centaines de milliers de nucléotides.
Notre génome comporte 3,2 milliards de paires de nucléotides dont 3,2 millions diffèrent de celles des autres, c'est-à-dire 0,1 %. Ce sont ces différences dans notre génome qui constituent notre empreinte génétique.
Lorsque
la police scientifique cherche à identifier un individu
à
partir de son ADN, les laboratoires d'analyse ne déterminent
pas
l'ensemble des parties variables de son génome, car ce
serait
bien trop
long et
trop couteux. Pour simplifier la tache, on ne retient que
quelques satellites, ceux
qui peuvent
être aisément amplifiés pour l'analyse,
qui sont
suffisamment simples et qui
présentent une grande variabilité d'un individu
à
l'autre.
Les minisatellites présentent cette grande variabilité et sont les meilleurs candidats pour caractériser un individu. Les microsatellites présentent moins de variations, ont donc plus de chance d'être semblables chez 2 individus. Mais ils sont plus aisément amplifiables par les techniques routinières de laboratoire et sont donc plus souvent employés dans les tests ADN.
Dans une parenté, la probabilité des microsatellites (ou STR) d'être identiques chez 2 individus n'est pas nulle. On a plus de chance de faire la distinction entre deux individus si on examine plusieurs loci. C'est pourquoi la législation a retenu un nombre minimum de microsatellites (10 ou plus), situés à des loci déterminés et normalisés, dont le choix est variable selon les normes des pays.
En France, les empreintes génétiques sont rassemblées dans le Fichier national automatisé des empreintes génétiques (FNAEG), destiné à l'origine à recueillir les empreintes des personnes condamnées pour infractions à caractère sexuel, mais dont l'usage s'est rapidement étendu à toutes sortes de délit. En Amérique du Nord (USA, Canada), la norme CODIS est la plus utilisée.

Fig.3. Localisation des 13
microsatellites
dans les 22+2 chromosomes humains, qui constituent l'empreinte
génétique selon la législation Codis
Merci à Wikipedia - Source: Short Tandem Repeat DNA Internet DataBase
Nous savons que la molécule d'ADN est constituée de l'enchainement de nucléotides à la manière d'une suite de lettres prises parmi 4 (A, T, C, G). Mais nous savons aussi (voir L'ADN et le code génétique) que cette suite est structurée en une sorte d'architecture comportant des emplacements ou cadres ou, en terme de biologie, un locus. C'est par exemple l'emplacement d'un gène donné. C'est une partie du chromosome qui est repérable de la même façon sur les chromosomes de tous les individus de la même espèce, disons l'être humain.
Ce cadre est rempli de nucléotides qui peuvent être identiques chez tous les individus, ou différents en partie. Chacune des versions possibles du locus s'appelle un allèle. Les allèles qui sont identiques chez tous les êtres humains portent les caractères propres à l'espèce humaine. Les allèles variables portent les caractéristiques propres à un individu, comme la couleur de ses cheveux.
Les zones non-codantes sont aussi structurées en
loci, avec leur début et leur fin. On peut
repérer un
même satellite chez des individus différents par
leur
emplacement ou locus. On constate que les
satellites d'un locus sont très variables d'un individu
à l'autre. Ce qui varie, c'est le
nombre de
répétitions de son motif.
De telles modifications se produisent pendant la formation des chromosomes au cours de la division des cellules, provoquant le raccourcissement ou l'allongement d'un satellite. Cela affecte également les cellules sexuelles, entrainant des changements de longueur de l'allèle d'une génération à l'autre. De ce fait, il est possible de définir une sorte de profil génétique d'un individu par la carte des nucléotides de ses satellites (voir encadré).
Sources: Guillaume Achaz, Etude de la
dynamique des génomes; les répétitions
intrachromosomiques.
Les empreintes
génétiques en médecine
légale, Lucie Le Beillan et Simon Clevers, projet
de biologie, licence de Physique-Chimie, Université de
Rouen, 2007
Matt Ridley, Chromosome 8,
l’intérêt personnel
L'enchainement des nucléotides le long de l'ADN n'est pas dû au hasard. En science, le hasard est défini de la façon suivante. Vous voulez construire un brin d'ADN et vous commencez par tirer au sort une première base. Pour simplifier, imaginons que ce sont 4 lettres, A, T, C, G, inscrites sur des carrés de scrable en nombre illimité, avec une répartition égale des 4 lettres. Pour la première lettre, il y a autant de chance d'avoir l'une que l'autre. Pour la seconde et toutes les suivantes, même chose. En définitive, chacune a une chance sur 4 d'apparaitre dans le filament à n'importe quelle place. Si le filament est très court, par exemple 6 lettres, le sort peut vous faire tirer plusieurs fois la même lettre, et vous aurez peut-être ATTTA. Mais, si le filament est très long, en moyenne, il y aura autant de lettres de chaque espèce, 1/4 de A, 1/4 de T, etc. Donc la fréquence d'apparition des lettres est la même et égale à 25%. Ou, autre façon de le présenter, la fréquence de A par rapport à TCG est de 1/3 (0,33). Si cette fréquence s'écarte notablement de cette valeur, cela montre qu'un processus autre que le hasard est en œuvre, qui crée les enchainements selon une logique, et institue un certain ordre.
Cet ordre ne peut être révélé que si on en découvre la règle. Dans la partie codante des gènes, la règle a été trouvée en tant que succession de codons, dont on a décrypté le code. Mais dans les introns et les zones intergènes, existe-t-il un ordre? Oui, au moins dans certaines parties, les satellites. La répétition est une forme d'ordre et n'est donc pas le résultat d'un hasard, surtout vu son abondance. Cet ordre a probablement un sens, une fonction. Mais laquelle?
Si l'on considère l'ADN dans son ensemble et pas seulement les satellites, il est intéressant de rechercher s'il présente un ou des types d'ordre. Des chercheurs s'y sont employés.
Le mathématicien Jean-Claude Pérez a appliqué des méthodes statistiques en recherchant la fréquence d'apparition des lettres dans un segment donné. Des études systématiques ont été conduites en faisant varier d'une part la longueur du segment analysé et d'autre part sa localisation, sans se préoccuper si on est dans un gène ou pas. Et il a trouvé que les fréquences de répartition des nucléotides ne sont pas dues au hasard.
La méthode est toutefois curieuse, car au lieu de rechercher la valeur de ces fréquences, il en fixe une a priori, la valeur de la fréquence d'une base par rapport aux 3 autres, sous la forme du nombre d'or 1,618 ou son inverse 0,618 (1:1,618=0,618). Il est indéniable que lorsque cette valeur qui est presque le double de la valeur du hasard 0,33 apparait dans les résultats du calcul, la distribution des nucléotides ne tient pas du hasard. Chaque fois que cela se produit, le mathématicien considère cette occurrence comme une résonance positive à sa quête, et il dénombre ces résonances. C'est peut-être mettre la charrue avant les bœufs que de limiter l'enquête à cette seule valeur. Mais même avec cette limite, les résultats sont intéressants car ils révèlent des résonances abondantes.
Pérez postule que le nombre de résonances constitue une mesure de l'ordre d'un segment donné d'ADN (c'est une façon de définir un type d'ordre). Il constate alors que cet ordre est différent selon les segments, et qu'il décroit fortement quand des parties y sont insérées artificiellement comme c'est le cas dans les OGM. Il est faible dans le virus du SIDA, probablement en lien avec l'instabilité de ce virus (en collaboration avec le Pr Montagnier - voir L'ADN décrypté, J.C. Pérez, Ed. Résurgence)
L'analyse mathématique comme celle qu'a employée Pérez n'est qu'un moyen sophistiqué de mettre en évidence ce que l'oeil a des difficultés à voir. Dans la succession des nucléotides, le cerveau s'y retrouve difficilement, sauf pour repérer des répétitions courtes. Les mathématiques permettent de présenter la réalité d'une façon plus évidente à l'observation (amélioration de l'image) et éventuellement d'en extraire certaines caractéristiques recherchées (analyse de l'image).
Un exemple relativement bien connu de mise en
évidence de
l'ordre par les mathématiques est l'analyse des
harmoniques incluses dans un son. Un son plein et
riche
comporte des harmoniques que l'oreille peut ressentir mais qu'elle
sépare
difficilement (voir Nature du
son, Timbre
et Harmoniques).
On enregistre ce son, on le représente par une courbe graphique (voir fig.4 gauche), et on effectue une transformation mathématique particulière appelée transformée de Fourier. Alors les harmoniques apparaissent, superbement représentées par une série de traits horizontaux sur la nouvelle courbe (voir fig.4 droite). Le son est le même, seule la représentation a changé pour l'adapter au cerveau qui interprète ce que l'œil perçoit.
![]() |
![]() |
| Fig.4-
Enregistrement d'un son.
La courbe représente comment la pression de l'air varie dans
le
temps |
Après
transformation
mathématique, les harmoniques apparaissent nettement |
Certaines transformations appelées transformées de Fourier permettent de mettre en évidence les répétitions ou les périodicités d'une courbe, procédé couramment employé pour détecter les harmoniques d'un son (voir encadré). Pour mettre en évidence d'autres types d'ordre, il faut utiliser d'autres fonctions mathématiques appelées fonctions de corrélation, qui sont basées sur des statistiques. Elles permettent de mesurer si la structure analysée est régie par le hasard ou non.
Des chercheurs (de Tokio, et de l'Université de Boston, USA) ont appliqué certaines fonctions de corrélation aux chaines d'ADN. Ce qui est intéressant, c'est qu'ils l'ont fait sur des portions d'ADN telles que les gènes, et aussi sur des filaments entiers. Le résultat est que la composition en bases n'est pas le fruit du hasard, même dans les zones non-codantes. Si on trouve une base G a un certain emplacement, cela influe sur la probabilité d'avoir un A (ou une autre base) à un autre emplacement, que ce dernier soit situé 100 nucléotides plus loin sur la chaine, ou 1000, 10'000 ou plus.
Comme le dit I. Amato (Revue Science, 1992), c'est comme si, sachant qu'il fait beau le 14 janvier de chaque année, on savait mieux prévoir s'il y aura du brouillard le 8 septembre. Une telle corrélation ne donne pas d'explication sur le type de lien entre les emplacements. On se contente de constater qu'il y a un lien de probabilité, mais on ne sait pas quelle en est la cause.
Ces chercheurs ont constaté que le degré de corrélation varie selon le type d'ADN. Il n'y a aucune corrélation pour les gènes qui ne possèdent pas d'introns, comme ceux des bactéries, alors que la présence d'introns élève cette corrélation. Les introns auraient-ils donc une fonction liée à l'ordre? Un peu comme s'ils étaient chargés de mettre de l'harmonie.
Autre découverte: Le degré de corrélation reste le même pour des portions courtes de 1000 nucléotides, ou longues de 10'000 ou 100'000, donc quelle que soit l'échelle d'observation. C'est aussi ce qu'a constaté J.C. Pérez pour l'existence des résonances. Une architecture qui présente la même forme à différentes échelles est ce qu'on nomme une structure fractale, caractérisée par sa dimension fractale (voir Les images fractales).
Un autre chercheur, R. Voss (Physical Review Letters, 1992), en analysant un nombre très important de gènes, a trouvé que chaque catégorie génétique d'êtres vivants (primates, invertébrés, organelles, etc.) avait chacune sa dimension fractale particulière.
D'autres hypothèses seront avancées dans la 6e partie, en examinant le champ énergétique de l'ADN.
Il existe donc bien une architecture sous-jacente dans la chaine de nucléotides. La molécule d'ADN n'est pas réduite à l'assemblage bout à bout de gènes et de portions vaguement utiles. Elle présente un ordre global. Si on la modifie localement, cela perturbe l'harmonie globale.
Accéder aux autres parties:
Texte conforme à la nouvelle orthographe française (1990)
13 novembre 2009