The China Mail - Un pas de plus dans l'interprétation du génome grâce à l'IA

USD -
AED 3.6725
AFN 63.4961
ALL 82.649558
AMD 368.05023
ANG 1.790403
AOA 916.999927
ARS 1489.523905
AUD 1.450245
AWG 1.8
AZN 1.716238
BAM 1.716457
BBD 2.014726
BDT 123.242589
BGN 1.69088
BHD 0.377025
BIF 2985
BMD 1
BND 1.296755
BOB 6.937497
BRL 5.207098
BSD 1.000298
BTN 95.33551
BWP 14.280449
BYN 2.914275
BYR 19600
BZD 2.01183
CAD 1.42063
CDF 2274.999838
CHF 0.808365
CLF 0.023517
CLP 925.5602
CNY 6.79445
CNH 6.787875
COP 3388.99
CRC 455.303389
CUC 1
CUP 26.5
CVE 97.124997
CZK 21.26705
DJF 177.720093
DKK 6.56361
DOP 59.450142
DZD 133.326892
EGP 49.084405
ERN 15
ETB 159.150286
EUR 0.87813
FJD 2.26665
FKP 0.753127
GBP 0.75205
GEL 2.639919
GGP 0.753127
GHS 11.365035
GIP 0.753127
GMD 73.494362
GNF 8770.000287
GTQ 7.629052
GYD 209.24824
HKD 7.84425
HNL 26.249776
HRK 6.615401
HTG 130.790023
HUF 312.027038
IDR 17988
ILS 2.990405
IMP 0.753127
INR 95.218302
IQD 1310.5
IRR 1375999.999628
ISK 126.269951
JEP 0.753127
JMD 157.314119
JOD 0.708961
JPY 162.201498
KES 129.260167
KGS 87.449929
KHR 4012.498967
KMF 432.999958
KPW 900.00035
KRW 1552.180255
KWD 0.30928
KYD 0.83364
KZT 479.437628
LAK 22500.000254
LBP 89730.684989
LKR 336.036368
LRD 181.874954
LSL 16.398106
LTL 2.95274
LVL 0.60489
LYD 6.414976
MAD 9.407505
MDL 17.690836
MGA 4287.499786
MKD 54.146995
MMK 2099.256901
MNT 3584.189705
MOP 8.081898
MRU 40.130314
MUR 47.270022
MVR 15.450362
MWK 1735.999766
MXN 17.53965
MYR 4.084497
MZN 63.90009
NAD 16.403383
NGN 1374.11965
NIO 36.604973
NOK 9.912735
NPR 152.537167
NZD 1.761515
OMR 0.3845
PAB 1.000298
PEN 3.418001
PGK 4.377982
PHP 61.578997
PKR 278.250181
PLN 3.76734
PYG 6080.073017
QAR 3.645497
RON 4.589006
RSD 103.062981
RUB 77.503084
RWF 1466
SAR 3.754201
SBD 8.049104
SCR 14.229436
SDG 600.498384
SEK 9.717195
SGD 1.294597
SHP 0.746601
SLE 24.375004
SLL 20969.503664
SOS 571.501978
SRD 37.504501
STD 20697.981008
STN 21.9
SVC 8.752391
SYP 110.532098
SZL 16.393234
THB 33.314501
TJS 9.252979
TMT 3.5
TND 2.93875
TOP 2.40776
TRY 46.683501
TTD 6.790936
TWD 31.882201
TZS 2627.502978
UAH 44.843589
UGX 3665.771506
UYU 40.21203
UZS 11932.501476
VES 632.57269
VND 26294.5
VUV 119.997124
WST 2.769645
XAF 575.673565
XAG 0.016647
XAU 0.000246
XCD 2.70255
XCG 1.802784
XDR 0.715018
XOF 574.496201
XPF 105.125007
YER 238.601099
ZAR 16.38831
ZMK 9001.199896
ZMW 18.211258
ZWL 321.999592
  • AEX

    -2.7900

    1070.37

    -0.26%

  • BEL20

    41.0600

    5743.9

    +0.72%

  • PX1

    57.5300

    8394.69

    +0.69%

  • ISEQ

    74.5300

    13875.97

    +0.54%

  • OSEBX

    13.8800

    1915.56

    +0.73%

  • PSI20

    80.9100

    9171.41

    +0.89%

  • ENTEC

    -5.8300

    1416.23

    -0.41%

  • BIOTK

    -58.5800

    4518.09

    -1.28%

  • N150

    33.6400

    4186.22

    +0.81%

Un pas de plus dans l'interprétation du génome grâce à l'IA
Un pas de plus dans l'interprétation du génome grâce à l'IA / Photo: © AFP/Archives

Un pas de plus dans l'interprétation du génome grâce à l'IA

AlphaGenome, outil d'intelligence artificielle (IA) de Google rendu public mercredi, fait un pas de plus dans la compréhension du génome, en analysant comment des portions de l'ADN régulent l'activité des gènes dans la cellule.

Taille du texte:

Le déchiffrage de l'ensemble du génome humain en 2003, "nous a donné le livre de la vie, mais le lire reste un défi", a rappelé Pushmeet Kohli, vice-président de la recherche chez Google DeepMind, à l'occasion de la présentation d'AlphaGenome dans la revue Nature.

"Nous avons le texte" - la succession de 3 milliards de paires de nucléotides A, T, C et G qui composent l'ADN -, mais "comprendre la grammaire (...) et la manière dont cela gouverne la vie constitue la prochaine frontière majeure de la recherche", a-t-il souligné devant la presse.

Seules 2% des séquences d'ADN "codent" directement des protéines, indispensables au fonctionnement des organismes vivants.

Les 98% restants ont un rôle de "chef d'orchestre": elles coordonnent, protègent et régulent l'expression de l'information génétique dans chacune de nos cellules. Ces séquences, appelées "non codantes", contiennent de nombreux variants associés à des maladies.

Ce sont elles qu'étudie AlphaGenome, venant compléter les autres modèles développés par le laboratoire d'IA de Google: AlphaMissense (analyse des séquences codantes de l'ADN), AlphaProteo (conception de protéines) et AlphaFold (prédiction de la structure de protéines, prix Nobel de chimie en 2024).

Le modèle d'apprentissage profond (dans lequel un réseau de neurones apprend à reconnaître automatiquement des motifs complexes) a été entraîné avec des données provenant de grands consortiums publics, qui ont mesuré expérimentalement ces propriétés dans des centaines de types de cellules et de tissus chez l'homme et la souris.

Il est capable d'analyser une longue séquence d'ADN et de "prédire" l'influence de chaque paire de nucléotides sur différents processus biologiques dans la cellule: activer ou réprimer l'expression d'un gène, piloter l'assemblage de l'ARN (une "copie" de l'ADN qui transmet l'information génétique dans la cellule)...

- "Fondamental" mais "pas parfait" -

D'autres modèles existaient déjà. Mais ils devaient faire un compromis entre la longueur des séquences analysées et la finesse de la résolution.

Or, une longue séquence - jusqu'à un million de paires de nucléotides - est "nécessaire pour comprendre l'environnement régulateur complet d'un gène unique", explique Ziga Avsec, un des co-auteurs du projet.

Et la finesse de la résolution permet d'étudier l'effet de variants génétiques en comparant les prédictions de séquences mutées à celles de séquences non mutées.

Autre avancée, AlphaGenome modélise simultanément l'influence de la séquence sur onze processus biologiques, alors que les scientifiques devaient jusqu'à présent utiliser plusieurs modèles.

Cet outil "peut accélérer notre compréhension du génome en aidant à cartographier l'emplacement des éléments fonctionnels et à déterminer leurs rôles au niveau moléculaire", estime Natasha Latysheva, également co-autrice.

"Nous espérons que les chercheurs enrichiront avec davantage de données et de modalités" le modèle, déjà testé par 3.000 scientifiques de 160 pays et désormais disponible en open source pour la recherche non-commerciale, souligne M. Kohli.

"Identifier précisément les différences dans nos génomes qui nous rendent plus ou moins susceptibles de développer des milliers de maladies est une étape clé vers de meilleurs traitements", note Ben Lehner, responsable de la génomique générative et synthétique au Wellcome Sanger Institute de Cambridge.

Le chercheur, qui n'a pas participé au projet mais a testé le modèle, le juge "très performant", mais encore "loin d'être parfait".

"Les modèles d'IA ne sont bons que dans la mesure où les données utilisées pour les entraîner le sont", or la plupart des jeux de données existants "sont trop petits et insuffisamment standardisés", explique-t-il dans une réaction à l'organisme britannique Science Media Center (SMC).

AlphaGenome n'est pas une "solution miracle à toutes les questions biologiques", l'expression des gènes "étant influencée par des facteurs environnementaux complexes", mais il constitue un "outil fondamental", abonde Robert Goldstone, responsable de la génomique au Francis Crick Institute, cité dans le même texte.

Selon lui, ce nouvel outil permettra aux scientifiques "d'étudier et de simuler de manière programmatique les bases génétiques des maladies complexes".

U.Chen--ThChM