The China Mail - Un pas de plus dans l'interprétation du génome grâce à l'IA

USD -
AED 3.6725
AFN 65.499729
ALL 82.012423
AMD 377.773158
ANG 1.79008
AOA 917.000037
ARS 1442.275002
AUD 1.437732
AWG 1.8
AZN 1.697294
BAM 1.659595
BBD 2.015639
BDT 122.394949
BGN 1.67937
BHD 0.376995
BIF 2965.596535
BMD 1
BND 1.27457
BOB 6.91481
BRL 5.271602
BSD 1.000776
BTN 90.44239
BWP 13.24927
BYN 2.866659
BYR 19600
BZD 2.012669
CAD 1.369065
CDF 2230.000275
CHF 0.7768
CLF 0.021932
CLP 866.00035
CNY 6.93805
CNH 6.938869
COP 3698
CRC 496.14758
CUC 1
CUP 26.5
CVE 93.565043
CZK 20.568969
DJF 178.211857
DKK 6.331013
DOP 63.157627
DZD 129.992996
EGP 46.861601
ERN 15
ETB 155.932472
EUR 0.847799
FJD 2.210498
FKP 0.732184
GBP 0.736925
GEL 2.694986
GGP 0.732184
GHS 10.987836
GIP 0.732184
GMD 73.000379
GNF 8783.310776
GTQ 7.675957
GYD 209.370505
HKD 7.81155
HNL 26.434899
HRK 6.3863
HTG 131.283861
HUF 322.487018
IDR 16879.45
ILS 3.13001
IMP 0.732184
INR 90.398099
IQD 1311.010794
IRR 42125.000158
ISK 122.770089
JEP 0.732184
JMD 156.523658
JOD 0.709003
JPY 156.875974
KES 129.102598
KGS 87.450209
KHR 4038.98126
KMF 418.999491
KPW 900.030004
KRW 1469.990241
KWD 0.307339
KYD 0.833956
KZT 493.576471
LAK 21509.911072
LBP 89638.030929
LKR 309.69554
LRD 186.137286
LSL 16.167606
LTL 2.95274
LVL 0.60489
LYD 6.339495
MAD 9.185352
MDL 17.007501
MGA 4427.737424
MKD 52.251206
MMK 2099.783213
MNT 3569.156954
MOP 8.05317
MRU 39.920067
MUR 46.059657
MVR 15.449897
MWK 1735.286131
MXN 17.426835
MYR 3.9525
MZN 63.750209
NAD 16.167606
NGN 1366.530344
NIO 36.826006
NOK 9.778903
NPR 144.708438
NZD 1.67346
OMR 0.384506
PAB 1.000776
PEN 3.36398
PGK 4.350519
PHP 58.550504
PKR 280.209677
PLN 3.58107
PYG 6608.484622
QAR 3.647395
RON 4.318398
RSD 99.504972
RUB 76.753269
RWF 1460.610278
SAR 3.750238
SBD 8.058149
SCR 14.862442
SDG 601.501385
SEK 9.03673
SGD 1.273565
SHP 0.750259
SLE 24.450362
SLL 20969.499267
SOS 570.904894
SRD 37.86973
STD 20697.981008
STN 20.789492
SVC 8.756194
SYP 11059.574895
SZL 16.159799
THB 31.705498
TJS 9.366941
TMT 3.505
TND 2.899825
TOP 2.40776
TRY 43.6127
TTD 6.776526
TWD 31.654974
TZS 2574.999777
UAH 43.184356
UGX 3572.383187
UYU 38.617377
UZS 12275.134071
VES 377.985125
VND 25960
VUV 119.687673
WST 2.726344
XAF 556.612755
XAG 0.013394
XAU 0.000205
XCD 2.702549
XCG 1.803594
XDR 0.692248
XOF 556.610394
XPF 101.198154
YER 238.396166
ZAR 16.198103
ZMK 9001.200805
ZMW 18.589121
ZWL 321.999592
  • AEX

    -5.1500

    985.14

    -0.52%

  • BEL20

    -20.5200

    5525.05

    -0.37%

  • PX1

    -23.1300

    8238.17

    -0.28%

  • ISEQ

    -319.0500

    13200.06

    -2.36%

  • OSEBX

    1.4100

    1767.03

    +0.08%

  • PSI20

    -102.1300

    8779.01

    -1.15%

  • ENTEC

    -5.8300

    1416.23

    -0.41%

  • BIOTK

    -10.2400

    4084.58

    -0.25%

  • N150

    -8.7600

    3975.26

    -0.22%

Un pas de plus dans l'interprétation du génome grâce à l'IA
Un pas de plus dans l'interprétation du génome grâce à l'IA / Photo: © AFP/Archives

Un pas de plus dans l'interprétation du génome grâce à l'IA

AlphaGenome, outil d'intelligence artificielle (IA) de Google rendu public mercredi, fait un pas de plus dans la compréhension du génome, en analysant comment des portions de l'ADN régulent l'activité des gènes dans la cellule.

Taille du texte:

Le déchiffrage de l'ensemble du génome humain en 2003, "nous a donné le livre de la vie, mais le lire reste un défi", a rappelé Pushmeet Kohli, vice-président de la recherche chez Google DeepMind, à l'occasion de la présentation d'AlphaGenome dans la revue Nature.

"Nous avons le texte" - la succession de 3 milliards de paires de nucléotides A, T, C et G qui composent l'ADN -, mais "comprendre la grammaire (...) et la manière dont cela gouverne la vie constitue la prochaine frontière majeure de la recherche", a-t-il souligné devant la presse.

Seules 2% des séquences d'ADN "codent" directement des protéines, indispensables au fonctionnement des organismes vivants.

Les 98% restants ont un rôle de "chef d'orchestre": elles coordonnent, protègent et régulent l'expression de l'information génétique dans chacune de nos cellules. Ces séquences, appelées "non codantes", contiennent de nombreux variants associés à des maladies.

Ce sont elles qu'étudie AlphaGenome, venant compléter les autres modèles développés par le laboratoire d'IA de Google: AlphaMissense (analyse des séquences codantes de l'ADN), AlphaProteo (conception de protéines) et AlphaFold (prédiction de la structure de protéines, prix Nobel de chimie en 2024).

Le modèle d'apprentissage profond (dans lequel un réseau de neurones apprend à reconnaître automatiquement des motifs complexes) a été entraîné avec des données provenant de grands consortiums publics, qui ont mesuré expérimentalement ces propriétés dans des centaines de types de cellules et de tissus chez l'homme et la souris.

Il est capable d'analyser une longue séquence d'ADN et de "prédire" l'influence de chaque paire de nucléotides sur différents processus biologiques dans la cellule: activer ou réprimer l'expression d'un gène, piloter l'assemblage de l'ARN (une "copie" de l'ADN qui transmet l'information génétique dans la cellule)...

- "Fondamental" mais "pas parfait" -

D'autres modèles existaient déjà. Mais ils devaient faire un compromis entre la longueur des séquences analysées et la finesse de la résolution.

Or, une longue séquence - jusqu'à un million de paires de nucléotides - est "nécessaire pour comprendre l'environnement régulateur complet d'un gène unique", explique Ziga Avsec, un des co-auteurs du projet.

Et la finesse de la résolution permet d'étudier l'effet de variants génétiques en comparant les prédictions de séquences mutées à celles de séquences non mutées.

Autre avancée, AlphaGenome modélise simultanément l'influence de la séquence sur onze processus biologiques, alors que les scientifiques devaient jusqu'à présent utiliser plusieurs modèles.

Cet outil "peut accélérer notre compréhension du génome en aidant à cartographier l'emplacement des éléments fonctionnels et à déterminer leurs rôles au niveau moléculaire", estime Natasha Latysheva, également co-autrice.

"Nous espérons que les chercheurs enrichiront avec davantage de données et de modalités" le modèle, déjà testé par 3.000 scientifiques de 160 pays et désormais disponible en open source pour la recherche non-commerciale, souligne M. Kohli.

"Identifier précisément les différences dans nos génomes qui nous rendent plus ou moins susceptibles de développer des milliers de maladies est une étape clé vers de meilleurs traitements", note Ben Lehner, responsable de la génomique générative et synthétique au Wellcome Sanger Institute de Cambridge.

Le chercheur, qui n'a pas participé au projet mais a testé le modèle, le juge "très performant", mais encore "loin d'être parfait".

"Les modèles d'IA ne sont bons que dans la mesure où les données utilisées pour les entraîner le sont", or la plupart des jeux de données existants "sont trop petits et insuffisamment standardisés", explique-t-il dans une réaction à l'organisme britannique Science Media Center (SMC).

AlphaGenome n'est pas une "solution miracle à toutes les questions biologiques", l'expression des gènes "étant influencée par des facteurs environnementaux complexes", mais il constitue un "outil fondamental", abonde Robert Goldstone, responsable de la génomique au Francis Crick Institute, cité dans le même texte.

Selon lui, ce nouvel outil permettra aux scientifiques "d'étudier et de simuler de manière programmatique les bases génétiques des maladies complexes".

U.Chen--ThChM