The China Mail - L'avenir incertain de la lecture humaine dans le livre audio

USD -
AED 3.672499
AFN 65.504736
ALL 82.012423
AMD 377.773158
ANG 1.79008
AOA 917.000047
ARS 1442.262801
AUD 1.431516
AWG 1.8
AZN 1.698448
BAM 1.659595
BBD 2.015639
BDT 122.394949
BGN 1.67937
BHD 0.376973
BIF 2965.596535
BMD 1
BND 1.27457
BOB 6.91481
BRL 5.303402
BSD 1.000776
BTN 90.44239
BWP 13.24927
BYN 2.866659
BYR 19600
BZD 2.012669
CAD 1.36738
CDF 2229.99993
CHF 0.777898
CLF 0.021857
CLP 863.079882
CNY 6.93805
CNH 6.936665
COP 3704.17
CRC 496.14758
CUC 1
CUP 26.5
CVE 93.565043
CZK 20.54795
DJF 178.211857
DKK 6.332197
DOP 63.157627
DZD 129.926302
EGP 46.854801
ERN 15
ETB 155.932472
EUR 0.848035
FJD 2.209501
FKP 0.738005
GBP 0.73584
GEL 2.695038
GGP 0.738005
GHS 10.987836
GIP 0.738005
GMD 73.000256
GNF 8783.310776
GTQ 7.675957
GYD 209.370505
HKD 7.813225
HNL 26.434899
HRK 6.390402
HTG 131.283861
HUF 320.478501
IDR 16876.7
ILS 3.129102
IMP 0.738005
INR 90.66105
IQD 1311.010794
IRR 42125.000158
ISK 122.959832
JEP 0.738005
JMD 156.523658
JOD 0.709008
JPY 157.044949
KES 129.000287
KGS 87.449435
KHR 4038.98126
KMF 418.999668
KPW 900.002243
KRW 1467.470252
KWD 0.307361
KYD 0.833956
KZT 493.576471
LAK 21509.911072
LBP 89638.030929
LKR 309.69554
LRD 186.137286
LSL 16.167606
LTL 2.95274
LVL 0.60489
LYD 6.339495
MAD 9.185352
MDL 17.007501
MGA 4427.737424
MKD 52.293597
MMK 2100.00747
MNT 3580.70414
MOP 8.05317
MRU 39.920067
MUR 46.059462
MVR 15.45012
MWK 1735.286131
MXN 17.347575
MYR 3.947502
MZN 63.749726
NAD 16.167606
NGN 1368.195506
NIO 36.826006
NOK 9.71805
NPR 144.708438
NZD 1.668345
OMR 0.384495
PAB 1.000776
PEN 3.36398
PGK 4.350519
PHP 58.562992
PKR 280.209677
PLN 3.57626
PYG 6608.484622
QAR 3.647395
RON 4.318502
RSD 99.548986
RUB 76.997104
RWF 1460.610278
SAR 3.750238
SBD 8.058149
SCR 13.889902
SDG 601.498432
SEK 9.04498
SGD 1.273275
SHP 0.750259
SLE 24.45004
SLL 20969.499267
SOS 570.904894
SRD 37.869637
STD 20697.981008
STN 20.789492
SVC 8.756194
SYP 11059.574895
SZL 16.159799
THB 31.611501
TJS 9.366941
TMT 3.505
TND 2.899825
TOP 2.40776
TRY 43.615017
TTD 6.776526
TWD 31.678202
TZS 2585.000013
UAH 43.184356
UGX 3572.383187
UYU 38.617377
UZS 12275.134071
VES 377.985125
VND 25950
VUV 119.988021
WST 2.726314
XAF 556.612755
XAG 0.013379
XAU 0.000204
XCD 2.70255
XCG 1.803594
XDR 0.692248
XOF 556.610394
XPF 101.198154
YER 238.400271
ZAR 16.12955
ZMK 9001.195865
ZMW 18.589121
ZWL 321.999592
  • AEX

    8.2800

    993.41

    +0.84%

  • BEL20

    -21.0000

    5504.29

    -0.38%

  • PX1

    32.9500

    8270.8

    +0.4%

  • ISEQ

    34.3200

    13234.35

    +0.26%

  • OSEBX

    48.7700

    1815.8

    +2.76%

  • PSI20

    58.8200

    8837.9

    +0.67%

  • ENTEC

    -5.8300

    1416.23

    -0.41%

  • BIOTK

    -10.2400

    4084.58

    -0.25%

  • N150

    31.0100

    4006.27

    +0.78%

L'avenir incertain de la lecture humaine dans le livre audio
L'avenir incertain de la lecture humaine dans le livre audio / Photo: © AFP/Archives

L'avenir incertain de la lecture humaine dans le livre audio

Faire lire intégralement un livre en vue de sa version audio coûte cher, trop cher pour certains promoteurs de ce format. Alors ils investissent dans le clonage de voix et les voix de synthèse.

Taille du texte:

Nicolas Sarkozy, par exemple, a enregistré en 2021 plus de 13 heures de ses mémoires de président, "Le Temps des tempêtes". Barack Obama a fait plus fort avec "Une terre promise" en 2020: 29 heures.

D'autres livres sont lus par des comédiens. Denis Podalydès a prêté sa voix à "Martin Eden", roman de Jack London. La narratrice du prix Goncourt 2024, "Houris" de Kamel Daoud, est incarnée par Lola Naymark, moins connue.

Mais des productions de ce genre, assez ou très onéreuses, ont un avenir incertain parmi les livres audio, qui font désormais de plus en plus souvent appel à l'intelligence artificielle (IA). Le Festival du livre de Paris, du 11 au 13 avril, a été l'occasion de deux annonces en ce sens.

Librinova, numéro un français de l'auto-édition, a ainsi dit adopter "la technologie de clonage vocal, qui permet d'obtenir une qualité largement supérieure à celle des voix synthétiques, souvent trop robotiques".

Un auteur enregistre la lecture d'une petite partie seulement de son livre et l'IA va extrapoler l'autre partie.

- "Il faut de tout" -

Spotify, le numéro un mondial du streaming, a lui indiqué qu'il investissait un million d'euros pour "des livres narrés par la voix de synthèse", autrement dit une machine qui imite, de plus en plus fidèlement, la voix humaine.

Et d'expliquer: "Les coûts importants de production et l'adoption encore naissante de l'usage du livre audio ont eu pour conséquences de limiter l'offre et le catalogue existant en français".

Spotify indique clairement à ses utilisateurs quelle voix leur fait la lecture. À eux de savoir s'ils acceptent qu'elle soit artificielle.

La plateforme suédoise n'abandonne pas les livres intégralement lus par un humain. "Ils viennent aider les éditeurs en finançant une partie de la production. Pour qu'un marché se développe et soit mature, il faut de tout", souligne auprès de l'AFP le directeur général de Hugo Publishing, Arthur de Saint-Vincent.

Cet éditeur, qui s'est imposé comme le numéro un de la romance en France, a pour sa part annoncé une offensive dans le livre audio, sans IA de son côté. Avec sa maison mère Glénat, il proposera 200 nouveaux titres dans les trois ans à venir.

"Nous en sommes à un stade de développement où nous pouvons investir dans une production de qualité. Donc on veut choisir les voix, travailler avec des comédiens et, avec le partenaire que nous avons choisi, le studio Blynd à Lyon, être intransigeants à chaque fois", avance le patron de Hugo.

- Monotonie -

Tout le monde n'a toutefois pas la trésorerie pour suivre.

En 2021, le numéro un du livre audio dans le monde, Audible, filiale d'Amazon, écrivait sur son site internet français: "Au départ, les livres audio utilisaient la synthèse vocale, c'est-à-dire une voix générée par ordinateur. Aujourd'hui, la voix humaine est privilégiée, car elle permet une plus grande proximité avec le lecteur, plus de chaleur et une meilleure intonation".

Quatre ans plus tard, la recherche "virtual voice" ("voix artificielle") sur son catalogue anglophone donne "plus de 50.000 résultats". L'immense majorité des titres sont signés d'auteurs mal ou pas connus.

La qualité de cette lecture laisse des appréciations contrastées, tantôt enthousiastes sur les progrès rapides de cette technologie, tantôt sceptiques sur ses limitations.

"Je ne pense pas que la narration par IA soit bonne avec les émotions des personnages, hélas", a par exemple commenté sur X Alisanya, autrice anglophone de romans "fantasy" autoédités sur Amazon.

Les voix de synthèse ne bafouillent jamais et commettent de moins en moins d'erreurs dans la prononciation des noms propres. À l'intérieur d'une phrase, elles ont des modulations. Mais sur la longueur elles peuvent devenir monotones: elles ne savent pas (encore) accélérer ou ralentir, monter ou baisser l'intensité, s'agacer, s'étrangler, s'essouffler ni sangloter.

I.Ko--ThChM