The China Mail - L'avenir incertain de la lecture humaine dans le livre audio

USD -
AED 3.672504
AFN 67.701997
ALL 84.120616
AMD 376.86036
ANG 1.789699
AOA 917.000367
ARS 1354.222596
AUD 1.546791
AWG 1.8025
AZN 1.70397
BAM 1.687416
BBD 1.988007
BDT 120.374445
BGN 1.68952
BHD 0.371166
BIF 2935.507528
BMD 1
BND 1.278461
BOB 6.803848
BRL 5.538804
BSD 0.984686
BTN 86.116216
BWP 13.508477
BYN 3.222208
BYR 19600
BZD 1.977827
CAD 1.37995
CDF 2890.000362
CHF 0.803795
CLF 0.024709
CLP 958.992278
CNY 7.211804
CNH 7.19286
COP 4123.376903
CRC 497.476382
CUC 1
CUP 26.5
CVE 95.133946
CZK 21.201404
DJF 175.333247
DKK 6.439804
DOP 59.842112
DZD 130.120357
EGP 48.338726
ERN 15
ETB 135.820974
EUR 0.86255
FJD 2.261504
FKP 0.754031
GBP 0.752899
GEL 2.703861
GGP 0.754031
GHS 10.338639
GIP 0.754031
GMD 72.503851
GNF 8539.752383
GTQ 7.557051
GYD 205.99629
HKD 7.84915
HNL 25.874639
HRK 6.502404
HTG 128.898667
HUF 344.13504
IDR 16367.95
ILS 3.41469
IMP 0.754031
INR 87.167904
IQD 1289.849446
IRR 42112.503816
ISK 123.430386
JEP 0.754031
JMD 157.939692
JOD 0.70904
JPY 147.390385
KES 127.207627
KGS 87.450384
KHR 3945.472585
KMF 427.503794
KPW 899.997983
KRW 1389.030383
KWD 0.30527
KYD 0.8205
KZT 534.360036
LAK 21292.437772
LBP 88226.909969
LKR 296.665373
LRD 197.411673
LSL 18.03615
LTL 2.95274
LVL 0.60489
LYD 5.379406
MAD 9.016608
MDL 16.955265
MGA 4469.177344
MKD 53.112463
MMK 2098.596987
MNT 3590.521894
MOP 7.960657
MRU 39.275269
MUR 46.750378
MVR 15.403739
MWK 1707.346534
MXN 18.858904
MYR 4.277504
MZN 63.960377
NAD 18.03615
NGN 1533.980377
NIO 36.236573
NOK 10.23875
NPR 137.786118
NZD 1.691189
OMR 0.378586
PAB 0.984599
PEN 3.537207
PGK 4.147362
PHP 57.766038
PKR 279.383202
PLN 3.686327
PYG 7375.005392
QAR 3.580087
RON 4.380304
RSD 101.065528
RUB 79.88758
RWF 1422.285492
SAR 3.750991
SBD 8.264604
SCR 14.458134
SDG 600.503676
SEK 9.65361
SGD 1.290371
SHP 0.785843
SLE 23.000338
SLL 20969.503947
SOS 562.702213
SRD 36.84037
STD 20697.981008
STN 21.138001
SVC 8.615677
SYP 13001.722914
SZL 18.031146
THB 32.475038
TJS 9.289763
TMT 3.51
TND 2.92895
TOP 2.342104
TRY 40.620504
TTD 6.673569
TWD 29.709038
TZS 2491.091842
UAH 41.159484
UGX 3529.614771
UYU 39.558259
UZS 12497.303826
VES 123.49336
VND 26220
VUV 120.138031
WST 2.775456
XAF 565.943661
XAG 0.027001
XAU 0.000297
XCD 2.70255
XCG 1.774557
XDR 0.703852
XOF 565.943661
XPF 102.894612
YER 240.603589
ZAR 18.15613
ZMK 9001.203584
ZMW 22.522756
ZWL 321.999592
  • AEX

    -17.2300

    884.87

    -1.91%

  • BEL20

    -70.9400

    4565.37

    -1.53%

  • PX1

    -226.1700

    7546.16

    -2.91%

  • ISEQ

    -312.6300

    11097.34

    -2.74%

  • OSEBX

    -19.8300

    1605.43

    -1.22%

  • PSI20

    -84.8300

    7626.71

    -1.1%

  • ENTEC

    -5.8300

    1416.23

    -0.41%

  • BIOTK

    -65.7500

    3221.76

    -2%

  • N150

    -54.9400

    3607.69

    -1.5%

L'avenir incertain de la lecture humaine dans le livre audio
L'avenir incertain de la lecture humaine dans le livre audio / Photo: © AFP/Archives

L'avenir incertain de la lecture humaine dans le livre audio

Faire lire intégralement un livre en vue de sa version audio coûte cher, trop cher pour certains promoteurs de ce format. Alors ils investissent dans le clonage de voix et les voix de synthèse.

Taille du texte:

Nicolas Sarkozy, par exemple, a enregistré en 2021 plus de 13 heures de ses mémoires de président, "Le Temps des tempêtes". Barack Obama a fait plus fort avec "Une terre promise" en 2020: 29 heures.

D'autres livres sont lus par des comédiens. Denis Podalydès a prêté sa voix à "Martin Eden", roman de Jack London. La narratrice du prix Goncourt 2024, "Houris" de Kamel Daoud, est incarnée par Lola Naymark, moins connue.

Mais des productions de ce genre, assez ou très onéreuses, ont un avenir incertain parmi les livres audio, qui font désormais de plus en plus souvent appel à l'intelligence artificielle (IA). Le Festival du livre de Paris, du 11 au 13 avril, a été l'occasion de deux annonces en ce sens.

Librinova, numéro un français de l'auto-édition, a ainsi dit adopter "la technologie de clonage vocal, qui permet d'obtenir une qualité largement supérieure à celle des voix synthétiques, souvent trop robotiques".

Un auteur enregistre la lecture d'une petite partie seulement de son livre et l'IA va extrapoler l'autre partie.

- "Il faut de tout" -

Spotify, le numéro un mondial du streaming, a lui indiqué qu'il investissait un million d'euros pour "des livres narrés par la voix de synthèse", autrement dit une machine qui imite, de plus en plus fidèlement, la voix humaine.

Et d'expliquer: "Les coûts importants de production et l'adoption encore naissante de l'usage du livre audio ont eu pour conséquences de limiter l'offre et le catalogue existant en français".

Spotify indique clairement à ses utilisateurs quelle voix leur fait la lecture. À eux de savoir s'ils acceptent qu'elle soit artificielle.

La plateforme suédoise n'abandonne pas les livres intégralement lus par un humain. "Ils viennent aider les éditeurs en finançant une partie de la production. Pour qu'un marché se développe et soit mature, il faut de tout", souligne auprès de l'AFP le directeur général de Hugo Publishing, Arthur de Saint-Vincent.

Cet éditeur, qui s'est imposé comme le numéro un de la romance en France, a pour sa part annoncé une offensive dans le livre audio, sans IA de son côté. Avec sa maison mère Glénat, il proposera 200 nouveaux titres dans les trois ans à venir.

"Nous en sommes à un stade de développement où nous pouvons investir dans une production de qualité. Donc on veut choisir les voix, travailler avec des comédiens et, avec le partenaire que nous avons choisi, le studio Blynd à Lyon, être intransigeants à chaque fois", avance le patron de Hugo.

- Monotonie -

Tout le monde n'a toutefois pas la trésorerie pour suivre.

En 2021, le numéro un du livre audio dans le monde, Audible, filiale d'Amazon, écrivait sur son site internet français: "Au départ, les livres audio utilisaient la synthèse vocale, c'est-à-dire une voix générée par ordinateur. Aujourd'hui, la voix humaine est privilégiée, car elle permet une plus grande proximité avec le lecteur, plus de chaleur et une meilleure intonation".

Quatre ans plus tard, la recherche "virtual voice" ("voix artificielle") sur son catalogue anglophone donne "plus de 50.000 résultats". L'immense majorité des titres sont signés d'auteurs mal ou pas connus.

La qualité de cette lecture laisse des appréciations contrastées, tantôt enthousiastes sur les progrès rapides de cette technologie, tantôt sceptiques sur ses limitations.

"Je ne pense pas que la narration par IA soit bonne avec les émotions des personnages, hélas", a par exemple commenté sur X Alisanya, autrice anglophone de romans "fantasy" autoédités sur Amazon.

Les voix de synthèse ne bafouillent jamais et commettent de moins en moins d'erreurs dans la prononciation des noms propres. À l'intérieur d'une phrase, elles ont des modulations. Mais sur la longueur elles peuvent devenir monotones: elles ne savent pas (encore) accélérer ou ralentir, monter ou baisser l'intensité, s'agacer, s'étrangler, s'essouffler ni sangloter.

I.Ko--ThChM