The China Mail - L'avenir incertain de la lecture humaine dans le livre audio

USD -
AED 3.672501
AFN 63.493369
ALL 83.065121
AMD 368.061373
ANG 1.790403
AOA 917.503082
ARS 1479.268799
AUD 1.450705
AWG 1.80125
AZN 1.704306
BAM 1.724631
BBD 2.015008
BDT 123.052911
BGN 1.69088
BHD 0.377235
BIF 2981.376318
BMD 1
BND 1.298014
BOB 6.913275
BRL 5.202301
BSD 1.000494
BTN 94.394378
BWP 13.651955
BYN 2.847191
BYR 19600
BZD 2.012169
CAD 1.42401
CDF 2269.000106
CHF 0.813199
CLF 0.023389
CLP 920.249899
CNY 6.7905
CNH 6.80507
COP 3440.62
CRC 455.363127
CUC 1
CUP 26.5
CVE 97.231163
CZK 21.38355
DJF 178.15793
DKK 6.59032
DOP 58.957356
DZD 133.564019
EGP 49.534796
ERN 15
ETB 157.79172
EUR 0.88172
FJD 2.244203
FKP 0.75995
GBP 0.759865
GEL 2.640163
GGP 0.75995
GHS 11.25259
GIP 0.75995
GMD 72.510374
GNF 8766.88653
GTQ 7.632888
GYD 209.329395
HKD 7.840575
HNL 26.770661
HRK 6.645899
HTG 130.762583
HUF 313.477965
IDR 17982
ILS 2.975899
IMP 0.75995
INR 94.38045
IQD 1310.623964
IRR 1375050.000123
ISK 126.960185
JEP 0.75995
JMD 157.684032
JOD 0.708978
JPY 161.850226
KES 129.59298
KGS 87.450161
KHR 4028.922887
KMF 433.999516
KPW 900.00035
KRW 1542.979919
KWD 0.30971
KYD 0.833737
KZT 484.885895
LAK 22235.351175
LBP 89595.167762
LKR 337.175056
LRD 182.081919
LSL 16.568199
LTL 2.95274
LVL 0.60489
LYD 6.424817
MAD 9.418715
MDL 17.758476
MGA 4265.244037
MKD 54.366184
MMK 2099.534862
MNT 3583.823146
MOP 8.07945
MRU 39.739339
MUR 48.190398
MVR 15.449729
MWK 1734.844143
MXN 17.638795
MYR 4.117302
MZN 63.909585
NAD 16.568199
NGN 1379.810012
NIO 36.814468
NOK 9.891199
NPR 151.027498
NZD 1.773553
OMR 0.384501
PAB 1.000485
PEN 3.423701
PGK 4.390498
PHP 61.322498
PKR 278.431272
PLN 3.78022
PYG 6113.48706
QAR 3.646841
RON 4.613097
RSD 103.466046
RUB 75.497985
RWF 1470.217363
SAR 3.75631
SBD 8.051953
SCR 14.057553
SDG 600.000277
SEK 9.75957
SGD 1.297675
SHP 0.746601
SLE 24.792558
SLL 20969.503664
SOS 571.756095
SRD 37.459846
STD 20697.981008
STN 21.604176
SVC 8.754541
SYP 110.532098
SZL 16.56607
THB 33.402522
TJS 9.249239
TMT 3.5
TND 2.970618
TOP 2.40776
TRY 46.51525
TTD 6.795175
TWD 31.850502
TZS 2618.939032
UAH 44.986949
UGX 3701.80946
UYU 40.139678
UZS 12018.0946
VES 620.752985
VND 26320
VUV 119.820737
WST 2.777776
XAF 578.419823
XAG 0.017474
XAU 0.000251
XCD 2.70255
XCG 1.803071
XDR 0.718004
XOF 578.424923
XPF 105.161521
YER 238.625026
ZAR 16.561795
ZMK 9001.203975
ZMW 18.058287
ZWL 321.999592
  • AEX

    8.1000

    1073.48

    +0.76%

  • BEL20

    28.9300

    5700.71

    +0.51%

  • PX1

    53.6700

    8439.41

    +0.64%

  • ISEQ

    86.4100

    14022.81

    +0.62%

  • OSEBX

    -12.5200

    1914.31

    -0.65%

  • PSI20

    112.2900

    9167.91

    +1.24%

  • ENTEC

    -5.8300

    1416.23

    -0.41%

  • BIOTK

    -300.8100

    4116.43

    -6.81%

  • N150

    12.1300

    4195.02

    +0.29%

L'avenir incertain de la lecture humaine dans le livre audio
L'avenir incertain de la lecture humaine dans le livre audio / Photo: © AFP/Archives

L'avenir incertain de la lecture humaine dans le livre audio

Faire lire intégralement un livre en vue de sa version audio coûte cher, trop cher pour certains promoteurs de ce format. Alors ils investissent dans le clonage de voix et les voix de synthèse.

Taille du texte:

Nicolas Sarkozy, par exemple, a enregistré en 2021 plus de 13 heures de ses mémoires de président, "Le Temps des tempêtes". Barack Obama a fait plus fort avec "Une terre promise" en 2020: 29 heures.

D'autres livres sont lus par des comédiens. Denis Podalydès a prêté sa voix à "Martin Eden", roman de Jack London. La narratrice du prix Goncourt 2024, "Houris" de Kamel Daoud, est incarnée par Lola Naymark, moins connue.

Mais des productions de ce genre, assez ou très onéreuses, ont un avenir incertain parmi les livres audio, qui font désormais de plus en plus souvent appel à l'intelligence artificielle (IA). Le Festival du livre de Paris, du 11 au 13 avril, a été l'occasion de deux annonces en ce sens.

Librinova, numéro un français de l'auto-édition, a ainsi dit adopter "la technologie de clonage vocal, qui permet d'obtenir une qualité largement supérieure à celle des voix synthétiques, souvent trop robotiques".

Un auteur enregistre la lecture d'une petite partie seulement de son livre et l'IA va extrapoler l'autre partie.

- "Il faut de tout" -

Spotify, le numéro un mondial du streaming, a lui indiqué qu'il investissait un million d'euros pour "des livres narrés par la voix de synthèse", autrement dit une machine qui imite, de plus en plus fidèlement, la voix humaine.

Et d'expliquer: "Les coûts importants de production et l'adoption encore naissante de l'usage du livre audio ont eu pour conséquences de limiter l'offre et le catalogue existant en français".

Spotify indique clairement à ses utilisateurs quelle voix leur fait la lecture. À eux de savoir s'ils acceptent qu'elle soit artificielle.

La plateforme suédoise n'abandonne pas les livres intégralement lus par un humain. "Ils viennent aider les éditeurs en finançant une partie de la production. Pour qu'un marché se développe et soit mature, il faut de tout", souligne auprès de l'AFP le directeur général de Hugo Publishing, Arthur de Saint-Vincent.

Cet éditeur, qui s'est imposé comme le numéro un de la romance en France, a pour sa part annoncé une offensive dans le livre audio, sans IA de son côté. Avec sa maison mère Glénat, il proposera 200 nouveaux titres dans les trois ans à venir.

"Nous en sommes à un stade de développement où nous pouvons investir dans une production de qualité. Donc on veut choisir les voix, travailler avec des comédiens et, avec le partenaire que nous avons choisi, le studio Blynd à Lyon, être intransigeants à chaque fois", avance le patron de Hugo.

- Monotonie -

Tout le monde n'a toutefois pas la trésorerie pour suivre.

En 2021, le numéro un du livre audio dans le monde, Audible, filiale d'Amazon, écrivait sur son site internet français: "Au départ, les livres audio utilisaient la synthèse vocale, c'est-à-dire une voix générée par ordinateur. Aujourd'hui, la voix humaine est privilégiée, car elle permet une plus grande proximité avec le lecteur, plus de chaleur et une meilleure intonation".

Quatre ans plus tard, la recherche "virtual voice" ("voix artificielle") sur son catalogue anglophone donne "plus de 50.000 résultats". L'immense majorité des titres sont signés d'auteurs mal ou pas connus.

La qualité de cette lecture laisse des appréciations contrastées, tantôt enthousiastes sur les progrès rapides de cette technologie, tantôt sceptiques sur ses limitations.

"Je ne pense pas que la narration par IA soit bonne avec les émotions des personnages, hélas", a par exemple commenté sur X Alisanya, autrice anglophone de romans "fantasy" autoédités sur Amazon.

Les voix de synthèse ne bafouillent jamais et commettent de moins en moins d'erreurs dans la prononciation des noms propres. À l'intérieur d'une phrase, elles ont des modulations. Mais sur la longueur elles peuvent devenir monotones: elles ne savent pas (encore) accélérer ou ralentir, monter ou baisser l'intensité, s'agacer, s'étrangler, s'essouffler ni sangloter.

I.Ko--ThChM