The China Mail - L'avenir incertain de la lecture humaine dans le livre audio

USD -
AED 3.673042
AFN 66.000368
ALL 83.203989
AMD 382.120403
ANG 1.790055
AOA 917.000367
ARS 1397.162531
AUD 1.531159
AWG 1.80375
AZN 1.70397
BAM 1.682293
BBD 2.013023
BDT 122.133531
BGN 1.683185
BHD 0.375425
BIF 2946
BMD 1
BND 1.30133
BOB 6.906191
BRL 5.297104
BSD 0.999415
BTN 88.626159
BWP 14.228698
BYN 3.409228
BYR 19600
BZD 2.010098
CAD 1.40315
CDF 2174.000362
CHF 0.794757
CLF 0.023592
CLP 925.503912
CNY 7.09955
CNH 7.10029
COP 3757.25
CRC 500.954773
CUC 1
CUP 26.5
CVE 95.303894
CZK 20.805104
DJF 177.720393
DKK 6.425804
DOP 64.150393
DZD 130.25304
EGP 46.987226
ERN 15
ETB 155.950392
EUR 0.86005
FJD 2.30065
FKP 0.760064
GBP 0.759878
GEL 2.703861
GGP 0.760064
GHS 10.97504
GIP 0.760064
GMD 72.503851
GNF 8688.000355
GTQ 7.660548
GYD 209.038916
HKD 7.77455
HNL 26.303838
HRK 6.482904
HTG 130.932925
HUF 330.790388
IDR 16712
ILS 3.227704
IMP 0.760064
INR 88.68575
IQD 1310
IRR 42100.000352
ISK 126.820386
JEP 0.760064
JMD 160.523667
JOD 0.70904
JPY 154.54504
KES 129.203801
KGS 87.450384
KHR 4015.00035
KMF 424.00035
KPW 899.988423
KRW 1449.503789
KWD 0.30669
KYD 0.832889
KZT 523.891035
LAK 21685.000349
LBP 89550.000349
LKR 306.559549
LRD 181.000348
LSL 17.120381
LTL 2.95274
LVL 0.60489
LYD 5.455039
MAD 9.24375
MDL 16.871097
MGA 4495.000347
MKD 52.917244
MMK 2099.610882
MNT 3572.735976
MOP 8.000774
MRU 39.850379
MUR 45.650378
MVR 15.403739
MWK 1736.503736
MXN 18.318904
MYR 4.132504
MZN 63.950377
NAD 17.120377
NGN 1440.780377
NIO 36.760377
NOK 10.088804
NPR 141.801854
NZD 1.760254
OMR 0.382902
PAB 0.999415
PEN 3.365504
PGK 4.223504
PHP 59.015038
PKR 280.703701
PLN 3.63804
PYG 7042.096028
QAR 3.64075
RON 4.374304
RSD 101.247038
RUB 80.491936
RWF 1450
SAR 3.750059
SBD 8.244163
SCR 13.654864
SDG 601.503676
SEK 9.449304
SGD 1.297604
SHP 0.750259
SLE 23.403667
SLL 20969.498139
SOS 571.503662
SRD 38.589504
STD 20697.981008
STN 21.375
SVC 8.745205
SYP 11056.884007
SZL 17.120369
THB 32.330369
TJS 9.225
TMT 3.51
TND 2.978504
TOP 2.40776
TRY 42.170504
TTD 6.777226
TWD 30.569504
TZS 2440.000335
UAH 42.001858
UGX 3567.926508
UYU 39.765005
UZS 12050.000334
VES 236.162804
VND 26350
VUV 121.871382
WST 2.813729
XAF 564.142765
XAG 0.019769
XAU 0.000245
XCD 2.70255
XCG 1.801252
XDR 0.704774
XOF 563.000332
XPF 103.150363
YER 238.525037
ZAR 17.08321
ZMK 9001.203584
ZMW 22.46297
ZWL 321.999592
  • AEX

    0.0000

    951.92

    0%

  • BEL20

    0.0000

    5034.52

    0%

  • PX1

    0.0000

    8170.09

    0%

  • ISEQ

    0.0000

    12365.36

    0%

  • OSEBX

    0.0000

    1614.79

    0%

  • PSI20

    0.0000

    8250.3

    0%

  • ENTEC

    -5.8300

    1416.23

    -0.41%

  • BIOTK

    76.6000

    4308.58

    +1.81%

  • N150

    0.0000

    3679.16

    0%

L'avenir incertain de la lecture humaine dans le livre audio
L'avenir incertain de la lecture humaine dans le livre audio / Photo: © AFP/Archives

L'avenir incertain de la lecture humaine dans le livre audio

Faire lire intégralement un livre en vue de sa version audio coûte cher, trop cher pour certains promoteurs de ce format. Alors ils investissent dans le clonage de voix et les voix de synthèse.

Taille du texte:

Nicolas Sarkozy, par exemple, a enregistré en 2021 plus de 13 heures de ses mémoires de président, "Le Temps des tempêtes". Barack Obama a fait plus fort avec "Une terre promise" en 2020: 29 heures.

D'autres livres sont lus par des comédiens. Denis Podalydès a prêté sa voix à "Martin Eden", roman de Jack London. La narratrice du prix Goncourt 2024, "Houris" de Kamel Daoud, est incarnée par Lola Naymark, moins connue.

Mais des productions de ce genre, assez ou très onéreuses, ont un avenir incertain parmi les livres audio, qui font désormais de plus en plus souvent appel à l'intelligence artificielle (IA). Le Festival du livre de Paris, du 11 au 13 avril, a été l'occasion de deux annonces en ce sens.

Librinova, numéro un français de l'auto-édition, a ainsi dit adopter "la technologie de clonage vocal, qui permet d'obtenir une qualité largement supérieure à celle des voix synthétiques, souvent trop robotiques".

Un auteur enregistre la lecture d'une petite partie seulement de son livre et l'IA va extrapoler l'autre partie.

- "Il faut de tout" -

Spotify, le numéro un mondial du streaming, a lui indiqué qu'il investissait un million d'euros pour "des livres narrés par la voix de synthèse", autrement dit une machine qui imite, de plus en plus fidèlement, la voix humaine.

Et d'expliquer: "Les coûts importants de production et l'adoption encore naissante de l'usage du livre audio ont eu pour conséquences de limiter l'offre et le catalogue existant en français".

Spotify indique clairement à ses utilisateurs quelle voix leur fait la lecture. À eux de savoir s'ils acceptent qu'elle soit artificielle.

La plateforme suédoise n'abandonne pas les livres intégralement lus par un humain. "Ils viennent aider les éditeurs en finançant une partie de la production. Pour qu'un marché se développe et soit mature, il faut de tout", souligne auprès de l'AFP le directeur général de Hugo Publishing, Arthur de Saint-Vincent.

Cet éditeur, qui s'est imposé comme le numéro un de la romance en France, a pour sa part annoncé une offensive dans le livre audio, sans IA de son côté. Avec sa maison mère Glénat, il proposera 200 nouveaux titres dans les trois ans à venir.

"Nous en sommes à un stade de développement où nous pouvons investir dans une production de qualité. Donc on veut choisir les voix, travailler avec des comédiens et, avec le partenaire que nous avons choisi, le studio Blynd à Lyon, être intransigeants à chaque fois", avance le patron de Hugo.

- Monotonie -

Tout le monde n'a toutefois pas la trésorerie pour suivre.

En 2021, le numéro un du livre audio dans le monde, Audible, filiale d'Amazon, écrivait sur son site internet français: "Au départ, les livres audio utilisaient la synthèse vocale, c'est-à-dire une voix générée par ordinateur. Aujourd'hui, la voix humaine est privilégiée, car elle permet une plus grande proximité avec le lecteur, plus de chaleur et une meilleure intonation".

Quatre ans plus tard, la recherche "virtual voice" ("voix artificielle") sur son catalogue anglophone donne "plus de 50.000 résultats". L'immense majorité des titres sont signés d'auteurs mal ou pas connus.

La qualité de cette lecture laisse des appréciations contrastées, tantôt enthousiastes sur les progrès rapides de cette technologie, tantôt sceptiques sur ses limitations.

"Je ne pense pas que la narration par IA soit bonne avec les émotions des personnages, hélas", a par exemple commenté sur X Alisanya, autrice anglophone de romans "fantasy" autoédités sur Amazon.

Les voix de synthèse ne bafouillent jamais et commettent de moins en moins d'erreurs dans la prononciation des noms propres. À l'intérieur d'une phrase, elles ont des modulations. Mais sur la longueur elles peuvent devenir monotones: elles ne savent pas (encore) accélérer ou ralentir, monter ou baisser l'intensité, s'agacer, s'étrangler, s'essouffler ni sangloter.

I.Ko--ThChM