The China Mail - L'avenir incertain de la lecture humaine dans le livre audio

USD -
AED 3.67325
AFN 63.999745
ALL 83.250398
AMD 377.159929
ANG 1.790083
AOA 916.9998
ARS 1382.3505
AUD 1.449696
AWG 1.80125
AZN 1.695409
BAM 1.70594
BBD 2.013154
BDT 122.637848
BGN 1.709309
BHD 0.377515
BIF 2964
BMD 1
BND 1.290401
BOB 6.906447
BRL 5.193497
BSD 0.999512
BTN 95.111495
BWP 13.788472
BYN 2.972354
BYR 19600
BZD 2.010179
CAD 1.391525
CDF 2285.000157
CHF 0.799702
CLF 0.023467
CLP 926.610462
CNY 6.894697
CNH 6.887795
COP 3682.63
CRC 464.734923
CUC 1
CUP 26.5
CVE 95.875012
CZK 21.255603
DJF 177.71982
DKK 6.466502
DOP 60.098809
DZD 133.238132
EGP 54.517371
ERN 15
ETB 157.050114
EUR 0.865301
FJD 2.236694
FKP 0.758039
GBP 0.75605
GEL 2.69004
GGP 0.758039
GHS 10.9998
GIP 0.758039
GMD 73.999913
GNF 8775.000005
GTQ 7.64789
GYD 209.174328
HKD 7.84015
HNL 26.604398
HRK 6.521299
HTG 131.185863
HUF 333.98978
IDR 16949.3
ILS 3.15655
IMP 0.758039
INR 93.48455
IQD 1310
IRR 1315874.999986
ISK 124.090168
JEP 0.758039
JMD 158.129555
JOD 0.709037
JPY 158.770105
KES 130.000308
KGS 87.449728
KHR 4009.999698
KMF 428.495038
KPW 899.974671
KRW 1504.669993
KWD 0.30953
KYD 0.832908
KZT 476.211659
LAK 21950.00036
LBP 89509.104995
LKR 315.318459
LRD 183.675007
LSL 17.069667
LTL 2.95274
LVL 0.60489
LYD 6.404975
MAD 9.342503
MDL 17.701369
MGA 4177.999863
MKD 53.342853
MMK 2099.498084
MNT 3571.008867
MOP 8.070843
MRU 40.109985
MUR 47.119596
MVR 15.469396
MWK 1737.000313
MXN 17.93386
MYR 4.049001
MZN 63.950207
NAD 17.070162
NGN 1385.730126
NIO 36.729977
NOK 9.688099
NPR 152.178217
NZD 1.741235
OMR 0.384474
PAB 0.999507
PEN 3.495979
PGK 4.389672
PHP 60.393032
PKR 279.191108
PLN 3.71335
PYG 6474.685228
QAR 3.643985
RON 4.413001
RSD 101.656005
RUB 81.298695
RWF 1460
SAR 3.752978
SBD 8.042037
SCR 14.05702
SDG 600.999874
SEK 9.469898
SGD 1.285897
SHP 0.750259
SLE 24.550373
SLL 20969.510825
SOS 571.505345
SRD 37.374033
STD 20697.981008
STN 21.725
SVC 8.746053
SYP 110.555055
SZL 17.070278
THB 32.610303
TJS 9.580319
TMT 3.51
TND 2.930302
TOP 2.40776
TRY 44.469755
TTD 6.790468
TWD 31.952024
TZS 2588.311
UAH 43.911606
UGX 3762.887497
UYU 40.550736
UZS 12195.499903
VES 473.27785
VND 26340
VUV 120.343344
WST 2.769273
XAF 572.15615
XAG 0.013308
XAU 0.000214
XCD 2.70255
XCG 1.801363
XDR 0.710952
XOF 570.501861
XPF 104.049913
YER 238.649671
ZAR 16.937302
ZMK 9001.198901
ZMW 19.105686
ZWL 321.999592
  • AEX

    -4.7300

    959.8

    -0.49%

  • BEL20

    43.2600

    5073.12

    +0.86%

  • PX1

    44.3000

    7816.94

    +0.57%

  • ISEQ

    125.2700

    12056.03

    +1.05%

  • OSEBX

    30.1600

    2067.97

    +1.48%

  • PSI20

    61.6800

    9131.56

    +0.68%

  • ENTEC

    -5.8300

    1416.23

    -0.41%

  • BIOTK

    62.7400

    3689.24

    +1.73%

  • N150

    42.0100

    3861.27

    +1.1%

L'avenir incertain de la lecture humaine dans le livre audio
L'avenir incertain de la lecture humaine dans le livre audio / Photo: © AFP/Archives

L'avenir incertain de la lecture humaine dans le livre audio

Faire lire intégralement un livre en vue de sa version audio coûte cher, trop cher pour certains promoteurs de ce format. Alors ils investissent dans le clonage de voix et les voix de synthèse.

Taille du texte:

Nicolas Sarkozy, par exemple, a enregistré en 2021 plus de 13 heures de ses mémoires de président, "Le Temps des tempêtes". Barack Obama a fait plus fort avec "Une terre promise" en 2020: 29 heures.

D'autres livres sont lus par des comédiens. Denis Podalydès a prêté sa voix à "Martin Eden", roman de Jack London. La narratrice du prix Goncourt 2024, "Houris" de Kamel Daoud, est incarnée par Lola Naymark, moins connue.

Mais des productions de ce genre, assez ou très onéreuses, ont un avenir incertain parmi les livres audio, qui font désormais de plus en plus souvent appel à l'intelligence artificielle (IA). Le Festival du livre de Paris, du 11 au 13 avril, a été l'occasion de deux annonces en ce sens.

Librinova, numéro un français de l'auto-édition, a ainsi dit adopter "la technologie de clonage vocal, qui permet d'obtenir une qualité largement supérieure à celle des voix synthétiques, souvent trop robotiques".

Un auteur enregistre la lecture d'une petite partie seulement de son livre et l'IA va extrapoler l'autre partie.

- "Il faut de tout" -

Spotify, le numéro un mondial du streaming, a lui indiqué qu'il investissait un million d'euros pour "des livres narrés par la voix de synthèse", autrement dit une machine qui imite, de plus en plus fidèlement, la voix humaine.

Et d'expliquer: "Les coûts importants de production et l'adoption encore naissante de l'usage du livre audio ont eu pour conséquences de limiter l'offre et le catalogue existant en français".

Spotify indique clairement à ses utilisateurs quelle voix leur fait la lecture. À eux de savoir s'ils acceptent qu'elle soit artificielle.

La plateforme suédoise n'abandonne pas les livres intégralement lus par un humain. "Ils viennent aider les éditeurs en finançant une partie de la production. Pour qu'un marché se développe et soit mature, il faut de tout", souligne auprès de l'AFP le directeur général de Hugo Publishing, Arthur de Saint-Vincent.

Cet éditeur, qui s'est imposé comme le numéro un de la romance en France, a pour sa part annoncé une offensive dans le livre audio, sans IA de son côté. Avec sa maison mère Glénat, il proposera 200 nouveaux titres dans les trois ans à venir.

"Nous en sommes à un stade de développement où nous pouvons investir dans une production de qualité. Donc on veut choisir les voix, travailler avec des comédiens et, avec le partenaire que nous avons choisi, le studio Blynd à Lyon, être intransigeants à chaque fois", avance le patron de Hugo.

- Monotonie -

Tout le monde n'a toutefois pas la trésorerie pour suivre.

En 2021, le numéro un du livre audio dans le monde, Audible, filiale d'Amazon, écrivait sur son site internet français: "Au départ, les livres audio utilisaient la synthèse vocale, c'est-à-dire une voix générée par ordinateur. Aujourd'hui, la voix humaine est privilégiée, car elle permet une plus grande proximité avec le lecteur, plus de chaleur et une meilleure intonation".

Quatre ans plus tard, la recherche "virtual voice" ("voix artificielle") sur son catalogue anglophone donne "plus de 50.000 résultats". L'immense majorité des titres sont signés d'auteurs mal ou pas connus.

La qualité de cette lecture laisse des appréciations contrastées, tantôt enthousiastes sur les progrès rapides de cette technologie, tantôt sceptiques sur ses limitations.

"Je ne pense pas que la narration par IA soit bonne avec les émotions des personnages, hélas", a par exemple commenté sur X Alisanya, autrice anglophone de romans "fantasy" autoédités sur Amazon.

Les voix de synthèse ne bafouillent jamais et commettent de moins en moins d'erreurs dans la prononciation des noms propres. À l'intérieur d'une phrase, elles ont des modulations. Mais sur la longueur elles peuvent devenir monotones: elles ne savent pas (encore) accélérer ou ralentir, monter ou baisser l'intensité, s'agacer, s'étrangler, s'essouffler ni sangloter.

I.Ko--ThChM