The China Mail - L'avenir incertain de la lecture humaine dans le livre audio

USD -
AED 3.6731
AFN 71.021929
ALL 86.757891
AMD 388.845938
ANG 1.80229
AOA 916.00013
ARS 1164.995901
AUD 1.563184
AWG 1.8025
AZN 1.695628
BAM 1.718274
BBD 2.002838
BDT 121.45998
BGN 1.719885
BHD 0.376949
BIF 2973.111879
BMD 1
BND 1.309923
BOB 6.907155
BRL 5.620603
BSD 0.999627
BTN 85.145488
BWP 13.647565
BYN 3.271381
BYR 19600
BZD 2.008021
CAD 1.384205
CDF 2877.999668
CHF 0.82343
CLF 0.024644
CLP 945.690094
CNY 7.2695
CNH 7.26779
COP 4197
CRC 505.357119
CUC 1
CUP 26.5
CVE 96.873243
CZK 21.912502
DJF 178.012449
DKK 6.56327
DOP 58.908545
DZD 132.536245
EGP 50.806099
ERN 15
ETB 133.81045
EUR 0.879204
FJD 2.290499
FKP 0.746656
GBP 0.746705
GEL 2.74497
GGP 0.746656
GHS 14.294876
GIP 0.746656
GMD 71.501438
GNF 8658.065706
GTQ 7.698728
GYD 209.76244
HKD 7.757825
HNL 25.941268
HRK 6.627056
HTG 130.799
HUF 355.493505
IDR 16711.5
ILS 3.62415
IMP 0.746656
INR 85.23945
IQD 1309.571398
IRR 42100.000327
ISK 128.449891
JEP 0.746656
JMD 158.35182
JOD 0.709197
JPY 142.383503
KES 129.196076
KGS 87.449716
KHR 4001.774662
KMF 432.24966
KPW 900.101764
KRW 1428.525013
KWD 0.30626
KYD 0.833044
KZT 511.344318
LAK 21622.072771
LBP 89567.707899
LKR 299.446072
LRD 199.931473
LSL 18.549157
LTL 2.95274
LVL 0.60489
LYD 5.468994
MAD 9.272737
MDL 17.203829
MGA 4511.41031
MKD 54.139301
MMK 2099.785163
MNT 3572.381038
MOP 7.98763
MRU 39.575655
MUR 45.198647
MVR 15.39652
MWK 1733.40069
MXN 19.5658
MYR 4.315499
MZN 64.009882
NAD 18.549157
NGN 1601.520135
NIO 36.785022
NOK 10.381755
NPR 136.237321
NZD 1.68704
OMR 0.385003
PAB 0.999613
PEN 3.664973
PGK 4.141482
PHP 55.902622
PKR 280.826287
PLN 3.752184
PYG 8005.376746
QAR 3.644223
RON 4.377995
RSD 102.966435
RUB 81.997213
RWF 1428.979332
SAR 3.751083
SBD 8.361298
SCR 14.223739
SDG 600.500677
SEK 9.64578
SGD 1.307315
SHP 0.785843
SLE 22.75026
SLL 20969.483762
SOS 571.328164
SRD 36.849852
STD 20697.981008
SVC 8.746876
SYP 13001.961096
SZL 18.542907
THB 33.415978
TJS 10.555936
TMT 3.51
TND 2.990231
TOP 2.342098
TRY 38.476596
TTD 6.782431
TWD 32.039744
TZS 2690.000086
UAH 41.530014
UGX 3663.550745
UYU 42.090559
UZS 12943.724275
VES 86.54811
VND 26005
VUV 121.306988
WST 2.770092
XAF 576.298184
XAG 0.030327
XAU 0.000302
XCD 2.70255
XDR 0.71673
XOF 576.29312
XPF 104.776254
YER 245.050464
ZAR 18.56875
ZMK 9001.189716
ZMW 27.965227
ZWL 321.999592
  • AEX

    2.0100

    874.74

    +0.23%

  • BEL20

    43.7600

    4376.51

    +1.01%

  • PX1

    -18.1800

    7555.87

    -0.24%

  • ISEQ

    165.4400

    10377.75

    +1.62%

  • OSEBX

    4.8400

    1472.35

    +0.33%

  • PSI20

    94.1600

    6967.27

    +1.37%

  • ENTEC

    -5.8300

    1416.23

    -0.41%

  • BIOTK

    51.5000

    2805.66

    +1.87%

  • N150

    19.5700

    3393.83

    +0.58%

L'avenir incertain de la lecture humaine dans le livre audio
L'avenir incertain de la lecture humaine dans le livre audio / Photo: © AFP/Archives

L'avenir incertain de la lecture humaine dans le livre audio

Faire lire intégralement un livre en vue de sa version audio coûte cher, trop cher pour certains promoteurs de ce format. Alors ils investissent dans le clonage de voix et les voix de synthèse.

Taille du texte:

Nicolas Sarkozy, par exemple, a enregistré en 2021 plus de 13 heures de ses mémoires de président, "Le Temps des tempêtes". Barack Obama a fait plus fort avec "Une terre promise" en 2020: 29 heures.

D'autres livres sont lus par des comédiens. Denis Podalydès a prêté sa voix à "Martin Eden", roman de Jack London. La narratrice du prix Goncourt 2024, "Houris" de Kamel Daoud, est incarnée par Lola Naymark, moins connue.

Mais des productions de ce genre, assez ou très onéreuses, ont un avenir incertain parmi les livres audio, qui font désormais de plus en plus souvent appel à l'intelligence artificielle (IA). Le Festival du livre de Paris, du 11 au 13 avril, a été l'occasion de deux annonces en ce sens.

Librinova, numéro un français de l'auto-édition, a ainsi dit adopter "la technologie de clonage vocal, qui permet d'obtenir une qualité largement supérieure à celle des voix synthétiques, souvent trop robotiques".

Un auteur enregistre la lecture d'une petite partie seulement de son livre et l'IA va extrapoler l'autre partie.

- "Il faut de tout" -

Spotify, le numéro un mondial du streaming, a lui indiqué qu'il investissait un million d'euros pour "des livres narrés par la voix de synthèse", autrement dit une machine qui imite, de plus en plus fidèlement, la voix humaine.

Et d'expliquer: "Les coûts importants de production et l'adoption encore naissante de l'usage du livre audio ont eu pour conséquences de limiter l'offre et le catalogue existant en français".

Spotify indique clairement à ses utilisateurs quelle voix leur fait la lecture. À eux de savoir s'ils acceptent qu'elle soit artificielle.

La plateforme suédoise n'abandonne pas les livres intégralement lus par un humain. "Ils viennent aider les éditeurs en finançant une partie de la production. Pour qu'un marché se développe et soit mature, il faut de tout", souligne auprès de l'AFP le directeur général de Hugo Publishing, Arthur de Saint-Vincent.

Cet éditeur, qui s'est imposé comme le numéro un de la romance en France, a pour sa part annoncé une offensive dans le livre audio, sans IA de son côté. Avec sa maison mère Glénat, il proposera 200 nouveaux titres dans les trois ans à venir.

"Nous en sommes à un stade de développement où nous pouvons investir dans une production de qualité. Donc on veut choisir les voix, travailler avec des comédiens et, avec le partenaire que nous avons choisi, le studio Blynd à Lyon, être intransigeants à chaque fois", avance le patron de Hugo.

- Monotonie -

Tout le monde n'a toutefois pas la trésorerie pour suivre.

En 2021, le numéro un du livre audio dans le monde, Audible, filiale d'Amazon, écrivait sur son site internet français: "Au départ, les livres audio utilisaient la synthèse vocale, c'est-à-dire une voix générée par ordinateur. Aujourd'hui, la voix humaine est privilégiée, car elle permet une plus grande proximité avec le lecteur, plus de chaleur et une meilleure intonation".

Quatre ans plus tard, la recherche "virtual voice" ("voix artificielle") sur son catalogue anglophone donne "plus de 50.000 résultats". L'immense majorité des titres sont signés d'auteurs mal ou pas connus.

La qualité de cette lecture laisse des appréciations contrastées, tantôt enthousiastes sur les progrès rapides de cette technologie, tantôt sceptiques sur ses limitations.

"Je ne pense pas que la narration par IA soit bonne avec les émotions des personnages, hélas", a par exemple commenté sur X Alisanya, autrice anglophone de romans "fantasy" autoédités sur Amazon.

Les voix de synthèse ne bafouillent jamais et commettent de moins en moins d'erreurs dans la prononciation des noms propres. À l'intérieur d'une phrase, elles ont des modulations. Mais sur la longueur elles peuvent devenir monotones: elles ne savent pas (encore) accélérer ou ralentir, monter ou baisser l'intensité, s'agacer, s'étrangler, s'essouffler ni sangloter.

I.Ko--ThChM