Loading…

Techniques de synthèse vocale neuronale à l'épreuve des données d'apprentissage non dédiées : les livres audio amateurs en français

Dans cet article,nous nous intéressons à la capacité des systèmes de synthèse vocale neuronale à tirer parti des données non dédiées en langue française. En effet, ces dernières sont abondantes mais leurs conditions d'enregistrement sont hétérogènes, alors que les données dédiées à la synthèse...

Full description

Saved in:
Bibliographic Details
Published in:Revue TAL 2022-01, Vol.63 (2), p.41
Main Authors: Sini, Aghilas, Wadoux, Lily, Perquin, Antoine, Vidal, Gaëlle, Guennec, David, Lolive, Damien, Alain, Pierre, Barbot, Nelly, Chevelu, Jonathan, Delhay, Arnaud
Format: Article
Language:fre
Subjects:
Online Access:Get full text
Tags: Add Tag
No Tags, Be the first to tag this record!
cited_by
cites
container_end_page
container_issue 2
container_start_page 41
container_title Revue TAL
container_volume 63
creator Sini, Aghilas
Wadoux, Lily
Perquin, Antoine
Vidal, Gaëlle
Guennec, David
Lolive, Damien
Alain, Pierre
Barbot, Nelly
Chevelu, Jonathan
Delhay, Arnaud
description Dans cet article,nous nous intéressons à la capacité des systèmes de synthèse vocale neuronale à tirer parti des données non dédiées en langue française. En effet, ces dernières sont abondantes mais leurs conditions d'enregistrement sont hétérogènes, alors que les données dédiées à la synthèse de parole (de meilleure qualité) sont en quantité limitée et difficiles à collecter. Leur impact est mesuré sur trois systèmes : synthèse de parole monolocuteur, clonage de voix et conversion de voix. Des évaluations objectives et subjectives sur la reproduction de la voix du locuteur et sur la qualité des échantillons synthétisés ont été menées. Elles montrent qu'il est difficile de produire une synthèse vocale de qualité comparable avec l'état de l'art dans certaines conditions d'enregistrement ou pour des voix atypiques.
format article
fullrecord <record><control><sourceid>proquest</sourceid><recordid>TN_cdi_proquest_journals_2835561387</recordid><sourceformat>XML</sourceformat><sourcesystem>PC</sourcesystem><sourcerecordid>2835561387</sourcerecordid><originalsourceid>FETCH-proquest_journals_28355613873</originalsourceid><addsrcrecordid>eNqNjkFuwkAMRUeVKoFa7mCpC1ZICVFCwrai4gDskUsMDJp6wjgTiSv0FOwg55iLdYI4QDf-X_bz139R47Qq8llSJcVITUT0d5KlVVUs5uVY_W5od2R99iRQE8iF22O4C0Fnd2gImLyzPLhwBTMNfePIdxTZyFvm0A9mik3cc6tF8BCfLEMd-lo_rkswcRrduSjoa20Bf7CNwQLEsHfI4YZa3tXrHo3Q5Klv6uNrtflczxpnh37t9mS9i11kOy-zPC_SrFxk_6P-APuQWZU</addsrcrecordid><sourcetype>Aggregation Database</sourcetype><iscdi>true</iscdi><recordtype>article</recordtype><pqid>2835561387</pqid></control><display><type>article</type><title>Techniques de synthèse vocale neuronale à l'épreuve des données d'apprentissage non dédiées : les livres audio amateurs en français</title><source>EBSCOhost MLA International Bibliography With Full Text</source><source>Linguistics and Language Behavior Abstracts (LLBA)</source><creator>Sini, Aghilas ; Wadoux, Lily ; Perquin, Antoine ; Vidal, Gaëlle ; Guennec, David ; Lolive, Damien ; Alain, Pierre ; Barbot, Nelly ; Chevelu, Jonathan ; Delhay, Arnaud</creator><creatorcontrib>Sini, Aghilas ; Wadoux, Lily ; Perquin, Antoine ; Vidal, Gaëlle ; Guennec, David ; Lolive, Damien ; Alain, Pierre ; Barbot, Nelly ; Chevelu, Jonathan ; Delhay, Arnaud</creatorcontrib><description>Dans cet article,nous nous intéressons à la capacité des systèmes de synthèse vocale neuronale à tirer parti des données non dédiées en langue française. En effet, ces dernières sont abondantes mais leurs conditions d'enregistrement sont hétérogènes, alors que les données dédiées à la synthèse de parole (de meilleure qualité) sont en quantité limitée et difficiles à collecter. Leur impact est mesuré sur trois systèmes : synthèse de parole monolocuteur, clonage de voix et conversion de voix. Des évaluations objectives et subjectives sur la reproduction de la voix du locuteur et sur la qualité des échantillons synthétisés ont été menées. Elles montrent qu'il est difficile de produire une synthèse vocale de qualité comparable avec l'état de l'art dans certaines conditions d'enregistrement ou pour des voix atypiques.</description><identifier>EISSN: 1965-0906</identifier><language>fre</language><publisher>Paris: ATALA (Association pour le Traitement Automatique des Langues)</publisher><subject>Audiobooks ; French language ; Speech synthesis</subject><ispartof>Revue TAL, 2022-01, Vol.63 (2), p.41</ispartof><rights>Copyright ATALA (Association pour le Traitement Automatique des Langues) 2022</rights><lds50>peer_reviewed</lds50><woscitedreferencessubscribed>false</woscitedreferencessubscribed></display><links><openurl>$$Topenurl_article</openurl><openurlfulltext>$$Topenurlfull_article</openurlfulltext><thumbnail>$$Tsyndetics_thumb_exl</thumbnail><link.rule.ids>314,776,780,31248</link.rule.ids></links><search><creatorcontrib>Sini, Aghilas</creatorcontrib><creatorcontrib>Wadoux, Lily</creatorcontrib><creatorcontrib>Perquin, Antoine</creatorcontrib><creatorcontrib>Vidal, Gaëlle</creatorcontrib><creatorcontrib>Guennec, David</creatorcontrib><creatorcontrib>Lolive, Damien</creatorcontrib><creatorcontrib>Alain, Pierre</creatorcontrib><creatorcontrib>Barbot, Nelly</creatorcontrib><creatorcontrib>Chevelu, Jonathan</creatorcontrib><creatorcontrib>Delhay, Arnaud</creatorcontrib><title>Techniques de synthèse vocale neuronale à l'épreuve des données d'apprentissage non dédiées : les livres audio amateurs en français</title><title>Revue TAL</title><description>Dans cet article,nous nous intéressons à la capacité des systèmes de synthèse vocale neuronale à tirer parti des données non dédiées en langue française. En effet, ces dernières sont abondantes mais leurs conditions d'enregistrement sont hétérogènes, alors que les données dédiées à la synthèse de parole (de meilleure qualité) sont en quantité limitée et difficiles à collecter. Leur impact est mesuré sur trois systèmes : synthèse de parole monolocuteur, clonage de voix et conversion de voix. Des évaluations objectives et subjectives sur la reproduction de la voix du locuteur et sur la qualité des échantillons synthétisés ont été menées. Elles montrent qu'il est difficile de produire une synthèse vocale de qualité comparable avec l'état de l'art dans certaines conditions d'enregistrement ou pour des voix atypiques.</description><subject>Audiobooks</subject><subject>French language</subject><subject>Speech synthesis</subject><issn>1965-0906</issn><fulltext>true</fulltext><rsrctype>article</rsrctype><creationdate>2022</creationdate><recordtype>article</recordtype><sourceid>7T9</sourceid><recordid>eNqNjkFuwkAMRUeVKoFa7mCpC1ZICVFCwrai4gDskUsMDJp6wjgTiSv0FOwg55iLdYI4QDf-X_bz139R47Qq8llSJcVITUT0d5KlVVUs5uVY_W5od2R99iRQE8iF22O4C0Fnd2gImLyzPLhwBTMNfePIdxTZyFvm0A9mik3cc6tF8BCfLEMd-lo_rkswcRrduSjoa20Bf7CNwQLEsHfI4YZa3tXrHo3Q5Klv6uNrtflczxpnh37t9mS9i11kOy-zPC_SrFxk_6P-APuQWZU</recordid><startdate>20220101</startdate><enddate>20220101</enddate><creator>Sini, Aghilas</creator><creator>Wadoux, Lily</creator><creator>Perquin, Antoine</creator><creator>Vidal, Gaëlle</creator><creator>Guennec, David</creator><creator>Lolive, Damien</creator><creator>Alain, Pierre</creator><creator>Barbot, Nelly</creator><creator>Chevelu, Jonathan</creator><creator>Delhay, Arnaud</creator><general>ATALA (Association pour le Traitement Automatique des Langues)</general><scope>7T9</scope></search><sort><creationdate>20220101</creationdate><title>Techniques de synthèse vocale neuronale à l'épreuve des données d'apprentissage non dédiées : les livres audio amateurs en français</title><author>Sini, Aghilas ; Wadoux, Lily ; Perquin, Antoine ; Vidal, Gaëlle ; Guennec, David ; Lolive, Damien ; Alain, Pierre ; Barbot, Nelly ; Chevelu, Jonathan ; Delhay, Arnaud</author></sort><facets><frbrtype>5</frbrtype><frbrgroupid>cdi_FETCH-proquest_journals_28355613873</frbrgroupid><rsrctype>articles</rsrctype><prefilter>articles</prefilter><language>fre</language><creationdate>2022</creationdate><topic>Audiobooks</topic><topic>French language</topic><topic>Speech synthesis</topic><toplevel>peer_reviewed</toplevel><toplevel>online_resources</toplevel><creatorcontrib>Sini, Aghilas</creatorcontrib><creatorcontrib>Wadoux, Lily</creatorcontrib><creatorcontrib>Perquin, Antoine</creatorcontrib><creatorcontrib>Vidal, Gaëlle</creatorcontrib><creatorcontrib>Guennec, David</creatorcontrib><creatorcontrib>Lolive, Damien</creatorcontrib><creatorcontrib>Alain, Pierre</creatorcontrib><creatorcontrib>Barbot, Nelly</creatorcontrib><creatorcontrib>Chevelu, Jonathan</creatorcontrib><creatorcontrib>Delhay, Arnaud</creatorcontrib><collection>Linguistics and Language Behavior Abstracts (LLBA)</collection><jtitle>Revue TAL</jtitle></facets><delivery><delcategory>Remote Search Resource</delcategory><fulltext>fulltext</fulltext></delivery><addata><au>Sini, Aghilas</au><au>Wadoux, Lily</au><au>Perquin, Antoine</au><au>Vidal, Gaëlle</au><au>Guennec, David</au><au>Lolive, Damien</au><au>Alain, Pierre</au><au>Barbot, Nelly</au><au>Chevelu, Jonathan</au><au>Delhay, Arnaud</au><format>journal</format><genre>article</genre><ristype>JOUR</ristype><atitle>Techniques de synthèse vocale neuronale à l'épreuve des données d'apprentissage non dédiées : les livres audio amateurs en français</atitle><jtitle>Revue TAL</jtitle><date>2022-01-01</date><risdate>2022</risdate><volume>63</volume><issue>2</issue><spage>41</spage><pages>41-</pages><eissn>1965-0906</eissn><abstract>Dans cet article,nous nous intéressons à la capacité des systèmes de synthèse vocale neuronale à tirer parti des données non dédiées en langue française. En effet, ces dernières sont abondantes mais leurs conditions d'enregistrement sont hétérogènes, alors que les données dédiées à la synthèse de parole (de meilleure qualité) sont en quantité limitée et difficiles à collecter. Leur impact est mesuré sur trois systèmes : synthèse de parole monolocuteur, clonage de voix et conversion de voix. Des évaluations objectives et subjectives sur la reproduction de la voix du locuteur et sur la qualité des échantillons synthétisés ont été menées. Elles montrent qu'il est difficile de produire une synthèse vocale de qualité comparable avec l'état de l'art dans certaines conditions d'enregistrement ou pour des voix atypiques.</abstract><cop>Paris</cop><pub>ATALA (Association pour le Traitement Automatique des Langues)</pub></addata></record>
fulltext fulltext
identifier EISSN: 1965-0906
ispartof Revue TAL, 2022-01, Vol.63 (2), p.41
issn 1965-0906
language fre
recordid cdi_proquest_journals_2835561387
source EBSCOhost MLA International Bibliography With Full Text; Linguistics and Language Behavior Abstracts (LLBA)
subjects Audiobooks
French language
Speech synthesis
title Techniques de synthèse vocale neuronale à l'épreuve des données d'apprentissage non dédiées : les livres audio amateurs en français
url http://sfxeu10.hosted.exlibrisgroup.com/loughborough?ctx_ver=Z39.88-2004&ctx_enc=info:ofi/enc:UTF-8&ctx_tim=2025-01-28T00%3A14%3A59IST&url_ver=Z39.88-2004&url_ctx_fmt=infofi/fmt:kev:mtx:ctx&rfr_id=info:sid/primo.exlibrisgroup.com:primo3-Article-proquest&rft_val_fmt=info:ofi/fmt:kev:mtx:journal&rft.genre=article&rft.atitle=Techniques%20de%20synth%C3%A8se%20vocale%20neuronale%20%C3%A0%20l'%C3%A9preuve%20des%20donn%C3%A9es%20d'apprentissage%20non%20d%C3%A9di%C3%A9es%20:%20les%20livres%20audio%20amateurs%20en%20fran%C3%A7ais&rft.jtitle=Revue%20TAL&rft.au=Sini,%20Aghilas&rft.date=2022-01-01&rft.volume=63&rft.issue=2&rft.spage=41&rft.pages=41-&rft.eissn=1965-0906&rft_id=info:doi/&rft_dat=%3Cproquest%3E2835561387%3C/proquest%3E%3Cgrp_id%3Ecdi_FETCH-proquest_journals_28355613873%3C/grp_id%3E%3Coa%3E%3C/oa%3E%3Curl%3E%3C/url%3E&rft_id=info:oai/&rft_pqid=2835561387&rft_id=info:pmid/&rfr_iscdi=true