Loading…
Techniques de synthèse vocale neuronale à l'épreuve des données d'apprentissage non dédiées : les livres audio amateurs en français
Dans cet article,nous nous intéressons à la capacité des systèmes de synthèse vocale neuronale à tirer parti des données non dédiées en langue française. En effet, ces dernières sont abondantes mais leurs conditions d'enregistrement sont hétérogènes, alors que les données dédiées à la synthèse...
Saved in:
Published in: | Revue TAL 2022-01, Vol.63 (2), p.41 |
---|---|
Main Authors: | , , , , , , , , , |
Format: | Article |
Language: | fre |
Subjects: | |
Online Access: | Get full text |
Tags: |
Add Tag
No Tags, Be the first to tag this record!
|
cited_by | |
---|---|
cites | |
container_end_page | |
container_issue | 2 |
container_start_page | 41 |
container_title | Revue TAL |
container_volume | 63 |
creator | Sini, Aghilas Wadoux, Lily Perquin, Antoine Vidal, Gaëlle Guennec, David Lolive, Damien Alain, Pierre Barbot, Nelly Chevelu, Jonathan Delhay, Arnaud |
description | Dans cet article,nous nous intéressons à la capacité des systèmes de synthèse vocale neuronale à tirer parti des données non dédiées en langue française. En effet, ces dernières sont abondantes mais leurs conditions d'enregistrement sont hétérogènes, alors que les données dédiées à la synthèse de parole (de meilleure qualité) sont en quantité limitée et difficiles à collecter. Leur impact est mesuré sur trois systèmes : synthèse de parole monolocuteur, clonage de voix et conversion de voix. Des évaluations objectives et subjectives sur la reproduction de la voix du locuteur et sur la qualité des échantillons synthétisés ont été menées. Elles montrent qu'il est difficile de produire une synthèse vocale de qualité comparable avec l'état de l'art dans certaines conditions d'enregistrement ou pour des voix atypiques. |
format | article |
fullrecord | <record><control><sourceid>proquest</sourceid><recordid>TN_cdi_proquest_journals_2835561387</recordid><sourceformat>XML</sourceformat><sourcesystem>PC</sourcesystem><sourcerecordid>2835561387</sourcerecordid><originalsourceid>FETCH-proquest_journals_28355613873</originalsourceid><addsrcrecordid>eNqNjkFuwkAMRUeVKoFa7mCpC1ZICVFCwrai4gDskUsMDJp6wjgTiSv0FOwg55iLdYI4QDf-X_bz139R47Qq8llSJcVITUT0d5KlVVUs5uVY_W5od2R99iRQE8iF22O4C0Fnd2gImLyzPLhwBTMNfePIdxTZyFvm0A9mik3cc6tF8BCfLEMd-lo_rkswcRrduSjoa20Bf7CNwQLEsHfI4YZa3tXrHo3Q5Klv6uNrtflczxpnh37t9mS9i11kOy-zPC_SrFxk_6P-APuQWZU</addsrcrecordid><sourcetype>Aggregation Database</sourcetype><iscdi>true</iscdi><recordtype>article</recordtype><pqid>2835561387</pqid></control><display><type>article</type><title>Techniques de synthèse vocale neuronale à l'épreuve des données d'apprentissage non dédiées : les livres audio amateurs en français</title><source>EBSCOhost MLA International Bibliography With Full Text</source><source>Linguistics and Language Behavior Abstracts (LLBA)</source><creator>Sini, Aghilas ; Wadoux, Lily ; Perquin, Antoine ; Vidal, Gaëlle ; Guennec, David ; Lolive, Damien ; Alain, Pierre ; Barbot, Nelly ; Chevelu, Jonathan ; Delhay, Arnaud</creator><creatorcontrib>Sini, Aghilas ; Wadoux, Lily ; Perquin, Antoine ; Vidal, Gaëlle ; Guennec, David ; Lolive, Damien ; Alain, Pierre ; Barbot, Nelly ; Chevelu, Jonathan ; Delhay, Arnaud</creatorcontrib><description>Dans cet article,nous nous intéressons à la capacité des systèmes de synthèse vocale neuronale à tirer parti des données non dédiées en langue française. En effet, ces dernières sont abondantes mais leurs conditions d'enregistrement sont hétérogènes, alors que les données dédiées à la synthèse de parole (de meilleure qualité) sont en quantité limitée et difficiles à collecter. Leur impact est mesuré sur trois systèmes : synthèse de parole monolocuteur, clonage de voix et conversion de voix. Des évaluations objectives et subjectives sur la reproduction de la voix du locuteur et sur la qualité des échantillons synthétisés ont été menées. Elles montrent qu'il est difficile de produire une synthèse vocale de qualité comparable avec l'état de l'art dans certaines conditions d'enregistrement ou pour des voix atypiques.</description><identifier>EISSN: 1965-0906</identifier><language>fre</language><publisher>Paris: ATALA (Association pour le Traitement Automatique des Langues)</publisher><subject>Audiobooks ; French language ; Speech synthesis</subject><ispartof>Revue TAL, 2022-01, Vol.63 (2), p.41</ispartof><rights>Copyright ATALA (Association pour le Traitement Automatique des Langues) 2022</rights><lds50>peer_reviewed</lds50><woscitedreferencessubscribed>false</woscitedreferencessubscribed></display><links><openurl>$$Topenurl_article</openurl><openurlfulltext>$$Topenurlfull_article</openurlfulltext><thumbnail>$$Tsyndetics_thumb_exl</thumbnail><link.rule.ids>314,776,780,31248</link.rule.ids></links><search><creatorcontrib>Sini, Aghilas</creatorcontrib><creatorcontrib>Wadoux, Lily</creatorcontrib><creatorcontrib>Perquin, Antoine</creatorcontrib><creatorcontrib>Vidal, Gaëlle</creatorcontrib><creatorcontrib>Guennec, David</creatorcontrib><creatorcontrib>Lolive, Damien</creatorcontrib><creatorcontrib>Alain, Pierre</creatorcontrib><creatorcontrib>Barbot, Nelly</creatorcontrib><creatorcontrib>Chevelu, Jonathan</creatorcontrib><creatorcontrib>Delhay, Arnaud</creatorcontrib><title>Techniques de synthèse vocale neuronale à l'épreuve des données d'apprentissage non dédiées : les livres audio amateurs en français</title><title>Revue TAL</title><description>Dans cet article,nous nous intéressons à la capacité des systèmes de synthèse vocale neuronale à tirer parti des données non dédiées en langue française. En effet, ces dernières sont abondantes mais leurs conditions d'enregistrement sont hétérogènes, alors que les données dédiées à la synthèse de parole (de meilleure qualité) sont en quantité limitée et difficiles à collecter. Leur impact est mesuré sur trois systèmes : synthèse de parole monolocuteur, clonage de voix et conversion de voix. Des évaluations objectives et subjectives sur la reproduction de la voix du locuteur et sur la qualité des échantillons synthétisés ont été menées. Elles montrent qu'il est difficile de produire une synthèse vocale de qualité comparable avec l'état de l'art dans certaines conditions d'enregistrement ou pour des voix atypiques.</description><subject>Audiobooks</subject><subject>French language</subject><subject>Speech synthesis</subject><issn>1965-0906</issn><fulltext>true</fulltext><rsrctype>article</rsrctype><creationdate>2022</creationdate><recordtype>article</recordtype><sourceid>7T9</sourceid><recordid>eNqNjkFuwkAMRUeVKoFa7mCpC1ZICVFCwrai4gDskUsMDJp6wjgTiSv0FOwg55iLdYI4QDf-X_bz139R47Qq8llSJcVITUT0d5KlVVUs5uVY_W5od2R99iRQE8iF22O4C0Fnd2gImLyzPLhwBTMNfePIdxTZyFvm0A9mik3cc6tF8BCfLEMd-lo_rkswcRrduSjoa20Bf7CNwQLEsHfI4YZa3tXrHo3Q5Klv6uNrtflczxpnh37t9mS9i11kOy-zPC_SrFxk_6P-APuQWZU</recordid><startdate>20220101</startdate><enddate>20220101</enddate><creator>Sini, Aghilas</creator><creator>Wadoux, Lily</creator><creator>Perquin, Antoine</creator><creator>Vidal, Gaëlle</creator><creator>Guennec, David</creator><creator>Lolive, Damien</creator><creator>Alain, Pierre</creator><creator>Barbot, Nelly</creator><creator>Chevelu, Jonathan</creator><creator>Delhay, Arnaud</creator><general>ATALA (Association pour le Traitement Automatique des Langues)</general><scope>7T9</scope></search><sort><creationdate>20220101</creationdate><title>Techniques de synthèse vocale neuronale à l'épreuve des données d'apprentissage non dédiées : les livres audio amateurs en français</title><author>Sini, Aghilas ; Wadoux, Lily ; Perquin, Antoine ; Vidal, Gaëlle ; Guennec, David ; Lolive, Damien ; Alain, Pierre ; Barbot, Nelly ; Chevelu, Jonathan ; Delhay, Arnaud</author></sort><facets><frbrtype>5</frbrtype><frbrgroupid>cdi_FETCH-proquest_journals_28355613873</frbrgroupid><rsrctype>articles</rsrctype><prefilter>articles</prefilter><language>fre</language><creationdate>2022</creationdate><topic>Audiobooks</topic><topic>French language</topic><topic>Speech synthesis</topic><toplevel>peer_reviewed</toplevel><toplevel>online_resources</toplevel><creatorcontrib>Sini, Aghilas</creatorcontrib><creatorcontrib>Wadoux, Lily</creatorcontrib><creatorcontrib>Perquin, Antoine</creatorcontrib><creatorcontrib>Vidal, Gaëlle</creatorcontrib><creatorcontrib>Guennec, David</creatorcontrib><creatorcontrib>Lolive, Damien</creatorcontrib><creatorcontrib>Alain, Pierre</creatorcontrib><creatorcontrib>Barbot, Nelly</creatorcontrib><creatorcontrib>Chevelu, Jonathan</creatorcontrib><creatorcontrib>Delhay, Arnaud</creatorcontrib><collection>Linguistics and Language Behavior Abstracts (LLBA)</collection><jtitle>Revue TAL</jtitle></facets><delivery><delcategory>Remote Search Resource</delcategory><fulltext>fulltext</fulltext></delivery><addata><au>Sini, Aghilas</au><au>Wadoux, Lily</au><au>Perquin, Antoine</au><au>Vidal, Gaëlle</au><au>Guennec, David</au><au>Lolive, Damien</au><au>Alain, Pierre</au><au>Barbot, Nelly</au><au>Chevelu, Jonathan</au><au>Delhay, Arnaud</au><format>journal</format><genre>article</genre><ristype>JOUR</ristype><atitle>Techniques de synthèse vocale neuronale à l'épreuve des données d'apprentissage non dédiées : les livres audio amateurs en français</atitle><jtitle>Revue TAL</jtitle><date>2022-01-01</date><risdate>2022</risdate><volume>63</volume><issue>2</issue><spage>41</spage><pages>41-</pages><eissn>1965-0906</eissn><abstract>Dans cet article,nous nous intéressons à la capacité des systèmes de synthèse vocale neuronale à tirer parti des données non dédiées en langue française. En effet, ces dernières sont abondantes mais leurs conditions d'enregistrement sont hétérogènes, alors que les données dédiées à la synthèse de parole (de meilleure qualité) sont en quantité limitée et difficiles à collecter. Leur impact est mesuré sur trois systèmes : synthèse de parole monolocuteur, clonage de voix et conversion de voix. Des évaluations objectives et subjectives sur la reproduction de la voix du locuteur et sur la qualité des échantillons synthétisés ont été menées. Elles montrent qu'il est difficile de produire une synthèse vocale de qualité comparable avec l'état de l'art dans certaines conditions d'enregistrement ou pour des voix atypiques.</abstract><cop>Paris</cop><pub>ATALA (Association pour le Traitement Automatique des Langues)</pub></addata></record> |
fulltext | fulltext |
identifier | EISSN: 1965-0906 |
ispartof | Revue TAL, 2022-01, Vol.63 (2), p.41 |
issn | 1965-0906 |
language | fre |
recordid | cdi_proquest_journals_2835561387 |
source | EBSCOhost MLA International Bibliography With Full Text; Linguistics and Language Behavior Abstracts (LLBA) |
subjects | Audiobooks French language Speech synthesis |
title | Techniques de synthèse vocale neuronale à l'épreuve des données d'apprentissage non dédiées : les livres audio amateurs en français |
url | http://sfxeu10.hosted.exlibrisgroup.com/loughborough?ctx_ver=Z39.88-2004&ctx_enc=info:ofi/enc:UTF-8&ctx_tim=2025-01-28T00%3A14%3A59IST&url_ver=Z39.88-2004&url_ctx_fmt=infofi/fmt:kev:mtx:ctx&rfr_id=info:sid/primo.exlibrisgroup.com:primo3-Article-proquest&rft_val_fmt=info:ofi/fmt:kev:mtx:journal&rft.genre=article&rft.atitle=Techniques%20de%20synth%C3%A8se%20vocale%20neuronale%20%C3%A0%20l'%C3%A9preuve%20des%20donn%C3%A9es%20d'apprentissage%20non%20d%C3%A9di%C3%A9es%20:%20les%20livres%20audio%20amateurs%20en%20fran%C3%A7ais&rft.jtitle=Revue%20TAL&rft.au=Sini,%20Aghilas&rft.date=2022-01-01&rft.volume=63&rft.issue=2&rft.spage=41&rft.pages=41-&rft.eissn=1965-0906&rft_id=info:doi/&rft_dat=%3Cproquest%3E2835561387%3C/proquest%3E%3Cgrp_id%3Ecdi_FETCH-proquest_journals_28355613873%3C/grp_id%3E%3Coa%3E%3C/oa%3E%3Curl%3E%3C/url%3E&rft_id=info:oai/&rft_pqid=2835561387&rft_id=info:pmid/&rfr_iscdi=true |