Loading…
基于细粒度强化学习增强噪声数据的低资源跨语言摘要
TP391; 跨语言摘要是从源语言文档生成目标语言摘要的任务.最近,端到端跨语言摘要模型通过使用大规模、高质量数据集取得令人瞩目的结果,这些数据集通常是通过将单语摘要语料库翻译成跨语言摘要语料库而构建的.然而,由于低资源语言翻译模型性能有限,翻译噪声会严重降低模型性能.提出一种细粒度强化学习方法解决基于噪声数据的低资源跨语言摘要问题.引入源语言摘要作为黄金信号,减轻翻译后噪声目标摘要的影响.具体来说,通过计算源语言摘要和生成目标语言摘要之间的词相关性和词缺失度设计强化奖励,并将其与交叉熵损失相结合优化跨语言摘要模型.为验证所提出模型性能,构建汉语-越南语和越南语-汉语跨语言摘要数据集.实验结果...
Saved in:
Published in: | 信息与电子工程前沿(英文版) 2024, Vol.25 (1), p.121-后插19 |
---|---|
Main Authors: | , , , , , |
Format: | Article |
Language: | Chinese |
Online Access: | Get full text |
Tags: |
Add Tag
No Tags, Be the first to tag this record!
|
cited_by | |
---|---|
cites | |
container_end_page | 后插19 |
container_issue | 1 |
container_start_page | 121 |
container_title | 信息与电子工程前沿(英文版) |
container_volume | 25 |
creator | 黄于欣 顾怀领 余正涛 高玉梦 潘通 徐佳龙 |
description | TP391; 跨语言摘要是从源语言文档生成目标语言摘要的任务.最近,端到端跨语言摘要模型通过使用大规模、高质量数据集取得令人瞩目的结果,这些数据集通常是通过将单语摘要语料库翻译成跨语言摘要语料库而构建的.然而,由于低资源语言翻译模型性能有限,翻译噪声会严重降低模型性能.提出一种细粒度强化学习方法解决基于噪声数据的低资源跨语言摘要问题.引入源语言摘要作为黄金信号,减轻翻译后噪声目标摘要的影响.具体来说,通过计算源语言摘要和生成目标语言摘要之间的词相关性和词缺失度设计强化奖励,并将其与交叉熵损失相结合优化跨语言摘要模型.为验证所提出模型性能,构建汉语-越南语和越南语-汉语跨语言摘要数据集.实验结果表明,所提出模型在ROUGE分数和BERTScore方面优于其他基线. |
doi_str_mv | 10.1631/FITEE.2300296 |
format | article |
fullrecord | <record><control><sourceid>wanfang_jour</sourceid><recordid>TN_cdi_wanfang_journals_zjdxxbc_e202401010</recordid><sourceformat>XML</sourceformat><sourcesystem>PC</sourcesystem><wanfj_id>zjdxxbc_e202401010</wanfj_id><sourcerecordid>zjdxxbc_e202401010</sourcerecordid><originalsourceid>FETCH-wanfang_journals_zjdxxbc_e2024010103</originalsourceid><addsrcrecordid>eNpjYBA1NNAzNDM21HfzDHF11TMyNjAwsjRjYeA0MrA01bU0tDDhYOAtLs5MMjAyMbA0MTQ15GTweDp_15Ndfc93tz3fNOnprmVP9-x62jPt6dplT3YueLpoHog7c9XTxRueTd3wrHfd81ktT_b2vdja8mzXhBfbV7xYv_bFioZnE2e8WNbIw8CalphTnMoLpbkZtNxcQ5w9dMsT89IS89Ljs_JLi_KAMvFVWSkVFUnJ8alGIHcYAqExSYoBSgFf7Q</addsrcrecordid><sourcetype>Aggregation Database</sourcetype><iscdi>true</iscdi><recordtype>article</recordtype></control><display><type>article</type><title>基于细粒度强化学习增强噪声数据的低资源跨语言摘要</title><source>Springer Nature</source><creator>黄于欣 ; 顾怀领 ; 余正涛 ; 高玉梦 ; 潘通 ; 徐佳龙</creator><creatorcontrib>黄于欣 ; 顾怀领 ; 余正涛 ; 高玉梦 ; 潘通 ; 徐佳龙</creatorcontrib><description>TP391; 跨语言摘要是从源语言文档生成目标语言摘要的任务.最近,端到端跨语言摘要模型通过使用大规模、高质量数据集取得令人瞩目的结果,这些数据集通常是通过将单语摘要语料库翻译成跨语言摘要语料库而构建的.然而,由于低资源语言翻译模型性能有限,翻译噪声会严重降低模型性能.提出一种细粒度强化学习方法解决基于噪声数据的低资源跨语言摘要问题.引入源语言摘要作为黄金信号,减轻翻译后噪声目标摘要的影响.具体来说,通过计算源语言摘要和生成目标语言摘要之间的词相关性和词缺失度设计强化奖励,并将其与交叉熵损失相结合优化跨语言摘要模型.为验证所提出模型性能,构建汉语-越南语和越南语-汉语跨语言摘要数据集.实验结果表明,所提出模型在ROUGE分数和BERTScore方面优于其他基线.</description><identifier>ISSN: 2095-9184</identifier><identifier>DOI: 10.1631/FITEE.2300296</identifier><language>chi</language><publisher>昆明理工大学云南省人工智能重点实验室,中国 昆明市,650504</publisher><ispartof>信息与电子工程前沿(英文版), 2024, Vol.25 (1), p.121-后插19</ispartof><rights>Copyright © Wanfang Data Co. Ltd. All Rights Reserved.</rights><lds50>peer_reviewed</lds50><woscitedreferencessubscribed>false</woscitedreferencessubscribed></display><links><openurl>$$Topenurl_article</openurl><openurlfulltext>$$Topenurlfull_article</openurlfulltext><thumbnail>$$Uhttp://www.wanfangdata.com.cn/images/PeriodicalImages/zjdxxbc-e/zjdxxbc-e.jpg</thumbnail><link.rule.ids>314,776,780,4009,27902,27903,27904</link.rule.ids></links><search><creatorcontrib>黄于欣</creatorcontrib><creatorcontrib>顾怀领</creatorcontrib><creatorcontrib>余正涛</creatorcontrib><creatorcontrib>高玉梦</creatorcontrib><creatorcontrib>潘通</creatorcontrib><creatorcontrib>徐佳龙</creatorcontrib><title>基于细粒度强化学习增强噪声数据的低资源跨语言摘要</title><title>信息与电子工程前沿(英文版)</title><description>TP391; 跨语言摘要是从源语言文档生成目标语言摘要的任务.最近,端到端跨语言摘要模型通过使用大规模、高质量数据集取得令人瞩目的结果,这些数据集通常是通过将单语摘要语料库翻译成跨语言摘要语料库而构建的.然而,由于低资源语言翻译模型性能有限,翻译噪声会严重降低模型性能.提出一种细粒度强化学习方法解决基于噪声数据的低资源跨语言摘要问题.引入源语言摘要作为黄金信号,减轻翻译后噪声目标摘要的影响.具体来说,通过计算源语言摘要和生成目标语言摘要之间的词相关性和词缺失度设计强化奖励,并将其与交叉熵损失相结合优化跨语言摘要模型.为验证所提出模型性能,构建汉语-越南语和越南语-汉语跨语言摘要数据集.实验结果表明,所提出模型在ROUGE分数和BERTScore方面优于其他基线.</description><issn>2095-9184</issn><fulltext>true</fulltext><rsrctype>article</rsrctype><creationdate>2024</creationdate><recordtype>article</recordtype><recordid>eNpjYBA1NNAzNDM21HfzDHF11TMyNjAwsjRjYeA0MrA01bU0tDDhYOAtLs5MMjAyMbA0MTQ15GTweDp_15Ndfc93tz3fNOnprmVP9-x62jPt6dplT3YueLpoHog7c9XTxRueTd3wrHfd81ktT_b2vdja8mzXhBfbV7xYv_bFioZnE2e8WNbIw8CalphTnMoLpbkZtNxcQ5w9dMsT89IS89Ljs_JLi_KAMvFVWSkVFUnJ8alGIHcYAqExSYoBSgFf7Q</recordid><startdate>2024</startdate><enddate>2024</enddate><creator>黄于欣</creator><creator>顾怀领</creator><creator>余正涛</creator><creator>高玉梦</creator><creator>潘通</creator><creator>徐佳龙</creator><general>昆明理工大学云南省人工智能重点实验室,中国 昆明市,650504</general><general>昆明理工大学信息工程与自动化学院,中国 昆明市,650504</general><scope>2B.</scope><scope>4A8</scope><scope>92I</scope><scope>93N</scope><scope>PSX</scope><scope>TCJ</scope></search><sort><creationdate>2024</creationdate><title>基于细粒度强化学习增强噪声数据的低资源跨语言摘要</title><author>黄于欣 ; 顾怀领 ; 余正涛 ; 高玉梦 ; 潘通 ; 徐佳龙</author></sort><facets><frbrtype>5</frbrtype><frbrgroupid>cdi_FETCH-wanfang_journals_zjdxxbc_e2024010103</frbrgroupid><rsrctype>articles</rsrctype><prefilter>articles</prefilter><language>chi</language><creationdate>2024</creationdate><toplevel>peer_reviewed</toplevel><toplevel>online_resources</toplevel><creatorcontrib>黄于欣</creatorcontrib><creatorcontrib>顾怀领</creatorcontrib><creatorcontrib>余正涛</creatorcontrib><creatorcontrib>高玉梦</creatorcontrib><creatorcontrib>潘通</creatorcontrib><creatorcontrib>徐佳龙</creatorcontrib><collection>Wanfang Data Journals - Hong Kong</collection><collection>WANFANG Data Centre</collection><collection>Wanfang Data Journals</collection><collection>万方数据期刊 - 香港版</collection><collection>China Online Journals (COJ)</collection><collection>China Online Journals (COJ)</collection><jtitle>信息与电子工程前沿(英文版)</jtitle></facets><delivery><delcategory>Remote Search Resource</delcategory><fulltext>fulltext</fulltext></delivery><addata><au>黄于欣</au><au>顾怀领</au><au>余正涛</au><au>高玉梦</au><au>潘通</au><au>徐佳龙</au><format>journal</format><genre>article</genre><ristype>JOUR</ristype><atitle>基于细粒度强化学习增强噪声数据的低资源跨语言摘要</atitle><jtitle>信息与电子工程前沿(英文版)</jtitle><date>2024</date><risdate>2024</risdate><volume>25</volume><issue>1</issue><spage>121</spage><epage>后插19</epage><pages>121-后插19</pages><issn>2095-9184</issn><abstract>TP391; 跨语言摘要是从源语言文档生成目标语言摘要的任务.最近,端到端跨语言摘要模型通过使用大规模、高质量数据集取得令人瞩目的结果,这些数据集通常是通过将单语摘要语料库翻译成跨语言摘要语料库而构建的.然而,由于低资源语言翻译模型性能有限,翻译噪声会严重降低模型性能.提出一种细粒度强化学习方法解决基于噪声数据的低资源跨语言摘要问题.引入源语言摘要作为黄金信号,减轻翻译后噪声目标摘要的影响.具体来说,通过计算源语言摘要和生成目标语言摘要之间的词相关性和词缺失度设计强化奖励,并将其与交叉熵损失相结合优化跨语言摘要模型.为验证所提出模型性能,构建汉语-越南语和越南语-汉语跨语言摘要数据集.实验结果表明,所提出模型在ROUGE分数和BERTScore方面优于其他基线.</abstract><pub>昆明理工大学云南省人工智能重点实验室,中国 昆明市,650504</pub><doi>10.1631/FITEE.2300296</doi></addata></record> |
fulltext | fulltext |
identifier | ISSN: 2095-9184 |
ispartof | 信息与电子工程前沿(英文版), 2024, Vol.25 (1), p.121-后插19 |
issn | 2095-9184 |
language | chi |
recordid | cdi_wanfang_journals_zjdxxbc_e202401010 |
source | Springer Nature |
title | 基于细粒度强化学习增强噪声数据的低资源跨语言摘要 |
url | http://sfxeu10.hosted.exlibrisgroup.com/loughborough?ctx_ver=Z39.88-2004&ctx_enc=info:ofi/enc:UTF-8&ctx_tim=2025-01-22T19%3A38%3A54IST&url_ver=Z39.88-2004&url_ctx_fmt=infofi/fmt:kev:mtx:ctx&rfr_id=info:sid/primo.exlibrisgroup.com:primo3-Article-wanfang_jour&rft_val_fmt=info:ofi/fmt:kev:mtx:journal&rft.genre=article&rft.atitle=%E5%9F%BA%E4%BA%8E%E7%BB%86%E7%B2%92%E5%BA%A6%E5%BC%BA%E5%8C%96%E5%AD%A6%E4%B9%A0%E5%A2%9E%E5%BC%BA%E5%99%AA%E5%A3%B0%E6%95%B0%E6%8D%AE%E7%9A%84%E4%BD%8E%E8%B5%84%E6%BA%90%E8%B7%A8%E8%AF%AD%E8%A8%80%E6%91%98%E8%A6%81&rft.jtitle=%E4%BF%A1%E6%81%AF%E4%B8%8E%E7%94%B5%E5%AD%90%E5%B7%A5%E7%A8%8B%E5%89%8D%E6%B2%BF%EF%BC%88%E8%8B%B1%E6%96%87%E7%89%88%EF%BC%89&rft.au=%E9%BB%84%E4%BA%8E%E6%AC%A3&rft.date=2024&rft.volume=25&rft.issue=1&rft.spage=121&rft.epage=%E5%90%8E%E6%8F%9219&rft.pages=121-%E5%90%8E%E6%8F%9219&rft.issn=2095-9184&rft_id=info:doi/10.1631/FITEE.2300296&rft_dat=%3Cwanfang_jour%3Ezjdxxbc_e202401010%3C/wanfang_jour%3E%3Cgrp_id%3Ecdi_FETCH-wanfang_journals_zjdxxbc_e2024010103%3C/grp_id%3E%3Coa%3E%3C/oa%3E%3Curl%3E%3C/url%3E&rft_id=info:oai/&rft_id=info:pmid/&rft_wanfj_id=zjdxxbc_e202401010&rfr_iscdi=true |