Loading…

음성 기반 도로명 주소 인식 및 주소 검증 기법

TV홈쇼핑을 통한 상품 구매 과정에서, 전화망을 통한 배송지 정보의 확보는 필수적인 과정이며 동시에, 서비스 운영 효율을 높이기 위한 주요한 자동화 적용 대상 과정이다. 본 연구는 음성으로 기록된 배송지 정보를 자동으로 인식 및 검증하려는 방법을 제안한다. 본 제안 방법은 음성 기반의 주소 정보를 처리하는 데 필요한 다음의 세 가지 기능을 포함한다. 첫 번째 기능은 한글 발화문으로 부터 원래 주소의 표기 형태로 올바르게 변환하는 것이고, 두 번째 기능은 음성 녹취 과정에서 주소의 구성 요소별 순서 변화 혹은 동일 구성 요소의 중복...

Full description

Saved in:
Bibliographic Details
Published in:Inteonet jeongbo hakoe nonmunji = Journal of Korean Society for Internet Information 2021, 22(1), , pp.31-39
Main Authors: 이건수, Keonsoo Lee, 김중연, Jung-yeon Kim, 강병권, Byeong-gwon Kang
Format: Article
Language:Korean
Subjects:
Online Access:Get full text
Tags: Add Tag
No Tags, Be the first to tag this record!
Description
Summary:TV홈쇼핑을 통한 상품 구매 과정에서, 전화망을 통한 배송지 정보의 확보는 필수적인 과정이며 동시에, 서비스 운영 효율을 높이기 위한 주요한 자동화 적용 대상 과정이다. 본 연구는 음성으로 기록된 배송지 정보를 자동으로 인식 및 검증하려는 방법을 제안한다. 본 제안 방법은 음성 기반의 주소 정보를 처리하는 데 필요한 다음의 세 가지 기능을 포함한다. 첫 번째 기능은 한글 발화문으로 부터 원래 주소의 표기 형태로 올바르게 변환하는 것이고, 두 번째 기능은 음성 녹취 과정에서 주소의 구성 요소별 순서 변화 혹은 동일 구성 요소의 중복 발화 같은 주소 잡음을 처리하는 것이며, 마지막 기능은 띄어쓰기 처리를 통한 최종 주소의 가독성을 보장할 수 있는 기능이다. 제안된 방법을 구현하기 위해 우정사업본부 주소 DB와 행정안전부의 주소 DB를 사용하였으며, 통화에서 획득한 주소 발화로부터 도로명 주소를 도출하고, 도출된 주소의 유효성을 검증하였다. 또한 제안 방법의 구현 결과물은 STT를 통한 발화 인식 결과뿐만 아니라, 키보드를 이용한 표준 입출력으로도 입력 채널을 확장하여, 주소 검증이 필요한 비음성 기반의 서비스에서도 활용될 수 있도록 하였다. 제안 방법은 주소 구성 요소의 위치 변화 잡음에 강건하게 동작했지만, 요소 생략의 경우 오작동 경향이 존재했다. 이는 생략된 요소에 의해 하위 요소의 지역을 명시하지 못하는 경우 처리하지 못한 모호함 때문이었다. Obtaining delivery addresses from calls is one of the most important processes in TV home shopping business. By automating this process, the operational efficiency of TV home shopping can be increased. In this paper, a method of recognizing and validating road name address, which is the address system of South Korea, from speech oriented text is proposed. The speech oriented text has three challenges. The first is that the numbers are represented in the form of pronunciation. The second is that the recorded address has noises that are made from repeated pronunciation of the same address, or unordered address. The third is that the readability of the resulted address. For resolving these problems, the proposed method enhances the existing address databases provided by the Korea Post and Ministry of the Interior and Safety. Various types of pronouncing address are added, and heuristic rules for dividing ambiguous pronunciations are employed. And the processed address is validated by checking the existence in the official address database. Even though, this proposed method is for the STT result of the address pronunciation, this also can be used for any 3 rd party services that need to validate road name address. The proposed method works robustly on noises such as positions change or omission of elements.
ISSN:1598-0170
2287-1136