Loading…
The MATE workbench – An annotation tool for XML coded speech corpora
This paper describes the design and implementation of the MATE workbench, a program which provides support for the annotation of speech and text. It provides facilities for flexible display and editing of such annotations, and complex querying of a resulting corpus. The workbench offers a more flexi...
Saved in:
Published in: | Speech communication 2001, Vol.33 (1), p.97-112 |
---|---|
Main Authors: | , , , , , |
Format: | Article |
Language: | English |
Citations: | Items that this one cites Items that cite this one |
Online Access: | Get full text |
Tags: |
Add Tag
No Tags, Be the first to tag this record!
|
Summary: | This paper describes the design and implementation of the MATE workbench, a program which provides support for the annotation of speech and text. It provides facilities for flexible display and editing of such annotations, and complex querying of a resulting corpus. The workbench offers a more flexible approach than most existing annotation tools, which were often designed with a specific annotation scheme in mind. Any annotation scheme can be used with the MATE workbench, provided it is coded using XML markup (linked to the speech signal, if available, using certain conventions). The workbench uses a transformation language to define specialised editors optimised for particular annotation tasks, with suitable display formats and allowable editing operations tailored to the task. The workbench is written in Java, which means that it is platform-independent. This paper outlines the design of the workbench software and compares it with other annotation programs.
Dieser Beitrag beschreibt das Design und die Implementierung der MATE Workbench, einem Programm für die Annotation von gesprochener und geschriebener Sprache. Die Workbench bietet Funktionen für die flexible Darstellung und Bearbeitung von Annotationen sowie komplexe Suchanfragen an vorhandene Korpora. Die Workbench hat einen offeneren Ansatz als die meisten existierenden Annotations-Werkzeuge, welche oft auf ein festes Annotationsschema zugeschnitten sind. In der MATE Workbench kann jedes Annotationsschema benutzt werden, so es in XML kodiert und – wenn verfügbar – mit einem Sprachsignal verbunden ist. Die Workbench nutzt eine Transformationssprache für die Definition und Generierung des für die jeweilige Aufgabe angemessenen Editors mit entsprechenden Anzeigeformaten und Bearbeitungsfunktionen. Die Workbench ist in der Programmiersprache Java geschrieben und somit platform-unabhängig. Der Beitrag erläutert das Design der Workbench-Software und vergleicht es mit dem anderer Annotationsprogramme.
Nous présentons, dans cet article, la conception et le développement du workbench MATE, un programme pour l'annotation de la parole et des textes écrits. Il facilite la visualisation et l'édition flexibles de telles annotations, et permet des requêtes complexes sur un corpus résultant. Le workbench offre une approche plus souple que la plupart des outils d'annotation, qui ont souvent été conçus pour un jeu d'étiquettes spécifique. Le workbench MATE permet le traitement de tout jeu d'étiquettes pourvu que ce |
---|---|
ISSN: | 0167-6393 1872-7182 |
DOI: | 10.1016/S0167-6393(00)00071-6 |