DSpace at library NPU Dragomanova » Науковий часопис Національного педагогічного університету імені М.П. Драгоманова » Серія 09. Сучасні тенденції розвитку мов » Випуск 15 »

Please use this identifier to cite or link to this item: http://enpuir.npu.edu.ua/handle/123456789/17846
Title: Паралельний корпус текстів ПарКУМ
Other Titles: Параллельный корпус текстов ПарКУМ
Parallel corpus of texts ПарКУМ
Authors: Дарчук, Н. П.
Лангенбах, М. О.
Сорокін, В. М.
Ходаківська, Я. В.
Keywords: паралельний корпус
корпусна лінгвістика
корпусна розмітка
паралельні тексти
перекладні відповідники
параллельный корпус
корпусная лингвистика
аннотация корпуса
параллельные тексты
переводные соответствия
parallel corpus
corpus linguistics
annotation of the corpus
parallel texts
translation equivalents
Issue Date: 2017
Publisher: Видавництво НПУ імені М. П. Драгоманова
Citation: Паралельний корпус текстів ПарКУМ / Н. П. Дарчук, М. О. Лангенбах, В. М. Сорокін, Я. В. Ходаківська // Науковий часопис Національного педагогічного університету імені М. П. Драгоманова. Серія 9 : Сучасні тенденції розвитку мов : зб. наук. праць. - Київ : Вид-во НПУ імені М. П. Драгоманова, 2017. - Вип. 15. - С. 28-35.
Abstract: Незважаючи на активний розвиток корпусної лінгвістики в Україні, досі існує велика прогалина в царині розробки паралельних корпусів. Метою роботи є формулювання основних засад творення та використання паралельного корпусу текстів ПарКУМ. Завдання, що вирішуються в ході дослідження: визначення напрямів перекладу та принципів добору текстів; вибір основних параметрів розмітки; визначення концепції роботи з матеріалом; розробка структури користувацького інтерфейсу. Подається інформація про всі типи розмітки, передбачені в корпусі: метатекстову, структурну та лінгвістичну. Окрім опису структури проекту, подано роз’яснення щодо принципів роботи з корпусом.
Несмотря на активное развитие корпусной лингвистики в Украине, до сих пор существует большой пробел в области разработки параллельных корпусов. На сегодня почти не существует в открытом доступе подобных проектов, содержащих украиноязычные тексты. Цель статьи – изложение основных принципов создания и использования корпуса параллельных текстов ПарКУМ. Задания, решаемые в ходе исследования: определение принципов подбора текстов; выбор основных параметров разметки; формирование концепции работы с материалом; разработка структуры пользовательского интерфейса. Предоставляется информация обо всех типах разметки, предусмотренных в корпусе: метатекстовой, структурной и лингвистической, обеспечивающей возможность поиска информации не только по конкретным лексемам, но и по грамматическим признакам.
Despite the fact that Ukrainian corpus linguistics has some visible achievements, there is one field which is still almost unexplored – parallel corpora. In this paper we present a project of parallel corpus containing Ukrainian texts. The goal of our research is to formulate the basic principles of parallel corpus development. The tasks being solved are: to define the directions of translation and demands to the textual material; to choose necessary parameters of annotation; to build the architecture of corpus system and define user roles; to develop user interface. The article gives the information about all types of tagging specified for the corpus texts: metadata, structural and linguistic annotation. The corpus works in two modes: administrative (available after the registration at the http://mova.info) and search. The project works in test mode. The Ukrainian-English and English-Ukrainian parallel texts are being collected now and some examples of them are already available for search. On the next stages the corpus fill be filled with other parallel texts – polish, Bulgarian, Turkish, German etc.
URI: http://enpuir.npu.edu.ua/handle/123456789/17846
Appears in Collections:Випуск 15

Files in This Item:
File Description SizeFormat 
Darchuk 2.pdf930.09 kBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.