Цифровий репозитарій
Українського державного університету
імені Михайла Драгоманова

Можливості семантичної розмітки корпусу української мови (КУМ)

ISSN: 2310-8290

Показати скорочений опис матеріалу

dc.contributor.author Дарчук, Н. П.
dc.date.accessioned 2018-02-06T12:53:24Z
dc.date.available 2018-02-06T12:53:24Z
dc.date.issued 2017
dc.identifier.citation Дарчук, Н. П. Можливості семантичної розмітки корпусу української мови (КУМ) / Н. П. Дарчук // Науковий часопис Національного педагогічного університету імені М. П. Драгоманова. Серія 9 : Сучасні тенденції розвитку мов : зб. наук. праць. - Київ : Вид-во НПУ імені М. П. Драгоманова, 2017. - Вип. 15. - С. 18-28. ua
dc.identifier.uri http://enpuir.npu.edu.ua/handle/123456789/17838
dc.description.abstract У статті розглянуто лінгвістичні засади семантичного розмічування Корпусу української мови як четвертого етапу представлення інформації про одиниці Корпусу. В основу розмічування покладено таксономічну класифікацію корпусу російської мови, але доповнену та видозмінену. Створено програмне забезпечення для роботи в он-лайн режимі. Матеріалом слугував частотний словник публіцистичного стилю обсягом 40 тис. лексем, укладений на вибірці 16 млн словоформ українськомовного тексту. ua
dc.description.abstract В статье рассмотрены лингвистические основы семантической разметки Корпуса украинского языка как четвертого этапа представления информации о единицах Корпуса. В основу разметки положена таксономическая классификация корпуса русского языка, но дополненная и видозмененная. Создано программное обеспечение для работы в он-лайн режиме. Материалом послужил частотный словарь публицистического стиля объемом в 40 тыс. лексем, созданный на выборке в 16 млн словоформ украиноязычного текста. ua
dc.description.abstract The article views linguistic aspects of semantic tagging within the Ukrainian Corpus. The lexical content of texts of different genres, in particular, modern fiction, drama, journalism, scientific, popular scientific, and business will be provided with a specific tagging respectively. The work represents two types of tagging: I – a taxonomic one, featuring journalistic and fiction genre and II – a thesaurus-based tagging specifically for scientific and business genres. The tagging is based on taxonomic classification applied in the Russian Corpus but extended and extra modified. There were developed the software tools for online work based on materials of frequency dictionary of journalistic style with a total volume of 40,000 lexems compiled from the sampling of 16 Million word forms of Ukrainian texts. The thesaurus-based approach is grounded on the identification of thematically relevant lexical-semantic variations and grouping them by applying a formalized method of a thesaurus construction, which meets the standards of modern terminography. There were developed the software tools for performing of two types of semantic tagging. ua
dc.language.iso uk ua
dc.publisher Видавництво НПУ імені М. П. Драгоманова ua
dc.subject Корпус текстів ua
dc.subject семантичне розмічування ua
dc.subject таксономічна класифікація ua
dc.subject таксон ua
dc.subject тезаурус ua
dc.subject інформаційно-пошукова система ua
dc.subject Корпус текстов ua
dc.subject семантическая разметка ua
dc.subject таксономическая классификация ua
dc.subject linguistic corpus ua
dc.subject semantic tagging ua
dc.subject taxonomic classification ua
dc.subject taxon ua
dc.subject thesaurus ua
dc.subject information retrieval system ua
dc.subject.classification 81’322:811.161.2 ua
dc.title Можливості семантичної розмітки корпусу української мови (КУМ) ua
dc.title.alternative Возможности семантической разметки корпуса украинского языка (КУЯ) ua
dc.title.alternative Capabilities of Semantic Tagging Within the Ukrainian Corpus ua
dc.type Article ua


Долучені файли

Даний матеріал зустрічається у наступних фондах

Показати скорочений опис матеріалу