Статтю присвячено визначенню критеріїв корпусної метарозмітки спеціальних текстів з
лінгвоантропогенезу. Досягнення мети реалізовано через уточнення понять “лінгвоантропогенез”,
“спеціальні тексти”, “метарозмітка” та пошук набору елементів для здійснення метарозмітки
фахових текстів. Запропоновано включити такі групи метаданих до метарозмітки спеціальних
текстів із лінгвоантропогенезу: текстові метадані; дані про автора; лінгвістичні метадані;
тематичні питання (із функціональними сферами); технічні метадані, що дасть змогу суттєво
скоротити час технічної роботи з корпусом такого типу, розширить коло його користувачів та
підвищить об’єктивність результатів досліджень із проблематики лінгвоантропогенезу.
Статья посвящена определению критериев корпусной метаразметки специальных текстов по
лингвоантропогенезу. Достижение цели реализуется путём уточнения понятий
“лингвоантропогенез”, “специальные тексты”, “метаразметка” и поиском набора элементов для
метаразметки специальных текстов. Предлагается включить в метаразметку специальных текстов
по лингвоантропогенезу такие группы метаданных: текстовые метаданные; данные про автора;
лингвистические метаданные; тематические вопросы (с функциональными сферами); технические
метаданные, что позволит существенно сократить время технической работы с корпусом,
расширит круг его пользователей и повысит объективность результатов исследований по
проблематике лингвоантропогенеза.
The paper deals with peculiarities and criteria defining for building corpus mark-up of specialized texts
on linguoanthropogenesis. The aim was achieved through specifying of the concepts “linguoanthropogenesis”,
“specialized texts”, “mark-up”, as well as describing the set of components to form the mark-up of such
specialized texts. In the end the author suggested the following groups of metadata to be included into the
mark-up of specialized texts on linguoanthropogenesis: textual metadata; data about authors; linguistic
metadata; thematic issues (including their functional areas); technical metadata, which would help to save
time on technical processing of the corpus, expand the range of its users and increase the objectivity of the
obtained results on the problems of linguoantropogenesis.