АГАТ-семантика: семантичне розмічування Корпусу української мови
DOI:
https://doi.org/10.17721/um/46(2016).92-102Ключові слова:
корпус текстів, семантичне розмічування, таксономічна класифікація, таксонАнотація
У статті розглянуто лінгвістичні засади семантичного розмічування Корпусу української мови як четвертого етапу представлення інформації про одиниці Корпусу. В основу розмічування покладено таксономічну класифікацію Національного корпусу російської мови, але доповнену та видозмінену. Створено програмне забезпечення для роботи в он-лайн режимі. Матеріалом слугував частотний словник публіцистичного стилю обсягом 40 тис. лексем, укладений на вибірці 16 млн. словоформ українськомовного тексту.
Інформація про авторів:
Дарчук Наталія Петрівна – доктор філологічних наук, професор кафедри сучасної української мови Інституту філології Київського національного університету імені Тараса Шевченка (Україна).
Електронна адреса: nataliadarchuk@gmail.com
Зубань Оксана Миколаївна – кандидат філологічних наук, доцент кафедри сучасної української мови Інституту філології Київського національного університету імені Тараса Шевченка (Україна).
Електронна адреса: oxana.mell.zuban@gmail.com
Лангенбах Маргарита Олександрівна – кандидат філологічних наук, асистент кафедри сучасної української мови Інституту філології Київського національного університету імені Тараса Шевченка (Україна).
Електронна адреса: labacompli@gmail.com
Ходаківська Ярина Володимирівна – філолог лабораторії комп’ютерної лінгвістики Інституту філології Київського національного університету імені Тараса Шевченка (Україна).
Електронна адреса: yaryna.yaryna@gmail.com
____________
Література
- Апресян Ю. Д. Лексическая семантика : синонимические средства языка / Ю. Д. Апресян. – М. : Наука, 1974. – 367 с.
- Герд А. С. Прикладная лингвистика / А. С. Герд. – СПб : Изд-во С.-Петерб. ун-та. – 2005. – 266, [1] c.
- Дарчук Н. Комп’ютерне анотування українського тексту: результати і перспективи / Наталія Дарчук. – К. : Освіта України, 2013. – 543 с.
- Красильщик И. С., Рахилина Е. В. Предметные имена в системе “Лексикограф” / И. С. Красильщик, Е. В. Рахилина // НТИ, сер. 2. Информационные процессы и системы. – 1992. – № 9. – С. 24–31.
- Кустова Г. И. Семантическая разметка лексики в национальном корпусе русского языка: принципы, проблемы, перспективы / Г. И. Кустова, О. Н. Ляшевская, Е. В. Падучева, Е. В. Рахилина // Национальный корпус русского языка: 2003–2005. – М. : Индрик. – 2005. – С. 155–174.
- Кустова Г. И., Падучева Е. В. Словарь как лексическая база данных / Г. И. Кустова, Е. В. Падучева // Вопросы языкознания. – 1994. – № 4.
- Рахилина Е. В. Задачи и принципы семантической разметки лексики в НКРЯ / Е. В. Рахилина, Г. И. Кустова, О. Н. Ляшевская, Т. И. Резникова, О. Ю. Шеманаева // Национальный корпус русского языка. Новые результаты и перспективы. – СПб : НЕСТОР-ИСТОРИЯ – 2009. – С. 215–239.
- Соколовская Ж. П. Проблемы системного описания лексической семантики / Ж. Соколовская. – К. :Наукова думка, 1990. – 184 с.
- Штерн І. Б. Вибрані топіки та лексикон сучасної лінгвістики : енцикл. слов. / І. Б. Штерн. – К. : АтрЕк, 1998. – 335 с.