АГАТ-семантика: семантичне розмічування Корпусу української мови
DOI:
https://doi.org/10.17721/um/46(2016).92-102Ключові слова:
корпус текстів, семантичне розмічування, таксономічна класифікація, таксонАнотація
У статті розглянуто лінгвістичні засади семантичного розмічування Корпусу української мови як четвертого етапу представлення інформації про одиниці Корпусу. В основу розмічування покладено таксономічну класифікацію Національного корпусу російської мови, але доповнену та видозмінену. Створено програмне забезпечення для роботи в он-лайн режимі. Матеріалом слугував частотний словник публіцистичного стилю обсягом 40 тис. лексем, укладений на вибірці 16 млн. словоформ українськомовного тексту.
Інформація про авторів:
Дарчук Наталія Петрівна – доктор філологічних наук, професор кафедри сучасної української мови Інституту філології Київського національного університету імені Тараса Шевченка (Україна).
Електронна адреса: nataliadarchuk@gmail.com
Зубань Оксана Миколаївна – кандидат філологічних наук, доцент кафедри сучасної української мови Інституту філології Київського національного університету імені Тараса Шевченка (Україна).
Електронна адреса: oxana.mell.zuban@gmail.com
Лангенбах Маргарита Олександрівна – кандидат філологічних наук, асистент кафедри сучасної української мови Інституту філології Київського національного університету імені Тараса Шевченка (Україна).
Електронна адреса: labacompli@gmail.com
Ходаківська Ярина Володимирівна – філолог лабораторії комп’ютерної лінгвістики Інституту філології Київського національного університету імені Тараса Шевченка (Україна).
Електронна адреса: yaryna.yaryna@gmail.com
____________
Література
- Апресян Ю. Д. Лексическая семантика : синонимические средства языка / Ю. Д. Апресян. – М. : Наука, 1974. – 367 с.
- Герд А. С. Прикладная лингвистика / А. С. Герд. – СПб : Изд-во С.-Петерб. ун-та. – 2005. – 266, [1] c.
- Дарчук Н. Комп’ютерне анотування українського тексту: результати і перспективи / Наталія Дарчук. – К. : Освіта України, 2013. – 543 с.
- Красильщик И. С., Рахилина Е. В. Предметные имена в системе “Лексикограф” / И. С. Красильщик, Е. В. Рахилина // НТИ, сер. 2. Информационные процессы и системы. – 1992. – № 9. – С. 24–31.
- Кустова Г. И. Семантическая разметка лексики в национальном корпусе русского языка: принципы, проблемы, перспективы / Г. И. Кустова, О. Н. Ляшевская, Е. В. Падучева, Е. В. Рахилина // Национальный корпус русского языка: 2003–2005. – М. : Индрик. – 2005. – С. 155–174.
- Кустова Г. И., Падучева Е. В. Словарь как лексическая база данных / Г. И. Кустова, Е. В. Падучева // Вопросы языкознания. – 1994. – № 4.
- Рахилина Е. В. Задачи и принципы семантической разметки лексики в НКРЯ / Е. В. Рахилина, Г. И. Кустова, О. Н. Ляшевская, Т. И. Резникова, О. Ю. Шеманаева // Национальный корпус русского языка. Новые результаты и перспективы. – СПб : НЕСТОР-ИСТОРИЯ – 2009. – С. 215–239.
- Соколовская Ж. П. Проблемы системного описания лексической семантики / Ж. Соколовская. – К. :Наукова думка, 1990. – 184 с.
- Штерн І. Б. Вибрані топіки та лексикон сучасної лінгвістики : енцикл. слов. / І. Б. Штерн. – К. : АтрЕк, 1998. – 335 с.
Завантаження
Опубліковано
Номер
Розділ
Ліцензія
Авторське право (c) 2022 Наталія Дарчук, Оксана Зубань, Маргарита Лангенбах, Ярина Ходаківська
Ця робота ліцензується відповідно до ліцензії Creative Commons Attribution 4.0 International License.