АГАТ-семантика: семантичне розмічування Корпусу української мови

Автор(и)

  • Наталія Дарчук КНУ імені Тараса Шевченка
  • Оксана Зубань КНУ імені Тараса Шевченка
  • Маргарита Лангенбах КНУ імені Тараса Шевченка
  • Ярина Ходаківська КНУ імені Тараса Шевченка

DOI:

https://doi.org/10.17721/um/46(2016).92-102

Ключові слова:

корпус текстів, семантичне розмічування, таксономічна класифікація, таксон

Анотація

У статті розглянуто лінгвістичні засади семантичного розмічування Корпусу української мови як четвертого етапу представлення інформації про одиниці Корпусу. В основу розмічування покладено таксономічну класифікацію Національного корпусу російської мови, але доповнену та видозмінену. Створено програмне забезпечення для роботи в он-лайн режимі. Матеріалом слугував частотний словник публіцистичного стилю обсягом 40 тис. лексем, укладений на вибірці 16 млн. словоформ українськомовного тексту.

 

Інформація про авторів:

Дарчук Наталія Петрівна – доктор філологічних наук, професор кафедри сучасної української мови Інституту філології Київського національного університету імені Тараса Шевченка (Україна).

Електронна адреса: nataliadarchuk@gmail.com

Зубань Оксана Миколаївна – кандидат філологічних наук, доцент кафедри сучасної української мови Інституту філології Київського національного університету імені Тараса Шевченка (Україна).

Електронна адреса: oxana.mell.zuban@gmail.com

Лангенбах Маргарита Олександрівна – кандидат філологічних наук, асистент кафедри сучасної української мови Інституту філології Київського національного університету імені Тараса Шевченка (Україна).

Електронна адреса: labacompli@gmail.com

Ходаківська Ярина Володимирівна – філолог лабораторії комп’ютерної лінгвістики Інституту філології Київського національного університету імені Тараса Шевченка (Україна).

Електронна адреса: yaryna.yaryna@gmail.com

____________

Література

  1. Апресян Ю. Д. Лексическая семантика : синонимические средства языка / Ю. Д. Апресян. – М. : Наука, 1974. – 367 с.
  2. Герд А. С. Прикладная лингвистика / А. С. Герд. – СПб : Изд-во С.-Петерб. ун-та. – 2005. – 266, [1] c.
  3. Дарчук Н. Комп’ютерне анотування українського тексту: результати і перспективи / Наталія Дарчук. – К. : Освіта України, 2013. – 543 с.
  4. Красильщик И. С., Рахилина Е. В. Предметные имена в системе  “Лексикограф” / И. С. Красильщик, Е. В. Рахилина // НТИ, сер. 2. Информационные процессы и системы. – 1992. – № 9. – С. 24–31.
  5. Кустова Г. И. Семантическая разметка лексики в национальном корпусе русского языка: принципы, проблемы, перспективы / Г. И. Кустова, О. Н. Ляшевская, Е. В. Падучева, Е. В. Рахилина // Национальный корпус русского языка: 2003–2005. – М. : Индрик. – 2005. – С. 155–174.
  6. Кустова Г. И., Падучева Е. В. Словарь как лексическая база данных  / Г. И. Кустова, Е. В. Падучева // Вопросы языкознания. – 1994. – № 4.
  7. Рахилина Е. В. Задачи и принципы семантической разметки лексики в НКРЯ /  Е. В. Рахилина, Г. И. Кустова, О. Н. Ляшевская, Т. И. Резникова, О. Ю. Шеманаева // Национальный корпус русского языка. Новые результаты и перспективы. – СПб : НЕСТОР-ИСТОРИЯ – 2009. – С. 215–239.
  8. Соколовская Ж. П. Проблемы системного описания лексической семантики / Ж. Соколовская. – К. :Наукова думка, 1990. – 184 с.
  9. Штерн І. Б. Вибрані топіки та лексикон сучасної лінгвістики : енцикл. слов. / І. Б. Штерн. – К. : АтрЕк, 1998. – 335 с.

Завантаження

Опубліковано

2016-09-09

Номер

Розділ

КОМП’ЮТЕРНА ЛІНГВІСТИКА

Як цитувати

Дарчук, Н., Зубань, О., Лангенбах, М., & Ходаківська, Я. (2016). АГАТ-семантика: семантичне розмічування Корпусу української мови. Українське мовознавство, 1(46), 92-102. https://doi.org/10.17721/um/46(2016).92-102

Схожі статті

1-10 з 12

Ви також можете розпочати розширений пошук схожих статей для цієї статті.