Ви переглядаєте архівну версію офіційного сайту НУЛП (2005-2020р.р.). Актуальна версія: https://lpnu.ua

Методи аналізу природномовних текстів

Major: Системний аналіз
Code of Subject: 8.124.00.M.26
Credits: 4
Department: Інформаційні системи та мережі
Lecturer: Професор, професор кафедри ІСМ, д.т.н. Пасічник Володимир Володимирович
Semester: 4 семестр
Mode of Study: денна
Learning outcomes:
- означення та методи визначення смислової інформації слів та надлишковості тексту;
- означення та методику побудови функцій розподілу в тексті складів, слів, словосполучень і граматичних класів;
- методи побудови статистичних моделей тексту та імовірнісних характеристик норм мови;
- означення породжувальних граматик та їх класифікацію за Н.Хомським;
- алгоритмічні аспекти теорії породжувальних граматик.
Required prior and related subjects:
Комп’ютерні технології розпізнавання та класифікації в складних системах. Методи аналізу та оптимізації складних систем.
Summary of the subject:
Предмет математичної лінгвістики. Квантитативна лінгвістика. Імовірнісне моделювання породження тексту та його складових одиниць. Первинна статистична обробка тексту. Точкова оцінка параметрів генеральної лінгвістичної сукупності. Комбінаторна лінгвістика. Основні означення, класифікація за Н. Хомським. Скінченні автомати. Розпізнавання мов.
Recommended Books:
1. Пасічник В.В., Щербина Ю.М., Висоцька В.А., Шестакевич Т.В. Математична лінгвістика – Львів.: "Новий світ 2000", 2012. – 359с.
2. Нікольський Ю.В., Пасічник В.В., Щербина Ю.М. Дискретна математика. – Львів.: Видавництво "Магнолія-2006", 2009. – 432 с.
3. М.Гросс, А.Лантен. Теория формальных грамматик. Мир, 1971.
4. О.П.Кузнецов, Г.М.Адельсон-Вельский. Дискретная математика для инженера. Энергоатомиздат, 1988. Гл. 7, 8.
5. Д.Кук, Г.Бейз. Компьютерная математика. Наука, 1990. Гл. 8, 9.
Assessment methods and criteria:
• Поточний контроль (45%): письмові звіти з лабораторних робіт, розрахункова робота, усне опитування
• Підсумковий контроль (55%, екзаменаційний контроль): тестування (45%), усна компонента (10%)