top of page

1. Введение. Терминология (лингвистические термины, NLP (обработка естественного           языка)), история, приложения, две парадигмы (символическая и статистическая). (1         лекция)

2. Извлечение информации, TF-IDF, точность и полнота. (1 лекция)

3. Стемминг и лемматизация. (1 лекция)

4. Корпусная лингвистика, английские и русские корпуса, частеречная разметка(POS-         tagging). (1-2 лекция)

5. Морфологические анализаторы. Морфосинтаксические неоднозначности:                           лингвистические методы. (1 лекция)

6. Скрытые Марковские модели. Морфосинтаксические неоднозначности:                                 статистические методы.

7. Виды POS-tagging. Гибридный метод Брилла (Brill tagger). (1 лекция)

8. Виды разбиения на предложения (Text segmentation into sentences). Системы и методы     автоматического реферирования. (1 лекция)

9. Методы проверки орфографии и коррекции. (1 лекция)

10. Лексическая семантика, семантические сети (wordnets), английский WordNet,                     онтологии. (1 лекция)

11. Автоматическое извлечение лексических и семантических отношений. (1 лекция)

12. Разрешение лексической многозначности слов. (1 лекция)

13. Статистический машинный перевод (или обработки речи). Итоги курса. (1-2 лекции)

bottom of page