Курс "Компьютерная лингвистика"
1. Введение. Терминология (лингвистические термины, NLP (обработка естественного языка)), история, приложения, две парадигмы (символическая и статистическая). (1 лекция)
2. Извлечение информации, TF-IDF, точность и полнота. (1 лекция)
3. Стемминг и лемматизация. (1 лекция)
4. Корпусная лингвистика, английские и русские корпуса, частеречная разметка(POS- tagging). (1-2 лекция)
5. Морфологические анализаторы. Морфосинтаксические неоднозначности: лингвистические методы. (1 лекция)
6. Скрытые Марковские модели. Морфосинтаксические неоднозначности: статистические методы.
7. Виды POS-tagging. Гибридный метод Брилла (Brill tagger). (1 лекция)
8. Виды разбиения на предложения (Text segmentation into sentences). Системы и методы автоматического реферирования. (1 лекция)
9. Методы проверки орфографии и коррекции. (1 лекция)
10. Лексическая семантика, семантические сети (wordnets), английский WordNet, онтологии. (1 лекция)
11. Автоматическое извлечение лексических и семантических отношений. (1 лекция)
12. Разрешение лексической многозначности слов. (1 лекция)
13. Статистический машинный перевод (или обработки речи). Итоги курса. (1-2 лекции)