Курс содержит подробный обзор основных направлений и методов компьютерной лингвистики. Будут разобраны как классические задачи, такие как исправление опечаток, так и современные, например генерация текста. Планируется максимально полно изложить математические и лингвистические идеи, лежащие в основе современных методов, а также привести примеры их практического использования. Курс не требует предварительных математических знаний, однако в его ходе потребуется овладеть базовыми понятиями математического анализа, линейной алгебры и теории формальных языков.
Примерная программа курса
1. Введение, обзор методов и приложений.
2. Основы теории формальных языков, регулярные выражения.
3. Конечные автоматы и преобразователи.
4. Корпусная лингвистика.
4. Вероятностная модель текста, энграммные модели.
5. Исправление опечаток, расстояние Левенштейна.
6. Введение в машинное обучение, линейные модели.
7. Введение в нейронные сети, их приложения в компьютерной лингвистике.
8. Автоматический перевод.
9. Большие языковые модели, их предобучение и дообучение.
10. Основные библиотеки для решения задач компьютерной лингвистики.
Курс по искусственному интеллекту
Факультет
Механико-математический факультет
Преподаватели
Где
Главное здание, ауд. 1224
Когда
Среда 15:10–16:40
Нагрузка:
Аудиторная [ч]: 24
Самостоятельная [ч]: 12
Семестр
Весенний семестр 2022/2023 учебного года
Записалось / всего мест
36 / 50