Курс состоит из трех частей. В первой части курса рассматривается формализация основных задач машинного обучения, излагаются алгоритмы обучения для линейно разделимых обучающих выборок, методы градиентного спуска и его разновидности, метод обучения нейронных сетей, метод опорных векторов, ядерные методы машинного обучения, регрессионный анализ, метрические и вероятностные модели машинного обучения. Во второй части рассматриваются задачи адаптивного прогнозирования. Излагаются алгоритмы экспоненциального смешивания экспертных прогнозов. В третьей части рассматриваются основные алгоритмы обучения с подкреплением (англ. reinforcement learning, RL) которое в настоящее время является наиболее перспективным направлением в искусственном интеллекте. Последняя премия Тьюринга (высшая награда в области компьютерных наук) была вручена именно специалистам в области обучения с подкреплением (Саттон и Барто). В курсе будут изложены математические модели обучения с подкреплением (марковские процессы принятия решений (МППР), выведены уравнения Беллмана и оптимальные уравнения Беллмана, будут изложены алгоритмы построения оптимальной политики для МППР. Также будут изложены статистические и градиентные алгоритмы обучения ММПР (TD и Q-learning).
Курс по искусственному интеллекту
Факультет
Механико-математический факультет
Преподаватели
Где
Главное здание, ауд. 1624
Когда
Среда 15:10–16:40
Нагрузка:
Аудиторная [ч]: 24
Самостоятельная [ч]: 12
Семестр
Весенний семестр 2025/2026 учебного года
Записалось / всего мест
163 / 200