Введение в обработку естественного языка и анализ текстов (на английском языке)
Институт теоретической и математической физики

В связи с появлением в конце 2022 года ChatGPT перед исследователями и преподавателями разных предметных областей были поставлены серьезные междисциплинарные вопросы по возможностям и ограничениям технологий генеративного искусственного интеллекта. С теоретической точки зрения, курс включает в себя описание принципов обработки естественного языка и методов работы больших языковых моделей, для чего происходит ознакомление студентов с основами когнитивной, корпусной и компьютерной лингвистики, а также дистрибутивной семантики. Все лекции сопровождаются анализом эмпирического материала и демонстрацией инструментов обработки естественного языка в рамках раздела case study для решения следующих прикладных задач:

поиск и систематизация научных материалов;

пред- и постредактирование текстов для осуществления их машинного перевода;

выделение наиболее частотных терминов, персоналий и других языковых единиц, отражающих тенденции исследований;

определение авторства текстов;

автоматизация сбора количественных и качественных данных.

Цель курса состоит в развитии профессиональной исследовательской и информационно-коммуникационной компетенции исследователя. Практическим результатом прохождения курса станет защита проекта «Корпусное исследование статей по проблематике научного интереса студента». Интерактивные и практические задания по темам лекций готовят студента к защите данного проекта, включающего в себя:

составление подкорпуса статей по проблематике исследования студента;

подготовку текстов статей в блокноте Google Colab для их дальнейшего анализа;

обработку текстов открытыми библиотеками на основе кода на языке Python;

лингвистический анализ собранных данных методами диахронического и дистрибутивного анализа с помощью корпусных менеджеров для выявления тенденций в статьях по тематике научного интереса студента;

визуализация полученных результатов корпусного исследования посредством графов для защиты проекта.

Курс по искусственному интеллекту

Факультет
Институт теоретической и математической физики

Преподаватели

Преподаватели

Авраменко Анна Петровна

Где
Главное здание, ауд. 1311

Когда
Среда 17:00–18:30

Нагрузка:
Аудиторная [ч]: 24
Самостоятельная [ч]: 12

Семестр
Осенний семестр 2024/2025 учебного года

Записалось / всего мест
49 / 50