В связи с появлением в конце 2022 года ChatGPT перед исследователями и преподавателями разных предметных областей были поставлены серьезные междисциплинарные вопросы по возможностям и ограничениям технологий генеративного искусственного интеллекта. На наш взгляд, представляется важным как ознакомить студентов с перспективами применения нейронных сетей на основе машинного обучения для их исследований, так и выделить угрозы избыточного использования данных инструментов.
Цель курса состоит в развитии профессиональной исследовательской и информационно-коммуникационной компетенции будущего специалиста в гуманитарной сфере и ознакомлении студентов, с одной стороны, с несовершенством больших языков моделей для генерации академического текста; а с другой - с их потенциалом для обработки больших текстовых данных в разных предметных областях. Задачи курса включают формирование следующих компетенций (студент в результате освоения курса должен):
• знать: основы прикладной, компьютерной и корпусной лингвистики, а также дистрибутивной семантики; принципы работы и особенности архитектуры основных языковых моделей (Word2vec, GloVe, Transformer); актуальные на момент проведения курса сравнительные характеристики отечественных аналогов систем генеративного искусственного интеллекта по сравнению с ChatGPT; основы пред- и пост-редактирования текстов для машинного перевода; принципы осуществления поиска и верификации данных для исследований; принципы анализа и классификации текстовых данных по предметным областям; принципы сбора количественных и качественных данных через чат-ботов;
•уметь: осуществлять семантический анализ с помощью электронных лингвистических корпусов; интерпретировать результаты обработки и классификации текстов пользовательскими инструментами на основе работы нейтронных сетей; оценивать инструменты машинного перевода; осуществлять базовые операции по пред- и пост-редактирования текстов своей предметной области для машинного перевода; проектировать на пользовательских конструкторах и применять в исследовательских целях чат-боты по сбору количественных и качественных данных для гуманитарного исследования;
• иметь опыт работы со следующими программами и сайтами: с Национальным корпусом русского языка; сChatGPT и его аналогами; с инструментами машинного перевода от DeepL к SmartCat; с пользовательскими интерфейсами нейронных сетей по обработке текстов SketchEngine (TextInspector/MonkeyLearn); с конструкторами по запуску чат-ботов и анализу их данных (Botmother).
Курс по искусственному интеллекту
Факультет
Факультет иностранных языков и регионоведения
Преподаватели
Где
4 учебный корпус В, ауд. 208
Когда
Среда 15:10–16:40
Нагрузка:
Аудиторная [ч]: 24
Самостоятельная [ч]: 12
Семестр
Осенний семестр 2023/2024 учебного года
Записалось / всего мест
73 / 100