Лингвисты ТГУ получили премию «Гравитация» за проект в сфере ИИ и Big Data

Магистранты и преподаватели программы «Компьютерная и когнитивная лингвистика» Томского государственного университета получили премию «Гравитация» в области искусственного интеллекта и больших данных в номинации «Повышение качества и доступности данных». Наградой отмечены проекты по созданию универсальных цифровых платформ для проведения когнитивных исследований и для эффективной организации учебного онлайн-процесса. Вместе с партнером ТГУ – IT-компанией IPST (Томск) – лингвисты разрабатывают информационные системы на основе методов машинного обучения и ИИ, обеспечивающие сбор, хранение, обработку и визуализацию данных в образовательной и исследовательской междисциплинарной среде. 

Сегодня ежегодный прирост онлайн-образования на мировом рынке составляет от 5 до15%, что повышает востребованность образовательных продуктов на основе технологий ИИ и анализа больших данных. Универсальные цифровые продукты, разработанные компьютерными лингвистами ТГУ вместе с сетевым партнером – IT-компанией IPST, помогут оптимизировать образовательный процесс и укрепить технологический суверенитет страны в образовательной сфере. Проект ТГУ и IPST «Сбор и разметка данных для совершенствования алгоритмов автопроверки заданий студентов и генерации вопросно-ответных структур в образовательном и исследовательских междисциплинарных проектах» получил международную университетскую премию «Гравитация» в номинации «Повышение качества и доступности данных». 

Разработку универсальной цифровой платформы для проведения нейролингвистических экспериментов компания IPST начала в 2021 году. Работы велись по заданию лаборатории лингвистической антропологии ТГУ и совместно с учеными Томского госуниверситета в рамках магистерской программы «Компьютерная и когнитивная лингвистика» и совместного проекта, поддержанного федеральной программой «Приоритет 2030». В этом году компания запустит созданный программный продукт в повседневную практику научных исследований. 

На цифровой платформе можно создавать нейролингвистические эксперименты и настраивать их параметры; выгружать, обрабатывать, хранить и анализировать данные о проведенных исследованиях; формировать статистику на основе методов когнитивной лингвистики. И все это без использования экспериментаторами алгоритмических языков программирования и сторонних программных средств. Технологии ИИ позволяют автоматизировать процесс обработки и визуализации результатов и сформировать единую экспериментальную базу в области когнитивной лингвистики.

По словам руководителя проекта, заведующей кафедрой общей, компьютерной и когнитивной лингвистики ФилФ ТГУ Зои Резановой, к необходимости создания отечественного программного обеспечения для проведения онлайн-экспериментов привели произошедшие в последние годы социальные потрясения. 

– Если раньше эксперименты по большей части проводились в лабораторных условиях, то во время пандемии всем пришлось выйти в онлайн-пространство. Мировое сообщество начало тестировать легитимность проведения экспериментов, когда испытуемый и исследователь взаимодействуют онлайн, – поясняет Зоя Ивановна. – В мире появились платформы для проведения экспериментов, но сейчас в связи с геополитическими событиями они все для нас закрылись, и остро встала задача создания собственного продукта. 

photo_2023-06-28_17-28-50 (4).jpg
Команда проекта: Валерия Владимирова, Алексей Бочаров, Зоя Резанова и Анна Сергина

Универсальная платформа экспериментов будет удобна респондентам и полезна, прежде всего, ученым исследовательских лабораторий, которые создают эксперименты в области когнитивной лингвистики, психолингвистики, нейробиологии, экспериментальной психологии и других смежных областях, отмечает младший научный сотрудник лаборатории лингвистической антропологии ТГУ Валерия Владимирова.

Базовые эксперименты уже разработаны, и теперь ученые собираются масштабировать платформу для апробации новых типов экспериментов и расширения спектра их возможных дизайнов. Летом платформу протестируют российские и зарубежные вузы – Ургенчский государственный университет (Узбекистан), Российско-Таджикский (Славянский) университет (Таджикистан), НИУ Высшая школа экономики, Алтайский государственный гуманитарно-педагогический университет имени В.М. Шукшина и другие; осенью участники проекта обработают и проанализируют результаты. Договоренности с вузами были достигнуты на международном конгрессе «Язык, культура и технологические транзиты: новые грани человеческого» в 2022 году в ТГУ. 

Для оптимизации взаимодействия студентов и преподавателя гуманитарии ТГУ вместе с разработчиками IPST развивают еще один программный проект – универсальную образовательную цифровую среду «Новая платформа». Этот продукт 5 июля 2023 года был включен в Российский реестр программного обеспечения.

– Суть разработки в том, чтобы проводить аудиторные онлайн-занятия с помощью выстраивания интерактивных блоков, где пользователь выполняет разные задания – тестовые, с видео, с картинками, – рассказывает сотрудник IPST, магистрантка программы «Компьютерная и когнитивная лингвистика» ТГУ Даниэль Буйницкая. – Сначала мы реализовали модуль автопроверки заданий студентов для определения семантического сходства между двумя короткими определениями термина. Например, преподаватель создает упражнение: описывает, что такое медицина, и дает системе идеальный ответ, который мы считаем эталонным. Когда студент дает развернутый ответ, мы по разным метрикам сравниваем семантику между двумя определениями и определяем, насколько оно точное. 

Второй реализованный модуль – генерация вопросно-ответных структур на основании методического материала: на основе размещенного на платформе текста система генерирует вопросы по тексту с заведомо верным ответом. Сейчас автогенерация работает по двум тематикам – информационные системы и электроэнергетика. В дальнейшем разработчики проведут пользовательское тестирование большой аудитории, выделят и разместят на платформе актуальные темы, обработку которых затем автоматизируют. 

После продвижения платформы и полноценного нагрузочного тестирования авторы планируют внедрить нейронные сети, которые будут подстраивать автопроверку заданий и генерацию вопросно-ответных структур под конкретного преподавателя, добавляет магистрантка ТГУ. 

– Целевая аудитория «Новой платформы» – это, во-первых, преподаватели и методисты различных образовательных учреждений и других организаций, которым необходимо единое рабочее пространство для создания, редактирования, классификации, хранения и эффективного использования методического материала в работе с учащимися. Во-вторых, это студенты – им тоже важно иметь возможность выполнять задания и взаимодействовать с преподавателем в простой и удобной форме, – дополняет Валерия. 

В междисциплинарную команду проекта вошли: заведующая кафедрой общей, компьютерной и когнитивной лингвистики ТГУ, профессор Зоя Резанова (руководитель), доцент кафедры, кандидат исторических наук Алексей Бочаров, студентка магистратуры «Компьютерная и когнитивная лингвистика» ТГУ и старший программист Даниэль Буйницкая, старший программист IPST Анна Сергина, младший научный сотрудник лаборатории лингвистической антропологии ТГУ Валерия Владимирова

0E0A5193_1200.jpg

Для справки. Первая международная университетская премия в области больших данных и искусственного интеллекта «Гравитация – 2023» учреждена в 2023 году ТГУ и РАНХиГС при поддержке Университетского консорциума исследователей больших данных. Организаторами премии также выступают МГУ имени М.В. Ломоносова, МФТИ и МГТУ им. Баумана. 

Премия поддерживает университетские команды, работающие в области больших данных и искусственного интеллекта, и разработчиков программных решений для сферы образования. Инициатором ее учреждения выступил Томский государственный университет как один из лидеров по созданию и внедрению технологий в области искусственного интеллекта и больших данных в различных отраслях экономики, социальной сферы и государственном управлении.