Зачем нужны большие данные в культуре, выясняли на всероссийском хакатоне

Студентка Высшей школы журналистики ТГУ Дарья Ромакер работала над проектом по дата-журналистике на студенческом хакатоне «ХАРТ» в Санкт-Петербурге. Темой хакатона стала визуализация данных в области культуры — большие данные о музеях, коллекциях и архитектурных объектах. Было подано больше 100 заявок от студентов из многих вузов России, по итогам конкурсного отбора выбрали 30 человек, в том числе Дарью. 

— «Основы визуализации данных. Опыт не требуется», — прочитала я в анонсе хакатона, — рассказывает Дарья Ромакер. — «Моё! Беру!» — пронеслось в голове. Откуда ты приехал, на каком факультете учишься, в каком университете и есть ли у тебя опыт работы с большими данными — всё это было неважно при отборе. В Санкт-Петербурге нас разделили на шесть команд и предложили программу-максимум: два полных дня погружения в тему, две освоенные компьютерные программы для работы с данными, шесть датасетов. 

Освоить основы анализа и визуализации данных участникам хакатона помогал дата-журналист, специалист по визуализации данных Андрей Дорожный. Андрей — автор Telegram-канала «Дата публикации» об инструментах для работы с данными без программирования и создатель собственной дата-студии. Он рассказал студентам, зачем визуализировать данные, как работает эта визуализация, как избежать ошибок при выборе графика и работе над его элементами. 

SAVE_20221125_164621crop.jpg
Участники хакатона

На первом этапе участники сделали наброски визуализации больших данных на бумаге, а затем приступили к созданию визуализаций в инструменте Tableau при поддержке наставников команд: дизайнера инфографики Константина Мшагского, дата-художницы, автора Telegram-канала Data-comics Натальи Киселевой и студентки магистратуры «Прикладной анализ данных» Европейского университета Дианы Бадалян

Участникам было предложено шесть датасетов с набором данных из области мировой культуры. Что чаще всего изображалось на полотнах эпохи Возрождения в разных странах? На музеи каких регионов приходится наибольшее число посещений? Какие архитектурные стили преобладали на территории Васильевского острова в разные века? Как составить культурный маршрут с помощью интерактивной карты? Какие слова чаще всего встречаются в названии скульптур? В каких регионах прошло больше всего выставок для слабовидящих? Каждая команда должны была выбрать один сет и визуализировать данные из него. 

— Вы знали, что в Петербурге около девяти тысяч скульптур, а самое часто встречаемое слово в их названиях «Ленин»? — рассказывает Дарья Ромакер. — Подобные сведения программа Tableau может выдать за пару секунд, если уметь ею пользоваться. В этой «каше» данных можно найти информацию про Томск и его культуру или, например, имя самого плодовитого скульптора России. Самое удивительное, что многие датасеты находятся в свободном доступе, но мало кто про это знает. 

Команда, участницей которой была томская студентка, изучала раздел «Скульптура» в открытых данных Государственного каталога Музейного фонда РФ. В процессе создания визуализаций выяснилось, что Пермский край находится на втором месте в России после Петербурга по богатству фонда скульптур. Кроме того, студенты узнали имя самого продуктивного скульптора Госкаталога. 

SAVE_20221125_164325crop.jpg
Студентка Высшей школы журналистики ТГУ Дарья Ромакер

— Поиск информации, попытки её визуализировать, работа в команде и защита проекта — всё это стало для меня возможностью проверить на деле навыки, которые я нарабатывала последние два года в ТГУ. Хакатон дал мне возможность получить новые знания в той сфере, про которую я ещё летом этого года думала: ну нет, я туда не полезу... Полезла — и не пожалела! Сейчас у меня такое чувство, будто я разблокировала для себя новую локацию — Санкт-Петербург, а вместе с этим получила направление для самореализации, — подводит итог Дарья Ромакер

Хакатон был организован Прикладным центром машинного обучения, анализа данных и статистики (ПЦ МАСТ) и Школой искусств и культурного наследия Европейского университета. Поездка студентки Высшей школы журналистики в Санкт-Петербург состоялась при поддержке Центра академической мобильности ТГУ. 

При подготовке публикации использованы материалы сайта Европейского университета в Санкт-Петербурге (ЕУСПб) 

Текст: Ирина Корнева, факультет журналистики ТГУ.
Фото: из архива Дарьи Ромакер