«Для дипломной работы я полтора года только собирал данные»
Студент 4-го курса образовательной программы «Экономика» НИУ ВШЭ Стефано Босколо Фьоре недавно защитил диплом по теме «Оценка влияния ремонтных дорожных работ на частоту и тяжесть ДТП», получив 10 баллов. Как ему удалось добиться такого результата, что восхитило комиссию в его работе, почему он не собирается уезжать из Москвы, без пяти минут выпускник Вышки рассказал новостной службе портала.
О выборе направления и поступлении в Вышку
Мой отец итальянец, а мама русская. Я родился в Италии, но моя семья переехала в Россию, когда я был совсем маленький. Школу — вернее, Лицей НИУ ВШЭ — окончил в Москве. Когда я поступал в лицей, он еще не пользовался такой популярностью, как сейчас, но о нем уже говорили. Конкурс и тогда уже был высокий, но сейчас гораздо выше. Мне не задавали суперсложных вопросов на собеседовании. Тогда вполне можно было поступить, если ты просто хорошо освоил школьную программу. Думаю, сейчас это сделать намного труднее. Тогда я не так сильно интересовался математикой, поэтому выбор бакалавриата на факультете экономических наук Вышки для меня стал более или менее случайным. Естественно, я не имел такого представления об экономике, как на 2–3-м курсе. Я решил поступать на факультет экономических наук по совету родителей, хотя поначалу думал о социологии. Теперь счастлив, что не ошибся с выбором.
Я учился не на бюджете, поступал по общему конкурсу. На Всеросе по итальянскому языку я не попал в число победителей, но вышел в заключительный этап, поэтому получил 50-процентную скидку на обучение в НИУ ВШЭ — и в первый же год из-за социологии слетел с этой скидки, такая ирония судьбы. Первый год я не очень хорошо готовился к тем предметам, которые не считал профильными для экономиста, и получил три удовлетворительные оценки. По итогам 2-го курса я уже вошел в рейтинг и снова получил скидку.
О преподавателях, учебе и работе
В целом все преподаватели, которые с нами работали, очень профессиональные. Некоторые предметы мне не сильно нравились — философия, социология. Мне казалось непонятным и обидным, что они оцениваются и влияют на рейтинг так же, как и макроэкономика и математика с метрикой и тервером. Университет обязан их преподавать, но это единственное, что мне не нравилось в Вышке.
Во время учебы на любой паре чувствовалась дружелюбная атмосфера, преподаватели всегда шли на контакт. Есть и такие, которые надолго останутся в моем сердце: мой научный руководитель Иван Павлович Станкевич, Полина Анатольевна Королева, которая вела у нас микроэкономику. Самое сложное в учебе было наверстывать, если пропустил часть материала. В плане дедлайнов тоже приходилось тяжело, хотя они были и в лицее, и я к этому, можно сказать, привык, но каждый раз начинаешь все делать в последний момент, и, если имеешь другие заботы, помимо учебы, это тяжело дается.
На 2-м курсе началась пандемия, учеба перешла в онлайн, и стало гораздо удобнее, потому что появилась возможность просматривать лекции и семинары в записи. Это круто, особенно если ты совмещаешь учебный процесс с работой
Работать я начал еще на 1-м курсе, ночным администратором в отеле. Ночью работал, потом приходил утром на учебу. Мне хотелось финансовой независимости. Но потом мне разонравилось, потому что эта работа предлагала невысокие деньги и никакой умственной деятельности, только коммуникативная. Это интересно, но скорее прожигание времени. Я стал работать в компании отца, где многому научился. На 3-м курсе я открыл свою компанию, тоже с отцом. Мы с нашими партнерами занимались производством и организацией поставок свежих салатов в Россию и другие страны. Сейчас у меня есть идеи, связанные с предпринимательством. Работа по найму меня не сильно интересует, пока есть возможность заниматься чем-то своим, что можно разработать и внедрить. Мне очень нравится Москва, нравится, как она развивается. Я не собираюсь никуда переезжать, в ближайшее время так уж точно. Я вижу тут только хорошее.
Дипломная работа
«Оценка влияния ремонтных дорожных работ на частоту и тяжесть ДТП»
ФИО студента: Босколо Фьоре Стефано
Руководитель: Станкевич Иван Павлович
Кампус/факультет: факультет экономических наук
Программа: «Экономика» (бакалавриат)
Год защиты: 2022
Согласно федеральной статистике, более 9000 россиян ежегодно погибают в результате автомобильных происшествий. Для улучшения распределения бюджета и повышения дорожной безопасности необходимо понимать, какие факторы влияют на степень тяжести и частоту ДТП. В данной работе была собрана большая база данных ДТП на Ленинградском шоссе в пределах Москвы и оценены два вида моделей: модели для степени тяжести и модели для частоты происшествий.
О научном руководителе и теме для исследования
Я защитил ВКР (выпускная квалификационная работа. — Ред.) по теме «Оценка влияния ремонтных дорожных работ на частоту и тяжесть ДТП». Заняться базой ДТП пришло в голову моему научному руководителю. У ГИБДД есть достаточно большая база данных, она в открытом доступе и в целом сделана круто. Из нее можно выгружать файлы, анализировать ее, делать выводы. Это малоизученная история, особенно если рассматривать влияние дорожных работ на число ДТП.
На 2-м курсе Иван Павлович Станкевич преподавал теорию вероятностей в моей группе и согласился стать научным руководителем моей курсовой работы. Мне так понравилось с ним работать (хочется верить — ему со мной тоже), что на 3-м курсе я снова обратился к нему. И мы договорились, что я буду анализировать базу данных ДТП. У меня была амбициозная идея — сделать хот-спот модели. У меня это не совсем получилось, потому что только данные для этого я собирал полтора года. Это долгий процесс, если делать все грамотно. Добавить датасет ремонтов было сложно, так как у него нет спецификации, это текстовые таблицы с координатами.
База данных крутая, но очень сырая, с ней ничего невозможно делать в исходном виде. У вас просто есть некие вводные данные — это карточки ДТП, в которых очень много параметров: употреблял ли водитель алкоголь, координаты ДТП, время и дата, время суток, какое нарушение сделали водители, при каких обстоятельствах. Очень много параметров, но их не всегда точно собирают. Например, в этой работе у меня не получилось проанализировать влияние алкоголя: в одной карточке есть об этом данные, в другой нет.
Карточки есть по всей Москве, но весь огромный город в работе не охватишь. Первоначальная структура данных — карточки ДТП с участниками и параметрами — в формате xml. Данные нужно так закодировать, чтобы получить те переменные, которые можно взять в модели. Я писал диплом на базе курсовой 3-го курса. Плюс к этой базе данных мы добавили ремонты. Информация о них выложена на портале открытых данных города Москвы, но выгрузить данные оттуда сложно. Есть архивы за 2016–2017 годы, там данные нужно искать, и это сложно. Моя дипломная работа делится на две части: о степени тяжести ДТП и о частоте ДТП. Для степени тяжести я добавлял к каждому ДТП расстояние до ближайшего активного ремонта в километрах. И это уже можно анализировать. Я делал анализ в R (язык программирования. — Ред.), мне пришлось этому учиться с нуля на 3-м курсе. И научный руководитель постоянно мне помогал, был на связи, а я писал ему по 20 раз в день.
О потолке в исследовании
Часть выдвинутых мной предположений подтвердить не удалось. Но в целом я очень доволен результатами, наши основные гипотезы — что ремонт влияет на частоту или степень тяжести ДТП — подтвердились. Я подобных исследований не нашел, идея непопулярная. Мне нравится, что ее можно развить во что-то еще более интересное, тут нет границ, это исследование будет двигаться вперед. Например, я взял только Ленинградское шоссе. Одно из направлений развития — другие дороги, сопоставимые с этой трассой. Также можно расширять инструментарий, смотреть другие модели, добавлять переменные, новые данные, например информацию с видеокамер. В моей работе уже почти 200 переменных. Самое главное — расширять временной период, тогда можно получить более устойчивые и точные результаты.
Иван Станкевич, старший преподаватель факультета экономических наук ВШЭ
Научным руководителем у Стефано я стал еще на его 2-м курсе бакалавриата — уже тогда он проявлял явную заинтересованность в исследовательской деятельности, его вопросы выходили за пределы стандартных курсов. Поэтому, когда он захотел писать у меня курсовую, я с радостью его взял и не пожалел.
К текущей теме мы пришли на 3-м курсе, и курсовая Стефано в значительной степени сводилась к сбору и обработке этих данных с более базовым анализом. Статистика ГИБДД по авариям, при всем богатстве информации, в ней представленной, — не самая простая для анализа. Даже чтобы просто выкачать достаточный объем данных, нужно потратить изрядное количество времени и сил. В этом году мы, сформировав основную часть базы (хотя понадобились, конечно же, доработки, равно как и привлечение других источников), смогли приступить к анализу. Выбор именно ремонтных работ как основного фокуса исследования обусловлен заметной недоисследованностью этого вопроса в мировой литературе (важное замечание: в отечественной литературе аварийность в принципе практически не исследована), притом что они очевидным образом влияют на характеристики дороги и, как следствие, могут влиять и на аварийность. ДТП — действительно серьезная проблема, которая представляет интерес не только общетеоретический, но и сугубо практический.
Елена Вакуленко, доцент департамента прикладной экономики ФЭН
Я была членом комиссии по защите ВКР, в которой защищался Стефано. Его работа про влияние ремонтных работ на ДТП значимо отличалась от других, защищавшихся в этот день. Стефано с такой увлеченностью и профессионализмом рассказывал о своей работе, что все члены комиссии безоговорочно сошлись во мнении: эта блестящая работа заслуживает максимальной оценки — 10 баллов. Работа проделана на уникальной базе данных, которую автор кропотливо собирал на протяжении полутора лет. Стефано продемонстрировал аккуратную работу с данными, отличное знание эконометрических моделей вероятностного выбора и счетных данных, а также умелое владение методами машинного обучения. Но самое важное — это практическое значение работы, поскольку проанализированы и количественно оценены различные причины ДТП, что позволит органам государственной власти эффективно распределять бюджет и повысить безопасность на автодорогах.
20 июля в 19:00 состоится вебинар, на котором Стефано Босколо расскажет о результатах своего исследования.