«Статистический анализ данных входит в набор базовых умений современного человека»
15 сентября завершается прием документов на первую в России англоязычную онлайн-программу по прикладной статистике Applied Statistics with Network Analysis. Магистратура ВШЭ готовит грамотных специалистов, способных работать с данными для стратегирования бизнес-процессов, владеющих методологией анализа системы взаимодействий компаний и людей.
Академический руководитель онлайн-программы Иван Климов считает, что обыденность тезиса о революции данных не отменяет фундаментальности процесса.
— Иван Александрович, согласны ли вы с утверждением, что сегодня работа с данными и их анализ играют первостепенную роль в социальных и бизнес-процессах?
— Для начала сформулирую тривиальность: мы живем в эпоху взрывного роста данных. Мы оставляем кучу цифровых следов о нашем поведении, интересах, намерениях, связях. С другой стороны, различные исследовательские команды создают системы измерения, собирают и моделируют данные о самых разных процессах, в которых человек может даже и не участвовать или присутствовать косвенно: климатические вопросы, геологические данные, астрофизика, изобретение материалов, разработка и тестирование новых лекарств, эпидемиологические исследования и пр. Люди стремятся принимать решения, основанные на данных и на их анализе. И парадоксально: данных постоянно не хватает. Вспомните, например, дискуссии об изменении климата и факторах, которые на них влияют. Поэтому мой первый тезис — статистический анализ данных входит в набор базовых умений современного человека. Это как умение ходить в походы и играть на гитаре в шестидесятые годы. Ну или иметь аккаунт ЖЖ в нулевые. А сегодня уже стыдно не владеть Python или R.
— Программа сфокусирована на сетевом анализе. Почему из всего арсенала аналитики данных выбран именно он?
— Сетевой анализ — это своего рода пятое измерение при работе практически с любыми данными, с любым дата-сетом. Он фокусируется на взаимодействии, на связях и взаимоотношениях. Довольно часто сетевой анализ путают с анализом социальных сетей типа «Твиттера», «ВКонтакте» или YouTube. Но по мне он ближе к биохимии: антитела или белки в целом складываются из аминокислот и специфических связей между множеством разнообразных элементов. Узлами в сети (в сетевом анализе они называются нодами) может быть все что угодно: не только люди, но и минералы, планеты, ферменты. Главное, чтобы между ними фиксировалась какая-то связь – линки. И тогда мы можем приземлять на ноды любые из известных их характеристик и смотреть, как меняются характер и структура связей в зависимости от выбранного условия. Кстати, у нас есть телеграмм-канал, который так и называется — Nodes and Links. Там много примеров, где и как используется сетевой анализ.
Так что сетевой анализ не отменяет другие методы статистического анализа. Он может давать им неожиданное и иногда очень полезное расширение. И так уж повелось, что нодами во многих исследованиях оказываются люди и организации. Просто потому, что они друг без друга жить не могут — не могут хотеть, действовать, достигать, изменяться.
— Если сетевой анализ — это пятое измерение, что представляют собой другие четыре?
— Первое измерение — фокус исследования, его проблема, цель, ключевой исследовательский вопрос. Без целеполагания нет результата. Второе измерение – это объект, это носитель изучаемой проблемы. Это тот фонарь, под которым я потерял ключи, а не тот, под которым светло. Третье измерение — это время. Какой период времени нас интересует? Что произошло с людьми в определенный период? Когда начались изменения или же обострение какой-либо проблемы? Четвертое измерение — это данные и их структура. Garbage in — garbage out. Это любимая поговорка Валентины Кусковой, создателя и первого руководителя нашей лаборатории. Ну, и пятое измерение — это связи. О них мы уже говорили.
— Данных — море. Но насколько острой оказывается проблема их качества? Насколько точны данные, с которыми работают современные аналитики?
— Наши данные о мире не точнее того инструмента, которым мы их получаем. Если данные кривые, неполные, имеют какие-то систематические смещения, то и выводы будут ошибочными, смещенными. И ужасно, если мы даже не будем знать тип и величину искажений. Поэтому в науках о данных очень важно не только подобрать правильную модель или стратегию анализа. Важно уметь корректно планировать процедуры сбора данных, уметь непредвзято оценивать качество полученного дата-сета, а также иметь сквозное видение всего исследовательского процесса — поиск проблемы, постановка задачи, формулировка гипотез, планирование эксперимента или сбора данных, подбор инструментов анализа, корректная интерпретация результатов статанализа. Собственно, это понимание и получение такого опыта и лежит в основе целеполагания нашей магистерской программы.
— Что, на ваш взгляд, самое интересное в программе?
— Я сформулирую, возможно, не основной, но лично для меня важный момент. Это прикладной характер нашего подхода к обучению, нацеленность на решение практических и зачастую прикладных задач. Это участие в проектах как сотрудников лаборатории и Вышки, так и наших коллег в исследовательской индустрии.
Мы стараемся сделать так, чтобы слушатели смогли собрать себе неплохое портфолио проектов для будущего трудоустройства
Например, трое студентов взяли тему устойчивости социального предпринимательства как одной из форм малого и среднего бизнеса. Увлеклись настолько серьезно, что им оказали поддержку исследовательская группа ЦИРКОН и Центр социального предпринимательства и социальных инноваций НИУ ВШЭ. А фонд «Наше будущее» и Рыбаков-фонд выделили небольшие, но все-таки гранты на исследование. Для «РИА Новости» мы вместе со студентами сделали исследование о том, как люди взаимодействуют с интерактивным видео. Одна из магистранток защитила прекрасную работу на основе ай-трекинга, семантического дифференциала и специально разработанного типа интервью. Ну а заказчик — команда разработчиков — сэкономил 14 млн рублей, которые они намеревались пустить на, как выяснилось, бесперспективную разработку.
Еще один кейс. Коллега, которая занимается обучением и развитием руководителей, получила анонимизированный дата-сет с результатами тестирования почти 2 тысяч человек. Это были топ-менеджеры крупных российских компаний. Задачка была интересная: понять, есть ли гендерные различия в наборе деструкторов. Деструкторы — это те реакции, которые возникают в ситуации стресса, давления, неопределенности. Это есть у каждого человека. А у нас появилась возможность вытащить закономерности у достаточно труднодоступной группы — реальных лидеров и руководителей высшего уровня. Интересно? Мне кажется, что да.
— На кого ориентируется программа?
— В нашей орбите оказываются три типа слушателей. Первый — это уже сложившиеся профессионалы в области анализа данных, дата-майнинга. Они хотят что-то добавить к своей профессиональной экспертизе или усилить ее. К нам регулярно приходят финансовые аналитики, сотрудники IT-компаний, HR-специалисты, медики, вузовские преподаватели. Редко, но встречаются собственники бизнеса.
Второй тип слушателей — это недавние выпускники бакалавриата или даже магистратуры. Они хотят собрать свою уникальную конфигурацию базового профессионального образования. Например, соединить предметные знания в политологии, международных отношениях, в управлении организациями или государственном и муниципальном управлении с умениями в сфере анализа данных и в исследовательской работе. И конечно, это могут быть специалисты и из других предметных областей. В частности, социологи. На факультете социальных наук Вышки недавно появилась просто классная бакалаврская программа Computational Social Sciences. Наша магистратура — логичное продолжение их профессионального развития.
И третий тип магистрантов — слушатели из ближнего и дальнего зарубежья. Их привлекает структура программы, ее доступность, возможность строить индивидуальные треки. И конечно, все-таки сетевой анализ. В России и в мире не так много центров, где можно не только освоить методологию сетевого анализа, но также получить опыт работы в специализированных программах, увидеть, как решают подобные задачи реальные исследователи в реальных исследованиях.
Поэтому мы очень дорожим нашими профессиональными отношениями с коллегами из Университета Любляны, с нашими научными руководителями — Анушкой Ферлигой и Владимиром Батагелем. Они находятся на острие атаки в развитии сетевого анализа и входят в число ведущих специалистов в этой области.
— Насколько дефицитны выпускники программы? Какую карьеру они могут построить?
— Запрос на профессионала, умеющего работать с данными, добывать их, оценивать полноту и качество, делать расчеты и строить модели, будет только усиливаться. Данных меньше не станет, а задачи для анализа будут только множиться и усложняться. Аналитические задачи, моделирование и статистический анализ данных стали уже неотъемлемой характеристикой практически любого бизнеса — от прогнозирования цены на товар до анализа логистики, от HR-аналитики до анализа паттернов распространения информации в различных социальных группах и средах. У выпускников программы есть два наиболее понятных карьерных трека — это дальнейшее профессиональное развитие в корпоративной сфере, в командах аналитиков и маркетологов, а также академический трек, предполагающий, что вы скажете свое слово в науке и в методах исследований.
Но есть и другие возможности. Они связаны с умением принимать решения, ставить задачи и управлять людьми и командами. Тут уже недостаточно только лишь знаний методов анализа данных. Нужно уметь видеть ситуацию целиком, например, в компании или в том, как реализуется какая-то программа развития, как развиваются рынки. Это совершенно другие умения и навыки. Однако я уверен, что умение работать с данными, видеть основное и не отвлекаться на незначительное, умение опираться на аналитические материалы — это отличная основа для успешного лидера и руководителя.
Текст: Екатерина Зиньковская, Дирекция по онлайн-обучению
Вам также может быть интересно:
«За сетевым анализом будущее»
Что общего между эффективностью работы коллектива, могуществом семьи Медичи и эпидемией лихорадки Эбола? То, что их можно изучать с помощью сетевого анализа. В 2017 году в Вышке открывается новая англоязычная магистерская программа «Прикладная статистика с методами сетевого анализа». Об особенностях сетевых исследований в социальных науках рассказывает заведующая Международной лаборатории прикладного сетевого анализа Валентина Кускова.
Современный менеджмент: развитие исследований и исследователей
На факультете менеджмента ВШЭ прошел академический семинар молодых исследователей в менеджменте, а также завершились Седьмая ежегодная научная конференция «Современный менеджмент: проблемы, гипотезы, исследования» и Первая международная конференция по сетевому анализу. Форумы совместились не только по времени проведения — все три мероприятия имели общих спикеров и слушателей.
Российский сетевой анализ начинается в Вышке
В Высшей школе экономики создана Международная лаборатория прикладного сетевого анализа. О развитии нового научного направления и основных задачах лаборатории рассказывают ее руководители — профессор Университета Индианы Стэнли Вассерман и заместитель декана факультета менеджмента ВШЭ Валентина Кускова.
Летняя школа по сетевому анализу
С 22 по 30 июня Лаборатория Санкт-Петербургского кампуса ВШЭ «Социология образования и науки» планирует провести международную летнюю школу, посвященную сетевому анализу данных.
Партнерство с голландскими университетами
Даниил Александров, заместитель директора кампуса ВШЭ в Санкт-Петербурге, рассказывает о своей поездке в Нидерланды, целью которой было расширение партнерских отношений между Вышкой и голландскими университетами.