Госстат генерирует львиную долю данных об экономике Украины, но технологически застрял в прошлом. Решит ли цифровизация все проблемы
Amazon інвестує мільярди доларів у ШІ, роботів та машинне навчання. Якими принципами й правилами керується компанія?
Дізнайтеся вже 22 листопада на Forbes Tech 2024. Купуйте квиток за посиланням!
Провести перепись населения в Украине в партнерстве с техгигантом Apple – одна из идей главного диджитализатора страны Михаила Федорова. Она появилась в 2021-м, когда глава Минцифры стал координатором развития Государственной службы статистики. Идея отложена как минимум до победы, но не похоронена. «Минцифры никогда ничего не прячет», – улыбается Федоров.
Вместо этого у цифрового министерства есть другой проект – перевести на диджитальные рейки сам Госстат. Аудит начали в 2021 году, активную разработку – уже во время полномасштабной войны. «Задача – построить современную организацию, которая больше похожа на IT-компанию и в режиме реального времени собирает, быстро обрабатывает и распространяет данные», – говорит Федоров. Насколько это амбициозно?
Видимая пользователям часть проекта – новый портал Госстата. Его планируют запустить во второй половине 2023-го. За кулисами – реорганизация административной структуры, создание внутренней IT-системы для сбора и обработки информации, перенос исторических данных за более чем три десятилетия независимости. Смета от консалтинга к реализации – около 55 млн грн. Финансирование – за счет программы EGAP, поддерживаемой правительством Швейцарии. Разработка – силами EPAM, крупнейшего в стране IT-игрока. Как это должно работать и поможет ли вылечить Госстат от накопленных «болезней»?
Как превратить государственный орган в IT-компанию
Попытки построить современную IT-систему были и раньше, говорит глава Госстата Игорь Вернер. Бывший военный и кандидат технических наук возглавляет главный статистический орган страны с 2016 года. За два года до его назначения Госстат получил интегрированную систему статистической информации, в которую завели около 40 исследований. Это менее половины из более чем 90 утвержденных правительством.
Часть систем обработки данных в Госстате работает с 90-х годов прошлого столетия, часть – с середины 2010-х. «Информация часто очень устарела и передается несовременными средствами: что-то на флешке отправляется, что-то – электронными средствами», – говорит Федоров. Решения из разных эпох решили не обновлять, а заменить одним современным.
Фишка обновленной системы – опция автоматизированного сбора данных и взаимодействие с другими административными реестрами. Например, можно получать информацию о потребительских ценах не от выборки респондентов, регулярно заполняющих опросники, а от PPO в магазинах и супермаркетах.
Другой пример – статистика средней заработной платы. Сейчас Госстат выводит ее на основе информации от ряда предприятий. Но есть возможность брать полный массив данных непосредственно в Пенсионном фонде и обрабатывать их по своей методологии, говорит Вернер. Однако эта задача на перспективу – чтобы получать статистику напрямую от ПФУ, нужно сначала обновить несколько законов.
Госстат собирает огромное количество информации внутри страны, предоставляет ее Евросоюзу, ООН, МВФ, другим международным организациям, говорит вице-президент EPAM в регионе Центральной и Восточной Европы Юрий Антонюк. «С технологической точки зрения это тоже сложный проект, – говорит он. – Нужно не только поставить новую систему, но и нужны новые люди, которые будут с ней работать». Подобное решение EPAM внедряет для одного международного финансового института, но больше деталей не разглашает.
Параллельно с оцифровкой систем в Госстате идет оптимизация. В 2022-м штат госоргана уменьшили с более чем 6000 сотрудников до 4600, убрав дублирование функций в региональных подразделениях. Конечная цель – сокращение на 30% и создание единого центрального юрлица. Отдельный челлендж – научить команду работать с новой IT-системой, говорит Федоров, нанять крутых дата-аналитиков или Python-разработчиков.
Новое IT-решение уже работает в тестовом режиме – туда переносят первые исследования. Также готовится обновление портала пользователя – замена нынешнему сайту Госстата. Статистику на нем можно будет просматривать на дашбордах или в виде интерактивных таблиц, скачивать в форматах xls или CSV. Также предусмотрена функция получения данных через API.
Показать первые результаты работы Федоров надеется в августе 2023 года. Что об изменениях в Госстате думают пользователи?
Что не так с государственной статистикой
«Данные – новая нефть», – эту фразу чаще всего приписывают британскому математику Клайву Гамби. В 2020-м Европейский портал данных (European Data Portal) оценивал рынок открытых данных в €184 млрд. Прогнозируемый рост – до €334 млрд в 2025-м, говорится в исследовании. В Украине проблемы с обработкой этой «нефти» накапливались годами.
«Все, что изменит Госстат, либо убьет Госстат, либо будет хорошо», – радикально настроен Алексей Иванкин, соучредитель компании «Опендатабот», работающей с открытыми данными. Нехватка актуальной информации об украинцах из-за того, что последняя перепись проводилась 22 года назад – самая известная, но не единственная проблема.
«Данные очень медленно считаются, иногда есть противоречия с данными реестров», – перечисляет Иванкин. Статистические наблюдения публикуются непонятным образом, они разбросаны по сайту в разных таблицах разных форматов, добавляет Кирилл Захаров, эксперт по открытым данным и представитель сообщества OpenUp. Другой пример – подробная статистика по отдельным регионам, рассеянная по сайтам региональных управлений статистики.
Еще один открытый вопрос – доступ экономистов и исследователей к так называемым микроданным, детальным срезам информации. Это позволяет оценивать, как определенные факторы влияют на среднюю заработную плату, доходы домохозяйств, экономику брака, приводит пример директор Института поведенческих исследований American University Kyiv Владимир Вахитов. Статистики такими оценками не занимаются, а у ученых нет информации. «Все это богатство данных никоим образом не используется, потому что оно секретно согласно закону о статистике», – говорит Вахитов.
Новый закон о статистике вступил в силу с января 2023 года. Он предполагает, что ряд международных организаций могут получать микроданные бесплатно, а остальные специалисты – на платной основе, говорит Вернер. Однако на апрель такого доступа еще не получила ни одна организация.
С февраля 2022-го к перечню добавилась проблема, которую не решит ни одна IT-система. Большинство важных данных не публикуется с начала войны, говорит Иванкин. В результате украинская экономика за 13 месяцев полномасштабного вторжения потеряла по меньшей мере 36 млрд грн, подсчитал основатель аналитической компании YouControl Сергей Мильман в колонке для издания «Бизнес.Цензор».
Почему все эти вопросы придется решать? 90% доступных данных об экономике Украины – государственные, говорит руководитель Аналитического отдела Sense Bank Алексей Блинов. «У Госстата выборка самая большая в стране, и я думаю, что это никогда не изменится», – добавляет он.
Сложнее всего – перенести исторические данные без потери качества, считает Федоров. По его расчетам, на это уйдет два-три года. «Как бы мне ни хотелось сделать эту реформу за год, такие глубинные фундаментальные реформы делаются все-таки несколько лет», – говорит он.
Вы нашли ошибку или неточность?
Оставьте отзыв для редакции. Мы учтем ваши замечания как можно скорее.