Новости

Мария Шклярук приняла участие в итоговой пресс-конференции Росстата о подведении итогов переписи населения 2021 г.

15 ноября в Калининграде прошла пресс-конференция Росстата «Перепись — итоги первого этапа». Мероприятие открылось выступлениями губернатора Калининградской области Антона Алиханова и руководителя Росстата Павла Малкова. 

Антон Алиханов отметил, что подведение предварительных итогов переписи на следующий день после окончания сбора данных стало возможно благодаря цифровизации этого процесса. Подготовка к проведению переписи в Калининградской области началась ещё в 2019 году и потребовала большой работы по приведению в порядок адресного хозяйства муниципальных образований. 

В свою очередь руководитель Росстата Павел Малков объявил о завершении первого этапа переписи населения — сбора данных — и старте нового этапа — их обработки. Он рассказал, что сбор данных производился на основе четырёх источников: переписчиков, портала «Госуслуги», административных данных различных органов власти и спецконтингента (военных, тюрем и других учреждений постоянного пребывания). Перепись проходила под пристальным вниманием и контролем общественности, в том числе с использованием социальных сетей. Далее предстоит большая работа по сведению данных и их очистке.

В переписи участвовало 268 тыс. переписчиков, 45 тыс. контролёров и 25 тыс. волонтёров, перед которыми стояла задача переписать более 50 млн домохозяйств и обеспечить работу более 40 тыс. переписных участков. Среди предварительных итогов переписи было отмечено, что с помощью портала «Госуслуги» было переписано более 25 млн человек (около 10 млн домохозяйств). Также если раньше на подведение итогов переписи уходило 3-4 года, то теперь ожидается, что результаты будут опубликованы в течение 2022 года.

Выступление генерального директора ЦПУР Марии Шклярук было посвящено значению данных переписи для аналитиков и исследователей. Она отметила два базовых сценария их использования — агрегированные данные и микроданные, а также призвала к открытому диалогу с исследовательским сообществом по вопросам доверия к данным переписи 2021 года. 


Полный текст выступления Марии Шклярук приведён ниже. 

Добрый день! Меня зовут Мария Шклярук, я генеральный директор Центра перспективных управленческих решений, мы делаем исследования на данных и помогаем госорганам принимать решения с опорой на данные и на научные методы, то есть действовать в логике подходов доказательной политики.

ЦПУР вместе с госорганами, в том числе с Росстатом, работает над открытостью и повышением удобства и доступности госданных для использования научно-исследовательским сообществом. В этом ключе у данных переписей населения есть два базовых сценария их использования.

Первый сценарий — это использование агрегированных данных переписи (то есть тех, что публикуются Росстатом по итогам каждой Всероссийской переписи населения) в качестве контрольных или нормирующих переменных в большом количестве исследований о социально-экономическом и демографическом состоянии российского общества. Численность населения, распределение по полу, возрасту, уровню образования в разрезе регионов или муниципалитетов включаются в построенные регрессионные модели и помогают, таким образом, точнее обнаруживать зависимости между другими — основными — переменными в исследовании.

Примером такого исследования может служить публикация наших коллег из Российской экономической школы, в рамках которой они оценили, какие факторы влияли на уровень социального дистанцирования в крупных российских городах во время пандемии. Чтобы учесть различия в структуре населения, использовались как раз результаты прошлых переписей — данные с детализацией до населенного пункта и муниципалитета. Хотела бы обратить внимание коллег из Росстата на то, что при ежегодном перерасчете показателей о численности населения на основе административных данных важно сохранять именно этот уровень детализации — раскрывать не только цифры по численности населения муниципальных образований, но и сохранять привязку к населённым пунктам и информацию о половозрастной структуре.

Второй сценарий использования данных Всероссийской переписи населения подразумевает использование гораздо более детальных данных — так называемых микроданных, где объектом наблюдения будет конкретный переписанный человек или домохозяйство. Естественно, такие данные публикуются не полностью по всей «переписанной России», а формируется выборка (семпл), который Россию будет репрезентировать, но в котором будет сохранена анонимность каждого человека и домохозяйства. Перед публикацией такие данные должны проходить все необходимые проверки на риски нарушения этой анонимности.

Микроданные переписей населения — одни из самых востребованных данных официальной статистики в мире. Это связано с тем, что в отличие от агрегированных показателей на них можно проводить гораздо более детальные исследования. С одной стороны, можно искать инсайты в самих данных переписей, например для изучения миграции: использование ответов на вопрос о предшествующем месте жительстве в переписных листах позволяет оценить миграцию в разных возрастных группах и регионах. С другой стороны, при объединении с другими микроданными, можно оценивать эффект от реализации мер госполитики. Например, именно так наши другие коллеги из Российской экономической школы смогли обнаружить и доказать факт значимого влияния программы материнского капитала на рождаемость в российских регионах.

Однако главное требование исследовательского сообщества к данным переписи — это возможность доверять им. Для формирования этого доверия крайне важно понимать ограничения в собранных данных, в том числе текущей переписи населения, понимать те проверки, которые были проведены Росстатом по вычистке задублированных данных. Большой вопрос вызвала озвученная за несколько дней до завершения переписи цифра в 99% переписанных, несмотря на очевидно затрудненный доступ переписчиков к респондентам в период пандемии.

Хорошим ответом на эти сомнения может быть раскрытие Росстатом хотя бы для исследователей детальных итогов проведения контрольных мероприятий, а также информации о том, какая доля населения была переписана по административным источникам. Идеальных данных не бывает, и важно открыто обсудить те ограничения, которые есть. Со своей стороны мы готовы организовать такой диалог представителей Росстата и научно-исследовательского сообщества.

Условия пандемии и использование новых форматов заполнения переписных листов у части исследователей вызывают сомнения в том, насколько полные и точные данные были получены Росстатом в рамках Всероссийской переписи населения-2021. Есть три основные группы потенциальных проблем в данных Всероссийской переписи населения-2021, собранных Росстатом. 

  1. Цифра переписанных как целевой показатель для территориальных органов Росстата и переписчиков. Наличие у переписчиков и территориальных органов Росстата плана по переписанным может приводить к тому, что в последние дни переписи оставшиеся наблюдения заполняются переписчиками по административным данным. Беспокойство вызывает возможность чрезмерного использования административных данных и возможность смешения реально собранных данных с административными, которые не отмечены как таковые, данными.
  2. Использование онлайн-данных совместно с переписчиками делает потенциально возможным двойное переписывание. Легко можно предположить, что часть граждан, прошедших перепись онлайн, не встретятся с переписчиками, которые потом перепишут их повторно по административным данным, не имея формального основания, чтобы исключить их из переписи.
  3. Негативное отношение респондентов к проведению переписи. Текущую волну переписи отличает от двух предыдущих негативное отношение к переписи. Можно заметить несколько дискурсивных объяснений: 1) государство о нас всё уже знает, поэтому перепись — бессмысленная трата денег; 2) государство узнает о нас, что мы делаем что-то нехорошее (например, что мы живём на доход от сдачи жилья и не платим налоги), и будет использовать это против нас; 3) возможность распространения коронавируса (переписчики без масок и пр.). Все они приводят к тому, что население отказывалось от участия в переписи активнее, чем в прошлые разы.