Предметно-ориентированный подход к «борьбе» с пропущенными данными в типологическом анализе

Предметно-ориентированный подход к «борьбе» с пропущенными данными в типологическом анализе


Татарова Г. Г.

Доктор социологических наук, профессор, главный научный сотрудник Института социологии ФНИСЦ РАН, Москва, Россия tatarova-gg@rambler.ru

Бессокирная Г. П.

Кандидат экономических наук, доцент, старший научный сотрудник Института социологии ФНИСЦ РАН, Москва, Россия gala@isras.ru

ID статьи на сайте журнала: 6972


Ссылка при цитировании:

Татарова Г. Г., Бессокирная Г. П. Предметно-ориентированный подход к «борьбе» с пропущенными данными в типологическом анализе // Социологические исследования. 2017. № 12. С. 42-54.
DOI 10.7868/S0132162517120054



Аннотация

Статья посвящена проблемам оценки качества первичных данных массовых опросов в процессе подготовки рабочих файлов для решения задач многомерного анализа. К числу подобных проблем относится введение критериев качества, часть из которых носит общий характер для различных способов анализа, а часть – специфический и зависящий от предполагаемой исследовательской практики. В нашем случае таковой является типологический анализ для цели реконструкции социальных типов как объектов функционального управления. На примере первичных данных опроса рабочих промышленных предприятий оценивается качество переменных и объектов для цели типологизации. Предлагается логика «борьбы» с пропущенными (отсутствующими) данными, опирающаяся на предметно-ориентированный подход. В основе последнего лежит идея восстановления (импутации) значений не исходных переменных, а индексов, играющих, в частности, роль классификационных признаков. Это те переменные, которые подаются на вход процедур разбиения объектов на классы. Выделяются несколько шагов в процессе формирования рабочих файлов для типологического анализа: оценка качества переменных, соответствующих первой части типообразующих признаков и используемых для формирования классификационных признаков (шаг 1); уточнение факторной структуры этих переменных (шаг 2); формирование классификационных признаков (шаг 3); присвоение значений индексам для случаев пропущенных данных (шаг 4); включение в рабочий файл переменных из второй и третьей части типообразующих признаков (шаг 5).


Ключевые слова
качество данных; типологический анализ; пропущенные данные; импутация данных; типообразующие признаки; классификационные признаки; индексы


Список литературы

Бессокирная Г.П. Факторный анализ: традиции использования и новые возможности // Социология: методология, методы, математические модели. 2002. № 12. С. 142–153.

Бессокирная Г.П., Татарова Г.Г. Идентификация с предприятием: концептуальная модель и инструментарий исследования // Спутник ежегодника «Россия реформирующаяся». Выпуск 2014 / ИС РАН. М.: ИС РАН, 2014. 1 CD ROM.

Бессокирная Г.П., Татарова Г.Г. Социальные типы рабочих как объекты управления // Современный менеджмент: проблемы, гипотезы, исследования: сб. науч. тр. Вып. 3. Ч. 2. М.: Изд. дом Высшей школы экономики, 2011. С. 253–264.

Воронин Г.Л. Еще раз о «кластерах на факторах» // Социологический журнал. 2010. № 3. С. 21–34.

Галицкая Е.Г., Галицкий Е.Б. Кластеры на факторах: как избежать распространенных ошибок? // Социология: методология, методы, математическое моделирование. 2006. № 22. С. 145–161.

Зангиева И.К. Проблема пропусков в социологических данных: смысл и подходы к решению // Социология: методология, методы, математическое моделирование. 2011. № 33. С. 28–56.

Зангиева И.К., Сулейманова А.Н. Подходы к агрегированию результатов множественного заполнения пропусков: сравнительный анализ // Социология: методология, методы, математическое моделирование. 2016. № 42. С. 7–60.

Зангиева И.К., Тимонина Е.С. Сравнение эффективности алгоритмов заполнения пропусков в данных в зависимости от используемого метода анализа // Мониторинг общественного мнения. 2014. № 1(119). С. 41–55.

Караханова Т.М., Бессокирная Г.П., Большакова О.А. Труд и досуг рабочих (программа, инструментарий и некоторые предварительные результаты повторного исследования). URL: http://www. isras.ru/publ.html?id=3224 (дата обращения: 19.05.2017).

Крыштановский А.О. «Кластеры на факторах» – об одном распространенном заблуждении // Социология: методология, методы, математическое моделирование. 2005. № 21. С. 172–187.

Кутлалиев А.Х. Метод множественного восстановления данных // Социологические методы в современной исследовательской практике: сборник статей, посвященный памяти первого декана факультета социологии НИУ ВШЭ А.О. Крыштановского / Под ред. О.А. Оберемко. М.: Издательский дом НИУ ВШЭ, 2011. С. 201–208.

Литтл Р.Д, Рубин Д.Б. Статистический анализ данных с пропусками. М.: Финансы и статистика, 1990.

Татарова Г.Г. Типологический анализ как исследовательская стратегия // Социологические методы в современной исследовательской практике. Материалы Всероссийской научной конференции памяти А.О. Крыштановского. М.: ГУ ВШЭ, 2007а. С. 114–123.

Татарова Г.Г. Основы типологического анализа в социологических исследованиях. М.: Высшее образование и наука, 2007б.

Татарова Г.Г., Бессокирная Г.П. Идентификация с предприятием: индексы для типологического анализа работников // Спутник ежегодника «Россия реформирующаяся». Вып. 2014 / ИС РАН. М.: ИС РАН, 2014а. 1 CD ROM.

Татарова Г.Г., Бессокирная Г.П. Идентификация с предприятием: классификация работников и выявление управляемых факторов трудовой деятельности // Спутник ежегодника «Россия реформирующаяся». Вып. 2. 2015: сборник научных статей / ИС РАН. М.: ИС РАН, 2016а [Электронный ресурс]. 1 CD ROM.

Татарова Г.Г., Бессокирная Г.П. О формировании базовых типообразующих признаков для выявления социальных типов работников как объектов управления // Социологическая наука и социальная практика. 2014б. № 1. С. 32–50.

Татарова Г.Г., Бессокирная Г.П. Типологический анализ для реконструкции социальных типов работников: концептуальное и эмпирическое обоснование // Социологические исследования. 2011. № 7. С. 3–15.

Татарова Г.Г., Бессокирная Г.П. Типологический анализ наемных работников в контексте их социальной адаптации // Россия реформирующаяся. Ежегодник. 2016б. Вып. 14. С. 21–49.

Толстова Ю.Н., Зангиева И.К. Статистический подход к анализу данных при заполнении пропусков // Проблемы подготовки первичных данных в социологическом исследовании / Отв. ред. Ю.Н. Толстова, О.А. Оберемко. М.: Российское общество социологов, 2012. С. 114–127.

Фабрикант М.С. Модель-ориентированный подход к отсутствующим значениям: множественная импутация в многоуровневой регрессии посредством R (на примере анализа опросных данных) // Социология: методология, методы, математическое моделирование. 2015. № 41. С. 7–29.

Содержание номера № 12, 2017