Data minig в социологии:
опыт и перспективы проведения исследования
Мальцева А. В.
Доктор социологических наук, профессор Алтайского государственного университета, Барнаул, Россия annamaltseva@rambler.ru
Шилкина Н. Е.
Кандидат социологических наук, доцент кафедры социологии молодежи и молодежной политики, Санкт-Петербургский государственный университет, Санкт-Петербург, Россия. n.shilkina@spbu.ru
Махныткина О. В.
Кандидат технических наук, доцент Алтайского государственного университета, Барнаул, Россия olesyamahnitkina@yandex.ru
Мальцева А. В., Шилкина Н. Е., Махныткина О. В. Data minig в социологии: опыт и перспективы проведения исследования // Социологические исследования. 2016. № 3. С. 35-44
Рассматриваются принципы, опыт и перспективные возможности анализа больших объемов данных с помощью методов Data Mining. Основные положения иллюстрированы примерами эмпирических исследований (базы данных государственной службы занятости Управления Алтайского края по труду и занятости населения, более 200 переменных, более 500000 записей). Описаны подготовка данных к анализу, кластеризация методом самоорганизующихся карт признаков и построение деревьев решений. Обоснованы критерии оценки качества применения Data Mining и принципы интерпретации результатов. Показано, что использование Data Mining в социологии перспективно, методологически обосновано и практически выполнимо.
Федеральный закон от 27.07.2006 № 152-ФЗ (ред. от 21.07.2014) “О персональных данных” (27 июля 2006 г.)
Абруков В.С., Карлович В.Е. Разработка моделей социальных явлений с помощью Data Mining // Социология вчера, сегодня, завтра. Новые ракурсы. III Социологические чтения памяти Валерия Борисовича Голофаста / Под ред. О.Б. Божкова. СПб.: Эйдос, 2011.
Абруков В.С., Николаева Я.Г. Количественные и качественные методы: соединяем и властвуем // Социологические исследования. 2010. № 1. С. 142–145.
Алексеенок А.А., Бараночников В.А. Методика классификации населения региона по протестному потенциалу // Фундаментальные исследования. 2013. № 10(9). С. 2090–2095.
Анализ данных и процессов: учеб. пособие / А.А. Барсегян, М.С. Куприянов, И.И. Холод, М.Д. Тесс, С.И. Елизаров. СПб.: БХВ-Петербург, 2009.
Берестнева О.Г., Муратова Е.А. Построение логических моделей с использованием деревьев решений // Известия Томского политехнического университета. 2004. Т. 207. Вып. 2. С. 55–61.
Давыдов А.А. Системная социология: Data Warehousing. М.: ИС РАН, 2009. URL: http://www.isras. ru/?page_id=1012 (дата обращения: 09.04.2015).
Давыдов А.А. Системный подход в социологии: новые направления, теории и методы анализа социальных систем. М.: Эдиториал УРСС, 2005.
Кацко И.А., Паклин Н.Б. Практикум по анализу данных на компьютере / Под ред. Г.В. Гореловой. М.: КолосС, 2009.
Кислова О.Н. Искусственные нейронные сети в социологии: новый инструмент познания или дань моде?// Перспективи. Серiя: Фiлософiя, iсторiя, соцiологiя, полiтологiя. Одеса: ПДПУ iменi К.Д. Ушинського, 2009. № 2(46). С. 70–75.
Круглов В.В., Дли М.И. Применение аппарата нейронных сетей для анализа социологических данных // Социологические исследования. 2001. № 9. С. 112–114.
Михеенкова М.А., Финн В.К. О представлении данных и знаний для интеллектуального анализа социологических данных. URL: http://www.umotnas.ru/umot/o-predstavlenii-dannih-i-znanij-dlyaintellektualenogo- analiza/ (дата обращения: 09.04.2015).
Островский А.М. О компьютерных технологиях поиска эмпирических закономерностей в базах данных // Социология: 4М. 2008. № 7. С. 140–157.
Паклин Н.Б., Орешков В.И. Бизнес-аналитика: от данных к знаниям. СПб.: Питер, 2009.
Хавенсон Т.Е. Применение методов Data Mining в социологии. URL: http://www.hse.ru/ data/084/371/1237/Khavenson_DM.pdf (дата обращения: 09.04.2015).
Шуметов В.Г., Лясковская О.В., Гудова Т.Г. Data Mining в эмпирической социологии: методология количественного моделирования. Монография / Под общ. ред. В.Г. Шуметова. Орел: Изда- тельство ОРАГС, 2011.
Piatetsky-Shapiro G. Knowledge Discovery in Real Databases: A Report on the IJCAI-89 Work-shop. AI Magazine. 1991. № 11(5). P. 68–70.