Эмпирическая кривая распределения. Показатели средней тенденции для различных типов шкал. Дескриптивная статистика. Мода. Медиана. Среднее арифметическое значение, взвешенное среднее. Меры рассеяния вокруг средних. Дисперсия. Коэффициент вариации как мера однородности. Квартильный размах. Меры качественной вариации. Коэффициент качественной вариации. Среднее геометрическое. Энтропия.
Регулярно на экране телевизора вы видите визуально представленные распределения какого-нибудь признака (столбики с обозначением процентов). Например, результаты изучения общественного мнения по претендентам на президентский пост или место в парламенте. Эти картинки называются гистограммами ¾графическое изображение или визуализация распределений. Они строятся по определенным правилам и в основном нужны не столько самому социологу, сколько заказчику социологического исследования (красиво и наглядно). Социологу они нужны лишь на предварительном этапе работы с эмпирией для того, чтобы на компьютере быстро просмотреть характер распределений. Существует множество способов визуализации. Исследователи называют 15 способов визуального изображения (графики, диаграммы) одних и тех же данных ¾ одномерного распределения признака.
На рис. изображена гистограмма, соответствующая распределению студентов по будущим профессиям. На горизонтальной оси, начиная с любой точки, откладываются на равном расстоянии восемь (профессий. Над каждой «профессией» воздвигается столбик высотой равный относительной частоте этойпрофессии. Столбики могут отстоять друг от друга и на каком-то расстоянии. В нашем случае они примыкают друг к другу. Гистограмму можно строить по частостям или по процентам. Они совпадут при соответствующем выборе масштаба. Для этого на вертикальной оси одна и та же точка должна соответствовать либо единице, либо ста процентам.
Сумма площадей всех прямоугольников равна единице, если "'' она построена по частостям и равна ста, если гистограмма построена по процентам. Вертикальная ось служит только для задания масштаба, поэтому гистограмму начинают строить с любой позиции по горизонтали. Ломаная линия (обозначенная на рис. 3.2.1 пунктиром) называется эмпирической кривой распределения, или полигоном. Она соединяет середины верхней стороны прямоугольников. Эта кривая и ее характеристики говорят социологу о «поведении» признака. Второй из этих терминов мало употребляется на практике.
Процент/частость/
Рис. 3.2.1 Гистограмма и эмпирическая кривая распределения студентов по профессиональным группам
Аналогичным образом строится гистограмма и эмпирическая кривая распределения для второго признака, т. е. для распределения студентов по степени их удовлетворенности учебой. Они изображены на рис. 3.2.2. Если для номинальных и порядковых шкал гистограммы эмпирическая кривая распределения служит только для визуализации, то для метрических они имеют особый смысл.
(степени удовлетворенности учебой студентов)
Рис. 3.2.2 Гистограмма и эмпирическая кривая распределения по степени удовлетворенности учебой
Построим гистограмму и эмпирическую кривую распределения для признака «продолжительность затрат времени на учебу». В этом случае гистограмма строится несколько иначе. Как вы заметили, каждый столбик гистограммы по площади был равен числу респондентов. Визуально передается не высота столбика, а его площадь. Ширина столбика равнялась единице и для номинального, и для порядкового признаков. В данном случае ширину нельзя выбрать одинаковой, так как наши интервалы разные. Поэтому гистограмма строится по плотности распределения. Плотность в интервале - это число респондентов, приходящихся на единицу интервала. Обозначим плотность в наших шести интервалах через
Р1, Р2, Рз, Р4, P5, Р6
Тогда Р1 = 27/1 = 27; Р2= 75/1,5 = 50; Рз= 150/1,5 = 100;
Р4 = 348/3 = 116; Р5 = 250/1 = 250; Р6 = 150/1 = 150
В данном случае эмпирическая кривая распределения не имеет содержательного смысла, ибо не передает характера распределения. Поэтому такую кривую строят при делении на равные интервалы. Число интервалов при этом определяется уже исходя из формальных критериев. Для порядковой и метрической шкалы гистограмму и эмпирическую кривую распределения можно построить и по накопленной частоте. Только в этом случае для эмпирической кривой распределения существует специфическое название. Она называется кумулята, а накопленную частоту называют кумулятивной. Построим ее по данным, представленным в таблице 3.2.1.
Таблица 3.2.1