Описательная статистика

Что такое Описательная статистика?

Описательная статистика – это краткие описательные коэффициенты, которые суммируют заданный набор данных, который может быть либо представлением всей, либо выборкой генеральной совокупности. Описательная статистика разбита на меры центральной тенденции и меры изменчивости (распространения). Меры центральной тенденции включают среднее, медианное значение и моду, тогда как меры изменчивости включают эксцесс и асимметрию.

Понимание описательной статистики

Короче говоря, описательная статистика помогает описать и понять особенности конкретного набора данных, давая краткие сведения об образце и показателях данных. Наиболее признанными типами описательной статистики являются меры центра: среднее , медиана и мода , которые используются почти на всех уровнях математики и статистики. Среднее или среднее значение рассчитывается путем сложения всех цифр в наборе данных и последующего деления на количество цифр в наборе. Например, сумма следующего набора данных равна 20: (2, 3, 4, 5, 6). Среднее значение 4 (20/5). Режим набора данных – это значение, которое встречается чаще всего, а медиана – это цифра, расположенная в середине набора данных. Это цифра, отделяющая более высокие цифры от более низких в наборе данных. Однако существуют менее распространенные типы описательной статистики, которые по-прежнему очень важны.

Люди используют описательную статистику, чтобы преобразовать трудные для понимания количественные данные по большому набору данных в краткие описания. Например, средний балл учащегося (GPA) обеспечивает хорошее понимание описательной статистики. Идея GPA заключается в том, что он берет данные по широкому спектру экзаменов, классов и оценок и усредняет их вместе, чтобы обеспечить общее представление об общей академической успеваемости студента. Персональный средний балл студента отражает его среднюю успеваемость.

Ключевые моменты

  • Описательная статистика суммирует или описывает характеристики набора данных.
  • Описательная статистика состоит из двух основных категорий показателей: показателей центральной тенденции и показателей изменчивости (или разброса).
  • Меры центральной тенденции описывают центр набора данных.
  • Показатели изменчивости или разброса описывают разброс данных в наборе.

Показатели описательной статистики

Вся описательная статистика является либо мерой центральной тенденции, либо мерами изменчивости , также известными как меры дисперсии. Меры центральной тенденции сосредоточены на средних или средних значениях наборов данных, тогда как меры изменчивости сосредоточены на разбросе данных. Эти два показателя используют графики, таблицы и общие обсуждения, чтобы помочь людям понять значение проанализированных данных.

Меры центральной тенденции описывают центральное положение распределения для набора данных. Человек анализирует частоту каждой точки данных в распределении и описывает ее, используя  среднее значениемедиану или режим , который измеряет наиболее распространенные шаблоны анализируемого набора данных.

Меры изменчивости, или меры распространения, помогают проанализировать, насколько распространено распределение для набора данных. Например, хотя показатели центральной тенденции могут дать человеку среднее значение набора данных, они не описывают, как данные распределяются внутри набора. Таким образом, хотя среднее значение данных может составлять 65 из 100, все же могут быть точки данных как на уровне 1, так и 100. Показатели изменчивости помогают сообщить об этом, описывая форму и распространение набора данных. Диапазон, квартили , абсолютное отклонение и дисперсия – все это примеры показателей изменчивости. Рассмотрим следующий набор данных: 5, 19, 24, 62, 91, 100. Диапазон этого набора данных – 95, который вычисляется путем вычитания наименьшего числа (5) в наборе данных из наибольшего (100).