Переход на главную страницу сайта “Термист” Термист
Термомеханическое упрочнение арматурного проката
технология, средства, разработка
Главная О сайте Стандарты Технология Устройства
Лаборатория Библиотека Глоссарий Желтые страницы Обратная связь

Математическая статистика

Простейшие приемы статистического описания

Изучаемая совокупность из n объектов может по какому-либо качественному признаку A разбиваться на классы A1, A2, …, Ar. Соответствующее этому разбиению распределение задаётся при помощи указания численностей n1, n2, …, nr (где ∑ni = n) отдельных классов. Вместо численностей ni часто указывают соответствующие относительные частоты hi =ni/n (удовлетворяющие, очевидно, соотношению ∑hi = 1). Если изучению подлежит некоторый количественный признак, то его распределение в совокупности из n объектов можно задать, перечислив непосредственно наблюдённые значения признака: x1, x2, ..., xn, например, в порядке их возрастания. Однако при больших n такой способ громоздок и в то же время не выявляет отчётливо существенных свойств распределения. При сколько-либо больших n на практике обычно совсем не составляют полных таблиц наблюдённых значений xi, а исходят во всей дальнейшей работе из таблиц, содержащих лишь численности классов, получающихся при группировке наблюденных значений по надлежаще выбранным интервалам.

Например, в первом столбце табл. 1 даны результаты измерения 200 диаметров деталей, группированные по интервалам длины 0.05 мм. Основная выборка соответствует нормальному ходу технологического процесса, 1-я, 2-я и 3-я выборки сделаны через некоторые промежутки времени для проверки устойчивости этого нормального хода производства.

Обычно группировка по 10 - 20 интервалам, в каждый из которых попадает не более 15 - 20 % значений xi, оказывается достаточной для довольно полного выявления всех существенных свойств распределения и надёжного вычисления по групповым численностям основных характеристик распределения (см. о них ниже). Составленная по таким группированным данным гистограмма наглядно изображает распределение. Гистограмма, составленная на основе группировки с маленькими интервалами, обычно многовершинная и не отражает наглядно существенных свойств распределения.

В качестве примера на рис. 1 дана при длине интервала группировки 0.05 мм гистограмма распределения 200 диаметров, соответствующая данным первого столбца табл. 1, а на рис. 2 - гистограмма того же распределения (соответствующая таблица не приводится ввиду её громоздкости) при длине интервала 0.01 мм. С другой стороны, группировка по слишком крупным интервалам (на рис. 3 длина интервала 0.25 мм) может привести к потере ясного представления о характере распределения и к грубым ошибкам при вычислении среднего и других характеристик распределения.

Рис. 1. Гистограмма распределения диаметров 200 деталей. Длина интервала группировки 0.05 мм.

Рис. 2. Гистограмма распределения диаметров 200 деталей. Длина интервала группировки 0.01 мм.

Рис. 3. Гистограмма распределения диаметров 200 деталей. Длина интервала группировки 0.25 мм.

В пределах математической статистики вопрос об интервалах группировки может быть рассмотрен только с формальной стороны: полноты математического описания распределения, точности вычисления средних по сгруппированным данным и т. д. При изучении совместного распределения двух признаков пользуются таблицами с двумя входами. Примером совместного распределения двух качественных признаков может служить табл. 2. В общем случае, когда по признаку A материал разбит на классы A1, A2, …, Ar, а по признаку B - на классы B1, B2, …, Bs, таблица состоит из численностей ni,j объектов, принадлежащих одновременно классам Ai и Bj. Суммируя их по формулам
ni• = ∑nij (j=1:s); n•j = ∑nij (i=1:n),
получают численности самих классов Ai и Bj; при этом
∑∑nij (i=1:r ;j=1:s) = ∑ni• (i=1:r) = ∑n•j (j=1:s) = n,
где n - численность всей изучаемой совокупности. В зависимости от целей дальнейшего исследования вычисляют те или иные из относительных частот
hij = nij/n, hi• = ni•/n, h•j = n•j/n,
hi(j) = nij/n•j, h(i)j = nij/ni•.

Пример таблицы для совместного распределения двух количественных признаков см. в статье "Корреляция".

Простейшими сводными характеристиками распределения одного количественного признака являются выборочное среднее
Оценка среднего значения исходного ряда
и выборочное среднее квадратичное отклонение
D = S/√n
или выборочная дисперсия
D2 = S2/n,
где
S2 = ∑(xi - xср)2 для i=1:n.

При вычислении xср, S2 и D по группированным данным пользуются формулами
Простейшие сводные характеристики распределения одного количественного признака
где r - число интервалов группировки, ak - их середины. Если материал сгруппирован по слишком крупным интервалам, то такой подсчёт даёт очень грубые результаты. Иногда в таких случаях полезно прибегать к специальным поправкам на группировку. Однако эти поправки имеет смысл вводить лишь при условии выполнения определённых вероятностных предположений.

О совместных распределениях двух и большего числа признаков см. Корреляция, Корреляционный анализ, Регрессия, Регрессионный анализ.


См. другие разделы статьи "Математическая статистика":
Определение
Предмет и метод математической статистики
Связь математической статистики с теорией вероятностей
Связь эмпирических распределений с вероятностными. Проверка статистических гипотез. Статистические оценки.
Выборочный метод
Дальнейшие задачи математической статистики
Историческая справка

 



Опубликовано по материалам: Математический энциклопедический словарь. / Гл. ред. Ю.В.Прохоров; Ред. кол.: С.И.Адян, Н.С.Бахвалов, В.И.Битюцков и др. - М.: Сов. энциклопедия, 1988. - 847 с. стр. 344 - 345.

 

К началу страницы


Web-сайт “Термист” (termist.com)
Термомеханическое упрочнение арматурного проката

Отсутствие ссылки на использованный материал является нарушением заповеди "Не укради"

Редактор сайта: Гунькин И.А. (termist.com@gmail.com)