Определение неизвестной функции распределения

Пусть мы имеем дело с непрерывной случайной величиной Определение неизвестной функции распределения - №1 - открытая онлайн библиотека , значения которой получены из наблюдений. Разобьем диапазон наблюдаемых значений Определение неизвестной функции распределения - №1 - открытая онлайн библиотека на интервалы ] X0, X1 [, ] X1, X2 [, ..., ] Xk-1, Xk [ одинаковой длины Определение неизвестной функции распределения - №3 - открытая онлайн библиотека . Пусть mi - число наблюдаемых значений Определение неизвестной функции распределения - №1 - открытая онлайн библиотека , попавших в i-й интервал. Разделив mi на общее число наблюдений n, получим частоту Определение неизвестной функции распределения - №5 - открытая онлайн библиотека , соответствующую i-му интервалу: Определение неизвестной функции распределения - №6 - открытая онлайн библиотека , причем Определение неизвестной функции распределения - №7 - открытая онлайн библиотека . Составим следующую таблицу:

Номер интервала Интервал mi Определение неизвестной функции распределения - №5 - открытая онлайн библиотека
] X0, X1 [ m1 Определение неизвестной функции распределения - №9 - открытая онлайн библиотека
] X1, X2 [ m2 Определение неизвестной функции распределения - №10 - открытая онлайн библиотека
... ... ... ...
k ] Xk-1, Xk [ mk Определение неизвестной функции распределения - №11 - открытая онлайн библиотека

которая называется статистическим рядом. Эмпирической (или статистической) функцией распределения случайной величины Определение неизвестной функции распределения - №1 - открытая онлайн библиотека называется частота события, заключающегося в том, что величина Определение неизвестной функции распределения - №1 - открытая онлайн библиотека в результате опыта примет значение, меньшее x:

Определение неизвестной функции распределения - №14 - открытая онлайн библиотека

На практике достаточно найти значения статистической функции распределения F*(x) в точках X0, X1, ..., Xk, которые являются границами интервалов статистического ряда:

Определение неизвестной функции распределения - №15 - открытая онлайн библиотека (65)

Cледует заметить, что F*(x)=0 при x<X0 и F*(x)=1 при x>Xk. Построив точки Mi [Xi ; F*(Xi)] и соединив их плавной кривой, получим приближенный график эмпирической функции распределения (рис. 15). Используя закон больших чисел Бернулли, можно доказать, что при достаточно большом числе n испытаний с вероятностью, близкой к единице, эмпирическая функция распределения F*(x) отличается сколь угодно мало от неизвестной нам функции распределения F(x) cлучайной величины Определение неизвестной функции распределения - №1 - открытая онлайн библиотека

Определение неизвестной функции распределения - №17 - открытая онлайн библиотека Определение неизвестной функции распределения - №18 - открытая онлайн библиотека

Часто вместо построения графика эмпирической функции распределения поступают следующим образом. На оси абсцисс откладывают интервалы ] X0, X1 [, ] X1, X2 [, ..., ] Xk-1, Xk [. На каждом интервале строят прямоугольник, площадь которого равна частоте Определение неизвестной функции распределения - №5 - открытая онлайн библиотека , соответствующей данному интервалу. Высота hi этого прямоугольника равна Определение неизвестной функции распределения - №20 - открытая онлайн библиотека , где Определение неизвестной функции распределения - №3 - открытая онлайн библиотека - длинна каждого из интервалов. Ясно, что сумма площадей всех построенных прямоугольников равна единице.
Рассмотрим функцию Определение неизвестной функции распределения - №22 - открытая онлайн библиотека , которая в интервале ] Xi-1, Xi [ постоянна и равна hi. График этой функции называется гистограммой. Он представляет собой ступенчатую линию (рис. 16). С помощью закона больших чисел Бернулли можно доказать, что при малых Определение неизвестной функции распределения - №3 - открытая онлайн библиотека и больших n с практической достоверностью Определение неизвестной функции распределения - №24 - открытая онлайн библиотека как угодно мало отличается от плотности распределения Определение неизвестной функции распределения - №25 - открытая онлайн библиотека непрерывной случайной величины Определение неизвестной функции распределения - №1 - открытая онлайн библиотека .

Пример. Измерен диаметр у 270 валов хвостовика. Значения диаметра (в см) оказались в диапазоне 66-90 см. Разбив этот диапазон на интервалы диной 2 см ( Определение неизвестной функции распределения - №3 - открытая онлайн библиотека =2), получим статистический ряд (см. таблицу)

Номера интервалов Интервалы mi Определение неизвестной функции распределения - №6 - открытая онлайн библиотека Определение неизвестной функции распределения - №20 - открытая онлайн библиотека
(1) (2) (3) (4) (5)
]66,68[ 0,015 0,008
]68,70[ 0,045 0,022
]70,72[ 0,090 0,045
]72,74[ 0,152 0,076
]74,76[ 0,185 0,092
]76,78[ 0,196 0,098
]78,80[ 0,144 0,072
]80,82[ 0,096 0,048
]82,84[ 0,048 0,024
]84,86[ 0,019 0,009
]86,88[ 0,007 0,004
]88,90[ 0,003 0,002
Определение неизвестной функции распределения - №30 - открытая онлайн библиотека   1,000  

Построим гистограмму и эмпирическую функцию распределения. Подсчитанные частоты Определение неизвестной функции распределения - №5 - открытая онлайн библиотека приведены в столбце (4), а значения высотhi прямоугольников гистограммы - в столбце (5). Гистограмма изображена на рис. 17.

Определение неизвестной функции распределения - №32 - открытая онлайн библиотека Определение неизвестной функции распределения - №33 - открытая онлайн библиотека

Значения эмпирической функции распределения в граничных точках интервалов вычислены по формуле (65) и приведены в следующей таблице:

x
F*(x) 0,015 0,060 0,150 0,302 0,487 0,683 0,827 0,923 0,971 0,990 0,997 1,000

Так, например,

Определение неизвестной функции распределения - №34 - открытая онлайн библиотека

График функции F*(x) изображен на рис.18.