1. МЕТОДИКА ВЫЧИСЛЕНИЯ ДОВЕРИТЕЛЬНОГО ИНТЕРВАЛА
ДЛЯ НЕБОЛЬШОГО ЧИСЛА ИСПЫТАНИЙ
В СРЕДЕ В MATHCAD
Выполнили:
студентки группы 08ФАПИ
спец. 080801 «ПИ в экономике»
Воинова А.В., Курилова Е.И., Штин О.А.
Научный руководитель:
Часов К.В., кпн, доцент кафедры ОНД АМТИ
Большое число измерений, проводимых в технике и на производстве,
осуществляется с некоторой погрешностью, иной раз с ошибками, а провести
бесконечное число измерений для получения верного результата в реальной
жизни невозможно, поэтому важно дать объективное представление ре-
зультатов ограниченного числа измерений, с этой целью мы проводим свою
исследовательскую работу.
Цель нашей исследовательской работы – разработка методики получе-
ния наиболее точного значения исследуемой характеристики. Как известно,
доверительный интервал позволяет с определенной точностью получить рас-
пределение параметра, что дает хорошее представление об исследуемом
объекте. Это потребовало от нас изучения большого числа литературных ис-
точников по указанной теме.
В источниках по теории вероятности и матстатистике вопрос о вычис-
лении доверительного интервала рассматривается по-отдельности для случа-
ев числа испытаний больше 30 и меньше 30.
На практике мы всегда имеем дело с ограниченным числом измерений,
и задача, которая всегда стоит перед исследователем, состоит в том, как оце-
нить точность измерений, т.е. найти его меру приближения к истинному зна-
чению на основании группы результатов наблюдений.
В частности, в работах «Статистические методы обработки данных»
(лабораторный практикум) авторов В.С.Муха и Т.В.Слуяновой, «Теория ве-
роятностей и математическая статистика» (конспект лекций) авторов
А.И.Волковец и А.Б.Гуринович, «Математические методы обработки экспе-
2. риментальных данных» авторов С.Н.Кункина, П.А.Кузнецова, В.Н.Вострова,
А.Г.Рябинина, а также других источниках, кроме точечной оценки, которая
определяется одним числом, рассматривают интервальную оценку.
При выборке малого объема и точечная, и интервальная оценки могут
приводить к грубым ошибкам, что вызвано различными причинами, в
частности, ошибками экспериментатора (в том числе измерительной аппара-
туры) или неправильной методикой проведения эксперимента. Именно по
этой причине при небольшом объеме выборки следует пользоваться интер-
вальными оценками.
Интервальные оценки параметров распределений.
По определению В.Е.Гмурмана (В.Е.Гмурман «Теория вероятностей и
математическая статистика»), «интервальной называют оценку, которая
определяется двумя числами – концами интервала, покрывающего оценивае-
мый параметр». Интервальные оценки позволяют установить точность и на-
дежность оценок.
Этот вопрос рассматривается В.Е.Гмурманом следующим образом:
1. Интервальной оценкой (с надежностью γ) математического ожида-
ния а нормально распределенного количественного признака X по выбороч-
ной средней при известном среднем квадратическом отклонении σ гене-
ральной совокупности служит доверительный интервал
,
где – точность оценки,
n – объем выборки,
t – значение аргумента функции Лапласа Ф(t) (обычно табулирует-
ся, соответствующая таблица содержится в приложениях), при котором
; при неизвестном а (и объёме выборки n < 30).
,
где s – «исправленное» выборочное среднее квадратическое отклоне-
ние,
находят по таблице, которое также обычно содержится в прило-
жениях, по заданным n и γ.
2. Интервальной оценкой (с надежностью γ) среднего квадратического
отклонения σ нормально распределенного количественного признака X по
3. «исправленному» выборочному среднему квадратическому отклонению s
служит доверительный интервал
(при q<1),
(при q > 1),
где q находят по таблице соответствующего приложения по заданным n
и γ.
3. Интервальной оценкой (с надежностью γ) неизвестной вероятности р
биномиального распределения по относительной частоте w служит довери-
тельный интервал (с приближенными концами p1 и р2)
p1 < р < р2
где
где n – общее число испытаний;
m – число появлений события;
w – относительная частота, равная отношению m/n;
t – значение аргумента функции Лапласа, при котором Ф(t) = γ/2 (γ
– заданная надежность).
Замечание. При больших значениях n (порядка сотен) можно принять
в качестве приближенных границ доверительного интервала
В работе «Математические методы обработки экспериментальных дан-
ных» авторов С.Н. Кункина, П.А. Кузнецова, В.Н. Вострова, А.Г. Рябинина
говорится, что при проведении измерений случайной величины важно уста-
новить величину доверительного интервала по данному числу измерений.
Доверительный интервал нужен для установления границ приближенного
оценивания случайного параметра, случайный характер которого обусловлен
рядом неучтенных факторов, влияющих на его значение.
Доверительным интервалом для некоторого параметра θ называется
интервал накрывающий параметр θ с доверительной вероятностью γ :
.
Задача получения интервальной оценки параметра распределения за-
4. ключается в определении по выборке нижней и верхней границ
интервала . Доверительная вероятность γ выбирается близкой к 1 из на-
бора чисел {0,9; 0,95; 0,975}.
Для придания задаче однозначности уравнение выше представляют в
виде двух уравнений
где (В.С.Муха и Т.В.Слуянова).
Аналогично этот вопрос рассматривают авторы А.И.Волковец и
А.Б.Гуринович.
По нашему мнению в работах указанных выше авторов, а также Гмур-
мана В.Е., для малого количества испытаний не учитываются грубые ошиб-
ки-промахи, на которые обращено внимание в работе «Математические мето-
ды обработки экспериментальных данных» авторов С.Н.Кункина, П.А.Кузне-
цова, В.Н.Вострова, А.Г.Рябинина.
Изучение всей генеральной совокупности во многих случаях либо не-
возможно, либо нецелесообразно в силу больших материальных затрат,
поэтому на практике часто приходится иметь дело с выборками небольшого
объема п<10-20. В этом случае используемый обычно метод построения ин-
тервальной оценки для генеральной средней (среднего арифметического ге-
неральной совокупности) и генеральной доли (доли элементов, обладающих
необходимым признаком) неприменим в силу двух обстоятельств:
1) необоснованным становится вывод о нормальном законе распределе-
ния выборочных средней и доли w, так как он основан на центральной пре-
дельной теореме при больших п;
2) необоснованной становится замена неизвестных генеральной дис-
персии σ2 и доли р их точечными оценками (или ) или w, так как в силу
закона больших чисел (состоятельности оценок) эта замена возможна лишь
при больших п.
Решение задачи
1 Теория
Выберем вероятность накрытия - α , тогда можно записать на основа-
нии теории вероятностей
5. ,
где под ε понимается точность накрытия, а доверительный интервал
запишется
,
где – выборочная оценка.
Если случайная величина подчиняется нормальному закону распреде-
ления, то при большом числе повторных измерений (не менее 30) вероят-
ность отклонения вычисляется как удвоенная функция Лапласа.
Если имеет место более типичный случай малого числа измерений
(n < 30), тогда в соответствии с распределением Стьюдента доверительный
интервал определяется по формуле:
,
где t – параметр распределения Стьюдента, определяемый из соответ-
ствующей таблицы, приводимой практически в каждом учебном издании по
теории вероятностей и матстатистике (к примеру, Приложение 3. Таблица
значений tγ = t ( γ , n ) . В.Е. Гмурман. «Теория вероятностей и математическая
статистика»).
2 Выявление и исключение промахов из серии измерений
Если серия из небольшого количества опытов содержит грубую ошиб-
ку-промах, то среднее значение измеряемой величины и границы доверитель-
ного интервала могут сильно искажать реальные величины измеряемого па-
раметра. Промахи нужно исключать из числа наблюдений.
Если в выборке есть значение, подозреваемое как промах, то следует
провести анализ условий проведения эксперимента. Если в методике прове-
дения опытов ошибки не обнаружено, то проводится статистический анализ
подозреваемого значения.
Выявление ошибочных опытных данных осуществляется по критерию
Груббса и выполняется в следующем порядке:
1. По результатам опытов определяем стандартное отклонение (средне-
квадратичное отклонение) по формуле
.
2. Рассматриваем переменную Θ:
6. ,
которая в случае или называется критерием совместимости.
Предельные значения Θ зависят от числа опытов n и заданной надежности р.
В следующей таблице (таблица 1) представлены значения Θкр.. для довери-
тельной вероятности р = 0,95.
3. Если Θ > Θкр., то хi max следует отбросить, как опыт, содержащий
грубую ошибку.
Таблица 1 – Значения Θкр
3 Практическое применение метода
Оценить доверительный интервал – средней толщины плоских
деталей из листового материала по данным измерений, приведенных в табли-
це при доверительной вероятности 0,95.
Решение:
n = 6; α = 0,95 ; t =2.57.
1
X0 = ( 2,50 + 2,40 + 2,45 + 2,53 + 2,38 + 3,80) = 2,677 .
6
D[ x ] = σ 2 =
1
6
[ ]
( 2,50 − 2,677 ) 2 + ( 2,40 − 2,677 ) 2 + ... + ( 3,80 − 2,677 ) 2 = 0,255 .
n 6
S2 = D = ⋅ 0,255 = 0,306 , S = 0,553 .
n −1 5
Вычисляем Θ для различных значений (минимального и максимально-
го) случайной величины.
Θ = |2,38-2,677|/0,553 = 0,537 для минимального значения,
Θ = |3,80-2,677|/0,553 = 2,03 для максимального значения.
Из указанной выше таблицы 1 для n = 6 и α = 0,95 выбираем
Θкр. = 2,00.
Очевидно, что для минимального значения критерий совместимости
7. выполняется, для максимального – не имеет места. Поэтому считаем величи-
ну 3,80 грубой ошибкой-промахом, которую отбрасываем и производим все
вычисления заново с 5-ю значениями. n = 5; α = 0,95 ; t =2,78.
1
X0 = ( 2,50 + 2,40 + 2,45 + 2,53 + 2,38) = 2,452 .
5
D[ x ] = σ 2 =
1
5
[ ]
( 2,50 − 2,452) 2 + ( 2,40 − 2,452) 2 + ... + ( 2,53 − 2,452) 2 = 0,003 .
n 5
S2 = D = ⋅ 0,003 = 0,004 , S = 0,063 .
n −1 4
Вычисляем Θ для различных значений (минимального и максимально-
го) случайной величины.
Θ = |2,38-2,452|/0,063 = 1,151 для минимального значения,
Θ = |2,53-2,452|/0,063 = 1,248 для максимального значения.
Из указанной выше таблицы 1 для n = 5 и α = 0,95 выбираем
Θкр. = 1,87.
Очевидно, что для минимального и максимального значений критерий
совместимости имеет место, поэтому все значения верны. Рассчитаем ε.
t⋅S
ε= = 0,078 .
n
Следовательно, доверительный интервал запишется [2,452 ± 0,078].
4 Решение задачи в математическом редакторе MathCad
n := 6
x0 := 2.5 x1 := 2.4 x2 := 2.45 x3 := 2.53 x4 := 2.38 x5 := 3.8
α := 0.95 ts := 2.57 i := 0 .. n − 1
xi
xs := mean( x) xs = 2.677 ∑ n = 2.677
i
dg := var( x) ( xi − xs) 2
dg = 0.255
∑ n
= 0.255
i
8. dv := Var( x) ( xi − xs) 2
dv = 0.306
∑ n −1
= 0.306
i
sdv := dv sdv = 0.553
min( x) − xs Θkr := 2
Rmin :=
sdv
Rmin = 0.536
max x) − xs
(
Rmax:=
sdv
Rmax = 2.03
T
Rmax = 2.03 y =
T
y := sort ( x) y = ( 2.38 2.4 2.45 2.5 2.53 3.8 )
T
x := submatrix y , 0 , n − 2 , 0 , 0)
( x = ( 2.38 2.4 2.45 2.5 2.53 )
n := n − 1
αα := 0.95
:= 0.95 tsts := 2.78
:= 2.78 i := 0 .. .. n − 1
i := 0 n − 1 xi
∑x n= =2.452
2.452
∑n
i
xs := mean( x) xs = 2.452
i
dg := var( x) ( xi − xs) 2 i
∑
−3
= 3.256× 10
−3 n
dg = 3.256× 10 i
dv := Var( x) ( xi − xs) 2
∑
−3
= 4.07 × 10
dv = 4.07 × 10
−3 n−1
i
sdv := dv sdv = 0.064
sdv := dv sdv = 0.064
min( x) − xs Θkr := 1.87
Rmin :=
sdv
Rmin = 1.129
max( x) − xs
Rmax:=
sdv
Rmax = 1.223
ñëåäîâàòåëüíî, äîâåðèòåëüíûé èíòåðâàë çàïèøåòñÿ òàê:
xs − ε < x < xs + ε
2 , 452 − 0 , 079 < x < 2 , 452 + 0 , 079
Замечание. При вычислении некоторых числовых характеристик слу-
чайной величины с правой стороны приведены расчёты в виде соответствую-
щих математических формул, подтверждающих правильность применяемых
операций математической статистики.
Выводы по работе.
В настоящем исследовании нами были изучены литературные источни-
9. ки по теме работы, выявлены общие положения и различия в работах различ-
ных исследователей (авторов). По результатам анализа указанных источни-
ков сделаны выводы о применимости каждого исследования в своих рамках.
Так как в исследовании нами рассматривался вопрос небольшого количества
испытаний (наблюдений), то применительно к нему были подобраны соот-
ветствующие положения и формулы. Решён пример на языке теории вероят-
ностей и математической статистики, затем перенесён в математическую
среду MathCad. Результаты совпадают, что говорит о правильности применя-
емой методики расчёта доверительного интервала. Приведённое решение
можно совершенствовать, в частности, расчёт коэффициента Стьюдента и
критерия совместимости можно автоматизировать.