SlideShare uma empresa Scribd logo
1 de 9
МЕТОДИКА ВЫЧИСЛЕНИЯ ДОВЕРИТЕЛЬНОГО ИНТЕРВАЛА
         ДЛЯ НЕБОЛЬШОГО ЧИСЛА ИСПЫТАНИЙ
                 В СРЕДЕ В MATHCAD

                                                              Выполнили:
                                               студентки группы 08ФАПИ
                                            спец. 080801 «ПИ в экономике»
                                  Воинова А.В., Курилова Е.И., Штин О.А.
                                                    Научный руководитель:
                               Часов К.В., кпн, доцент кафедры ОНД АМТИ


      Большое число измерений, проводимых в технике и на производстве,
осуществляется с некоторой погрешностью, иной раз с ошибками, а провести
бесконечное число измерений для получения верного результата в реальной
жизни невозможно, поэтому важно дать объективное представление ре-
зультатов ограниченного числа измерений, с этой целью мы проводим свою
исследовательскую работу.
      Цель нашей исследовательской работы – разработка методики получе-
ния наиболее точного значения исследуемой характеристики. Как известно,
доверительный интервал позволяет с определенной точностью получить рас-
пределение параметра, что дает хорошее представление об исследуемом
объекте. Это потребовало от нас изучения большого числа литературных ис-
точников по указанной теме.
      В источниках по теории вероятности и матстатистике вопрос о вычис-
лении доверительного интервала рассматривается по-отдельности для случа-
ев числа испытаний больше 30 и меньше 30.
      На практике мы всегда имеем дело с ограниченным числом измерений,
и задача, которая всегда стоит перед исследователем, состоит в том, как оце-
нить точность измерений, т.е. найти его меру приближения к истинному зна-
чению на основании группы результатов наблюдений.
      В частности, в работах «Статистические методы обработки данных»
(лабораторный практикум) авторов В.С.Муха и Т.В.Слуяновой, «Теория ве-
роятностей и математическая статистика» (конспект лекций) авторов
А.И.Волковец и А.Б.Гуринович, «Математические методы обработки экспе-
риментальных данных» авторов С.Н.Кункина, П.А.Кузнецова, В.Н.Вострова,
А.Г.Рябинина, а также других источниках, кроме точечной оценки, которая
определяется одним числом, рассматривают интервальную оценку.
     При выборке малого объема и точечная, и интервальная оценки могут
приводить к грубым ошибкам, что вызвано различными причинами, в
частности, ошибками экспериментатора (в том числе измерительной аппара-
туры) или неправильной методикой проведения эксперимента. Именно по
этой причине при небольшом объеме выборки следует пользоваться интер-
вальными оценками.
     Интервальные оценки параметров распределений.
     По определению В.Е.Гмурмана (В.Е.Гмурман «Теория вероятностей и
математическая статистика»), «интервальной называют оценку, которая
определяется двумя числами – концами интервала, покрывающего оценивае-
мый параметр». Интервальные оценки позволяют установить точность и на-
дежность оценок.
     Этот вопрос рассматривается В.Е.Гмурманом следующим образом:
      1. Интервальной оценкой (с надежностью γ) математического ожида-
ния а нормально распределенного количественного признака X по выбороч-
ной средней    при известном среднем квадратическом отклонении σ гене-
ральной совокупности служит доверительный интервал

                                                         ,
       где             – точность оценки,
          n – объем выборки,
          t – значение аргумента функции Лапласа Ф(t) (обычно табулирует-
ся, соответствующая таблица содержится в приложениях), при котором
             ; при неизвестном а (и объёме выборки n < 30).
                                                    ,
       где s – «исправленное» выборочное среднее квадратическое отклоне-
ние,
                находят по таблице, которое также обычно содержится в прило-
жениях, по заданным n и γ.
       2. Интервальной оценкой (с надежностью γ) среднего квадратического
отклонения σ нормально распределенного количественного признака X по
«исправленному» выборочному среднему квадратическому отклонению s
служит доверительный интервал
                                           (при q<1),
                                         (при q > 1),
       где q находят по таблице соответствующего приложения по заданным n
и γ.
     3. Интервальной оценкой (с надежностью γ) неизвестной вероятности р
биномиального распределения по относительной частоте w служит довери-
тельный интервал (с приближенными концами p1 и р2)
                               p1 < р < р2
     где




       где n – общее число испытаний;
           m – число появлений события;
           w – относительная частота, равная отношению m/n;
          t – значение аргумента функции Лапласа, при котором Ф(t) = γ/2 (γ
– заданная надежность).
      Замечание. При больших значениях n (порядка сотен) можно принять
в качестве приближенных границ доверительного интервала


     В работе «Математические методы обработки экспериментальных дан-
ных» авторов С.Н. Кункина, П.А. Кузнецова, В.Н. Вострова, А.Г. Рябинина
говорится, что при проведении измерений случайной величины важно уста-
новить величину доверительного интервала по данному числу измерений.
Доверительный интервал нужен для установления границ приближенного
оценивания случайного параметра, случайный характер которого обусловлен
рядом неучтенных факторов, влияющих на его значение.
     Доверительным интервалом для некоторого параметра θ называется
интервал        накрывающий параметр θ с доверительной вероятностью γ :
                                          .
       Задача получения интервальной оценки параметра распределения за-
ключается в определении по выборке                нижней и верхней границ
интервала       . Доверительная вероятность γ выбирается близкой к 1 из на-
бора чисел {0,9; 0,95; 0,975}.
      Для придания задаче однозначности уравнение выше представляют в
виде двух уравнений




 где                 (В.С.Муха и Т.В.Слуянова).
      Аналогично этот вопрос рассматривают авторы А.И.Волковец и
А.Б.Гуринович.
      По нашему мнению в работах указанных выше авторов, а также Гмур-
мана В.Е., для малого количества испытаний не учитываются грубые ошиб-
ки-промахи, на которые обращено внимание в работе «Математические мето-
ды обработки экспериментальных данных» авторов С.Н.Кункина, П.А.Кузне-
цова, В.Н.Вострова, А.Г.Рябинина.
      Изучение всей генеральной совокупности во многих случаях либо не-
возможно, либо нецелесообразно в силу больших материальных затрат,
поэтому на практике часто приходится иметь дело с выборками небольшого
объема п<10-20. В этом случае используемый обычно метод построения ин-
тервальной оценки для генеральной средней (среднего арифметического ге-
неральной совокупности) и генеральной доли (доли элементов, обладающих
необходимым признаком) неприменим в силу двух обстоятельств:
      1) необоснованным становится вывод о нормальном законе распределе-
ния выборочных средней    и доли w, так как он основан на центральной пре-
дельной теореме при больших п;
     2) необоснованной становится замена неизвестных генеральной дис-
персии σ2 и доли р их точечными оценками     (или    ) или w, так как в силу
закона больших чисел (состоятельности оценок) эта замена возможна лишь
при больших п.
      Решение задачи
      1 Теория
      Выберем вероятность накрытия - α , тогда можно записать на основа-
нии теории вероятностей
,
     где под ε понимается точность накрытия, а доверительный интервал
запишется
                                                      ,
      где      – выборочная оценка.
      Если случайная величина подчиняется нормальному закону распреде-
ления, то при большом числе повторных измерений (не менее 30) вероят-
ность отклонения вычисляется как удвоенная функция Лапласа.
      Если имеет место более типичный случай малого числа измерений
(n < 30), тогда в соответствии с распределением Стьюдента доверительный
интервал определяется по формуле:
                                              ,
     где t – параметр распределения Стьюдента, определяемый из соответ-
ствующей таблицы, приводимой практически в каждом учебном издании по
теории вероятностей и матстатистике (к примеру, Приложение 3. Таблица
значений tγ = t ( γ , n ) . В.Е. Гмурман. «Теория вероятностей и математическая
статистика»).
      2 Выявление и исключение промахов из серии измерений
      Если серия из небольшого количества опытов содержит грубую ошиб-
ку-промах, то среднее значение измеряемой величины и границы доверитель-
ного интервала могут сильно искажать реальные величины измеряемого па-
раметра. Промахи нужно исключать из числа наблюдений.
      Если в выборке есть значение, подозреваемое как промах, то следует
провести анализ условий проведения эксперимента. Если в методике прове-
дения опытов ошибки не обнаружено, то проводится статистический анализ
подозреваемого значения.
      Выявление ошибочных опытных данных осуществляется по критерию
Груббса и выполняется в следующем порядке:
      1. По результатам опытов определяем стандартное отклонение (средне-
квадратичное отклонение) по формуле

                                                  .

      2. Рассматриваем переменную Θ:
,
которая в случае         или         называется критерием совместимости.
Предельные значения Θ зависят от числа опытов n и заданной надежности р.
В следующей таблице (таблица 1) представлены значения Θкр.. для довери-
тельной вероятности р = 0,95.
     3. Если Θ > Θкр., то хi max следует отбросить, как опыт, содержащий
грубую ошибку.
Таблица 1 – Значения Θкр




        3 Практическое применение метода
        Оценить доверительный интервал                                    – средней толщины плоских
деталей из листового материала по данным измерений, приведенных в табли-
це при доверительной вероятности 0,95.


      Решение:
n = 6; α = 0,95 ; t =2.57.
       1
X0 =     ( 2,50 + 2,40 + 2,45 + 2,53 + 2,38 + 3,80) = 2,677 .
       6

D[ x ] = σ 2 =
                 1
                 6
                   [                                                               ]
                   ( 2,50 − 2,677 ) 2 + ( 2,40 − 2,677 ) 2 + ... + ( 3,80 − 2,677 ) 2 = 0,255 .
         n     6
S2 =        D = ⋅ 0,255 = 0,306 ,           S = 0,553 .
       n −1    5
      Вычисляем Θ для различных значений (минимального и максимально-
го) случайной величины.
      Θ = |2,38-2,677|/0,553 = 0,537 для минимального значения,
      Θ = |3,80-2,677|/0,553 = 2,03 для максимального значения.
      Из указанной выше таблицы 1 для n = 6 и α = 0,95 выбираем
      Θкр. = 2,00.
      Очевидно, что для минимального значения критерий совместимости
выполняется, для максимального – не имеет места. Поэтому считаем величи-
ну 3,80 грубой ошибкой-промахом, которую отбрасываем и производим все
вычисления заново с 5-ю значениями. n = 5; α = 0,95 ; t =2,78.
          1
X0 =        ( 2,50 + 2,40 + 2,45 + 2,53 + 2,38) = 2,452 .
          5

D[ x ] = σ 2 =
                   1
                   5
                     [                                                                ]
                     ( 2,50 − 2,452) 2 + ( 2,40 − 2,452) 2 + ... + ( 2,53 − 2,452) 2 = 0,003 .
         n     5
S2 =        D = ⋅ 0,003 = 0,004 ,                     S = 0,063 .
       n −1    4
      Вычисляем Θ для различных значений (минимального и максимально-
го) случайной величины.
      Θ = |2,38-2,452|/0,063 = 1,151 для минимального значения,
      Θ = |2,53-2,452|/0,063 = 1,248 для максимального значения.
      Из указанной выше таблицы 1 для n = 5 и α = 0,95 выбираем
      Θкр. = 1,87.
      Очевидно, что для минимального и максимального значений критерий
совместимости имеет место, поэтому все значения верны. Рассчитаем ε.
                                                                     t⋅S
                                                              ε=         = 0,078 .
                                                                       n
            Следовательно, доверительный интервал запишется [2,452 ± 0,078].
            4 Решение задачи в математическом редакторе MathCad
 n := 6
x0 := 2.5     x1 := 2.4 x2 := 2.45           x3 := 2.53      x4 := 2.38   x5 := 3.8
α := 0.95          ts := 2.57           i := 0 .. n − 1
                                                                     xi
       xs := mean( x)       xs = 2.677                          ∑ n = 2.677
                                                                 i
   dg := var( x)                    ( xi − xs) 2
   dg = 0.255
                            ∑            n
                                                   = 0.255
                                i
dv := Var( x)                              ( xi − xs) 2
dv = 0.306
                                  ∑          n −1
                                                           = 0.306
                                   i


 sdv := dv                    sdv = 0.553
              min( x) − xs                                 Θkr := 2
 Rmin :=
                   sdv

   Rmin = 0.536

                  max x) − xs
                     (
   Rmax:=
                        sdv
 Rmax = 2.03
                        T
 Rmax = 2.03            y =
                        T
 y := sort ( x)     y = ( 2.38 2.4 2.45 2.5 2.53 3.8 )
                                                T
x := submatrix y , 0 , n − 2 , 0 , 0)
              (                                x = ( 2.38 2.4 2.45 2.5 2.53 )
 n := n − 1
αα := 0.95
  := 0.95          tsts := 2.78
                      := 2.78              i := 0 .. .. n − 1
                                             i := 0 n − 1                                 xi
                                                                              ∑x n= =2.452
                                                                                      2.452
                                                                              ∑n
                                                                                      i
       xs := mean( x)                   xs = 2.452
                                                                                  i

   dg := var( x)                            ( xi − xs) 2                      i

                                       ∑
                                                                         −3
                                                           = 3.256× 10
                        −3                          n
   dg = 3.256× 10                      i


   dv := Var( x)                            ( xi − xs) 2
                                       ∑
                                                                      −3
                                                           = 4.07 × 10
   dv = 4.07 × 10
                        −3                     n−1
                                       i


     sdv := dv                  sdv = 0.064
sdv := dv                   sdv = 0.064
            min( x) − xs                                Θkr := 1.87
Rmin :=
                  sdv

 Rmin = 1.129


              max( x) − xs
 Rmax:=
                   sdv

  Rmax = 1.223
ñëåäîâàòåëüíî, äîâåðèòåëüíûé èíòåðâàë çàïèøåòñÿ òàê:

xs − ε < x < xs + ε

2 , 452 − 0 , 079 < x < 2 , 452 + 0 , 079

     Замечание. При вычислении некоторых числовых характеристик слу-
чайной величины с правой стороны приведены расчёты в виде соответствую-
щих математических формул, подтверждающих правильность применяемых
операций математической статистики.
     Выводы по работе.
     В настоящем исследовании нами были изучены литературные источни-
ки по теме работы, выявлены общие положения и различия в работах различ-
ных исследователей (авторов). По результатам анализа указанных источни-
ков сделаны выводы о применимости каждого исследования в своих рамках.
Так как в исследовании нами рассматривался вопрос небольшого количества
испытаний (наблюдений), то применительно к нему были подобраны соот-
ветствующие положения и формулы. Решён пример на языке теории вероят-
ностей и математической статистики, затем перенесён в математическую
среду MathCad. Результаты совпадают, что говорит о правильности применя-
емой методики расчёта доверительного интервала. Приведённое решение
можно совершенствовать, в частности, расчёт коэффициента Стьюдента и
критерия совместимости можно автоматизировать.

Mais conteúdo relacionado

Mais procurados

Прикладная эконометрика. Лекция 4
Прикладная эконометрика. Лекция 4Прикладная эконометрика. Лекция 4
Прикладная эконометрика. Лекция 4
Vladimir Tcherniak
 
Прикладная эконометрика. Лекция 12
Прикладная эконометрика. Лекция 12Прикладная эконометрика. Лекция 12
Прикладная эконометрика. Лекция 12
Vladimir Tcherniak
 
Прикладная эконометрика. Лекция 5
Прикладная эконометрика. Лекция 5Прикладная эконометрика. Лекция 5
Прикладная эконометрика. Лекция 5
Vladimir Tcherniak
 
итервальное оценивание параметров распределения
итервальное оценивание параметров распределенияитервальное оценивание параметров распределения
итервальное оценивание параметров распределения
MedvedevaS
 
методические указания к практическим занятиям «основные понятия статистики и ...
методические указания к практическим занятиям «основные понятия статистики и ...методические указания к практическим занятиям «основные понятия статистики и ...
методические указания к практическим занятиям «основные понятия статистики и ...
Иван Иванов
 

Mais procurados (13)

Надежность и позиционный анализ (главная)
Надежность и позиционный анализ (главная)Надежность и позиционный анализ (главная)
Надежность и позиционный анализ (главная)
 
курсовая работа
курсовая работакурсовая работа
курсовая работа
 
Stat 4 alpha
Stat 4 alphaStat 4 alpha
Stat 4 alpha
 
Позиционный анализ для магистров
Позиционный анализ для магистровПозиционный анализ для магистров
Позиционный анализ для магистров
 
Прикладная эконометрика. Лекция 4
Прикладная эконометрика. Лекция 4Прикладная эконометрика. Лекция 4
Прикладная эконометрика. Лекция 4
 
Формирование целевой функции оценки качества раскатки слоеного теста
Формирование целевой функции оценки качества раскатки слоеного тестаФормирование целевой функции оценки качества раскатки слоеного теста
Формирование целевой функции оценки качества раскатки слоеного теста
 
Прикладная эконометрика. Лекция 12
Прикладная эконометрика. Лекция 12Прикладная эконометрика. Лекция 12
Прикладная эконометрика. Лекция 12
 
Прикладная эконометрика. Лекция 5
Прикладная эконометрика. Лекция 5Прикладная эконометрика. Лекция 5
Прикладная эконометрика. Лекция 5
 
Lecture 8 clt
Lecture 8 cltLecture 8 clt
Lecture 8 clt
 
итервальное оценивание параметров распределения
итервальное оценивание параметров распределенияитервальное оценивание параметров распределения
итервальное оценивание параметров распределения
 
Логлинейный анализ (главная)
Логлинейный анализ (главная)Логлинейный анализ (главная)
Логлинейный анализ (главная)
 
Regress 2015.05.011
Regress 2015.05.011Regress 2015.05.011
Regress 2015.05.011
 
методические указания к практическим занятиям «основные понятия статистики и ...
методические указания к практическим занятиям «основные понятия статистики и ...методические указания к практическим занятиям «основные понятия статистики и ...
методические указания к практическим занятиям «основные понятия статистики и ...
 

Semelhante a МЕТОДИКА ВЫЧИСЛЕНИЯ ДОВЕРИТЕЛЬНОГО ИНТЕРВАЛА

теория вероятностей и математическая статистика. часть 2. регрессионный анали...
теория вероятностей и математическая статистика. часть 2. регрессионный анали...теория вероятностей и математическая статистика. часть 2. регрессионный анали...
теория вероятностей и математическая статистика. часть 2. регрессионный анали...
Иван Иванов
 
л 2. 3. с 1. к 1
л 2. 3. с 1. к 1л 2. 3. с 1. к 1
л 2. 3. с 1. к 1
salimaader
 
Представление результатов психологических исследований: рекомендации APA и в...
Представление результатов психологических исследований: рекомендации APA и в...Представление результатов психологических исследований: рекомендации APA и в...
Представление результатов психологических исследований: рекомендации APA и в...
Андрей Четвериков
 
317.оптимизация интервалов времени измерения интенсивности потоков излучений
317.оптимизация интервалов времени измерения интенсивности потоков излучений317.оптимизация интервалов времени измерения интенсивности потоков излучений
317.оптимизация интервалов времени измерения интенсивности потоков излучений
ivanov1566359955
 
моделирование Гуманитарных процессов. Лекция 3
моделирование Гуманитарных процессов. Лекция 3моделирование Гуманитарных процессов. Лекция 3
моделирование Гуманитарных процессов. Лекция 3
Andrei V, Zhuravlev
 
моделирование гуманитарных процессов. Лекция 4
моделирование гуманитарных процессов. Лекция 4моделирование гуманитарных процессов. Лекция 4
моделирование гуманитарных процессов. Лекция 4
Andrei V, Zhuravlev
 
лекция08
лекция08лекция08
лекция08
cezium
 

Semelhante a МЕТОДИКА ВЫЧИСЛЕНИЯ ДОВЕРИТЕЛЬНОГО ИНТЕРВАЛА (20)

теория вероятностей и математическая статистика. часть 2. регрессионный анали...
теория вероятностей и математическая статистика. часть 2. регрессионный анали...теория вероятностей и математическая статистика. часть 2. регрессионный анали...
теория вероятностей и математическая статистика. часть 2. регрессионный анали...
 
л 2. 3. с 1. к 1
л 2. 3. с 1. к 1л 2. 3. с 1. к 1
л 2. 3. с 1. к 1
 
лекция 5
лекция 5лекция 5
лекция 5
 
Проверка Гипотез Критерий Пирсона01 .pptx
Проверка Гипотез Критерий Пирсона01 .pptxПроверка Гипотез Критерий Пирсона01 .pptx
Проверка Гипотез Критерий Пирсона01 .pptx
 
Представление результатов психологических исследований: рекомендации APA и в...
Представление результатов психологических исследований: рекомендации APA и в...Представление результатов психологических исследований: рекомендации APA и в...
Представление результатов психологических исследований: рекомендации APA и в...
 
6
66
6
 
Классические методы математической статистики в задачах web-аналитики
Классические методы математической статистики в задачах web-аналитикиКлассические методы математической статистики в задачах web-аналитики
Классические методы математической статистики в задачах web-аналитики
 
Сравнение выборок
Сравнение выборокСравнение выборок
Сравнение выборок
 
585
585585
585
 
317.оптимизация интервалов времени измерения интенсивности потоков излучений
317.оптимизация интервалов времени измерения интенсивности потоков излучений317.оптимизация интервалов времени измерения интенсивности потоков излучений
317.оптимизация интервалов времени измерения интенсивности потоков излучений
 
Лекция 2. Описательная статистика
Лекция 2. Описательная статистикаЛекция 2. Описательная статистика
Лекция 2. Описательная статистика
 
Методы оценивания
Методы оцениванияМетоды оценивания
Методы оценивания
 
8
88
8
 
Представление результатов психологических исследований
Представление результатов психологических исследованийПредставление результатов психологических исследований
Представление результатов психологических исследований
 
моделирование Гуманитарных процессов. Лекция 3
моделирование Гуманитарных процессов. Лекция 3моделирование Гуманитарных процессов. Лекция 3
моделирование Гуманитарных процессов. Лекция 3
 
моделирование гуманитарных процессов. Лекция 4
моделирование гуманитарных процессов. Лекция 4моделирование гуманитарных процессов. Лекция 4
моделирование гуманитарных процессов. Лекция 4
 
биостат.pptx
биостат.pptxбиостат.pptx
биостат.pptx
 
лекция08
лекция08лекция08
лекция08
 
426
426426
426
 
426
426426
426
 

МЕТОДИКА ВЫЧИСЛЕНИЯ ДОВЕРИТЕЛЬНОГО ИНТЕРВАЛА

  • 1. МЕТОДИКА ВЫЧИСЛЕНИЯ ДОВЕРИТЕЛЬНОГО ИНТЕРВАЛА ДЛЯ НЕБОЛЬШОГО ЧИСЛА ИСПЫТАНИЙ В СРЕДЕ В MATHCAD Выполнили: студентки группы 08ФАПИ спец. 080801 «ПИ в экономике» Воинова А.В., Курилова Е.И., Штин О.А. Научный руководитель: Часов К.В., кпн, доцент кафедры ОНД АМТИ Большое число измерений, проводимых в технике и на производстве, осуществляется с некоторой погрешностью, иной раз с ошибками, а провести бесконечное число измерений для получения верного результата в реальной жизни невозможно, поэтому важно дать объективное представление ре- зультатов ограниченного числа измерений, с этой целью мы проводим свою исследовательскую работу. Цель нашей исследовательской работы – разработка методики получе- ния наиболее точного значения исследуемой характеристики. Как известно, доверительный интервал позволяет с определенной точностью получить рас- пределение параметра, что дает хорошее представление об исследуемом объекте. Это потребовало от нас изучения большого числа литературных ис- точников по указанной теме. В источниках по теории вероятности и матстатистике вопрос о вычис- лении доверительного интервала рассматривается по-отдельности для случа- ев числа испытаний больше 30 и меньше 30. На практике мы всегда имеем дело с ограниченным числом измерений, и задача, которая всегда стоит перед исследователем, состоит в том, как оце- нить точность измерений, т.е. найти его меру приближения к истинному зна- чению на основании группы результатов наблюдений. В частности, в работах «Статистические методы обработки данных» (лабораторный практикум) авторов В.С.Муха и Т.В.Слуяновой, «Теория ве- роятностей и математическая статистика» (конспект лекций) авторов А.И.Волковец и А.Б.Гуринович, «Математические методы обработки экспе-
  • 2. риментальных данных» авторов С.Н.Кункина, П.А.Кузнецова, В.Н.Вострова, А.Г.Рябинина, а также других источниках, кроме точечной оценки, которая определяется одним числом, рассматривают интервальную оценку. При выборке малого объема и точечная, и интервальная оценки могут приводить к грубым ошибкам, что вызвано различными причинами, в частности, ошибками экспериментатора (в том числе измерительной аппара- туры) или неправильной методикой проведения эксперимента. Именно по этой причине при небольшом объеме выборки следует пользоваться интер- вальными оценками. Интервальные оценки параметров распределений. По определению В.Е.Гмурмана (В.Е.Гмурман «Теория вероятностей и математическая статистика»), «интервальной называют оценку, которая определяется двумя числами – концами интервала, покрывающего оценивае- мый параметр». Интервальные оценки позволяют установить точность и на- дежность оценок. Этот вопрос рассматривается В.Е.Гмурманом следующим образом: 1. Интервальной оценкой (с надежностью γ) математического ожида- ния а нормально распределенного количественного признака X по выбороч- ной средней при известном среднем квадратическом отклонении σ гене- ральной совокупности служит доверительный интервал , где – точность оценки, n – объем выборки, t – значение аргумента функции Лапласа Ф(t) (обычно табулирует- ся, соответствующая таблица содержится в приложениях), при котором ; при неизвестном а (и объёме выборки n < 30). , где s – «исправленное» выборочное среднее квадратическое отклоне- ние, находят по таблице, которое также обычно содержится в прило- жениях, по заданным n и γ. 2. Интервальной оценкой (с надежностью γ) среднего квадратического отклонения σ нормально распределенного количественного признака X по
  • 3. «исправленному» выборочному среднему квадратическому отклонению s служит доверительный интервал (при q<1), (при q > 1), где q находят по таблице соответствующего приложения по заданным n и γ. 3. Интервальной оценкой (с надежностью γ) неизвестной вероятности р биномиального распределения по относительной частоте w служит довери- тельный интервал (с приближенными концами p1 и р2) p1 < р < р2 где где n – общее число испытаний; m – число появлений события; w – относительная частота, равная отношению m/n; t – значение аргумента функции Лапласа, при котором Ф(t) = γ/2 (γ – заданная надежность). Замечание. При больших значениях n (порядка сотен) можно принять в качестве приближенных границ доверительного интервала В работе «Математические методы обработки экспериментальных дан- ных» авторов С.Н. Кункина, П.А. Кузнецова, В.Н. Вострова, А.Г. Рябинина говорится, что при проведении измерений случайной величины важно уста- новить величину доверительного интервала по данному числу измерений. Доверительный интервал нужен для установления границ приближенного оценивания случайного параметра, случайный характер которого обусловлен рядом неучтенных факторов, влияющих на его значение. Доверительным интервалом для некоторого параметра θ называется интервал накрывающий параметр θ с доверительной вероятностью γ : . Задача получения интервальной оценки параметра распределения за-
  • 4. ключается в определении по выборке нижней и верхней границ интервала . Доверительная вероятность γ выбирается близкой к 1 из на- бора чисел {0,9; 0,95; 0,975}. Для придания задаче однозначности уравнение выше представляют в виде двух уравнений где (В.С.Муха и Т.В.Слуянова). Аналогично этот вопрос рассматривают авторы А.И.Волковец и А.Б.Гуринович. По нашему мнению в работах указанных выше авторов, а также Гмур- мана В.Е., для малого количества испытаний не учитываются грубые ошиб- ки-промахи, на которые обращено внимание в работе «Математические мето- ды обработки экспериментальных данных» авторов С.Н.Кункина, П.А.Кузне- цова, В.Н.Вострова, А.Г.Рябинина. Изучение всей генеральной совокупности во многих случаях либо не- возможно, либо нецелесообразно в силу больших материальных затрат, поэтому на практике часто приходится иметь дело с выборками небольшого объема п<10-20. В этом случае используемый обычно метод построения ин- тервальной оценки для генеральной средней (среднего арифметического ге- неральной совокупности) и генеральной доли (доли элементов, обладающих необходимым признаком) неприменим в силу двух обстоятельств: 1) необоснованным становится вывод о нормальном законе распределе- ния выборочных средней и доли w, так как он основан на центральной пре- дельной теореме при больших п; 2) необоснованной становится замена неизвестных генеральной дис- персии σ2 и доли р их точечными оценками (или ) или w, так как в силу закона больших чисел (состоятельности оценок) эта замена возможна лишь при больших п. Решение задачи 1 Теория Выберем вероятность накрытия - α , тогда можно записать на основа- нии теории вероятностей
  • 5. , где под ε понимается точность накрытия, а доверительный интервал запишется , где – выборочная оценка. Если случайная величина подчиняется нормальному закону распреде- ления, то при большом числе повторных измерений (не менее 30) вероят- ность отклонения вычисляется как удвоенная функция Лапласа. Если имеет место более типичный случай малого числа измерений (n < 30), тогда в соответствии с распределением Стьюдента доверительный интервал определяется по формуле: , где t – параметр распределения Стьюдента, определяемый из соответ- ствующей таблицы, приводимой практически в каждом учебном издании по теории вероятностей и матстатистике (к примеру, Приложение 3. Таблица значений tγ = t ( γ , n ) . В.Е. Гмурман. «Теория вероятностей и математическая статистика»). 2 Выявление и исключение промахов из серии измерений Если серия из небольшого количества опытов содержит грубую ошиб- ку-промах, то среднее значение измеряемой величины и границы доверитель- ного интервала могут сильно искажать реальные величины измеряемого па- раметра. Промахи нужно исключать из числа наблюдений. Если в выборке есть значение, подозреваемое как промах, то следует провести анализ условий проведения эксперимента. Если в методике прове- дения опытов ошибки не обнаружено, то проводится статистический анализ подозреваемого значения. Выявление ошибочных опытных данных осуществляется по критерию Груббса и выполняется в следующем порядке: 1. По результатам опытов определяем стандартное отклонение (средне- квадратичное отклонение) по формуле . 2. Рассматриваем переменную Θ:
  • 6. , которая в случае или называется критерием совместимости. Предельные значения Θ зависят от числа опытов n и заданной надежности р. В следующей таблице (таблица 1) представлены значения Θкр.. для довери- тельной вероятности р = 0,95. 3. Если Θ > Θкр., то хi max следует отбросить, как опыт, содержащий грубую ошибку. Таблица 1 – Значения Θкр 3 Практическое применение метода Оценить доверительный интервал – средней толщины плоских деталей из листового материала по данным измерений, приведенных в табли- це при доверительной вероятности 0,95. Решение: n = 6; α = 0,95 ; t =2.57. 1 X0 = ( 2,50 + 2,40 + 2,45 + 2,53 + 2,38 + 3,80) = 2,677 . 6 D[ x ] = σ 2 = 1 6 [ ] ( 2,50 − 2,677 ) 2 + ( 2,40 − 2,677 ) 2 + ... + ( 3,80 − 2,677 ) 2 = 0,255 . n 6 S2 = D = ⋅ 0,255 = 0,306 , S = 0,553 . n −1 5 Вычисляем Θ для различных значений (минимального и максимально- го) случайной величины. Θ = |2,38-2,677|/0,553 = 0,537 для минимального значения, Θ = |3,80-2,677|/0,553 = 2,03 для максимального значения. Из указанной выше таблицы 1 для n = 6 и α = 0,95 выбираем Θкр. = 2,00. Очевидно, что для минимального значения критерий совместимости
  • 7. выполняется, для максимального – не имеет места. Поэтому считаем величи- ну 3,80 грубой ошибкой-промахом, которую отбрасываем и производим все вычисления заново с 5-ю значениями. n = 5; α = 0,95 ; t =2,78. 1 X0 = ( 2,50 + 2,40 + 2,45 + 2,53 + 2,38) = 2,452 . 5 D[ x ] = σ 2 = 1 5 [ ] ( 2,50 − 2,452) 2 + ( 2,40 − 2,452) 2 + ... + ( 2,53 − 2,452) 2 = 0,003 . n 5 S2 = D = ⋅ 0,003 = 0,004 , S = 0,063 . n −1 4 Вычисляем Θ для различных значений (минимального и максимально- го) случайной величины. Θ = |2,38-2,452|/0,063 = 1,151 для минимального значения, Θ = |2,53-2,452|/0,063 = 1,248 для максимального значения. Из указанной выше таблицы 1 для n = 5 и α = 0,95 выбираем Θкр. = 1,87. Очевидно, что для минимального и максимального значений критерий совместимости имеет место, поэтому все значения верны. Рассчитаем ε. t⋅S ε= = 0,078 . n Следовательно, доверительный интервал запишется [2,452 ± 0,078]. 4 Решение задачи в математическом редакторе MathCad n := 6 x0 := 2.5 x1 := 2.4 x2 := 2.45 x3 := 2.53 x4 := 2.38 x5 := 3.8 α := 0.95 ts := 2.57 i := 0 .. n − 1 xi xs := mean( x) xs = 2.677 ∑ n = 2.677 i dg := var( x) ( xi − xs) 2 dg = 0.255 ∑ n = 0.255 i
  • 8. dv := Var( x) ( xi − xs) 2 dv = 0.306 ∑ n −1 = 0.306 i sdv := dv sdv = 0.553 min( x) − xs Θkr := 2 Rmin := sdv Rmin = 0.536 max x) − xs ( Rmax:= sdv Rmax = 2.03 T Rmax = 2.03 y = T y := sort ( x) y = ( 2.38 2.4 2.45 2.5 2.53 3.8 ) T x := submatrix y , 0 , n − 2 , 0 , 0) ( x = ( 2.38 2.4 2.45 2.5 2.53 ) n := n − 1 αα := 0.95 := 0.95 tsts := 2.78 := 2.78 i := 0 .. .. n − 1 i := 0 n − 1 xi ∑x n= =2.452 2.452 ∑n i xs := mean( x) xs = 2.452 i dg := var( x) ( xi − xs) 2 i ∑ −3 = 3.256× 10 −3 n dg = 3.256× 10 i dv := Var( x) ( xi − xs) 2 ∑ −3 = 4.07 × 10 dv = 4.07 × 10 −3 n−1 i sdv := dv sdv = 0.064 sdv := dv sdv = 0.064 min( x) − xs Θkr := 1.87 Rmin := sdv Rmin = 1.129 max( x) − xs Rmax:= sdv Rmax = 1.223 ñëåäîâàòåëüíî, äîâåðèòåëüíûé èíòåðâàë çàïèøåòñÿ òàê: xs − ε < x < xs + ε 2 , 452 − 0 , 079 < x < 2 , 452 + 0 , 079 Замечание. При вычислении некоторых числовых характеристик слу- чайной величины с правой стороны приведены расчёты в виде соответствую- щих математических формул, подтверждающих правильность применяемых операций математической статистики. Выводы по работе. В настоящем исследовании нами были изучены литературные источни-
  • 9. ки по теме работы, выявлены общие положения и различия в работах различ- ных исследователей (авторов). По результатам анализа указанных источни- ков сделаны выводы о применимости каждого исследования в своих рамках. Так как в исследовании нами рассматривался вопрос небольшого количества испытаний (наблюдений), то применительно к нему были подобраны соот- ветствующие положения и формулы. Решён пример на языке теории вероят- ностей и математической статистики, затем перенесён в математическую среду MathCad. Результаты совпадают, что говорит о правильности применя- емой методики расчёта доверительного интервала. Приведённое решение можно совершенствовать, в частности, расчёт коэффициента Стьюдента и критерия совместимости можно автоматизировать.