Уважаемые посетители Портала Знаний, если Вы найдете ошибку в тексте, выделите, пожалуйста, ее мышью и нажмите Сtrl+Enter. Мы обязательно исправим текст!


Случайная цитата


Сегодня это действительно слишком просто: вы можете подойти к компьютеру и практически без знания того, что вы делаете, создавать разумное и бессмыслицу с поистине изумительной быстротой. (Дж. Бокс)

Некоторые задачи оценивания параметров конечных совокупностей

Точечные оценки

Асимптотическое оценивание

Литература

 

Вашему вниманию предлагаются материалы книги "Итоги науки и техники. Теория вероятностей. Математическая статистика. Теоретическая кибернетика." (Том 22, стр. 46-48).

В ряде прикладных задач, связанных с выборочным обследованием конечных совокупностей, мы имеем дело с ситуацией, когда число элементов (объем) N исследуемой совокупности U является априори либо неизвестной величиной, либо о нем известно лишь, что его значение находится в некоторых заданных пределах N1NN2.

В этих случаях возникает задача получения тех или иных статистических выводов относительно N на основе имеющейся статистической информации об U. Такая информация представляет собой обычно выборку элементов из U, извлеченную по некоторому заданному стохастическому закону, и решение задачи, естественно, существенно зависит от типа этого закона.

Чаще всего в приложениях имеют дело со схемами повторной и бесповторной выборки.


Точечные оценки

Простейший пример подобной задачи обсуждается в книге В. Феллера [1, стр. 56-58], где речь идет об оценке числа рыб в озере по результатам двух независимых уловов, когда каждый улов представляет собой бесповторную выборку.

В этом случае статистические выводы о неизвестном числе рыб N формулируются на основании изучения статистики μ2 – числа рыб, попавших в оба улова (величина μ2 имеет, как известно, гипергеометрическое распределение).

Если обозначить объемы выборок через m1 и m2, соответственно, то в данном случае для оценки максимального правдоподобия (о.м.п.)  параметра N справедливо соотношение:

где η=m1+m2-μ2 - число разных рыб, пойманных за оба улова.

Таким образом, в данном случае (две независимые бесповторные выборки) изучение статистики μ2 фактически эквивалентно изучению статистики η.

Детальный анализ такой двухвыборочной схемы проводился в работе Чэпмана [2]. Обобщение этой схемы на случай произвольного числа s выборок рассматривалось в работах Г. И. Ивченко и Е. Е. Тимониной [3, 4, 5].

Пусть m1, ..., ms (s≥2) - объемы независимых бесповторных выборок из совокупности U,

,

n=m1+...+ms

μr обозначает число элементов U, каждый из которых вошел ровно в r некоторых выборок, r=1, ..., s.

Тогда вся совокупность данных представляется векторной статистикой μ=(μ1, ..., μs), и по этой информации требуется оценить неизвестный параметр N и, более общо, произвольную параметрическую функцию τ(N).

В работе [5] доказывается, что статистика η=μ1+... +μs – общее число наблюденных элементов U – является полной достаточной статистикой для параметра N и, основываясь на этом, описывается класс функций τ(N), для которых существуют несмещенные (а значит, и с минимальной дисперсией) оценки φ(N), и указывается, как по τ определить φ.

Оказывается, что если Nn, то оптимальная оценка существует для любой функции τ(N) и она имеет вид:

            (1)

где  и Δ - оператор разности: Δf(x)= f(x+1)-f(x).

В частности, оптимальная оценка для параметра N имеет вид (при Nn):

           (2)

Если же N (≥m) может быть априори любым натуральным числом, то оптимальные оценки можно построить лишь для функций вида τ(N)= f(N)/φ(N), где f(N) - многочлен степени не выше n, удовлетворяющий условиям f(x)=0 при x= 0, 1, ..., m-1.

Если τ(N) - такая функция, то оптимальная оценка для нее дается формулой:

           (3)

В частности, несмещенная оценка с минимальной дисперсией для функции τ(N)= 1/N всегда существует и имеет вид:

           (4)

Если же ограничиться классом оценок, являющихся линейными функциями от μ1, ..., μs то в этом классе единственной несмещенной оценкой для τ(N)= 1/N является статистика:

           (5)

Для параметра N построена также о.м.п. , которая для случая выборок одинакового объема m1=ms=...=m находится из условия [4]:

           (6)

Показано также [3], что с помощью линейных оценок вида  несмещенным образом можно оценивать лишь полиномы от 1/N степени не выше s-1.

Положив в предыдущих формулах m1=...=ms=1, можно получить соответствующие выводы для схемы простой повторной выборки, которая изучалась Харрисом [6] (его результат содержится в формуле (2)) и Дримлом и Ульрихом [7] (их результат содержится в (6)).

Основываясь на распределении статистики η, для схемы с s бесповторными выборками равных объемов m рассчитаны доверительные интервалы для N для значений n=sm=5 (5) 25, всех возможных комбинаций s и m и доверительных уровней 0,9; 0,95; 0,99.

 

Асимптотическое оценивание

На практике часто объем совокупности представляет собой априори весьма большую величину и потому представляет интерес асимптотическая постановка задачи, предполагающая неограниченное возрастание как параметра N, так и объема выборки.

Пусть m1=...=ms=m→∞, N→∞ и при этом p=m/N∈[p1, p2], где 0<p1<p2<1 - заданные границы, в которых находится неизвестное значение параметра p.

В качестве оценки для p согласно (5) можно рассматривать статистику:

которая является единственной несмещенной оценкой, линейной относительно μ1, ..., μs.


Литература

  1. Феллер В., Введение в теорию вероятностей и ее приложения. М: Мир, 1, 1967, 500 с.
  2. Chapman D. G., Some properties of the hypergeometric distributions with applications to zoological sample consuses. University of California Publ. Statist., 1951, 1, 131-160
  3. Ивченко Г. И., Тимонина Е. Е., Об оценивании при выборе из конечной совокупности. Мат. заметки, 1980, № 4, 623-633 (РЖМат, 1981, 2В146)
  4. Ивченко Г. И., Тимонина Е. Е., О некоторых задачах оценивания для выборок из конечной совокупности. Изв. АН УзССР. Сер. физ.-мат. н., 1981, № 4, 27-33 (РЖМат, 1982, 2В173)
  5. Ивченко Г. И., Тимонина Е. Е., Об оптимальном оценивании для конечной совокупности, размер которой неизвестен. Мат. заметки, 1982, 31, № 4, 633-640 (РЖМат, 1983, 8В178)
  6. Harris B., Statistical inference in the classical occupancy problem unbiased estimation of the number of classes. J. Amer. Statist. Assoc., 1968, 63, № 323, 837-847 (РЖМат, 1969, 6В87)
  7. Driml M., Ullrich M., Maximum likelihood estimate og the number of types. Acta techn. CSAV, 1967, 12, № 3, 300-303 (РЖМат, 1968, 8В94)

В начало

Содержание портала