на методы какой науки опирается математическая статистика
Модуль 1. Предмет и задачи математической статистики, ее связь с другими науками
судить доказательно, опровергать неправильные выводы
должен уметь всякий: физик и поэт, тракторист и химик»
Непрерывное и быстрое расширение областей исследования, в которых удается эффективно использовать математические и статистические методы, составляет одну из характерных черт развития современной науки. Раздвигая традиционные рамки «точных наук», этот процесс вовлекает сегодня в свою сферу биологию и социологию, языкознание и психологию, юриспруденцию, педагогику и историю. Применение методов математической статистики в самых разных областях знания открывает более широкие возможности для глубокого проникновения в сущность и закономерности изучаемых явлений, более точного предсказания их развития в различных условиях, а значит и более эффективного управления ими, практического их использования.
1.1. Понятие математической статистики
Математическая статистика – раздел математики, посвященный математическим методам систематизации, обработки и использования статистических данных для научных и практических выводов. Определение, сформулированное видными отечественными математиками А.Н. Колмогоровым и Ю.В. Прохоровым.
Статистические данные – это данные, полученные в результате обследования большого числа объектов или явлений. Статистические методы — методы анализа статистических данных. Математическая статистика не раскрывает сущности исследуемых явлений. Она может фиксировать статистически достоверные различия между двумя исследуемыми явлениями, но не может объяснить причины этих различий.
Математическая статистика подразделяется на две основные области: описательную и аналитическую статистику. Описательная статистика раскрывает методы описания статистических данных, представляет их в форме таблиц, графиков и распределений.
Аналитическая статистика(теория статистических выводов) ориентирована на обработку данных, полученных в ходе эксперимента, с целью формулировки выводов, имеющих прикладное значение для самых различных областей человеческой деятельности.
Математическая статистика исходит из предположения, что наблюдаемая изменчивость окружающего мира имеет два источника:
– действие известных причин и факторов. Они порождают изменчивость, закономерно объяснимую;
– действие случайных причин и факторов. Большинство природных и общественных явлений обнаруживают изменчивость, которая не может быть целиком объяснена закономерными причинами. В таком случае прибегают к концепции случайной изменчивости. Выражение «случайный» в данном контексте означает «подчиняющийся законам теории вероятности».
Проверка психолого-педагогических гипотез и моделей является тоже случайным событием, так как результаты педагогического исследования определяются очень большим количеством заранее непредсказуемых факторов.Определенные закономерности можно выявить только в случае массовых наблюдений вследствие закона больших чисел.Закон больших чисел – это объективный математический закон, согласно которому совместное действие большого числа случайных факторов приводит к результату, почти не зависящему от случая.
Отсюда совершенно очевидным является факт, что педагогические и психологические измерения однозначно связаны со статистическими измерениями.
Статистический подход– это выявление закономерной изменчивости на фоне случайных факторов и причин. Методы математической статистики позволяют оценить параметры имеющихся закономерностей, проверить те или иные гипотезы об этих закономерностях.
Аппарат математической статистики является замечательным по мощности и гибкости инструментом для отсеивания закономерностей от случайностей. Педагогу-исследователю обязательно необходимо накапливать информацию об окружающем мире, пытаясь выделить закономерности из случайностей.
Математическая статистика возникла (XVIIв.) и развивалась параллельно с теорией вероятностей. Дальнейшее развитие математической статистики (вторая половинаXIX— началоXXв.) обязано, в первую очередь, П. Л. Чебышеву, А. А. Маркову, А. М. Ляпунову, а также К. Гауссу, А. Кетле, Ф. Гальтону, К. Пирсону и др.
В XXв. наиболее существенный вклад в математическую статистику был сделан советскими математиками (В. И. Романовский, Е. Е. Слуцкий, А. Н. Колмогоров, Н. В. Смирнов), а также английскими (Стьюдент, Р. Фишер, Э. Пирсон) и американскими (Ю. Нейман, А. Вальд) учеными [2,c. 88].
На методы какой науки опирается математическая статистика
Глава II . Математическая статистика
2.1 Математическая статистика и её методы
Статистка, как отмечалось во Введении, сегодня имеет дело с количественной стороной явлений, поэтому она теснейшим образом связана с Математикой, а не с исходным для неё Правом. Статистика неразрывно связана с научными дисциплинами, изучающими основные закономерности и качественные особенности той или иной области явлений. Но она как никакая другая наука имеет дело, прежде всего, с количественной стороной явлений и поэтому она тесно связана с математикой.
В распоряжении статистики имеются такие средства, как массовое статистическое наблюдение (сплошное и выборочное), отчётность. Используются также системы показателей, всесторонне характеризующих явление, объект и совокупность в целом, сводные, групповые и комбинационные таблицы, представляющие результаты статистических группировок. При анализе методом статистических группировок изучаемая совокупность явлений расчленяется на однородные по отдельным признакам группы и подгруппы и каждая из них характеризуется системой статистических показателей
Математическая статистика – это, прежде всего, наука, разрабатывающая математические методы систематизации и использования статистических данных для научных и практических выводов.
Во многих своих разделах математическая статистика опирается на теорию вероятностей, позволяющую оценить надёжность и точность выводов, делаемых на основании ограниченного статистического материала.
Математическая статистика представляет собой раздел математики, предметом которой является разработка методов регистрации, описания и анализа данных наблюдений и экспериментов с целью построения вероятностных моделей массовых случайных явлений. [1] В зависимости от математической природы конкретных результатов наблюдений математическая статистика делится на статистику чисел, многомерный статистический анализ, анализ функций (процессов) и временных рядов, статистику объектов нечисловой природы.
В математической статистике также выделяют описательную статистику, теорию оценивания и теорию проверки гипотез.
Описательная статистика представляет собой совокупность эмпирических методов, используемых для визуализации и интерпретации данных.
Методы описательной статистики предполагают использование возможностей современных компьютеров, так как они используются как не только для расчётов, но и для графического моделирования в виде таблиц, диаграмм, графиков и т. д. С помощью компьютеров гораздо проще произвести как кластерный анализ, нацеленный на выделение групп объектов, похожих друг на друга, так и многомерное моделирование, позволяющее наглядно представить объекты на плоскости.
Методы оценивания и проверки гипотез опираются на вероятностные модели происхождения данных, которые делятся на параметрические и непараметрические. В параметрических моделях предполагается, что характеристики изучаемых объектов описываются посредством распределений, зависящих от одного или нескольких числовых параметров. Непараметрические модели не связаны со спецификацией параметрического семейства для распределения изучаемых характеристик.
Важным шагом в современной математической статистике стал статистический последовательный анализ, основной вклад в создание и развитие которого внес Абрахам Вальд ( Wald Abraham, 30.10.1902 г., Австро-Венгрия – 13.12.1950 г., США). В отличие от традиционных (непоследовательных) методов статистического анализа, основанных на случайной выборке фиксированного объема, в последовательном анализе допускается формирование массива наблюдений по одному (или, более общим образом, группами), при этом решение об проведении следующего наблюдения (группы наблюдений) принимается на основе уже накопленного массива наблюдений. Ввиду этого, теория последовательного статистического анализа тесно связана с теорией оптимальной остановки.
В математической статистике есть общая теория проверки гипотез и большое число методов, посвящённых проверке конкретных гипотез. Рассматривают гипотезы о значениях параметров и характеристик, о проверке однородности, о согласии эмпирической функции распределения с заданной функцией распределения или с параметрическим семейством таких функций, о симметрии распределения и др.
Большое значение имеет раздел математической статистики, связанный с проведением выборочных обследований, со свойствами различных схем организации выборок и построением адекватных методов оценивания и проверки гипотез.
В отличии полного наблюдения выборочное наблюдение применяется, когда применение сплошного наблюдения физически невозможно из-за большого массива данных или экономически нецелесообразно. Физическая невозможность имеет место, например, при изучении пассажиропотоков, рыночных цен, семейных бюджетов. Экономическая нецелесообразность имеет место при оценке качества товаров, связанной с их уничтожением, например, дегустация, испытание кирпичей на прочность и т.п.
Существует 4 способа случайного отбора в выборку:
1. Собственно случайный отбор или «метод лото», когда статистическим величинам присваиваются порядковые номера, заносимые на определенные предметы (карточки, бочонки), которые затем перемешиваются и выбираются наугад. На практике этот способ осуществляют с помощью генератора случайных чисел или математических таблиц случайных чисел.
3. Стратифицированный (расслоенный) отбор величин ведётся из неоднородного массива данных, когда генеральная совокупность предварительно разбивается на однородные группы, к которым применяется случайный или механический отбор.
4. Серийный отбор представляет собой особый способ составления выборки, при котором случайно или механически выбирают не отдельные величины, а их серии (последовательности с какого-то номера по какой-то подряд), внутри которых ведут сплошное наблюдение.
Повторный отбор означает, что попавшие в выборку статистические величины или их серии после использования возвращаются в генеральную совокупность, имея шанс попасть в новую выборку. При этом у всех величин генеральной совокупности одинаковая вероятность включения в выборку.
Бесповторный отбор означает, что попавшие в выборку статистические величины или их серии после использования не возвращаются в генеральную совокупность, а потому для остальных величин последней повышается вероятность попадания в следующую выборку.
Бесповторный отбор дает более точные результаты, поэтому применяется чаще. Но есть ситуации, когда его применить нельзя (изучение пассажиропотоков, потребительского спроса и т.п.) и тогда ведется повторный отбор.
Выборочную совокупность можно сформировать по количественному признаку статистических величин, а также по альтернативному или атрибутивному. В первом случае обобщающей характеристикой выборки служит выборочная средняя величина, обозначаемая 1/Temp/msohtml1/02/clip_image001.gif» />, а во втором − выборочная доля величин, обозначаемая w. В генеральной совокупности соответственно: генеральная средняя
1/Temp/msohtml1/02/clip_image002.gif» />и генеральная доля р. Разности
1/Temp/msohtml1/02/clip_image001.gif» /> −
Источник
Математическая статистика
Математи́ческая стати́стика — наука, разрабатывающая математические методы систематизации и использования статистических данных для научных и практических выводов.
Во многих своих разделах математическая статистика опирается на теорию вероятностей, позволяющую оценить надёжность и точность выводов, делаемых на основании ограниченного статистического материала (напр., оценить необходимый объём выборки для получения результатов требуемой точности при выборочном обследовании).
Содержание
Предмет и методы
Выделяют описательную статистику, теорию оценивания и теорию проверки гипотез. Описательная статистика есть совокупность эмпирических методов, используемых для визуализации и интерпретации данных (расчет выборочных характеристик, таблицы, диаграммы, графики и т. д.), как правило, не требующих предположений о вероятностной природе данных. Некоторые методы описательной статистики предполагают использование возможностей современных компьютеров. К ним относятся, в частности, кластерный анализ, нацеленный на выделение групп объектов, похожих друг на друга, и многомерное шкалирование, позволяющее наглядно представить объекты на плоскости.
Методы оценивания и проверки гипотез опираются на вероятностные модели происхождения данных. Эти модели делятся на параметрические и непараметрические. В параметрических моделях предполагается, что характеристики изучаемых объектов описываются посредством распределений, зависящих от (одного или нескольких) числовых параметров. Непараметрические модели не связаны со спецификацией параметрического семейства для распределения изучаемых характеристик. В математической статистике оценивают параметры и функции от них, представляющие важные характеристики распределений (например, математическое ожидание, медиана, стандартное отклонение, квантили и др.), плотности и функции распределения и пр. Используют точечные и интервальные оценки.
Большой раздел современной математической статистики — статистический последовательный анализ, фундаментальный вклад в создание и развитие которого внес А. Вальд во время Второй мировой войны. В отличие от традиционных (непоследовательных) методов статистического анализа, основанных на случайной выборке фиксированного объема, в последовательном анализе допускается формирование массива наблюдений по одному (или, более общим образом, группами), при этом решение об проведении следующего наблюдения (группы наблюдений) принимается на основе уже накопленного массива наблюдений. Ввиду этого, теория последовательного статистического анализа тесно связана с теорией оптимальной остановки.
В математической статистике есть общая теория проверки гипотез и большое число методов, посвящённых проверке конкретных гипотез. Рассматривают гипотезы о значениях параметров и характеристик, о проверке однородности (то есть о совпадении характеристик или функций распределения в двух выборках), о согласии эмпирической функции распределения с заданной функцией распределения или с параметрическим семейством таких функций, о симметрии распределения и др.
Большое значение имеет раздел математической статистики, связанный с проведением выборочных обследований, со свойствами различных схем организации выборок и построением адекватных методов оценивания и проверки гипотез.
Задачи восстановления зависимостей активно изучаются более 200 лет, с момента разработки К. Гауссом в 1794 г. метода наименьших квадратов.
Различные методы построения (кластер-анализ), анализа и использования (дискриминантный анализ) классификаций (типологий) именуют также методами распознавания образов (с учителем и без), автоматической классификации и др.
В настоящее время компьютеры играют большую роль в математической статистике. Они используются как для расчётов, так и для имитационного моделирования (в частности, в методах размножения выборок и при изучении пригодности асимптотических результатов).
Учебное пособие: Математическая статистика
Название: Математическая статистика Раздел: Рефераты по математике Тип: учебное пособие Добавлен 11:35:38 21 апреля 2009 Похожие работы Просмотров: 12068 Комментариев: 17 Оценило: 8 человек Средний балл: 4.3 Оценка: 4 Скачать | |||||||||||||||
Распределение величины называют эмпирическим или выборочным распределением. Вычислим математическое ожидание и дисперсию величины
и введем обозначения для этих величин:
Точно так же вычислим и момент порядка
В общем случае обозначим через величину
Если при построении всех введенных нами характеристик считать выборку ,
,
набором случайных величин, то и сами эти характеристики —
,
,
,
,
— станут величинами случайными. Эти характеристики выборочного распределения используют для оценки (приближения) соответствующих неизвестных характеристик истинного распределения.
Причина использования характеристик распределения для оценки характеристик истинного распределения
(или
) — в близости этих распределений при больших
.
Мы не станем уточнять, что имеется в виду под близостью выборочного и истинного распределений. В следующих параграфах мы подробнее познакомимся с каждой из введенных выше характеристик и исследуем ее свойства, в том числе ее поведение с ростом объема выборки.
Поскольку неизвестное распределение можно описать, например, его функцией распределения
, построим по выборке «оценку» для этой функции.
Эмпирической функцией распределения, построенной по выборке объема
, называется случайная функция
, при каждом
равная
Напоминание: Случайная функция
называется индикатором события . При каждом
это — случайная величина, имеющая распределение Бернулли с параметром
. почему?
Иначе говоря, при любом значение
, равное истинной вероятности случайной величине
быть меньше
, оценивается долей элементов выборки, меньших
.
Если элементы выборки ,
,
упорядочить по возрастанию (на каждом элементарном исходе), получится новый набор случайных величин, называемый вариационным рядом :
Выборка:
Вариационный ряд:
Рис. 1. Пример 1 |
Эмпирическая функция распределения имеет скачки в точках выборки, величина скачка в точке равна
, где
— количество элементов выборки, совпадающих с
.
Можно построить эмпирическую функцию распределения по вариационному ряду:
(1) |
На каждом из интервалов строят прямоугольник, площадь которого пропорциональна
. Общая площадь всех прямоугольников должна равняться единице. Пусть
— длина интервала
. Высота
прямоугольника над
равна
Полученная фигура называется гистограммой.
Имеется вариационный ряд (см. пример 1):
Разобьем отрезок на 4 равных отрезка. В отрезок
попали 4 элемента выборки, в
— 6, в
— 3, и в отрезок
попали 2 элемента выборки. Строим гистограмму (рис. 2). На рис. 3 — тоже гистограмма для той же выборки, но при разбиении области на 5 равных отрезков.
Рис. 2. Пример 2 | Рис. 3. Пример 2 |