для каких объектов переписи применяется метод несплошного статистического наблюдения
Для каких объектов переписи применяется метод несплошного статистического наблюдения
1.1.1. СПЛОШНОЕ И НЕСПЛОШНОЕ НАБЛЮДЕНИЕ
Фундаментальным понятием в статистической теории является понятие совокупности, представляющей собой множество объектов или явлений, объединенных общими признаками и подвергающихся статистическому исследованию. При проведении выборочного наблюдения (обследования) различают генеральную и выборочную совокупности.
Генеральная совокупность представляет собой множество реально или гипотетически существующих объектов или явлений, из которых тем или иным способом формируется совокупность выборочная. В качестве примера можно привести генеральные совокупности населения, домашних хозяйств, предприятий и т.п.
Статистика изучает прежде всего свойства генеральных совокупностей, а не отдельных составляющих их единиц. Так, при статистическом исследовании генеральной совокупности предприятий розничной торговли представляют интерес суммарные по отрасли значения розничного товарооборота, численности занятых работников, размера торговых площадей и т.д., а также вариации и взаимосвязи данных показателей. Необходимо отметить, что генеральная совокупность на практике очень редко в точности подчиняется простым математическим законам, и именно этим в первую очередь обусловлена необходимость ее статистического исследования.
Рассматриваемые в статистике генеральные совокупности могут реально существовать, а могут и нет. Различение реальных и гипотетических генеральных совокупностей на практике важно, когда делаются выводы о генеральной совокупности по извлеченной из нее выборке.
Генеральная совокупность может быть как конечной, так и бесконечной. Однако для органов государственной статистики практический интерес представляет конечная генеральная совокупность. Поэтому в сборнике под термином «совокупность» понимается конечная совокупность.
Статистическое исследование представляет собой процесс изучения социально-экономических объектов и явлений на основе статистических методов и систем статистических показателей. К наиболее распространенным обобщающим статистическим характеристикам, получаемым в результате исследования, относятся: доля элементов генеральной совокупности, отвечающих некоторому критерию; средние и суммарные значения признаков элементов; отношение средних или суммарных значений и др.
С точки зрения полноты охвата элементов генеральной совокупности статистическое наблюдение может быть сплошным или несплошным.
Сплошное наблюдение представляет собой обследование всех без исключения элементов изучаемой совокупности и, следовательно, получение исчерпывающей статистической информации.
Сплошное наблюдение используется в случае, когда обследуемая совокупность состоит из сравнительно небольшого числа элементов, либо в силу необходимости получения точной информации, в том числе по каждому элементу. Сплошные обследования необходимы для актуализации статистической основы и получения структурных данных в региональной и тематической группировках. Эта информация используется для уточнения результатов выборочных обследований.
В случае, когда проведение сплошного наблюдения не имеет смысла, невозможно по организационным причинам или экономически нецелесообразно в силу требующихся на его осуществление ресурсных затрат, используется несплошное наблюдение посредством применения выборочного метода.
Несплошное наблюдение представляет собой учёт только подмножества элементов общей совокупности, на основе которого можно получить обобщающие характеристики всей совокупности с некоторой степенью точности.
Вследствие этого несплошное наблюдение имеет следующие преимущества перед сплошным.
1. Затраты на получение данных лишь от части элементов общей совокупности меньше, следовательно, выборочное обследование является более экономически выгодным, чем сплошное.
2. Объем работы по сбору и обобщению результатов обследования значительно меньше, поэтому результаты выборочного обследования можно получить значительно быстрее, чем при сплошном наблюдении.
3. Так как наблюдению подвергается лишь часть элементов общей совокупности, появляется возможность расширения программы обследования, т.е. более широкого и детального наблюдения каждой единицы в отдельности.
4. При проведении обследования выборочным методом общий объем работы меньше, поэтому можно лучше подготовить и более тщательно контролировать его проведение и обработку данных. Следовательно, выборочное обследование может дать более достоверные результаты, чем соответствующее сплошное.
При решении ряда прикладных статистических задач выборочное наблюдение является единственно возможным. Так, в технологической статистике контроль качества отдельных видов продукции невозможен без нарушения ее потребительских свойств, поэтому он может осуществляться только на основе низкопроцентной выборки. В маркетинговых обследованиях в большинстве случаев также невозможно полностью обследовать всю совокупность потенциальных потребителей того или иного товара.
Следует отметить, что, исходя из нужд практической статистики, выборочный метод широко используется для проверки результатов сплошного наблюдения (контроля качества), например, данных переписи населения, когда из-за трудностей обработки огромного объема первичной информации возможны ошибки в результатах.
Методологические положения по статистике (выпуск 1,2,3,4,5)
Copyright © Федеральная служба государственной статистики
Переписи и другие виды специально организованного статистического наблюдения
При отсутствии каких-либо сведений в отчетности или для проверки ее данных осуществляется специально организованное наблюдение. Одним из таких наблюдений является перепись населения.
Перепись населения– процесс сбора информации о численности, составе и состоянии объекта статистического наблюдения по ряду признаков, повторяющийся, как правило, через равные промежутки времени.
Характерные особенности переписи:
1) проводится на всей территории, входящей в исследование, в одно время;
2) данная программа является единой;
3) все наблюдаемые элементы регистрируются в один критический момент времени.
Статистическое наблюдение имеет формы и виды (рис. 1).
Статистические наблюдения разделяют по времени регистрации фактовна:
1) непрерывное (текущее) – изменения относительно исследуемых явлений устанавливаются лишь по мере их наступления;
2) периодическое – данные об изменениях объекта собираются в ходе нескольких обследований. В основном осуществляются по подобным программам и инструментарию;
3) единовременное – наблюдение, направленное на получение сведений о количественных характеристиках определенного явления или процесса. Очередная регистрация может быть проведена только через какое-то время, которое заранее, как правило, не определяется, либо может не проводиться вообще.
выделяют сплошное и несплошное статистическое наблюдение.
По охвату всех единиц
Сплошное наблюдение– полный учет всех единиц изучаемой совокупности.
Однако такой вид наблюдения имеет большие минусы: немалые расходы на получение и обработку всего объема информации; большие затраты трудовых ресурсов; недостаточную оперативность информации, так как для ее сбора и обработки необходимо много времени. Никакое сплошное наблюдение не может полностью охватить все единицы совокупности. Это объясняет то, что какое-то количество единиц так или иначе останется не исследованным.
Количество и доля неохваченных единиц находятся в зависимости от следующих условий [3] :
1) вид обследования (по почте, с помощью устного опроса);
2) тип отчетной единицы;
3) квалификация регистратора;
3) содержание вопросов, предусмотренных программой наблюдения;
4) время дня или года, когда проводится обследование, и др.
Несплошное наблюдение – наблюдение, при котором учитываются части единиц совокупности, где есть вероятность получения обобщающей характеристики всей совокупности. Примерами несплошного наблюдения являются: способ основного массива, выборочные наблюдения, монографические описания. Одной из привилегий несплошных наблюдений выступает возможность получения сведений в достаточно короткие сроки и с наименьшими потерями ресурсов, нежели при сплошном наблюдении.
Существует несколько видов несплошного наблюдения:
1) выборочное наблюдение, в основе которого лежит принцип случайного отбора единиц изучаемой совокупности, подвергаемых наблюдению. Достоинство: дает достаточно точные результаты, вполне пригодные для характеристики всей исследуемой совокупности, по сравнению с другими видами несплошного наблюдения.
Разновидностью выборочного наблюдения является метод моментных наблюдений. Суть его состоит в том, что информация собирается путем регистрации значений признаков у единиц выборочной совокупности в некоторые заранее определенные моменты времени. Этот вид наблюдения применяется при проведении обследований доходов населения;
2) метод основного массива. При нем обследованию подвергаются самые существенные, обычно наиболее крупные единицы изучаемой совокупности, имеющие по основному признаку наибольший удельный вес в совокупности. Данный вид применяется для организации наблюдения за работой городских рынков;
Помимо переписи населения, некоторые характеристики состава населения может дать статистическая отчетность, такие как численность отдельных категорий населения и т. п. Это относится в первую очередь к таким группам, как: дети, посещающие дошкольные учреждения; учащиеся учебных заведений различного типа; пенсионеры; лица, занятые в различных отраслях народного хозяйства.
К такой отчетности относятся:
1) Отчет о численности пенсионеров и суммах назначенных месячных пенсий. Форма № 6-ПФ(к) (годовая, почтовая);
2) Отчет о численности военнослужащих, размерах денежного обеспечения и состоянии его выплаты. Форма № 2-ВС (полугодовая);
3) Отчет о деятельности концертной организации, самостоятельного профессионального коллектива за год. Форма № 12-нк (почтовая – годовая);
4) Отчет о деятельности театра за год. Форма № 9-нк (почтовая – годовая);
5) Отчет о деятельности музея. Форма № 8-нк (почтовая – годовая) и др.
Отчетность заключает в себе информацию о численности посетителей музеев, зрелищных учреждений, объемах пассажирских перевозок различными видами транспорта. Данные сведения имеют особенность и ограниченность в том, что они отражают в основном общую численность лиц без каких-либо характеристик их состава.
Лекция 6. Методы несплошного наблюдения.
1. Монографический метод предполагает всестороннее изучение и описание единичных объектов. Требует особой осторожности при использовании массовых источников данных. Может использоваться, если все единичные объекты, избраные для изучения, не выделяются какими-либо резкими отличиями. Следовательно, выводы, полученные при использовании данного метода, должны основываться на заранее выявленных тенденциях и закономерностях. Чаще всего используется для иллюстрации как вспомогательный.
2. Метод основного массива. Предполагает изучение той части единиц наблюдения, которая имеет высокий удельный вес в совокупности. Часто важные тенденции не проявляются в равной степени у всех единиц наблюдения, только набирающие силу факторы, которые могут сыграть решающую роль в развитии процесса в будущем, затушевываются в генеральной совокупности. Для их выделения и используется данный метод.
3. Выборочный метод. Это такая система отбора единиц наблюдения, при которой результаты, полученные на частичном отборе, отражают всю изучаемую совокупность.
По времени регистрации фактов стат наблюдение может быть непрерывным, периодическим и единовременным. По охвату единиц совокупности может быть сплошным и не сплошным.
Виды несплошного наблюдения:
Способы статистического наблюдения:
Основанием для регистрации фактов служат либо документы, либо устные заявления, либо какие-то хронометражные данные. В связи с этим различают наблюдения:
Способы сбора информации:
1. Она должна по возможности содержать только те признаки, значения которых будут использованы для проведения анализа или в контрольных целях.
2. Вопросы должны быть четко сформулированы, чтобы не допустить неправильную их трактовку.
3. Программа должна содержать контрольные вопросы для проверки и корректировки сообщаемых сведений.
Заполнение стат формуляра осуществляется в соответствии с инструкцией.
При организации стат наблюдения решается вопрос о времени и месте проведения наблюдения. Выбор места зависит от цели наблюдения, выбор времени связан с определением критического момента даты или интервала времени. Критическим моментом стат наблюдения называют момент времени, к которому приурочены регистрируемые сведения. Срок наблюдения должен быть не слишком удален от критического момента наблюдения, чтобы можно было воспроизвести состояние объекта на тот момент.
2. По причинам возникновения:
3. По стадии возникновения:
— Ошибки при подготовке данных к машинной обработке
— Ошибки в процессе обработки данных
Виды контроля достоверности данных:
Контроль достоверности результатов осуществляется на всех этапах проведения стат наблюдения.
1) информация должна быть достоверной, то есть максимально соответствовать реальной действительности
2) Сведения должны быть достаточно полными для решения задач исследования
3) Отбор информации должен быть проведен в максимально сжатые сроки для использования ее в оперативных целях
Преимущества этого метода по сравнению со сплошным можно оценить, если оно организованно и проведено в строгом соответствии с научными принципами теории выборочного методы. Прежде всего если обеспечена случайность отбора единиц и изучено достаточное их число. Если это все соблюдается, то выборка считается репрезентативной.
Выборочное исследование проходит три этапа:
1) определение объема выборочной совокупности. Поскольку мы имеем дело с частичными данными, каждый показатель или варианта признака несет в себе некоторую погрешность, связанную с неполнотой единиц наблюдения. Следовательно, точность и достоверность результатов напрямую зависит от объема выборки. При увеличении объема выборки до определенного уровня, величина ошибки уменьшается быстро, а затем все медленнее. Разработаны спец методики определения минимального объема выборки при сохранении достаточной репрезентативности. Выборка должна быть такой, чтобы свойство достоверности было присуще каждому изучаемому признаку, поэтому численность выборки насчитывается многократно, исходя из допустимых ошибок различных показателей. Исследование нужно базировать на максимальной величине объема выборочной совокупности или создавать многоступенчатую выборку. Выборочное изучение начинается с определения уровня точности будущих результатов. Он задается с помощью мат формул, либо с помощью таблицы достаточно больших чисел. Эта таблица рассчитана на определение выборки для признаков имеющих норм распределение или близкое к ним. Исследователь задает желаемый уровень вероятности Р и возможную допустимую ошибку м доп. В соответствии с этим на стыке строки и столбца таблицы находим величину, обозначающую объем выборки. Допустимая ошибка обычно не должна превышать пяти процентов. Вероятность должна быть в пределах от 0,95 до 0,99.
3) Нахождение величины выбранной ошибки
25.02.2016
Показатели, связанные с индексируемым показателем, используются в качестве весов индекса, а взвешивание и элиминирование изменения весов (фиксирование в числителе и знаменателе индекса на одном и том же уровне) составляют специфику собственно индексов и индексного метода.
Технически любой индекс представляет собой показатель, определяемый как соотношение двух величин. Эти величины являются определенными состояниями заданного признака. С помощью индексов осуществляется сравнение фактических показателей с базисными.
Существует два основных вида индексов: простые (частные, индивидуальные) и аналитические.
В первом случае исследуемый признак принимается без учета связи этого признака с остальными признаками изучаемых явлений. Ip=p1/p0
С помощью весовых признаков исследуются изменения явлений, элементы которых несоизмеримы. Простые и аналитические индексы взаимно дополняют друг друга.
С помощью индексов можно сравнивать данные в динамике за ряд лет. Например, рассчитав темпы роста продукции в сопоставимых ценах. При анализе динамики показателей различают цепной и базисный индекс.
Базисный индекс рассчитывается по отношению к базисному периоду.
Цепной рассчитывается по отношению к предыдущему периоду.
Индексный метод широко используется в социологии для измерения соц установок и бюджетов времени респондентов при анализе текстовой информации, межличностных отношений и тд.
Различают логические и аналитические индексы.
Логические используются обычно для измерения скрытого (латентного) качественного признака через многомерное (и часто многосвязное) пространство эмпирических индикаторов, измеряемых по номинальным шкалам. Близкие по смыслу комбинации значений индикаторов объединяются в типологические группы, которым присваиваются текстовые или цифровые обозначения, используемые в дальнейшем как школьные значения измеряемого признака. Эти значения представляют собой логический индекс. Построив их, начинается сбор данных по шкалам индикаторов и затем сводит эти многомерные данные в одномерную шкалу признака.
Корректное выполнение данной процедуры требует ответа на следующие вопросы:
1) существует ли одномерный признак, который будет измеряться с помощью логического индекса
2) Связаны ли выделенные индикаторы с этим латентным признаком
3) Адекватна ли используемая форма выражения скрытого признака через эмпирический индикатор
4) К какому типу относится шкала признака соответствующая построенному логическому индексу
Аналитические индексы образуются из индикаторов с помощью математических операций. Их основная ценность не столько в конкретных получаемых значениях, сколько в возможностях их использования для сравнительного анализа.
Пример. Проанализируем коллектив из шести персон. Опросили членов группы как они относятся друг к другу. Получили таблицу (фотка).
Результаты предварительной обработки по столбцам позволяют оценить соц статус членов коллектива, по строкам их соц экспансию.
Персональные социоиндексы или индексы соц статуса. 2 Фотки.
Индексы соц экспансии. Фотка.
Анализ таблицы: признанный коллективом лидер х2, так как у него максимальный положительный индекс статуса С+-. Изгой в коллективе х5. Самый изолированный член коллектива х6, потому что нулевые индексы соц статуса и соц активности. Наибольший интерес вызывает х4, х5. Наиболее активный член коллектива х1 и х3, так как у них максимальный соц индекс экспансии. При этом х3 наиболее благожелателен коллегам, так как у него более значительный индекс Э+-. Коллектив более или менее устойчив, так как нет отрицательных индексов Э+-.
Индекс связанности фотка. Индекс сплоченности (взаимосвязанности) фотка. Индекс референтности фотка. 1-Гр характеризует степень «безответной любви», когда положительные выборы не находят взаимности.
Фотка. Изучаемая группа примерно наполовину связана между собой, так как Гс более 0,5, то есть реализовано более 50% всех возможных связей между членами группы. Относительно мала степень сплоченности группы, всего 20%. При этом 40% положительных связей не находят взаимопонимания.
В зависимости от того, насколько оптимально сочетаются разные факторы, будет неодинаковой степень воздействия каждого из них на величину результативного показателя.
Корреляционные связи различаются по форме, направлению и силе.
По форме корреляционная связь может быть прямолинейной и криволинейной. Прямолинейной может быть связь между количеством правильно решенных заданий на семинаре и положительной оценкой. Криволинейной может быть связь между уровнем мотивации и эффективностью выполнения задачи.
По направлению может быть положительной (прямой) и отрицательной (обратной). При положительной более высоким значениям одного признака соответствуют более высокие значения другого, а более низким значениям одного признака низкие значения другого. При отрицательной корреляции наоборот.
Если точки не выстраиваются по прямой линии, а образуют облако, коэффициент корреляции по абсолютной величине становится меньше 1 и по мере округления этого облака приближается к нулю. Если коэффициент корреляции равен 0, переменные полностью независимы друг от друга.
Используются две системы классификации корреляционных связей по силе: общая и частная.
Общая классификация: фотка.
Согласно частной классификации: фотка
Первая классификация (общая) ориентирована только на величину коэффициента корреляции, а вторая (частная) определяет какого уровня значимости достигает данная величина коэффициента корреляции при данном объеме выборки. Чем больше объем выборки, тем меньше величины коэффициента корреляции оказывается достаточно, чтобы признать ее достоверность. Обычно ориентируются на частную классификацию, потому что она учитывает объем выборки.
В качестве мер корреляции используются: фотка.
Прежде чем приступать к корреляционному анализу, следует проверить будут ли его результаты реально отражать существующую картину. Признаки, исследуемые методом корреляции, должны быть нормально распределены и линейно зависимы между собой.
Признак обладает свойством нормальности, если его значение симметрично распределяется от центра, которым считается его средняя арифметическая величина. Проще всего проверить нормальность распределения графическим методом. График нормально распределенного признака имеет колоколообразный вид (фотка).
Линейная зависимость между двумя признаками существует тогда, когда с увеличением на единицу значений одного признака изменяется в ту или иную сторону значение другого. Проверить это можно с помощью графического метода, чаще всего когда в системе координат отмечаются точками те данные, которые имеются.
1) Проверка нормальности и линейности должна проводиться перед применением мат методов
2) свойство нормальности и линейности определяется по не сгруппированным данным
3) нормальность и линейность определяются относительно каждого признака изучаемого явления
4) если признаки не отвечают свойству нормальности и линейности, это не означает отказа от статистических методов.
В статистике разработан ряд приемов, преобразующих значение признаков, существенно отклоняющихся от данных свойств.
Чаще всего при изучении массовых источников применяют коэффициент линейной корреляции (r). Формула: фотка.
Пример. Нам даны данные о возрасте 25 человек. Определить связь между возрастом и количеством детей.
Коэффициенты корреляции изменяются в пределах от 0 до плюс минус 1. Чем ближе значение к нулю, тем меньше связь между признаками. Если коэффициент корреляции имеет положительное значение, то связь между признаками прямая, то есть с увеличением значения одного признака растет среднее значение второго. Если коэффициент корреляции отрицательный, связь обратная. При r больше или равно 0,5 можно говорить о наличии существенной связи между признаками. Оценка значимости коэффициента корреляции во многом зависит от объема выборки. Если число наблюдений велико, то даже небольшая величина коэффициента линейной корреляции имеет определенную значимость, которой нельзя пренебречь. Это проверяется специальными стат таблицами, раскрывающими значимость r от объема изучаемой совокупности. В данном примере связь между признаками тесная и прямая, то есть количество детей в семье в значительной мере зависит от возраста родителей. Чем старше опрашиваемый, тем больше у него детей.
Применение коэффициента линейной корреляции имеет несколько ограничений:
1) он вычисляется только для количественных признаков
2) Признаки, связь между которыми выявляется, должны быть нормально распределены и линейно зависимы
Данная формула применяется только для первичных не сгруппированных данных.
Для анализа силы связи качественных альтернативных признаков применяется коэффициента ассоциации и коэффициент сопряженности. Их вычисление предворяется тем, что имеющиеся данные сводятся в таблицу 4-х полей.
Фотка. (Ад-цб исправить)
Пример. Фотка. Интерференция полученных значений аналогична толкованию значений коэффициента линейной корреляции. Но при этом оценивать связь между признаками как тесную, существенную можно при значении Ф не ниже +-0,3. Значение Q всегда несколько больше значения Ф. Коэффициент ассоциации отражает одностороннюю связь между признаками, то есть показывает степень влияния одного признака на другой.
Коэффициент сопряженности раскрывает силу взаимосвязи между признаками. Величина коэффициента сопряженности в определенной мере зависит от абсолютных значений признаков в таблице распределения. Следовательно, нужно это учитывать при сравнении коэффициентов сопряженности рассчитанных по разным исходным данным. Изменения его величины может в большей степени объясняться разницей абсолютных частот признака, чем разницей силы их взаимодействия.
Значения коэффициентов, полученных по данным примерам, говорят, что выбор места жительства в малой степени зависел от такого показателя как грамотность. Взаимодействие этих характеристик практически отсутсвует.
Пример. Дано распределение факторов валового дохода в сельском хозяйстве. Нужно определить уровень влияния затрат труда на этот доход. Фотка. Полученное значение говорит о тесной сильной связи и прямой.
Не всякий качественный признак можно заменить количеством. Чтобы измерить влияние качественных признаков, используют коэффициент ранговой корреляции. Ранжировать изучаемые признаки нужно обязательно в одном и том же порядке. Ранжированию подвергаются как количественные, так и качественные признаки. Фотка. Интерпретируется так же, как и другие коэффициенты. При совпадении ранжированных рядов по обоим признакам коэффициент примет значение 1. Если объекты в одном ранжированном ряду будь прямо противоположны рангам второго признака, то выявляется максимально тесная обратная связь.
Пример. Данной семейное состояние и семейно-душевой доход. Фотка.
Значение коэффициента Спирмена в данном примере говорит о наличии прямой, но довольно слабой связи между признаками.
Данной формулой пользуются доя сгруппированных данных или при малых выборках, когда каждый ранг встречается в исходной совокупности только 1 раз. В остальных случаях формула видоизменяется. Фотка.
Полученное значение говорит о прямой тесной связи между признаками. Успеваемость зависит от пола студента.
Сложнее обстоит дело при вычислении силы взаимодействия признаков, проявляющихся в динамике. В динамических рядах показатели могут быть обусловлены как случайными, так и детерминированными факторами, где каждое последующее явление обусловлено предыдущим. На изменение значения признака в динамическом ряду могут влиять сезонные колебания, цикличность процесса. Следовательно, прежде чем вычислять коэффициент корреляции, необходимо оценить характер признаков динамического ряда и факторы, определяющие изменения значения этих признаков. Когда предполагается, что компоненты динамического ряда могут быть связаны, прибегают к вычислению автокорреляции, которая раскрывает силу зависимости между соседними уровнями динамического ряда. Автокорреляция вычисляется по формуле линейного коэффициента корреляции. В качестве значений первого признака х берутся исходные уровни динамического ряда за исключением последнего. В качестве значений второго признака у, используются те же уровни динамического ряда, но без первого.
10.03.2016
1) Величины, подсчитанные разными методами коэффициентом корреляции не сопоставимы между собой.
2) Не рекомендуется сравнивать силу связи признаков разной природы. При расчете коэффициентов корреляции при выборочных данных необходима стат оценка степени надежности параметров корреляции.
3) Коэффициент корреляции не раскрывает степень воздействия факторного признака на результативный. Таким показателем служит коэффициент детерминации (Д). Его значение определяет долю изменений, возникающих под влиянием факторного признака в общей изменчивости результативного признака. Величина Д измеряется значением коэффициента линейной корреляции, возведенного в квадрат и выраженного в процентах. Например, если коэффициент линейной корреляции двух признаков факторного и результативного равен 0,7, то Д будет равно 49%. Следовательно, только на 49% данный признак зависит от изучаемого фактора. Использованию корреляционному метода должен предшествовать качественный анализ, в ходе которого определяется принципиальная возможность существования связи между признаками, Характер распределения их значений, в ходе которого доказывается правомерность использования той или иной формулы коэффициента корреляции.
Многомерный статистический анализ.
Это раздел мат статистики, посвященный методам, направленный на выявление характера и структуры взаимосвязи между компонентами исследуемого многомерного признака и предназначенная для получения научных и практических выводов и построения моделей.
В процессе многомерного анализа происходит классификация данных, объяснение их структуры, поиск неизвестных значений с учетом выявленных закономерностей.
Исходным массивом данных для многомерного анализа обычно служат результаты измерения компонент многомерного признака для каждого из объектов изучаемой совокупности.
Под многомерным признаком чаще всего понимается многомерная случайная величина, а под последовательностью многомерных наблюдений выборка из генеральной совокупности. В этом случае выбор метода обработки данных производится на основе допущения относительно закона распределения изучаемого признака.
Многомерный стат анализ условно делится на три подраздела:
1) анализ многомерных распределений и их характеристик. Охватывает ситуации, когда обрабатываемые наблюдения имеют вероятностную природу. То есть интерпретируются как выборка из соответствующей генеральной совокупности. К основным задачам этого подраздела относят стат оценивание изучаемых многомерных распределений, изучение свойств использования стат оценок, исследования распределения вероятности для ряда статистик с помощью которых строятся стат критерии проверки различных гипотез о вероятностной природе изучаемых многомерных данных.
2) Анализ характера и структуры взаимосвязей компонентов исследуемого многомерного признака. Объединяет понятия и результаты, присущие таким моделям и методам, как регрессионный, дисперсионный, ковариационный, факторный, латентно-структурный, логлинейный анализы. Методы, принадлежащие к этой группе включают как алгоритмы, основанные на предположении о вероятностной природе данных, так и методы, не укладывающиеся в рамки любой из вероятностных моделей.