На основании какого документа рассчитывается статистическая погрешность?

Глава 1. Статистическая обработка результатов измерения. Погрешность

На основании какого документа рассчитывается статистическая погрешность?

Обработка результатов эксперимента вбиохимии, заключается в примененииметодов математической статистики дляоценки значений различных физическихвеличин характеризующих изучаемыеобъекты, и (или) зависимости этих величинот одного либо нескольких изменяемыхвнешних условий (например, температура,давление, тип катализатора). Обработкарезультатов эксперимента включает, какправило, также и определение точностиданных, полученных при его проведении.

Результаты измерений обычно содержатслучайные ошибки, поэтому статистическиеоценки выполняют только при наличиисерии измерений – так называемойслучайной выборки.

Для оценки измеряемогозначения какой-либо величины илиисследуемой зависимости ее от внешнихусловий по данным выборки рассчитываютвыборочные параметры, характеризующиестатистическое распределение ошибокв проведенном эксперименте.

Такоераспределение, как правило, подчиняетсянормальному закону, конкретный видкоторого определяют два параметра –выборочное среднее и выборочнаядисперсия.

Точность получаемых оценок устанавливаютс помощью статистических критериевСтьюдента (t-критерий), Фишера (F-критерий)и т. д. При этом количественными мерамислужат вероятность β и уровень значимостистатистического критерия р=1-β. Призаданных требованиях на точностьрезультатов измерений доверительнаявероятность (уровень значимости)определяет надежность полученнойоценки.

Методы статистической обработкирезультатов измерений позволяют оценитьсистематические и случайные погрешностиизмерений.

Погрешность является неотъемлемойчастью любого измерения.

Погрешность– количественнаяхарактеристика неопределенности, илинеоднозначности, результата измерения.Ее оценивают, исходя из всей информации,накопленной при подготовке и выполненииизмерений.

Эту информацию обрабатываютдля совместного одновременногоопределения окончательного результатаизмерения и его погрешности.

Окончательныйрезультат нельзя расценивать как«истинное значение» измеряемой физическойвеличины, так как в этом нет смысла из-заналичия погрешности. Погрешность можноразделить на несколько классов.

1. Промахиили грубые погрешности.

Такие погрешности возникают вследствиенеисправности измерительных приборовили ошибок в эксперименте, сделанныхпо невнимательности. Естественностремление избегать промахи, но еслистало понятно, что они все-таки допущены,соответствующие им результаты измеренийпросто отбрасывают.

2. Систематическиепогрешности.

Приборная погрешность. Систематическаяпогрешность, присутствующая в результатахизмерений, выполненных с помощью любогоизмерительного прибора, как правило,неизвестна и не может быть учтена.

Ееможно оценить только путем сравненияпоказаний прибора с показаниями другого,более точного.

Иногда результатыспециально проведенного сравненияприводят в паспорте прибора, однакочаще указывают максимально возможнуюпогрешность для приборов данного типа.

Модельнаяпогрешность. В основу любогоэкспериментального исследования,сопряженного с измерениями, заложенамодель.

Модель содержит наиболее полноефизическое описание исследуемогообъекта или процесса, которое позволяетсоставить его математическое описание,а именно, набор математических соотношений,включающих в себя физические величины.

Они выступают в роли переменных ипараметров, которыми могут быть величины,непосредственно измеряемые в ходеэксперимента, и величины, значениякоторых требуется определить, исходяиз всей совокупности экспериментальныхданных. В итоге модель представляетсобой математическую конструкцию,базирующуюся на физических представлениях.

Толькона основании эксперимента можно сделатьобоснованное заключение о приемлемостиописания полученных данных с помощьюиспользованной теоретической модели.

Зафиксированные несоответствияпостроенной модели, фактически – теории,и эксперимента, служат важнейшим стимуломразвития науки, требуя уточнятьпредставления о природе окружающегофизического мира.

В свое время именноотчетливо зарегистрированныенесоответствия привели к созданиютеории равновесного теплового излучения,квантовой механики, теории относительности.

Сдругой стороны, неверно построеннаямодель, в которой не нашли отражениякакие-то важные процессы или факторы,влияющие на результат измерений, такжеприводит к несоответствиям.

Как следствие,измеряемые в эксперименте величины,вычисляемые по полученным из моделирабочим формулам, содержат погрешности,которые носят название модельныхпогрешностей.

В эксперименте лабораторнуюустановку стараются поместить в такиеусловия, которые были бы максимальноблизки к требованиям модели. Однакополностью исключить несоответствиемодели и экспериментальной ситуацииудается далеко не всегда.

Кразряду модельных может быть отнесенапогрешность взвешивания на рычажныхвесах. Согласно закону Архимеда вестела и гирь уменьшается из-за действиявыталкивающей силы воздуха. Напомним,что 1 куб.м. воздуха весит примерно 10 Н.

Для того, чтобы правильно найти массувзвешиваемого тела, опять же, нужноввести поправки на потерю веса гирямии самим телом. Вместе с тем, как и прилюбых измерениях, здесь необходимразумный подход.

Например, при работес грубыми техническими весами бессмысленновводить поправку на Архимедову силу,так как она окажется много меньшепогрешностей, вносимых в результатизмерения гирями и самими весами.

Следуетособо отметить, что модельные погрешностиявляются наиболее сложными для анализаи учета.

3. Случайныепогрешности.

Изсамого названия следует, что при повторныхизмерениях погрешности этого типадемонстрируют свою случайную природу.Возникают они вследствие множествапричин, совместное воздействие которыхна каждое отдельное измерение невозможноучесть или заранее установить.

Такимипричинами могут оказаться, к примеру,незначительные колебания температурыразличных деталей и узлов установки,скачки напряжения, вибрации, турбулентныедвижения воздуха, трение в механизмах,ошибки считывания показаний приборови т.п.

Единственно возможный способобъективного учета случайных погрешностейсостоит в определении их статистическихзакономерностей, проявляющихся врезультатах многократных измерений.Рассчитанные статистические оценкивносят в окончательный результатизмерения.

Дляоценки погрешности используют различныечисловые характеристики: пусть x12, … хnобозначаютnрезультатов измеренийвеличины, истинное значение которойX.

  1. Среднее значение находится по формуле:

Этосреднее значение принимают за приближенное(наиболее вероятное) значение измеряемойвеличины.

  1. Дисперсия – среднеквадратичная погрешность. Рассеяние результатов измерений относительно среднего значения принято характеризовать дисперсией ΔS2:

  1. Стандартное отклонение:

  2. Абсолютная погрешность результата – доверительный интервал– Δх – характеризует попадание случайной величины в доверительный интервал с доверительной вероятностью α:

,

где ta–коэффициент Стьюдента зависит отдоверительной вероятности и числапроведенных экспериментов. В математическойстатистике коэффициент Стьюдентавычислен для различных значений, и егоможно найти в таблице.

Для n=5 (число измерений) и α=0.95, коэффициентСтьюдента – 2.570

Обычно для расчетов доверительногоинтервала пользуются значениями α=0,95;иногда достаточно α=0,90, но при ответственныхизмерениях требуется более высокаянадежность (α= 0,99).

  1. Относительная погрешность:

Источник: https://studfile.net/preview/5271857/page:2/

Вциом и его статистика?

На основании какого документа рассчитывается статистическая погрешность?
?

Category: Статистика – самая точная из всех неточных наук.
– Г. ФлоберНаткнулся в Интернете на вот такое видео, которое захотелось разобрать. Эту запись можно рассмотреть как ликбез в области статистики или как продолжение серии “научных анекдотов”:

scinquisitor.livejournal.com/9724.html 

scinquisitor.livejournal.com/14730.html
scinquisitor.livejournal.com/10323.html

На сайте ВЦИОМ  wciom.ru/index.php сделано утверждение: “Опрошено 1600 человек в 138 населенных пунктах в 46 областях, краях и республиках России. Статистическая погрешность не превышает 3,4%”. Далее приведена таблица, из которой видно, что 32% Россиян считают, что Солнце вращается вокруг Земли, а не наоборот, а так же ряд других не очень приятных для патриота РФ статистических данных.

В обсуждаемом ролике говорится, что фраза на сайте ВЦИОМ: “статистическая погрешность не превышает 3,4%”  – является “артефактом” и “ни о чем не говорит”.

На основании чего ВЦИОМ обвиняется в подтасовке и выдумывании фактов.

В конце ролика нам сообщают, что “время, когда все верят в социологические опросы, должно кануть в лету” – настораживающее заявление для тех кто хоть немного понимает как работает статистика.

Если набрать в гугле www.google.ru/ словосочетание “Статистическая погрешность” мы увидим, что не только ВЦИОМ пользуется данным термином в обсуждаемом контексте. Приведу лишь пару примеров:

Статистическая погрешность при такой выборке не превышает 2,3%” – Фонд “Общественное Мнение” www.fom.ru/about/18.

html”Для данного объема выборочной совокупности максимальная статистическая погрешность выборки при доверительном уровне 0,95 равна 2,36 %” – Центр Социологических и Маркетинговых Исследвоаний “Аналитик” www.socio-research.

ru/svd/cnt/ru/fldr_mainmenu/fldr_publications/fldr_thesis/fldr_dnv_citymodification/fldr_dnv_abstract/cnt_basis

Это должно было послужить неким сигналом, что дело все-таки не во ВЦИОМе. Автор ролика мог  предположить, что он просто не понимает значения термина “статистическая погрешность” в контексте социологических исследований. Но не предположил.

Из приведенных выше контекстов понятно, что максимальная статистическая погрешность в социологическом исследовании – это некая величина не зависящая от того, какими были ответы респондентов (ведь приводится одна величина на множество вопросов, с разным распределением ответов), но зависящая от размера выборки, а так же от доверительного уровня.

Попробую объяснить не вдаваясь в математические детали, что такое статистическая погрешность и доверительный уровень.

Предположим, что в действительности у 50% людей в некотором городе с населением в 100000 человек есть машина. Мы хотели бы узнать это число, но всех опросить не можем.

Давайте много раз возьмем случайную выборку из 383 человек и спросим их “есть ли у Вас машина?” (предполагая честность ответов). При таких условиях в 95% случаев опрос покажет, что машина имеется у 45-55% из взятых 383 человек.

То есть в 95% случаев полученные данные каждого из небольших опросов будут не больше, чем на 5% отличаться от реального значения – доли людей, у которых в действительности есть машина (50%).

В данном случае 5% – это статистическая погрешность. 95% – это доверительный уровень при котором эта погрешность посчитана. 383 человека – это взятая выборка. 100 000 – общий размер изучаемой популяции.

Чтобы получить меньшую статистическую погрешность при том же доверительном уровне, нам необходимо иметь большую выборку. В моем примере, если мы возьмем случайным образом не 383 человек, а 1056 человек, то в 95% случаев опрос покажет, что машина имеется у 47-53% и в 99% случаев, что у 46-54% людей.

То есть в среднем результаты опроса будут ближе к действительности . Когда делается социальный опрос мы не знаем удалось ли нам установить точную долю людей, дающих некий ответ на заданный вопрос. Но мы знаем с заданной вероятностью (доверительный уровень), что находимся где-то в рамках статистической погрешности .

Здесь сразу хочу отметить еще одну деталь. Полученные погрешности посчитаны уже исходя из предположения, что у 50% людей в данной популяции в действительности имеется автомобиль. Но на практике мы именно это и пытаемся узнать – у какой доли населения есть машина?! Нет ли здесь порочного круга или парадокса? Нисколько.

Дело в том, что мы ищем максимальную погрешность.

Предположим, что у нас есть вопрос с двумя вариантами ответа, как в примере с автомобилем. Он либо есть у человека, либо его нет.

Если у абсолютно всех людей из популяции есть автомобиль (или его нет ни у кого) то какой бы не была наша выборка, доля людей с автомобилем в этой выборке будет точно равна доли людей с автомобилем во всей популяции – 100% (или 0%). То есть  погрешность измерений будет равна нулю.

Если в действительности в популяции один из вариантов ответа преобладает над другим, то погрешность измерений падает (это так же видно из формулы, которая приведена в конце статьи). Если ровно половина людей имеет машину, а половина людей машины не имеет, погрешность опросов будет максимальной.

Предполагая, что 50% людей имеют машину мы добиваемся максимального значения погрешности т.е. работаем против себя, переоцениваем неточность наших методов. В действительности погрешность будет не больше, чем посчитанная, но может быть меньше.

Автор ролика утверждает, что “ВЦИОМ показывает погрешность, которая совсем ни о чем не говорит” и, на этом основании, заявляется, что “можно однозначно утверждать: в Рамках страны ценность исследования ВЦИОМа равна нулю”.

В случае с опросом ВЦИОМа мы имеем следующие показатели. Размер популяции – это максимальная оценка населения России, примерно 145 000 000 человек.

  Можно отметить, что с точки зрения конечных чисел, разницы между 145 000 000 и, скажем 1 000 000 в этой графе не будет практически никакой, поэтому точность данной оценки не принципиальна (она играет роль лишь при малых значениях размера популяции). Размер нашей выборки – 1600 человек.

Доверительный уровень (как у меня получилось обратным расчетом) – 99%. Поскольку мы хотим максимизировать погрешность будем исходить из того, что 50% людей выберут некий вариант ответа на вопрос, например, вариант ответа “да”, а 50% не выберут.

Итак, мы теперь можем расшифровать популярно значение того, что написано на сайте ВЦИОМ – то, чего не понял автор ролика, но взялся критиковать. “Статистическая погрешность не превышает 3,4%”

С вероятностью 99% доля ответов из рассмотренной подвыборки в 1600 человек по любому взятому в опросе вопросу не отличается более, чем на 3.

4% от реальной доли Россиян, которые дали бы аналогичной ответ на данный вопрос.

Это справедливо при допущении, что выборка репрезентативная (что опрашивались люди, действительно, случайно, а не специально выискивались особо одаренные) и предположении о нормальном распределении.

С уверенностью в 99% мы можем сказать, что в России на вопрос “Солнце вращается вокруг Земли” ответят 32% плюс минус 3.4% людей.

Таким образом, опровергнуты следующие утверждения:

“ВЦИОМ показывает погрешность, которая совсем ни о чем не говорит”

“Можно однозначно утверждать: в Рамках страны ценность исследования ВЦИОМа равна нулю”

Я не берусь давать оценку деятельности ВЦИОМа – я не знаю, подделывают ли они сырые данные (это отдельный вопрос) и т.д. но могу сказать лишь то, что вся критика деятельности ВЦИОМа и статистики, использованной данной организацией в социальных опросах, приведенная в данном конкретном ролике не обоснована и связана с тем, что автор ролика не потрудился разобраться в той терминологии которая используется в формулах расчета.Кстати, для математически подкованных любителей формул, вот они:

x=Z(c/100)2r(100-r)
n=N x/((N-1)E2 + x)
E=Sqrt[(Nn)x/n(N-1)]

Здесь c – доверительный уровень (например, 99%),  n -размер выборки (например, 1600), N – размер популяции (например, 145 000 000), E – статистическая ошибка, r – доля интересующих нас ответов (например, 50% для оценки максимальной ошибки).  Вторая формула позволяет посчитать необходимый размер выборки при заданной статистической ошибке. Третья формула позволяет посчитать значение статистической ошибки при данном размере выборки. Отмечу, что при r = 0, как я и говорил, E = 0 при любых n не равных нулю.

Формула взята с сайта, где имеется калькулятор, позволяющий посчитать эту самую статистическую ошибку для некой выборки и ряд других пояснений на английском для тех, кто хочет подробно разобраться в математике, а не только в самой идее www.raosoft.com/samplesize.

html Профилактика ФГМ (фимоза головного мозга – lurkmore.

ru/ФГМ ) – это очень полезная деятельности, однако, не стоит выдавать за борьбу с ФГМ борьбу со статистикой или социологией, а так же пропаганду очередной теории заговора, что все социологические опросы куплены и так далее.

анекдоты, социология, статистика

Источник: https://scinquisitor.livejournal.com/16856.html

Систематическая погрешность

На основании какого документа рассчитывается статистическая погрешность?
Категория: Стандартизация, метрология, сертификация

Систематической погрешностью называется составляющая погрешности измерения, остающаяся постоянной или закономерно меняющаяся при повторных измерениях одной и той же величины.

При этом предполагается, что систематические погрешности представляют собой определенную функцию неслучайных факторов, состав которых зависит от физических, конструкционных и технологических особенностей средств измерений, условий их применения, а также индивидуальных качеств наблюдателя.

Сложные детерминированные закономерности, которым подчиняются систематические погрешности, определяются либо при создании средств измерений и комплектации измерительной аппаратуры, либо непосредственно при подготовке измерительного эксперимента и в процессе его проведения.

Совершенствование методов измерения, использование высококачественных материалом, прогрессивная технология — все это позволяет на практике устранить систематические погрешности настолько, что при обработке результатов наблюдений с их наличием зачастую не приходится считаться.

Систематические погрешности принято классифицировать в зависимости от причин их возникновения и по характеру их проявления при измерениях.

В зависимости от причин возникновения рассматриваются четыре вида систематических погрешностей.

1. Погрешности метода, или теоретические погрешности, проистекающие от ошибочности или недостаточной разработки принятой теории метода измерений в целом или от допущенных упрощений при проведении измерений.

Погрешности метода возникают также при экстраполяции свойства, измеренного на ограниченной части некоторого объекта, на весь объект, если последний не обладает однородностью измеряемого свойства.

Так, считая диаметр цилиндрического вала равным результату, полученному при измерении в одном сечении и в одном направлении, мы допускаем систематическую погрешность, полностью определяемую отклонениями формы исследуемого вала.

При определении плотности вещества по измерениям массы и объема некоторой пробы возникает систематическая погрешность, если проба содержала некоторое количество примесей, а результат измерения принимается за характеристику данного вещества -вообще.

К погрешностям метода следует отнести также те погрешности, которые возникают вследствие влияния измерительной аппаратуры на измеряемые свойства объекта.

Подобные явления возникают, например, при измерении длин, когда измерительное усилие используемых приборов достаточно велико, при регистрации быстропротекаюших процессов недостаточно быстродействующей аппаратурой, при измерениях температур жидкостными или газовыми термометрами и т.д.

2. Инструментальные погрешности, зависящие от погрешностей применяемых средств измерений..

Среди инструментальных погрешностей в отдельную группу выделяются погрешности схемы, не связанные с неточностью изготовления средств измерения и обязанные своим происхождением самой структурной схеме средств измерений.

Исследование инструментальных погрешностей является предметом специальной дисциплины — теории точности измерительных устройств.

3.   Погрешности, обусловленные неправильной установкой и взаимным расположением средств измерения, являющихся частью единого комплекса, несогласованностью их характеристик, влиянием внешних температурных, гравитационных, радиационных и других полей, нестабильностью источников питания, несогласованностью входных и выходных параметров электрических цепей приборов и т.д.

4. Личные погрешности, обусловленные индивидуальными особенностями наблюдателя. Такого рода погрешности вызываются, например, запаздыванием или опережением при регистрации сигнала, неправильным отсчетом десятых долей деления шкалы, асимметрией, возникающей при установке штриха посередине между двумя рисками.

По характеру своего поведения в процессе измерения систематические погрешности подразделяются на постоянные и переменные.

Постоянные систематические погрешности возникают, например, при неправильной установке начала отсчета, неправильной градуировке и юстировке средств измерения и остаются постоянными при всех повторных наблюдениях. Поэтому, если уж они возникли, их очень трудно обнаружить в результатах наблюдений.

Среди переменных систематических погрешностей принято выделять прогрессивные и периодические.

Прогрессивная погрешность возникает, например, при взвешивании, когда одно из коромысел весов находится ближе к источнику тепла, чем другое, поэтому быстрее нагревается и

удлиняется. Это приводит к систематическому сдвигу начала отсчета и к монотонному изменению показаний весов.

Периодическая погрешность присуща измерительным приборам с круговой шкалой, если ось вращения указателя не совпадает с осью шкалы.

Все остальные виды систематических погрешностей принято называть погрешностями, изменяющимися по сложному закону.

В тех случаях, когда при создании средств измерений, необходимых для данной измерительной установки, не удается устранить влияние систематических погрешностей, приходится специально организовывать измерительный процесс и осуществлять математическую обработку результатов.

Методы борьбы с систематическими погрешностями заключаются в их обнаружении и последующем исключении путем полной или частичной компенсации.

Основные трудности, часто непреодолимые, состоят именно в обнаружении систематических погрешностей, поэтому иногда приходится довольствоваться приближенным их анализом.

Способы обнаружения систематических погрешностей.

Результаты наблюдений, полученные при наличии систематических погрешностей, будем называть неисправленными и в отличие от исправленных снабжать штрихами их обозначения (например, Х1, Х2 и т.д.).

Вычисленные в этих условиях средние арифметические значения и отклонения от результатов наблюдений будем также называть неисправленными и ставить штрихи у символов этих величин. Таким образом,

Поскольку неисправленные результаты наблюдений включают в себя систематические погрешности, сумму которых для каждого /-го наблюдения будем обозначать через 8., то их математическое ожидание не совпадает с истинным значением измеряемой величины и отличается от него на некоторую величину 0, называемую систематической погрешностью неисправленного среднего арифметического. Действительно,

Если систематические погрешности постоянны, т.е. 0/ = 0, /=1,2, …, п, то неисправленные отклонения могут быть непосредственно использованы для оценки рассеивания ряда наблюдений. В противном случае необходимо предварительно исправить отдельные результаты измерений, введя в них так называемые поправки, равные систематическим погрешностям по величине и обратные им по знаку:

q = -Oi.

Таким образом, для нахождения исправленного среднего арифметического и оценки его рассеивания относительно истинного значения измеряемой величины необходимо обнаружить систематические погрешности и исключить их путем введения поправок или соответствующей каждому конкретному случаю организации самого измерения. Остановимся подробнее на некоторых способах обнаружения систематических погрешностей.

Постоянные систематические погрешности не влияют на значения случайных отклонений результатов наблюдений от средних арифметических, поэтому никакая математическая обработка результатов наблюдений не может привести к их обнаружению.

Анализ таких погрешностей возможен только на основании некоторых априорных знаний об этих погрешностях, получаемых, например, при поверке средств измерений. Измеряемая величина при поверке обычно воспроизводится образцовой мерой, действительное значение которой известно.

Поэтому разность между средним арифметическим результатов наблюдения и значением меры с точностью, определяемой погрешностью аттестации меры и случайными погрешностями измерения, равна искомой систематической погрешности.

Одним из наиболее действенных способов обнаружения систематических погрешностей в ряде результатов наблюдений является построение графика последовательности неисправленных значений случайных отклонений результатов наблюдений от средних арифметических.

Рассматриваемый способ обнаружения постоянных систематических погрешностей можно сформулировать следующим образом: если неисправленные отклонения результатов наблюдений резко изменяются при изменении условий наблюдений, то данные результаты содержат постоянную систематическую погрешность, зависящую от условий наблюдений.

Систематические погрешности являются детерминированными величинами, поэтому в принципе всегда могут быть вычислены и исключены из результатов измерений. После исключения систематических погрешностей получаем исправленные средние арифметические и исправленные отклонения результатов наблюдении, которые позволяют оценить степень рассеивания результатов.

Для исправления результатов наблюдений их складывают с поправками, равными систематическим погрешностям по величине и обратными им по знаку. Поправку определяют экспериментально при поверке приборов или в результате специальных исследований, обыкновенно с некоторой ограниченной точностью.

Поправки могут задаваться также в виде формул, по которым они вычисляются для каждого конкретного случая. Например, при измерениях и поверках с помощью образцовых манометров следует вводить поправки к их показаниям на местное значение ускорения свободного падения

где Р — измеряемое давление.

Введением поправки устраняется влияние только одной вполне определенной систематической погрешности, поэтому в результаты измерения зачастую приходится вводить очень большое число поправок. При этом вследствие ограниченной точности определения поправок накапливаются случайные погрешности и дисперсия результата измерения увеличивается.

Систематическая погрешность, остающаяся после введения поправок на ее наиболее существенные составляющие включает в себя ряд элементарных составляющих, называемых неисключенными остатками систематической погрешности. К их числу относятся погрешности:

•   определения поправок;

•   зависящие от точности измерения влияющих величин, входящих в формулы для определения поправок;

•   связанные с колебаниями влияющих величин (температуры окружающей среды, напряжения питания и т.д.).

Перечисленные погрешности малы, и поправки на них не вводятся.

Источник: https://znaytovar.ru/new2610.html

Фгуп внииофи : всероссийский научно-исследовательский институт оптико-физических измерений – погрешности средств измерений

На основании какого документа рассчитывается статистическая погрешность?

Погрешность средства измерений (англ. error (of indication) of a measuring instrument) – разность между показанием средства измерений и истинным (действительным) значением измеряемой физической величины.

Систематическая погрешность средства измерений (англ. bias error of a measuring instrument) – составляющая погрешности средства измерений, принимаемая за постоянную или закономерную изменяющуюся.
Примечание.

Систематическая погрешность данного средства измерений, как правило, будет отличаться от систематической погрешности другого экземпляра средства измерений этого же типа, вследствие чего для группы однотипных средств измерений систематическая погрешность может иногда рассматриваться как случайная погрешность.

Случайная погрешность средства измерений (англ. repeatability error of a measuring instrument) – составляющая погрешности средства измерений, изменяющаяся случайным образом.

Абсолютная погрешность средства измерений – погрешность средства измерений, выраженная в единицах измеряемой физической величины.

Относительная погрешность средства измерений – погрешность средства измерений, выраженная отношением абсолютной погрешности средства измерений к результату измерений или к действительному значению измеренной физической величины.

Приведенная погрешность средства измерений (англ. reducial error of a measuring instrument) – относительная погрешность, выраженная отношением абсолютной погрешности средства измерений к условно принятому значению величины, постоянному во всем диапазоне измерений или в части диапазона.
Примечания:

  • Условно принятое значение величины называют нормирующим значением. Часто за нормирующее значение принимают верхний предел измерений.
  • Приведенную погрешность обычно выражают в процентах.

Основная погрешность средства измерений (англ. intrinsic error of a measuring instrument) – погрешность средства измерений, применяемого в нормальных условиях.

Дополнительная погрешность средства измерений (англ. complementary error of a measuring instrument) – составляющая погрешности средства измерений, возникающая дополнительно к основной погрешности вследствие отклонения какой-либо из влияющих величин от нормального ее значения или вследствие ее выхода за пределы нормальной области значений.

Статическая погрешность средства измерений – погрешность средства измерений, применяемого при измерении физической величины, принимаемой за неизменную.

Динамическая погрешность средства измерений – погрешность средства измерений, возникающая при измерении изменяющейся (в процессе измерений) физической величины.

Погрешность меры – разность между номинальным значением меры и действительным значением воспроизводимой ею величины.

Стабильность средства измерений (англ. stability) – качественная характеристика средства измерений, отражающая неизменность во времени его метрологических характеристик.
Примечание. В качестве количественной оценки стабильности служит нестабильность средства измерений.

Нестабильность средства измерений – изменение метрологических характеристик средства измерений за установленный интервал времени.
Примечания:

  • Для ряда средств измерений, особенно некоторых мер, нестабильность является одной из важнейших точностных характеристик. Для нормальных элементов обычно нестабильность устанавливается за год.
  • Нестабильность определяют на основании длительных исследований средства измерений, при этом полезны периодические сличения с более стабильными средствами измерений.

Точность средства измерений (англ. accuracy of a measuring instrument) – характеристика качества средства измерений, отражающая близость его погрешности к нулю.
Примечание. Считается, что чем меньше погрешность, тем точнее средство измерений.

Класс точности средств измерений (англ. accuracy class) – обобщенная характеристика данного типа средств измерений, как правило, отражающая уровень их точности, выражаемая пределами допускаемых основной и дополнительных погрешностей, а также другими характеристиками, влияющими на точность.
Примечания:

  • Класс точности дает возможность судить о том, в каких пределах находится погрешность средства измерений одного типа, но не является непосредственным показателем точности измерений, выполняемых с помощью каждого из этих средств. Это важно при выборе средств измерений в зависимости от заданной точности измерений.
  • Класс точности средств измерений конкретного типа устанавливают в стандартах технических требований (условий) или в других нормативных документах.

Предел допускаемой погрешности средства измерений – наибольшее значение погрешности средств измерений, устанавливаемое нормативным документом для данного типа средств измерений, при котором оно еще признается годным к применению.
Примечания:

  • При превышении установленного предела погрешности средство измерений признается негодным для применения (в данном классе точности).
  • Обычно устанавливают пределы допускаемой погрешности, то есть границы зоны, за которую не должна выходить погрешность.

Пример. Для 100-миллиметровой концевой меры длины 1-го класса точности пределы допускаемой погрешности +/- 50 мкм.

Нормируемые метрологические характеристики типа средства измерений – совокупность метрологических характеристик данного типа средств измерений, устанавливаемая нормативными документами на средства измерений.

Точностные характеристики средства измерений – совокупность метрологических характеристик средства измерений, влияющих на погрешность измерения.
Примечание. К точностным характеристикам относят погрешность средства измерений, нестабильность, порог чувствительности, дрейф нуля и др.

Вернуться к списку разделов

Источник: http://www.vniiofi.ru/about/rmg/pogreshnostsi.html

Выборка. Типы выборок. Расчет ошибки выборки

На основании какого документа рассчитывается статистическая погрешность?
Калькулятор расчета ошибки и размера выборки
Калькулятор расчета статистической значимости различий

Суммарная численность объектов наблюдения (люди, домохозяйства, предприятия, населенные пункты и т.д.), обладающих определенным набором признаков (пол, возраст, доход, численность, оборот и т.д.), ограниченная в пространстве и времени. Примеры генеральных совокупностей

  • Все жители Москвы (10,6 млн. человек по данным переписи 2002 года)
  • Мужчины-Москвичи (4,9 млн. человек по данным переписи 2002 года) 
  • Юридические лица России (2,2 млн. на начало 2005 года)
  • Розничные торговые точки, осуществляющие продажу продуктов питания (20 тысяч на начало 2008 года) и т.д. 

Выборка (Выборочная совокупность)

Часть объектов из генеральной совокупности, отобранных для изучения, с тем чтобы сделать заключение обо всей генеральной совокупности. Для того чтобы заключение, полученное путем изучения выборки, можно было распространить на всю генеральную совокупность, выборка должна обладать свойством репрезентативности. 

Репрезентативность выборки

Свойство выборки корректно отражать генеральную совокупность. Одна и та же выборка может быть репрезентативной и нерепрезентативной для разных генеральных совокупностей.
Пример:

  • Выборка, целиком состоящая из москвичей, владеющих автомобилем, не репрезентирует все население Москвы. 
  • Выборка из российских предприятий численностью до 100 человек не репрезентирует все предприятия России.
  • Выборка из москвичей, совершающих покупки на рынке, не репрезентирует покупательское поведение всех москвичей.

В то же время, указанные выборки (при соблюдении прочих условий) могут отлично репрезентировать москвичей-автовладельцев, небольшие и средние российские предприятия и покупателей, совершающих покупки на рынках соответственно.

Важно понимать, что репрезентативность выборки и ошибка выборки – разные явления. Репрезентативность, в отличие от ошибки никак не зависит от размера выборки.

Пример:

Как бы мы не увеличивали количество опрошенных москвичей-автовладельцев, мы не сможем репрезентировать этой выборкой всех москвичей.

Ошибка выборки (доверительный интервал)

Отклонение результатов, полученных с помощью выборочного наблюдения от истинных данных генеральной совокупности. Ошибка выборки бывает двух видов – статистическая и систематическая. Статистическая ошибка зависит от размера выборки. Чем больше размер выборки, тем она ниже.

Пример: Для простой случайной выборки размером 400 единиц максимальная статистическая ошибка (с 95% доверительной вероятностью) составляет 5%, для выборки в 600 единиц – 4%, для выборки в 1100 единиц – 3% Обычно, когда говорят об ошибке выборки, подразумевают именно статистическую ошибку.

Систематическая ошибка зависит от различных факторов, оказывающих постоянное воздействие на исследование и смещающих результаты исследования в определенную сторону.

Пример:

  • Использование любых вероятностных выборок занижает долю людей с высоким доходом, ведущих активный образ жизни. Происходит это в силу того, что таких людей гораздо сложней застать в каком-либо определенном месте (например, дома).
  • Проблема респондентов, отказывающихся отвечать на вопросы  анкеты (доля «отказников» в Москве, для разных опросов, колеблется от 50% до 80%)

В некоторых случаях, когда известны истинные распределения, систематическую ошибку можно нивелировать введением квот или перевзвешиванием данных, но в большинстве реальных исследований даже оценить ее бывает достаточно проблематично.  

Типы выборок

Выборки делятся на два типа:

  • вероятностные
  • невероятностные 

1. Вероятностные выборки
1.1 Случайная выборка (простой случайный отбор) Такая выборка предполагает однородность генеральной совокупности, одинаковую вероятность доступности всех элементов, наличие полного списка всех элементов. При отборе элементов, как правило, используется таблица случайных чисел. 

1.2 Механическая (систематическая) выборка

Разновидность случайной выборки, упорядоченная по какому-либо признаку (алфавитный порядок, номер телефона, дата рождения и т.д.). Первый элемент отбирается случайно, затем, с шагом ‘n’ отбирается каждый ‘k’-ый элемент. Размер генеральной совокупности, при этом – N=n*k 

1.3 Стратифицированная (районированная)

Применяется в случае неоднородности генеральной совокупности. Генеральная совокупность разбивается на группы (страты). В каждой страте отбор осуществляется случайным или механическим образом. 

1.4 Серийная (гнездовая или кластерная) выборка

При серийной выборке единицами отбора выступают не сами объекты, а группы (кластеры или гнёзда). Группы отбираются случайным образом. Объекты внутри групп обследуются сплошняком. 

2.Невероятностные выборки Отбор в такой выборке осуществляется не по принципам случайности, а по субъективным критериям – доступности, типичности, равного представительства и т.д.. 

2.1. Квотная выборка

Изначально выделяется некоторое количество групп объектов (например, мужчины в возрасте 20-30 лет, 31-45 лет и 46-60 лет; лица с доходом до 30 тысяч рублей, с доходом от 30 до 60 тысяч рублей и с доходом свыше 60 тысяч рублей) Для каждой группы задается количество объектов, которые должны быть обследованы. Количество объектов, которые должны попасть в каждую из групп, задается, чаще всего, либо пропорционально заранее известной доле группы в генеральной совокупности, либо одинаковым для каждой группы. Внутри групп объекты отбираются произвольно. Квотные выборки используются в маркетинговых исследованиях достаточно часто. 
2.2. Метод снежного кома Выборка строится следующим образом. У каждого респондента, начиная с первого, просятся контакты его друзей, коллег, знакомых, которые подходили бы под условия отбора и могли бы принять участие в исследовании. Таким образом, за исключением первого шага, выборка формируется с участием самих объектов исследования. Метод часто применяется, когда необходимо найти и опросить труднодоступные группы респондентов (например, респондентов, имеющих высокий доход, респондентов, принадлежащих к одной профессиональной группе, респондентов, имеющих какие-либо схожие хобби/увлечения и т.д.) 

2.3 Стихийная выборка

Опрашиваются наиболее доступные респонденты. Типичные примеры стихийных выборок – опросы в газетах/журналах, анкеты, отданные респондентам на самозаполнение, большинство интернет-опросов. Размер и состав стихийных выборок заранее не известен, и определяется только одним параметром – активностью респондентов. 
2.4 Выборка типичных случаев
Отбираются единицы генеральной совокупности, обладающие средним (типичным) значением признака. При этом возникает проблема выбора признака и определения его типичного значения. 

Курс лекций по теории статистики

Более подробную информацию по выборочным наблюдениям можно получить просмотрев видеокурс по теории статистики:
Выборочное наблюдение Способы формирование выборки
Специальные виды отбора

Калькулятор расчета ошибки и размера выборки (для простой случайной выборки)

Пояснения к полям:
Доверительная вероятность Вероятность того, что доверительный интервал накроет неизвестное истинное значение параметра, оцениваемого по выборочным данным. В практике исследований чаще всего используют 95%-ую доверительную вероятность

Ошибка выборки (доверительный интервал)

Интервал, вычисленный по выборочным данным, который с заданной вероятностью (доверительной) накрывает неизвестное истинное значение оцениваемого параметра распределения.

Доля признака

Ожидаемая доля признака, для которого рассчитывается ошибка. В случае, если данные о доле признака отсутствуют, необходимо использовать значение равное 50, при котором достигается максимальная ошибка.

Калькулятор расчета статистической значимости различий

Калькулятор позволяет проверить есть ли статистически значимая разница между долями признака, полученными из независимых выборок.

  Например, если до начала рекламной кампании марку знали 55% респондентов, а по окончании – 60% – есть ли между этими долями статистически значимая разница, или же эта разница укладывается в ошибку выборки? 

Примечание.

Эта процедура может законно использоваться, только если обе выборки удовлетворяют следующему условию: произведения n*p и n*(1-p), где n=размер выборки а p=доля признака, должны быть не меньше 5. 

Оставить свои комментарии по затронутой теме Вы можете на наших страницах в и .

Источник: http://fdfgroup.ru/poleznaya-informatsiya/stati/vyborka-tipy-vyborok-raschet-oshibki-vyborki/

Статистическая погрешность

На основании какого документа рассчитывается статистическая погрешность?

Статистическая погрешность — это та неопределенность в оценке истинного значения измеряемой величины, которая возникает из-за того, что несколько повторных измерений тем же самым инструментом дали различающиеся результаты.

Возникает она, как правило, из-за того, что результаты измерения в микромире не фиксированы, а вероятностны. Она тесно связана с объемом статистики: обычно чем больше данных, тем меньше статистическая погрешность и тем точнее результат измерения.

Среди всех типов погрешностей она, пожалуй, самая безобидная: понятно, как ее считать, и понятно, как с ней бороться.

Статистическая погрешность: чуть подробнее

Предположим, что ваш детектор может очень точно измерить какую-то величину в каждом конкретном столкновении.

Это может быть энергия или импульс какой-то родившейся частицы, или дискретная величина (например, сколько мюонов родилось в событии), или вообще элементарный ответ «да» или «нет» на какой-то вопрос (например, родилась ли в этом событии хоть одна частица с импульсом больше 100 ГэВ).

Это конкретное число, полученное в одном столкновении, почти бессмысленно. Скажем, взяли вы одно событие и выяснили, что в нём хиггсовский бозон не родился. Никакой научной пользы от такого единичного факта нет.

Законы микромира вероятностны, и если вы организуете абсолютно такое же столкновение протонов, то картина рождения частиц вовсе не обязана повторяться, она может оказаться совсем другой.

Если бозон не родился сейчас, не родился в следующем столкновении, то это еще ничего не говорит о том, может ли он родиться вообще и как это соотносится с теоретическими предсказаниями.

Для того, чтобы получить какое-то осмысленное число в экспериментах с элементарными частицами, надо повторить эксперимент много раз и набрать статистику одинаковых столкновений. Всё свое рабочее время коллайдеры именно этим и занимаются, они накапливают статистику, которую потом будут обрабатывать экспериментаторы.

В каждом конкретном столкновении результат измерения может быть разный. Наберем статистику столкновений и усредним по ней результат.

Этот средний результат, конечно, тоже не фиксирован, он может меняться в зависимости от статистики, но он будет намного стабильнее, он не будет так сильно прыгать от одной статистической выборки к другой.

У него тоже есть некая неопределенность (в статистическом анализе она так и называется: «неопределенность среднего»), но она обычно небольшая. Вот эта величина и называется статистической погрешностью измерения.

Итак, когда экспериментаторы предъявляют измерение какой-то величины, то они сообщают результат усреднения этой величины по всей набранной статистике столкновений и сопровождают его статистической погрешностью. Именно такие средние значения имеют физический смысл, только их может предсказывать теория.

Есть, конечно, и иной источник статистической погрешности: недостаточный контроль условий эксперимента при повторном измерении.

Если в физике частиц этот источник можно попытаться устранить, по крайней мере, в принципе, то в других разделах естественных наук он выходит на первый план; например, в медицинских исследованиях каждый человек отличается от другого по большому числу параметров.

Как считать статистическую погрешность?

Существует теория расчета статистической погрешности, в которую мы, конечно, вдаваться не будем. Но есть одно очень простое правило, которое легко запомнить и которое срабатывает почти всегда. Пусть у вас есть статистическая выборка из N столкновений и в ней присутствует n событий какого-то определенного типа.

Тогда в другой статистической выборке из N событий, набранной в тех же условиях, можно ожидать примерно n ± √n таких событий. Поделив это на N, мы получим среднюю вероятность встретить такое событие и погрешность среднего: n/N ± √n/N.

Оценка истинного значения вероятности такого типа события примерно соответствует этому выражению.

Сразу же, впрочем, подчеркнем, что эта простая оценка начинает сильно «врать», когда количество событий очень мало. В науке обсчета маленькой статистики есть много дополнительных тонкостей.

Более серьезное (но умеренно краткое) введение в методы статистической обработки данных в применении к экспериментам на LHC см. в лекциях arXiv.1307.2487.

Именно поэтому эксперименты в физике элементарных частиц стараются оптимизировать не только по энергии, но и по светимости. Ведь чем больше светимость, тем больше столкновений будет произведено — значит, тем больше будет статистическая выборка.

И уже это позволит сделать измерения более точными — даже без каких-либо улучшений в эксперименте.

Примерная зависимость тут такая: если вы увеличите статистику в k раз, то относительные статистические погрешности уменьшатся примерно в √k раз.

Этот пример — некая симуляция того, как могло бы происходить измерение массы ρ-мезона свыше полувека назад, на заре адронной физики, если бы он был вначале обнаружен в процессе e+e– → π+π–. А теперь перенесемся в наше время.

Сейчас этот процесс изучен вдоль и поперек, статистика набрана огромная (миллионы событий), а значит, и масса ρ-мезона сейчас определена несравнимо точнее. На рис. 3 показано современное состояние дел в этой области масс. Если ранние эксперименты еще имели какие-то существенные погрешности, то сейчас они практически неразличимы глазом.

Огромная статистика позволила не только измерить массу (примерно равна 775 МэВ с точностью в десятые доли МэВ), но и заметить очень странную форму этого пика. Такая форма получается потому, что практически в том же месте на шкале масс находится и другой мезон, ω(782), который «вмешивается» в процесс и искажает форму ρ-мезонного пика.

Другой, гораздо более реальный пример влияния статистики на процесс поиска и изучения хиггсовского бозона обсуждался в новости Анимации показывают, как в данных LHC зарождался хиггсовский сигнал.

Источник: https://elementy.ru/LHC/HEP/study/errors/statistical

Вопрос права
Добавить комментарий