Проверка адекватности регрессионной модели. Доверительные интервалы прогноза. Оценка адекватности и точности моделей

Какой бы сложной и полной не была модель, она тем не менее является приближенным отображение реального объекта и отражает его при определенных принятых допущениях. Однако до тех пор пока не доказана адекватность модели реальной обстановке, нельзя с уверенностью утверждать, что с ее помощью получается те результаты, которые действительно характеризуют функционирование исследуемого объекта. Оценка адекватности и точности математической модели любого типа, в том числе и имитационной, является важнейшей задачей моделирования, так как любые исследования на неадекватной модели теряют смысл.

С ростом адекватности и точности модели возрастают как ее стоимость, так и ценность для исследования, в связи с чем приходится решать вопрос о компромиссе между стоимостью модели и последствиями ошибочных решений из-за ее неадекватности исследуемому процессу. Поэтому на практике построение модели представляет собой итеративный процесс усовершенствования системы моделей, а следовательно, и исследования объекта до тех пор, пока это считается разумным. Поэтому и оценка адекватности и точности модели представляет собой непрерывный процесс, начинающийся с началом исследования. Правильность построения модели может быть проверена только на практике за счет повторения цикла «построение модели – проверка модели».

Следует отметить, что понятие адекватности модели не имеет качественного измерения: модель либо адекватна явлении., либо не адекватна (естественно, сточки зрения выносящего суждение – заказчика). Говорить о количественной оценке точности перехода от концептуальной модели к математической. Правомерно говорить лишь о количественной оценке точности реализации на ЭВМ заданной и адекватной объекту математической модели. При этом, естественно, предполагается, что программа, реализующая вычисления по математической модели, не содержит ошибок, исходные данные введены в машине правильно, а ЭВМ в процессе счета не имела сбоев в работе. Модель является достоверной, если ее концептуальная модель адекватна исследуемому процессу, математическая модель адекватна концептуальной, а точность реализации математической модели на ЭВМ соответствует заданной, т.е. погрешности расчета не превышают допустимых

Основные ошибки при формировании концептуальной модели следующие:

    неправильный выбор критериев или ограничений;

    введение в концептуальную модель несущественных факторов или отсутствие в ней ряда существенных факторов;

    неучет ряда условий функционирования объекта;

    неправильный выбор гипотез, положенных в основу структуры модели (например, по составу элементов объекта, связей между ними в процессе функционирования и т.п.).

Проверка адекватности концептуальной модели является достаточно сложной задачей, так как оценка принципов, положенных в основу модели, является субъективной. Лучшим методом проверки адекватности концептуальной модели является рассмотрение модели специалистами, не участвовавшими в ее разработке (экспертиза модели), так как они могут более объективно рассмотреть задачу и заметить слабые стороны модели, не замеченные авторами. Окончательное решение об адекватности концептуальной модели принимается только заказчиком, который при одобрении концепции одобряет тем самым все положенные в основу модели допущения.

Основные принципиальные ошибки при переходе от концептуальной модели к математической следующие:

структура математической модели не соответствует структуре концептуальной модели;

модель включает неверные математические соотношения.

По окончании разработки математической модели до начала программирования необходимая проверка адекватности должна дать ответ на вопрос, насколько используемые уравнения или моделирующий алгоритм отражает концептуальную модель. Если уравнения получены теоретическим путем, могут быть проведены вычисления в нескольких точках с целью определения приемлемости результатов. Дополнительная проверка уравнений состоит в анализе размерностей. Необходимо убедиться, что все единицы измерения применены в соответствии с физическим смыслом, масштабирование и согласование размерностей в уравнениях проведено правильно. Кроме того, обязательными являются проверка результатов в условиях, когда факторы модели принимают предельные значения.

При переходе от концептуальной модели к математической для формализации описания явлений используются линеаризация, аппроксимация, интерполяция, причем каждый метод вносит определенные погрешности. Если уравнения выведены на основании анализа эмпирических данных, необходимо провести выборочную проверку согласия с опытными данными. При этом могут быть использованы статистические выборки для оценки средних значений и дисперсий, дисперсионный, регрессионный, факторный и спектральный анализ, автокорреляция, метод проверки с помощью критерия «-квадрат» и непараметрические проверки. Так как каждый из этих статистических методов основан на некоторых допущениях, то при их использовании возникают вопросы, связанные с оценкой их адекватности.

Решение об адекватности математической модели по отношению к концептуальной также принимается только заказчиком, который тем самым разрешает исследователю перейти к этапу реализации математической модели на ЭВМ.

Оценка точности математической модели представляет одну из наименее исследованных методологических проблем в теории моделирования. Рассмотрим, например, измерение погрешности при изготовлении детали. Если x и – размер детали на чертеже (идеальный размер), а х Ф – фактический размер изготовленной детали, то абсолютная погрешность изготовления рассчитывается по формуле

. (4.7)

Заметим, что определить погрешность можно после изготовления детали.

Заказчика интересует, насколько результаты моделирования могут отличаться от того, что он получает на практике, реализуя полученные на модели рекомендации. При этом погрешность модели для него характеризуется выражением, аналогичным (4.7):

, (4.8)

где x Ф – фактический результат, полученный в производстве после внедрения рекомендаций модели;x М – «теоретический» результат, т.е. полученный при расчетах по математической модели.

Однако оценка (4.8) может быть получена заказчиком только после того, как рекомендации модели внедрены. А если модель неправильна или велика ошибка? Естественно, что заказчик хотел быдо внедрения рекомендаций, полученных на модели, убедиться в том, что им можно доверять, что они характеризуются приемлемой для него погрешностью, т.е. определить величину
до реализации результатов моделирования.

Но тогда
, гдеx И – результат. Полученный на «идеальной» математической модели, т.е. модели, не имеющей погрешности. В качестве «идеальной» математической модели может быть принята адекватная концептуальной и утвержденная заказчиком математическая модель исследуемого процесса до ее реализации на ЭВМ.

Обычно точность реализации математической модели на ЭВМ рассматривают через совокупность различного рода погрешностей.

Если классифицировать погрешности реализации «идеальной» модели на ЭВМ с точки зрения причин их возникновения (в качестве наиболее общего случая рассмотрим имитационное статистическое моделирование), можно выделить четыре их вида:

    погрешности моделирования, являющиеся результатом незнания или неточного задания исходных даны;

    погрешности моделирования, возникающие при упрощении исходной математической модели;

    погрешности расчета выходных характеристик из-за дискретной реализации математической модели на используемой цифровой вычислительной машине, в том числе ошибки округления;

    погрешности моделирования, обусловленные ограниченностью статистики при выборочной обработке статистической информации или ограниченным числом случайных испытаний модели на ЭВМ (имитации).

Как правило, погрешности моделирования представляют собой сумму систематических (неслучайных) и случайных ошибок. Рассмотрим отдельные группы погрешностей.

Погрешности моделирования, возникающие из-за неточного

задания исходных данных

Как указывалось ранее, входные факторы математической модели по своей природе можно разделить на управляемые переменные (выбираются исследователем), детерминированные, случайные и неопределенные факторы. Учет в модели даже очень большого числа детерминированных факторов не приводит к существенным вычислительным трудностям. Включение в модель случайных факторов на два-три порядка увеличивает объем вычислений. Увеличение числа переменных и неопределенных факторов с оптимизационных моделях также существенно увеличивает объемы вычислений по нахождению оптимальных решений. В ряде случаев их большая размерность не позволяет отыскать оптимальное решение в отведенное время.

Стремление уменьшить объем вычислений заставляет исследователя рассматривать менее существенные факторы этих групп как детерминированные, внося тем самым ошибки в результаты моделирования. Кроме того, неточность априорных сведений зачастую приводит к тому, что исходные данные в виде констант модели будут определены с ошибками. Поэтому помимо приближенного числового значения входного детерминированного (или рассматриваемого как детерминированный) фактора необходимо указывать также его предельную абсолютную погрешность (или доверительный интервал), определенную эвристически или с помощью известных методов математической статистики.

Для изучения влияния величины этих погрешностей на точность расчета характеристик функционирования объекта обычно применяют методы теории чувствительности, основанные на линеаризации исследуемой функции. Вычисляемые коэффициенты чувствительности функции по отношению к изменению соответствующего фактора характеризуют степень, с которой выходная характеристика подвержена изменениям при изменении интересующих исследователя входных факторов. Однако непосредственное получение уравнений чувствительности может натолкнуться на серьезные трудности, обусловленные большой размерностью вектора входных факторов. Поэтому на практике уравнения чувствительности составляют для небольшого числа факторов модели, наиболее значимо влияющих на точность определения выходных характеристик системы. Выбор значимых факторов проводится экспертными методами.

Погрешности упрощения исходной математической модели

При реализации математической модели на ЭВМ приходится решать задачи, связанные с упрощением исходной математической модели. Чаще всего исходную математическую модель упрощают в целях получения пусть приближенного, но аналитического решения, позволяющего быстро определить как область нахождения экстремума, так и влияния на нее расположение тех или иных факторов модели. Для решения подобных задач, как правило. Используют методы аппроксимации исходных элементов математической модели более простыми математическими зависимостями, например заменой нелинейных зависимостей линейными, полиномов высоких степеней полиномами низких степеней, негладких функций гладкими и т.д. Величина ошибки определяется степенью аппроксимации и в ряде случаев сравнительно легко может быть рассчитана.

Погрешность расчета выходных характеристик из-за дискретной

реализации математической модели на ЭВМ

Одним из видов ошибок дискретной реализации является погрешность округления за счет конечного числа разрядов ЭВМ. Погрешность округления возникает при делении, умножении, возведении в степень, в случае выполнения трансцендентных операций (таких, как логарифмирование), тогда неизбежно приходится ограничивать количество значащих цифр, т.е. производить округление промежуточных результатов.

Применяемые при решении моделей численные методы вносят погрешность, связанную с заменой бесконечного вычислительного процесса конечным и называемую погрешностью данного метода или методической ошибкой. Например, производная заменяется конечной разностью, интеграл – суммой и т.п. Эти погрешности обусловлены ошибками численного интегрирования дифференциальных уравнений, итерационных процедур поиска экстремума, решения системы алгебраических уравнений и многими другими ошибками, которые сопровождают процессы реализации математических моделей на ЭВМ. Погрешности этого вида изучаются в численных методах математического анализа и математического программирования, где выводятся их оценки, например остаточный член формулы квадратур, остаточный член интерполяционной формулы.

Замена непрерывных величин дискретными при численном исследовании процессов на ЭВМ также приводит к погрешностям, величина которых зависит от шага дискретизации. Количественную оценку составляющих этих погрешностей удается провести на уровне относительно автономных частей математической модели – модулей, реализующих данный численный метод. При разработке модулей стремятся выбрать такие методы дискретной реализации, которые на основании имеющихся сведений позволяют утверждать, что погрешности моделирования не будут превышать заданных величин. В процессе испытания модели справедливость этих априорных утверждений в ряде случаев можно проверить с использованием результатов проведенных экспериментов.

Погрешности, обусловленные ограниченностью объема

статистических данных

Этот тип погрешностей характерен для моделей, включающих в состав входов случайные факторы. В связи с тем, что на практике исследователь всегда имеет дело только с ограниченной статистической выборкой, форма и характеристики построенных на ее основе экспериментальных законов распределения будут отличаться от формы и характеристик законов распределения, соответствующих генеральной совокупности статистических данных. Величина ошибок этого рода будет в первую очередь зависеть от объема статистической выборки и в меньшей степени от выбранного метода сбора и обработки статистических данных.

Для имитационной статистической модели результирующая погрешность этого рода будет определяться как погрешностью определения законов распределения входных случайных факторов (зависит от объема экспериментальных данных о значениях случайных величин), так и погрешностью реализации этих законов распределения на ЭВМ (зависит от числа реализаций – прогонов модели на ЭВМ для различных значений случайных величин). Мерой их количественного выражения является величина доверительного интервала тех или иных характеристик экспериментального (для входных факторов) или полученного при моделировании на ЭВМ (для выходных факторов) закона распределения (средняя, эмпирический стандарт и т.д.). при использовании в математической модели регрессионных зависимостей погрешность моделирования будет определяться также доверительными интервалами для коэффициентов в уравнении регрессии (они также зависят от объема статистики).

Ошибки, обусловленные ограниченностью объема статистических данных являются контролируемыми в том смысле, что при необходимости они могут быть уменьшены за счет увеличения их объема. Безусловно, это приводит к увеличению затрат (либо на сбор информации, либо затрат машинного времени при реализации модели на ЭВМ), но в разумных пределах этим фактором можно пользоваться для уменьшения суммарной погрешности моделирования.

Расчет суммарной погрешности модели

Чтобы правильно просуммировать систематические и случайные ошибки, необходимо сначала их разделить. Затем систематические ошибки алгебраически суммируются для получения результирующей систематической ошибки для всех рассматриваемых компонентов. Так,

Случайные ошибки суммируются в обычном среднеквадратичном смысле:

Если при построении модели пренебрегают случайными факторами, учесть которые можно, но которые в целях упрощения включаются в модель детерминированными средними значениями, то соответствующая составляющая методической ошибки может быть вычислена по формуле

,

где
– среднеквадратичное отклонение неучитываемых входных факторов от средних значений;
- число неучитываемых случайных факторов;– коэффициент чувствительности целевой функции (или некоторой выходной характеристики) к изменению фактора.

Часто используемая аппроксимация результирующей ошибки, вызванной одновременным присутствием систематической и случайной ошибок, получается вычислением корня квадратного из суммы квадратов систематической и случайной компонент:

Необходимо имеет в виду, что изменение величин составляющих суммарной ошибки в тех случаях, когда они заметно меньше остальных, не приводит к существенному изменению суммарной ошибки. Поэтому, если модель является грубой, или часть информации, вводимой в модель, определена с большими ошибками, неизвестная информация также может быть установлена весьма приближенно. При построении модели следует стремиться к тому, чтобы все составляющие суммарной ошибки были примерно одного порядка.

Поиск компромиссного соотношения между случайными и систематическими ошибками практически всегда связан с анализом допустимых упрощений как исходных алгоритмов отдельных модулей, так и алгоритма их взаимодействия. При создании математической модели способы анализа возможных упрощений бывают различными, но главное – обеспечить расчеты в отведенное время и достичь при этом заданной точности расчета. Таким образом можно найти рациональную сложность модели, обеспечивающую минимальную величину суммарной погрешности при заданном машинном времени. Во всех случаях построения моделей следует выбирать оптимальное сочетание сложности модели (определяющей методическую ошибку) и метода расчета (определяющего ошибку расчета) с точностью входной информации.

Анализ результатов моделирования и оценка адекватности построенной модели позволяет сделать вывод о необходимости корректировки имеющейся модели и ее направлениях (учет новых факторов, переход от линейных зависимостей к более гибким нелинейным, замена статических моделей динамическими, учет стохастичности и т.д.).

Распределение допусков на управляемые переменные объекта

Как правило, время, стоимость и возможности построения объекта не позволяют требовать точного соответствия всех его управляемых переменных расчетным оптимальным значениям без каких-либо допусков. В реальных условиях вариации параметров объекта оказываются неизбежными из-за воздействия различных внешних условий, неучтенных моделью, постепенным их изменением на протяжении срока функционирования объекта. По этой причине «наилучшие» значения переменных должны выбираться с учетом влияния вариаций и допусков, а не для некоторых кратковременных «оптимальных» условий, которые могут быстро исчезнуть или практически ен существовать. Термин «допуск» употребляется для обозначения установленного допущения ошибки в параметре или каком-либо другом требовании и отражает максимально допустимую ошибку в противоположность действительной ошибке в каждом конкретном случае. Когда связь между изменение выходных характеристик и изменением переменных известна и известны допуски на характеристики, можно определить величины допуска на значения параметров:

,

где D E –допуск на выходную характеристику модели (например, критерий оптимальностиE ); устанавливается заказчиком в техническом задании на разработку математической модели
– суммарная погрешность модели при расчете выходной характеристикиE ;
– суммарный допуск по выходной характеристикеEна значение управляемых переменных .

Естественно, что проблема установления допусков возникает только в том случае, когда суммарная погрешность модели меньше величины допуска, т.е.
.

При распределении суммарного допуска
по управляемым переменным
необходимо ответить на два основных вопроса: как изменяется выходная характеристика при изменении каждой переменной, т.е. каков вид зависимостей
? Какова связь между допусками на отдельные переменный? Например, может ли изменение характеристики, вызванные одновременным переменных быть аппроксимировано суммой изменений, вызванных изменением каждой переменной с отдельности, т.е.
?

Обычно любым из пригодных методов (аналитическим, теории планирования экспериментов и т.п.) строят уравнения чувствительности относительно переменных моделей x i для интересующего исследователя диапазона их изменения:

. (4.9)

Зная коэффициенты чувствительности по переменным , определяют допуски по переменным
, для которых бы выполнялось равенство

. (4.10)

Выражение (4.10) не дает однозначного решения при определении величины допусков для отдельных переменных, а являются необходимым условием. Окончательно величины допусков выбираются исследователем эвристически, в том числе путем привлечения неформализуемой информации.

При разработке имитационных моделей в целях сокращения времени важно организовать работу так, чтобы программирование модулей в моделирующих алгоритмах велось параллельно и была уверенность в том, что точность описания процессов в модулях обеспечит требуемую точность расчета выходных характеристик всего объекта. При известных требованиях к точности значительно упрощается выбор метода моделирования и способов реализации операторов, описывающих процессы в отдельных модулях.

Для начальных этапов разработки модели в условиях неполной информации в литературе предлагается на основании оценки экспертов получить совокупность весовых коэффициентов
, определяющих распределение допуска выходной характеристики системыD E по каждомуr-му модулю:

.

Коэффициенты могут рассчитываться как суммы относительных ошибок оценки параметровx ir каждогоr-го модуля:

,

где n r – число параметров, описывающихr -й модуль.

В качестве факторов, входящих в формулу (4.10), могут быть использованы не только переменные, но и другие изменяющиеся или неточно определенные факторы, Далее по изложенной выше методике определяются погрешности по каждому модулю
, строятся уравнения чувствительности (4.9) и проводится распределение допусков на переменных по выражениям вида (4.10).

    Дайте определение имитационной системы и имитационной модели как подкласса математических моделей. Приведите классификацию имитационных моделей и представьте их особенности.

    Опишите основные этапы имитационного моделирования. В чем основная суть и содержание этапов имитационного моделирования: экспериментирование, интерпретация, трансляция модели, оценка адекватности

    Дайте основные понятия моделирующего алгоритма и формализованной схемы процесса. Приведите и поясните структуру моделирующего алгоритма для оптимизационной модели со случайными факторами

    В чем основная суть и содержание процедуры разработки формализованной схемы процесса

    Приведите основные принципы и способы построения моделирующих алгоритмов

    В чем суть и содержание метода имитации с использованием модели случайных входов?

    В чем основная суть и содержание метода преобразования равномерно распределенных случайных чисел, базирующихся на центральной предельной теореме теории вероятности?

    В чем суть и содержание метода имитации с использованием модели выхода – обработки реализации случайных величин?

    Опишите основные положения теории оптимального эксперимента. В чем суть планирования экспериментов? Как осуществляется описание результирующих характеристик по результатам реализации планированного эксперимента?

    Что такое полный факторный эксперимент? Приведите план и графическую интерпретацию эксперимента 2 n . Когда применяется план дробного факторного эксперимента?

    Что Вы знаете о языках имитационного моделирования? Перечислите некоторые из известных языков.

    Что такое адекватность и точность математической модели? Какие методы их оценки Вы знаете?

    Из чего складывается погрешность моделирования? Перечислите основные погрешности моделирования и источники их возникновения.

    Что Вы знаете о погрешностях моделирования, возникающих из-за неточности задания исходных данных?

    Как возникают погрешности моделирования за счет упрощения исходной математической модели?

    Опишите основные погрешности расчета выходных характеристик из-за дискретной реализации математической модели на ЭВМ

    В чем суть погрешностей, обусловленных ограниченностью объемов исходных статистических данных?

    Как осуществляется расчет суммарной погрешности математической модели?

Любая модель дает приближенное описание процесса функционирования объекта или системы. Поэтому необходима специальная процедура доказательства достоверности (адекватности) построенной модели. От решения задачи оценки адекватности зависит степень доверия к результатам, полученным методом моделирования.

Именно сложность доказательства адекватности предлагаемой модели принято считать важнейшим недостатком метода моделирования.

Фактически единственным, достоверным способом оценки в данном случае является проверка согласованности модели с накопленными знаниями о реальном объекте.

В частности, об адекватности модели можно судить по результатам полученных с ее помощью прогнозных данных.

Кроме того, при оценке адекватности проверяют:

1) полноту отражения моделью свойств реального объекта;

2) соответствие модели исходной информации;

3) корректность принятых при моделировании допущений и ограничений; правильность используемых логических и математических соотношений (функций);

При необходимости в модель вносятся соответствующие коррективы.

Для того,чтобы можно было судить об адекватности модели по результатам прогноза, при одних и тех же условиях замеряются некоторые экспериментальные данные Y i э, (где i=1,2,...,n) , и при тех же условиях решаются уравнения математической модели процесса и получают соответствующие значения Y im .. По их расхождению и судят об адекватности модели в смысле прогнозирования. Например, для регрессионных моделей используют критерий Фишера.

На рис. представлена общая блок-схема построения математической модели процесса.

Рис. Общая блок-схема построения математической модели процесса.

Любой процесс может быть записан в виде общего уравнения

массоэнергопереноса:

;

где - потенциал переноса, а V - конвективная составляющая,

G - компенсирующая составляющая, -дополнительные источники или стоки потенциала переноса.

Статический процесс, - динамический процесс.

Для однозначного решения этого уравнения необходимо задать 2 типа условий:

1. Начальные условия (временные краевые условия).

2. Граничные условия (пространственные краевые условия).

Граничные условия задают потенциал переноса на всей ограничивающей поверхности, включая границы во все моменты времени, включая начальные.

Начальные условия задают распределение потенциала переноса во всей рассматриваемой области, включая границу в начальный момент времени.

Построение математических моделей элементов ХТС.

Построение модели начинается с выбора модели для гидродинамики. Можно предложить разные подходы к изучению структуры по­тока и влияния этой структуры на ход химических процессов. Наиболее полную информацию о структуре потока можно по­лучить, зная скорость жидкости в любой точке аппарата, т. е. по­лучив поле скоростей. Но при таком подходе встречаются труднопреодолимые препятствия. Прежде всего, чрезвычайно трудна экспериментальная задача измерения скоростей во всех частях потока. В любом аппарате имеются области, где почти невозможно измерить скорость, не нарушив структуру потока. Знание поля скоростей лишь в принципе дает возможность решения практических задач. Чаще всего это решение оказывается настолько сложным, что львиной долей информации, которая заключена в данных о поле скоростей, воспользоваться не удается.

Поле скоростей - сложная трехмерная структура, описание которой долж­но содержать функции,по меньшей мере трех координат. Не стационарность (например, в турбулентном потоке) добавляет четвертую - время. Математическое описание поля скоростей получается в виде систем дифферен­циальных уравнений в частных производных; решить такую систему даже с по­мощью современных ЭВМ удается лишь в простейших случаях.

Второй возможный подход -описание потока на основе распределения вре­мени пребывания.

Разработаны две модели идеальных потоков: идеальное вытеснение и идеаль­ное смешение. Здесь отметим од­ну особенность этих моделей: они не содержат никаких парамет­ров, отражающих специфику структуры потока. Единственный па­раметр этих моделей-среднее время пребывания.

Для определения гидродинамической обстановки в аппарате во входящий поток добавляют пор­цию какой-либо примеси, называемой индикато­ром, или трассером. Ин­дикатор должен быть легко количественно определим. Кроме того, его добавление не должно влиять на характер потока (в частности, его следует вводить ма­ло, чтобы существенно не изменять расход), а сам он должен двигаться вместе с потоком, ни с чем не реагируя и не сорбируясь. Так, к потоку воды можно добавить немного кислоты или краси­теля, к воздуху-немного СО2 или гелия.

На выходе из аппарата измеряют кон­центрацию индикатора Си как функцию t. Схема установки изобра­жена на рис. . Типичный график зависимости Си от t показан на рис. В момент t=0 на входе,например, резким импульсом вводится индикатор (рис. 13,3,а).На выходе (рис. 13.3,6) вначале Си=0: ни одна частица индикатора не успела дойти до выхода. В момент t1 выхо­да достигает самая быстрая часть потока, появляется индикатор. Далее его концентрация нарастает до момента t2, а затем начи­нает убывать: основная масса потока прошла, выходят те части индикатора, которые попали в зоны циркуляции или застоя.

Рис. . Схема установки для измере­ния распределения времени пребывания:

1- ввод индикатора; 2 - вход в аппа­рат; 3 - выход из аппарата; 4 - датчик концентрации индикатора; 5 - самопи­шущий прибор.

Результаты эксперимента позволяют определить величину τ:

Время пребывания определяется по формуле:

Режим идеального смешения.

Режим идеального вытеснения.

По экспериментальным данным можно решить одну их двух задач:

 либо по известному объёму реактора V рассчитать расход жидкости W ,

 либо по известному объёмному расходу W - неизвестный объём.

Математическое описания

химического

на основе модели идеального смешения.

Химический реактор является одним из наиболее важных элементов химико-технологической схемы.

Модель химического реактора с мешалкой непрерывного действия базируется на допущении об идеальном перемешивании реагирующей смеси в зоне реакции, т.е. температура и концентрации компонентов одинаковы во всех точках реактора и на выходе из реактора.

Основным назначением математического описания такого реактора является определение из уравнения материального баланса и теплового баланса концентрации и температуры в выходном потоке.

С точки зрения управления очень важно поддерживать заданное мольное соотношение реагентов на входе в реактор.

Регулирование температуры осуществляется за счёт подачи хладагента в охлаждающую рубашку реактора и в змеевик.

При превышении температуры выше допустимой, происходит прекращение подачи исходного вещества.

Введем следующие обозначения:

Объём реактора; . - объемный расход реагирующей смеси.

Концентрация j-го вещества в реакторе и на выходе из него..

Уравнения материального баланса для вещества j можно записать следующим образом: ,

где -накопление вещества в реакторе,

Конвективный приток и сток вещества.

Количество вещества образующегося в реакторе.

Если накопление вещества в реакторе , то это статический процесс, в случае - это динамический процесс.

Уравнение материального баланса можно записать в следующем виде:

,где среднее расчётное время пребывание жидкости в аппарате рассчитывается по формуле:

Для практического использования моделей регрессии большое значение имеет их адекватность , т.е. соответствие фактическим статистическим данным.

Анализ качества эмпирического уравнения парной и множественной линейной регрессииначинаютс построения эмпирического уравнения регрессии, которое является начальным этапом эконометрического анализа. Первое же, построенное по выборке уравнение регрессии, очень редко является удовлетворительным по тем или иным характеристикам. Поэтому следующей важнейшей оценкой является проверка качества уравнения регрессии. В эконометрике принята устоявшаяся схема такой проверки, которая проводится по следующим направлениям:

  • проверка статистической значимости коэффициентов уравнения регрессии
  • проверка общего качества уравнения регрессии
  • проверка свойств данных, выполнимость которых предполагалась при оценивании уравнения (проверка выполнимости предпосылок МНК)

Прежде, чем проводить анализ качества уравнения регрессии, необходимо определить дисперсии и стандартные ошибки коэффициентов, а также интервальные оценки коэффициентов. Корреляционный и регрессионный анализ , как правило, проводится для ограниченной по объёму совокупности.

Поэтому параметры уравнения регрессии (показатели регрессии и корреляции), коэффициент корреляции и коэффициент детерминации могут быть искажены действием случайных факторов. Чтобы проверить, на сколько эти показатели характерны для всей генеральной совокупности и не являются ли они результатом стечения случайных обстоятельств, необходимо проверить адекватность построенных статистических моделей.

При анализе адекватности уравнения регрессии (модели) исследуемому процессу, возможны следующие варианты:

1. Построенная модель на основе F-критерия Фишера в целом адекватна и все коэффициенты регрессии значимы . Такая модель может быть использована для принятия решений и осуществления прогнозов.

2. Модель по F-критерию Фишера адекватна , но часть коэффициентов не значима . Модель пригодна для принятия некоторых решений, но не для прогнозов.

3. Модель по F-критерию адекватна, но все коэффициенты регрессии не значимы . Модель полностью считается неадекватной. На ее основе не принимаются решения и не осуществляются прогнозы.

Проверить значимость (качество) уравнения регрессии –значит установить, соответствует ли математическая модель , выражающая зависимость между переменными, экспериментальным данным, достаточно ли включенных в уравнение объясняющих переменных для описания зависимой переменной. Чтобы иметь общее суждение о качестве модели, по каждому наблюдению из относительных отклонений определяют среднюю ошибку аппроксимации . Проверка адекватности уравнения регрессии (модели) осуществляется с помощью средней ошибки аппроксимации , величина которой не должна превышать 12-15% (максимально допустимое значение).

Оценка значимости уравнения регрессии в целом производится на основе F-критерия Фишера , которому предшествует дисперсионный анализ . В математической статистике дисперсионный анализ рассматривается как самостоятельный инструмент статистического анализа. В эконометрике он применяется как вспомогательное средство для изучения качества регрессионной модели. Согласно основной идее дисперсионного анализа , общая сумма квадратов отклонений переменной (y) от среднего значения (y ср. ) раскладывается на две части: «объясненную» и «необъясненную» :

Схема дисперсионного анализа имеет следующий вид:

(n –число наблюдений, m–число параметров при переменной x)

Определение дисперсии на одну степень свободы приводит дисперсии к сравнимому виду. Сопоставляя факторную и остаточную дисперсии в расчете на одну степень свободы, получим величину F-критерия Фишера . Фактическое значение F -критерия Фишера сравнивается с табличным значением F табл. (α, k 1 , k 2 ) при заданном уровне значимости α и степенях свободы k 1 = m и k 2 =n-m-1. При этом, если фактическое значение F-критерия больше табличного F факт > F теор , то признается статистическая значимость уравнения в целом. Для парной линейной регрессии m=1 , поэтому:

Эта формула в общем виде может выглядеть так:

Отношение объясненной части дисперсии переменной (у) к общей дисперсии называют коэффициентом детерминации и используют для характеристики качества уравнения регрессии или соответствующей модели связи. Соотношение между объясненной и необъясненной частями общей дисперсии можно представить в альтернативном варианте:

Коэффициент детерминации R 2 принимает значения в диапазоне от нуля до единицы 0≤ R 2 ≤1. Коэффициент детерминации R 2 показывает, какая часть дисперсии результативного признака (y) объяснена уравнением регрессии. Чем больше R 2 , тем большая часть дисперсии результативного признака (y) объясняется уравнением регрессии и тем лучше уравнение регрессии описывает исходные данные. При отсутствии зависимости между (у) и (x) коэффициент детерминации R 2 будет близок к нулю. Таким образом, коэффициент детерминации R 2 может применяться для оценки качества (точности) уравнения регрессии. Значение R-квадрата является индикатором степени подгонки модели к данным (значение R-квадрата близкое к 1.0 показывает, что модель объясняет почти всю изменчивость соответствующих переменных). Чтобы определить, при каких значениях R 2 уравнение регрессии следует считать статистически не значимым, что, в свою очередь, делает необоснованным его использование в анализе, рассчитывается F-критерий Фишера : F факт > F теор - делаем вывод о статистической значимости уравнения регрессии. Величина F-критерия связана с коэффициентом детерминации R 2 xy (r 2 xy ) и ее можно рассчитать по следующей формуле:

Либо при оценке значимости индекса детерминации (аналог коэффициента детерминации):

Где: i 2 - индекс (коэффициент) детерминации, который рассчитывается:

Использование коэффициента множественной детерминации R 2 для оценки качества модели, обладает тем недостатком, что включение в модель нового фактора (даже несущественного) автоматически увеличивает величину R 2 . Поэтому, при большом количестве факторов, предпочтительнее использовать, так называемый, улучшенный, скорректированный коэффициент множественной детерминации R 2 , определяемый соотношением:

где p – число факторов в уравнении регрессии, n – число наблюдений. Чем больше величина p, тем сильнее различия между множественным коэффициентом детерминации R 2 и скорректированным R 2 . При использовании скорректированного R 2 , для оценки целесообразности включения фактора в уравнение регрессии, следует учитывать, что увеличение его величины (значения), при включении нового фактора, не обязательно свидетельствует о его значимости, так как значение увеличивается всегда, когда t-статистика больше единицы (|t|>1). При заданном объеме наблюдений и при прочих равных условиях, с увеличением числа независимых переменных (параметров), скорректированный коэффициент множественной детерминации убывает. При небольшом числе наблюдений, скорректированная величина коэффициента множественной детерминации R 2 имеет тенденцию переоценивать долю вариации результативного признака, связанную с влиянием факторов, включенных в регрессионную модель. Низкое значение коэффициента множественной корреляции и коэффициента множественной детерминации R 2 может быть обусловлено следующими причинами:

  • в регрессионную модель не включены существенные факторы;
  • неверно выбрана форма аналитической зависимости, которая нереально отражает соотношения между переменными, включенными в модель.

Следует также обратить внимание на важность анализа остатков (остаточной, «необъясненной» дисперсии ). Остаток представляет собой отклонение фактического значения зависимой переменной от значения, полученного расчетным путем. При построении уравнения регрессии, мы можем разбить значение (у) в каждом наблюдении на 2 составляющие:

Отсюда:

Если ε i =0, то для всех наблюдений фактические значения зависимой переменной совпадают с расчетными (теоретическими) значе­ниями. Графически это означает, что теоретическая линия рег­рессии (линия, построенная по функции у=а 0 +а 1 х) проходит через все точки корреляционного поля, что возможно только при строго функциональной связи. Следовательно, результативный признак (у) полностью обусловлен влиянием фактора (х). На практике, как правило, имеет место некоторое рассеива­ние точек корреляционного поля относительно теоретической линии регрессии, т.е. отклонения эмпирических данных от тео­ретических ε i ≠0. Величина этих отклонений и лежит в основе расчета показателей качества (адекватности) уравнения.

Большинство предположений множественной регрессии нельзя в точности проверить, однако можно обнаружить отклонения от этих предположений. В частности, выбросы (экстремальные наблюдения) могут вызвать серьезное смещение оценок, сдвигая линию регрессии в определенном направлении и, тем самым, вызывая смещение коэффициентов регрессии . Часто исключение всего одного экстремального наблюдения приводит к совершенно другому результату. Выбросы оказывают существенное влияние на угол наклона регрессионной линии и,соответственно, на коэффициент корреляции . Всего один выброс может полностью изменить наклон регрессионной линии и, следовательно, вид зависимости между переменными. Одна точка выброса обуславливает высокое значение коэффициента корреляции, в то время, как в отсутствие выброса, он практически равен нулю.

При численности объектов анализа до 30 единиц возникает необходимость проверки значимости (существенности) каждого коэффициента регрессии . При этом выясняют насколько вычисленные параметры характерны для отображения комплекса условий: не являются ли полученные значения параметров результатами действия случайных причин. Значимость коэффициентов простой линейной регрессии (применительно к совокупностям, у которых n<30) осуществляют с помощью t-критерия Стьюдента . При этом вычисляют расчетные (фактические) значения t-критерия для параметров a 0 а 1 :

  • n — число наблюдений, m-число параметров уравнения регрессии,
  • σ ε - (остаточное) α) и числа степеней свободы вариации k (ν )=n-2 . В социально-экономических исследованиях уровень значимости α обычно принимают равным 0,05. Параметр признается значимым (существенным) при условии, если t расч. > t табл . В этом случае, практически невероятно, что найденные значения параметров обусловлены только случайными совпадениями.

    Для оценки значимости парного коэффициента корреляции(корень квадратный из коэффициента детерминации), при условии линейной формы связи между факторами, можно использовать t-критерий Стьюдента :

    Анализ качества эмпирического уравнения множественной линейной регрессии предусматривает оценку мультиколлинеарности факторов. При оценке мультиколлинеарности факторов следует учитывать, что чем ближе к нулю определитель матрицы межфакторной корреляции, тем сильнее мультиколлинеарность факторов и ненадежнее результаты множественной регрессии. Для отбора наиболее значимых факторов Х i должны быть учтены следующие условия:

    • связь между результативным признаком и факторным должна быть выше межфакторной связи
    • связь между факторами должна быть не более 0.7
    • при высокой межфакторной связи признака отбираются факторы с меньшим коэффициентом корреляции между ними

    Более объективную характеристику тесноты связи дают частные коэффициенты корреляции , измеряющие влияние на результативный фактор У i фактора Х i при неизменном уровне других факторов. Коэффициент частной корреляции отличается от простого коэффициента линейной парной корреляции тем, что он измеряет парную корреляцию соответствующих признаков (У и Х i) при условии, что влияние на них остальных факторов (Х j) устранено.

    Смотри также

Если модель не учитывает существенную закономерность исследуемого процесса, ее нельзя применять для анализа и прогнозирования.

Модель считается адекватной , если ряд остатков обладает свойствами:

o независимость;

o их случайность;

o соответствие нормальному закону распределения;

o равенство нулю средней ошибки.

Наличие этих свойств проверяется с определенной степенью уверенности в правильности выводов. На практике обычно используется 5%- ный уровень значимости, соответствующий уверенности в 95%.

При проверке независимости (отсутствии автокорреляции) определяется отсутствие в ряду остатков систематической составляющей. Это проверяется с помощью d - критерия Дарбина - Уотсона, в соответствии с которым вычисляется коэффициент d :

Вычисленная величина этого критерия сравнивается с двумя табличными уровнями: нижним - d1 и верхним - d2 , значение которых зависит от количества наблюдений N , сложности модели (количества параметров) и выбранного уровня вероятности суждения. Если
d -коэффициент превышает 2 , то это свидетельствует об отрицательной корреляции и перед входом в таблицу его величину надо преобразовать: d" = 4 - d.

Если 0 d (или d") d1 – модель неадекватна (уровни ряда остатков сильно автокоррелированы);

d2 d (или d") 2 – модель адекватна;

d1 d (или d") d2 – однозначного вывода сделать нельзя и необходимо применять другие критерии (на основе коэффициента автокорреляции r(1), Q-коэффициента).

Надежным инструментом оценки независимости уровней ряда является автокорреляционная функция (АКФ), которая представляет собой последовательность коэффициентов автокорреляции. Если средний уровень ряда остатков равен нулю или другой малой величине, коэффициенты автокорреляции при сдвиге на m шагов вычисляются по простой формуле:

Вывод о независимости уровней можно сделать на основе первого коэффициента автокорреляции r(1) , вычисленного по этой формуле при m=1. Если r(1) > r табл , то присутствие в остаточном ряду существенной автокорреляции подтверждается – модель адекватна.

Целесообразно анализировать и другие значения АКФ. На основе всех коэффициентов, количество которых (М) не должно превышать одной трети объема данных, рассчитывается коэффициент Q :

Эта статистика, имеющая распределение χ-квадрат с (N-M-1) степенями свободы, не должна превышать соответствующего табличного уровня.

Рассмотренные три критерия в совокупности (коэффициент d, коэффициент автокорреляции r (1) и коэффициент Q ) позволяют однозначно определить независимость уровней ряда.

Для проверки случайности уровней ряда могут быть использованы критерий серий и критерий поворотных точек. Среди модификаций критерия серий наиболее удачной с точки зрения соотношения между сложностью и надежностью, на наш взгляд, является критерий «восходящих» и «нисходящих» серий. По результатам сравнения двух последних уровней ряда остатков составляется последовательность из нулей и единиц. Если E (t+ 1) - E (t ) > 0, в последовательности ставиться ноль, в противном случае – единица. Если исходный ряд представляет собой случайную последовательность, то продолжительность самой длинной серии τ (N ), т.е. последовательности, состоящей из идущих подряд нулей или единиц, должна быть небольшой, а общее число серий v – малым. Ряд остатков считается случайным с 95%-ной вероятностью в случае выполнения двух неравенств:

τ (N ) < τ 0 (N )

Квадратные скобки здесь означают, что от результата вычислений берется целая часть числа (не путать с процедурой округления!). Критическое значение длины серии τ 0 = 5; при 26 < N < 153, τ 0 = 6; а при N > 153, τ 0 = 7.

Менее строгим является критерий поворотных точек , который называется также критерием “пиков” и “впадин”. В соответствии с этим критерием каждый уровень ряда сравнивается с двумя соединенными с ними. Если он больше или меньше их, то эта точка считается поворотной. Далее подсчитывается сумма поворотных точек р . В случайном ряду чисел должно выполняться строгое неравенство:

Соответствие ряда остатков нормальному закону распределения важно с точки зрения правомерности построения доверительных интервалов прогноза. Наиболее существенными свойствами ряда отклонений являются их симметричность относительно модели и преобладание малых по абсолютной величине ошибок над большими. В этой связи определяется близость к соответствующим параметрам нормального закона распределения коэффициентов асимметрии – A c (мера скошенности) и эксцесса Э к (мера «скученности») наблюдений около модели:

Если эти коэффициенты приблизительно равны нулю, то ряд остатков распределен в соответствии с нормальным законом. Для оценки степени их близости к нулю вычисляются дисперсии:

S a = 6 (N - 2) / (N + 1) / (N + 3)

S э = 24N (N - 2)(N - 3)/ (N + 1)/(N + 3) / (N + 5)

Если вычисленные абсолютные значения этих коэффициентов не превосходят полутора среднеквадратических отклонений, то считается, что распределение ряда остатков не противоречит нормальному закону. Если хотя бы один из них превышает удвоенную величину среднеквадратического отклонения, то распределение ряда не соответствует нормальному закону, а построение доверительных интервалов неправомочно. В случае попадания в зону неопределенности (между полутора и двумя СКО) используются другие критерии, частности RS- критерий:

RS = (E max - E min) / S,

где E max – максимальный уровень ряда остатков;

E min – минимальный уровень ряда остатков;

S – среднее квадратическое отклонение.

Если значение этого критерия попадает между табулированными границами с заданным уровнем вероятности, то гипотеза о нормальном распределении ряда остатков принимается. (Для N = 10 и 5%-ного уровня значимости этот интервал равен 2,7 - 3,7).

Равенство нулю средней ошибки (математическое ожидание случайной последовательности) проверяют с помощью t-критерия Стьюдента:

Гипотеза отклоняется, если расчетное значение t p больше табличного уровня t -критерия с (N - 1) степенями свободы и выбранным уровнем значимости.

Оценка точности модели

В статистическом анализе известно большое число характеристик точности. Наиболее часто в практической работе, кроме среднеквадратического отклонения, используются:

o максимальная по абсолютной величине ошибка:

E max = max|e (t )|;

o относительная максимальная ошибка:

Е отн = Е max / Y ср * 100%

o средняя по модулю ошибка:

|Е ср | = (e (1) + ... + e (N ))/N

o относительная средняя по модулю ошибка:

|Е ср | отн = |Е ср | / Y ср * 100%

Эти показатели дают представление об абсолютной величине ошибки модели и о доле ошибки в процентном отношении к среднему значению результативного признака.

При использовании ретропрогноза – подхода, когда несколько последних уровней ряда оставляются в качестве проверочной последовательности – точность прогнозных оценок определяется на основе этих же показателей.

Лучшей по точности считается та модель, у которой все перечисленные характеристики имеют меньшую величину. Однако эти показатели по-разному отражают степень точности модели и потому нередко дают противоречивые выводы. Для однозначного выбора лучшей модели исследователь должен воспользоваться либо одним основным показателем, либо обобщенным критерием.

Примечание.

Для расширенной характеристики модели регрессии вычисляется несколько дополнительных показателей.

Кроме рассмотренных выше характеристик, целесообразно использовать корреляционное отношение (индекс корреляции ) R , а также характеристики существенности модели в целом и отдельных ее коэффициентов:

,

где S e 2 – сумма квадратов уровней остаточной компоненты;

S y 2 – сумма квадратов отклонений уровней исходного ряда от его среднего значения.

Данный коэффициент является универсальным, так как он отражает тесноту связи и точность модели, а также может использоваться при любой форме связи переменных. При построении однофакторной модели и их линейной зависимости он равен коэффициенту линейной корреляции.

Коэффициент множественной корреляции (индекс корреляции), возведенный в квадрат, называется коэффициентом детерминации .

Рассмотрим, к примеру, ситуацию, когда коэффициент корреляции между объемом выручки от реализации и расходами на рекламу составляет 0.8. Таким образом, r =0.8, а коэффициент детерминации r*r = 0.64 (=64%). Следовательно, это показывает, что 64 % изменений в объеме реализации можно объяснить изменениями в расходах на рекламу. Такой способ описания зависимости между двумя переменными подводит к рассмотрению причины и следствия. Из двух анализируемых переменных одна является прчиной (x ), а другая – следствием (y ). Например, надежды возлагаются на то, что реклама вызовет изменение объема реализации. Таким образом, мы можеж сказать, что расходы на рекламу являются «причиной», а объем реализации – «следствием». Рассмотрим вероятную ситуацию, при которой коэффициент корреляции между двумя переменными составляет +1. Итак, r = +1, а коэффициент детерминации r*r = 1. Это подразумевает, что 100% изменений в объеме реализации вызваны изменениями в расходах на рекламу. В таком случае изменения в расходах на рекламу автоматически вызывают пропорциональные изменения в объемах реализации, что для любого руководителя службы маркетинга ситуация идеальна. На практике, конечно, крайне маловероятно, что степень корреляции будет столь идеальной. Даже когда зависимость между двумя переменными зависима, требуется учет множества других факторов. Так, для примеров такого рода вполне обычным значением коэффициента детерминации будет показатель в диапазоне от 0.1 до 0.3. Например, коэффициент детерминации, равный 0.2 (20%),показывает, что 20% изменений в объеме реализации вызван изменениями в расходах на рекламу. Во многих хозяйственных ситуациях 20%-ный результат служит более чем адекватным обоснованием необходимости продолжать рекламирование. При истолковании значений коэффициента корреляции и коэффициента детерминации следует проявлять осторожность. Существует вероятность получения очень высоких значений коэффициента корреляции при отсутствии какой-либо прямой зависимости между двумя рассматриваемыми переменными. Рассмотрим, например, следующую ситуацию, когда мы имеем для анализа собранные за 10 лет данные по стоимости экспорта из Великобритании и средней цене стиральных машин во Франции:

Год
Экспорт
Цена 1,5 1,6 1,9 2,0 2,5 2,5 2,6 2,9 3,0 3,5

Данные переменные были отобраны ввиду фактического отсутствия прямой зависимости между ними. Итак, можно вычислить коэффициент корреляции между этими двумя переменными при x – стоимости экспорта из Великобритании и y – цене стиральных машин во Франции. Коэффициент корреляции составляет r = 0,9635. Таким образом, коэффициент детерминации r *r = 0,928 = 92,8 %

Такой коэффициент детерминации, видимо, указывает на то, что 92,8% изменений в цене стиральных машин во Франции вызваны колебаниями в стоимости экспорта из Великобритании. Такая зависимость называется ложной, так как прямая зависимость между переменными, очевидно, незначительна. Коэффициент корреляции оказывается значимым в этом случае по той причине, что обе переменные связаны с третьей переменной, т.е. с временным периодом. Такое следствие часто встречается при анализе экономических данных, взятых за длительный период времени, поскольку важным фактором здесь может быть инфляция. Чтобы установить наличие истинной зависимости между двумя переменными, необходимо устранить элемент инфляции при рассмотрении этих переменных и заново вычислить корреляцию. Выше приведенный пример представляется несколько более сложным, так как уровень инфляции в разных странах может быть неодинаков. Однако в целом между двумя значениями уровня инфляции вероятно существование зависимости, что и может дать ложную корреляцию между различными финансовыми и экономическими показателями, взятыми за продолжительный период времени.

Важную роль при оценке влияния факторов играют коэффициенты регрессионной модели. Однако непосредственно с их помощью нельзя сопоставить факторы по степени их влияния на зависимую переменную из-за различия единиц измерения и разной степени колеблемости. Для устранения таких различий при интерпретации применяются средние частные коэффициенты эластичности Э(j) и бета-коэффициенты β(j) , которые рассчитываются соответственно по формулам:

Э(j)=a(j)X cp (j)/Y cp

β(j)= a(j)S(j)/S y ,

где S(j) – среднеквадратическое отклонение фактора j .

Коэффициент эластичности показывает, на сколько процентов изменяется зависимая переменная при изменении фактора j на один процент. Однако он не учитывает степень колеблемости факторов.

Бета-коэффициент показывает, на какую часть величины среднеквадратического отклонения меняется среднее значение зависимой переменной с изменением соответствующей независимой переменной на одно среднеквадратическое отклонение при фиксированном на постоянном уровне значении остальных независимых переменных.

Указанные коэффициенты позволяют проранжировать факторы по степени влияния факторов на зависимую переменную.

Долю влияния фактора в суммарном влиянии всех факторов можно оценить по величине дельта-коэффициентов Δ(j):

Δ(j) = r(j) β(j) / R 2 ,

где r(j) - коэффициент парной корреляции между фактором j (j=1,...,m) и зависимой переменной;

R 2 = r(1) * β(1)+r(2) * β (2)+..+r(m) * β (m)

При корректно проводимом анализе все β - коэффициентыположительны.


Похожая информация.


Адекватность моделей определялась с помощью критерия Фишера F.

Адекватность модели -- совпадение свойств (функций/параметров/характеристик и т.п.) модели и соответствующих свойств моделируемого объекта. Адекватностью называется совпадение модели моделируемой системы в отношении цели моделирования.

Оценка адекватности модели - проверка соответствия модели реальной системе. Оценка адекватности модели реальному объекту оценивается по близости результатов расчетов экспериментальным данным.

Два основных подхода к оценке адекватности:

1) по средним значениям откликов модели и системы

Проверяется гипотеза о близости средних значений каждой n-й компоненты откликов модели Yn известным средним значениям n-й компоненты откликов реальной систем.

2) по дисперсиям отклонений откликов модели от среднего значения откликов систем

Сравнение дисперсии проводят с помощью критерия F (проверяют гипотезы о согласованности), с помощью критерия согласия?2 (при больших выборках, п>100), критерия Колмогорова- Смирнова (при малых выборках, известны средняя и дисперсия совокупности), Кохрена и др.

Критерием Фишера (F-критерием, ц*-критерием) -- называют любой статистический критерий, тестовая статистика которого при выполнении нулевой гипотезы имеет распределение Фишера (F-распределение).

Статистика теста так или иначе сводится к отношению выборочных дисперсий (сумм квадратов, деленных на "степени свободы"). Чтобы статистика имела распределение Фишера необходимо, чтобы числитель и знаменатель были независимыми случайными величинами и соответствующие суммы квадратов имели распределение Хи-квадрат. Для этого требуется, чтобы данные имели нормальное распределение. Кроме того, предполагается, что дисперсия случайных величин, квадраты которых суммируются, одинакова.

Тест проводится путем сравнения значения статистики с критическим значением соответствующего распределения Фишера при заданном уровне значимости. Известно, что если, то. Кроме того, квантили распределения Фишера обладают свойством. Поэтому обычно на практике в числителе участвует потенциально большая величина, в знаменателе -- меньшая и сравнение осуществляется с "правой" квантилью распределения. Тем не менее тест может быть и двусторонним и односторонним. В первом случае при уровне значимости используется квантиль, а при одностороннем тесте .

Более удобный способ проверки гипотез -- с помощью p-значения -- вероятностью того, что случайная величина с данным распределением Фишера превысит данное значение статистики. Если (для двустороннего теста --)) меньше уровня значимости, то нулевая гипотеза отвергается, в противном случае принимается.

Расчетный критерий Фишера:

Расчетное значение критерия Фишера F N сравнивается с табличным F Т.

Если расчетное значение критерия меньше критического то модель адекватна.

Таблица 6 - проверка адекватности модели

Анализ результатов эксперимента показал, что Fн>Fк, следовательно, модель не адекватна. Необходимо провести повторный эксперимент.

В ОБЩЕМ СЛУЧАЕ МОДЕЛЬ БУДЕТ ИМЕТЬ ВИД:

Y=2,65-0,4*V+0,359*t-0,047*S-0,102*V*t+0,042*V*S+0,052*t*S 0,199V 2 +0,078*t 2 -0,007*S 2