Уважаемые посетители Портала Знаний, если Вы найдете ошибку в тексте, выделите, пожалуйста, ее мышью и нажмите Сtrl+Enter. Мы обязательно исправим текст!


Случайная цитата


Все люди от природы стремятся к знанию. (Аристотель. Метафизика)

Промышленная аналитика

Планирование эксперимента

Выбор интервалов варьирования

Полный факторный эксперимент

Свойства полного факторного эксперимента типа 2k

Полный факторный эксперимент

Дробный факторный эксперимент

Минимизация числа опытов

Дробная реплика

Выбор полуреплик. Генерирующие соотношения и определяющие контрасты

Выбор 1/4-реплик. Обобщающий определяющий контраст

Реплики большой дробности

Проведение эксперимента

Ошибки параллельных опытов

Дисперсия параметра оптимизации

Проверка однородности дисперсий

Рандомизация

Разбиение матрицы типа 2k на блоки

Обработка результатов эксперимента

Метод наименьших квадратов

Регрессионный анализ

Планирование эксперимента

Планирование экспериментов чрезвычайно важно в анализе промышленных данных.

Эти методы незаменимы в химической, металлургической, нефтедобывающей и нефтеперерабатывающей промышленности и других отраслях, см. например.

Современная высокоразвитая теория планирования эксперимента объединяет разнообразные аналитические процедуры, позволяющие за минимальное число опытов получить максимальную информацию об изучаемом физическом или технологическом процессе, свойствах материалов, явлении.

Важными являются следующие положения:

  1. к минимизация общего числа опытов
  2. одновременное варьирование всех переменных, определяющих исследуемый процесс
  3. использование математического аппарата, формализующего многие действия экспериментатора
  4. выбор четкой стратегии, позволяющей принимать обоснованные решения после каждой серии экспериментов.

Решаемые методами планирования эксперимента задачи разнообразны:

  • поиск оптимальных условий
  • оптимизация процессов, например, плавки стали и использовании энергии
  • построение интерполяционных формул
  • выбор главных факторов, влияющих на производственный процесс
  • оценка констант теоретических моделей (например, кинетических), выбор наиболее приемлемых из некоторого множества гипотез о механизме явлений
  • исследование диаграмм состав-свойство и т.д.

Задачи поиска оптимальных условий являются одними из наиболее распространенных на практике и требуют постоянных творческих усилий.

Выбор оптимального состава многокомпонентных смесей или сплавов, повышение производительности действующих установок, повышение качества продукции, снижение затрат на ее получение – примеры задач оптимизации.

Для начального описания объекта исследования удобно использовать понятие «черного ящика».

Мы не можем заглянут внутрь ящика, однако можем управлять внешними воздействиями и наблюдать отклик на эти воздействия.

Для проведения эксперимента необходимо воздействовать на поведение «черного ящика».

Все способы такого воздействия мы называем факторами, их называют также входом черного ящика, см. стрелки слева.

На выходе получаются стрелки справа.

При решении задач используется модель объекта или уравнение:

.

Предполагается, что каждый фактор имеет определенное число дискретных уровней.

Фиксированный набор уровней факторов определяет одно из возможных состояний черного ящика.

Если перебрать все возможные наборы, то получим полное множество различных состояний данного «ящика».

Одновременно это будет число возможных различных опытов в постановке задачи планирования эксперимента.

Естественно считать, что число различных состояний определяет сложность данной системы.

Зная сложность, мы сможем оценить число различных опытов в нашей задаче.

Чтобы узнать число различных состояний, достаточно число уровней факторов (если оно для всех факторов одинаково) возвести в степень числа факторов k: pk, где p – число уровней.

Простая система с пятью факторами на пяти уровнях имеет 3125 состояний, а для десяти факторов на четырех уровнях их уже свыше миллиона!

В этих условиях мы просто вынуждены отказаться от таких экспериментов, которые включают все возможные опыты.

Возникает вопрос, сколько и каких опытов надо включить в эксперимент, чтобы решить поставленную задачу?

Здесь приходит на помощь планирование эксперимента.

Укажем два основных требования этой теории.

Прежде всего, важно ответить на вопрос, воспроизводятся на объекте результаты эксперимента или нет.

Выберем некоторые уровни для всех факторов и в этих условиях проведем эксперимент.

Затем повторим его несколько раз через неравные промежутки времени и сравним значения параметра оптимизации.

Разброс этих значений характеризует воспроизводимость результатов.

Если разброс не превышает некоторой, заранее заданной величины (наших требований к точности эксперимента), то объект удовлетворяет требованию воспроизводимости.

Планирование эксперимента предполагает активное вмешательство в процесс и возможность выбора в каждом опыте тех уровней факторов, которые представляют интерес.

Такой эксперимент называется активным.

Объект, на котором возможен активный эксперимент, называется управляемым.

На реальный объект обычно действуют как управляемые, так и неуправляемые факторы.

Неуправляемые факторы влияют на воспроизводимость эксперимента и являются причиной ее нарушения.

Если требования воспроизводимости не выполняются, приходится обращаться к активно-пассивному эксперименту.

Возможно, плохая воспроизводимость объясняется действием фактора, систематически изменяющегося (дрейфующего) во времени.

В этих случаях необходимо обращаться к специальным методам планирования.

Планирование экстремального эксперимента – это метод выбора количества и условий проведения опытов, минимально необходимых для отыскания оптимальных условий, т.е. для решения поставленной задачи.

При оптимизации распространен так называемый детерминированный подход, который широко используется, например, в химии.

Детерминированный подход предполагает построение физической модели процесса на основании тщательного изучения механизма явления (например, кинетики, гидродинамики).

Такой подход позволяет получить математическую модель объекта в виде системы дифференциальных уравнений.

Детерминированный и статистический подходы дополняют друг друга.

После того как выбран объект исследования и параметр оптимизации, нужно включить в рассмотрение все существенные факторы, которые потенциально могут влиять на технологический процесс.

Например, если мы оптимизируем расход газа или электроэнергии в металлургии, то нужно учесть также условия внешней среды, температуру, скорость и направление ветра.

Если какой-либо существенный фактор окажется неучтенным, то это может привести к неадекватности модели.

Если неучтенный фактор произвольно флуктуировал – принимал случайные значения и не контролировался, – это значительно увеличит ошибку опыта.

При поддержании фактора на некотором фиксированном уровне может быть получено ложное представление об оптимуме, так как нет гарантии, что фиксированный уровень является оптимальным.

Фактором называется измеряемая переменная величина, принимающая в некоторый момент времени определенное значение.

Факторы соответствуют способам воздействия на объект исследования.

Факторы разделяются на количественные и качественные.

Качественные факторы – это разные вещества, разные технологические способы, аппараты, исполнители и т.д.

Хотя качественным факторам не соответствует числовая шкала в том смысле, как это понимается для количественных факторов, однако можно построить условную порядковую шкалу, которая ставит в соответствие уровням качественного фактора числа натурального ряда, т.е. производит кодирование.

Порядок уровней может быть произволен, но после кодирования он фиксируется.

В ряде случаев граница между понятием качественного и количественного фактора условна.

Например, при изучении воспроизводимости результатов химического анализа надо установить влияние положения тигля с навеской в муфельной печи.

Можно разделить под печи на квадраты и считать номера квадратов уровнями качественного фактора, определяющего положение тигля.

Вместо этого можно ввести два количественных фактора – ширину и длину пода печи. Качественным факторам не соответствует числовая шкала, и порядок уровней факторов не играет роли.

При планировании эксперимента факторы должны быть управляемыми. Это значит, что экспериментатор, выбрав нужное значение фактора, может его поддерживать постоянным в течение всего опыта, т.е. может управлять фактором.

В этом состоит особенность «активного» эксперимента.

Чтобы точно определить фактор, нужно указать последовательность действий (операций), с помощью которых устанавливаются его конкретные значения (уровни).

Такое определение фактора будем называть операциональным.

Если фактором является давление в некотором аппарате, то совершенно необходимо указать, в какой точке и с помощью какого прибора оно измеряется и как оно устанавливается.

Точность замера факторов должна быть возможно более высокой. Степень точности определяется диапазоном изменения факторов.

При изучении процесса, который длится десятки часов, нет необходимости учитывать доли минуты, а в быстрых процессах необходимо учитывать, быть может, доли секунды.

Факторы должны быть непосредственными воздействиями на объект. Факторы должны быть однозначны. Трудно управлять фактором, который является функцией других факторов.

Но в планировании могут участвовать сложные факторы, такие, как соотношения между компонентами, их логарифмы и т.п.

Необходимость введения сложных факторов возникает при желании представить динамические особенности объекта в статической форме.

Пусть, например, требуется найти оптимальный режим подъема температуры в реакторе. Если относительно температуры известно, что она должна нарастать линейно, то в качестве фактора вместо функции (в данном случае линейной) можно использовать тангенс угла наклона, т.е. градиент.

Положение усложняется, когда исходная температура не зафиксирована. Тогда ее приходится вводить в качестве еще одного фактора.

Для более сложных кривых пришлось бы ввести большее число факторов (производные высоких порядков, координаты особых точек и т.д.).

Поэтому целесообразно пользоваться сложным качественным фактором – номером кривой. Различные варианты кривых рассматриваются в качестве уровней. Это могут быть разные режимы термообработки сплавов, переходные процессы в системах управления и т.д.

При планировании эксперимента обычно одновременно изменяется несколько факторов. Поэтому очень важно сформулировать требования, которые предъявляются к совокупности факторов. Прежде всего, выдвигается требование совместимости.

Совместимость факторов означает, что все их комбинации осуществимы и безопасны. Это важное требование.

Представьте себе, что вы поступили легкомысленно, не обратили внимания на требование совместимости факторов и запланировали такие условия опыта, которые могут привести к взрыву установки или осмолению продукта. Согласитесь, что такой результат очень далек от целей оптимизации.

Несовместимость факторов может наблюдаться на границах областей их определения. Избавиться от нее можно сокращением областей.

Положение усложняется, если несовместимость проявляется внутри областей определения.

Одно из возможных решений – разбиение на подобласти и решение двух отдельных задач.

При планировании эксперимента важна независимость факторов, т.е. возможность установления фактора на любом уровне вне зависимости от уровней других факторов.

Если это условно невыполнимо, то невозможно планировать эксперимент. Итак, мы подошли ко второму требованию – отсутствию корреляции между факторами.

Требование некоррелированности не означает, что между значениями факторов нет никакой связи. Достаточно, чтобы связь не была линейной.

Под моделью в теории планирования эксперимента понимается функция отклика

Выбрать модель – значит выбрать вид этой функции, записать ее уравнение.

Тогда останется спланировать и провести эксперимент для оценки численных значений констант (коэффициентов) этого уравнения.

Построим геометрический аналог функции отклика – поверхность отклика.

Для наглядности рассмотрим эксперимент с двумя факторами.

Заметим, что в случае многих факторов геометрическая наглядность теряется. Мы попадаем в абстрактное многомерное пространство, в котором у человека нет навыков ориентирования, приходится переходить на язык алгебры.

Итак, мы хотим изобразить геометрически возможные состояния «черного ящика» с двумя входами. Для этого достаточно располагать плоскостью с обычной Декартовой системой координат.

По одной оси координат будем откладывать в некотором масштабе значения (уровни) одного фактора, а по другой оси – второго.

Тогда каждому состоянию «ящика» будет соответствовать точка на плоскости.

Для факторов существуют области определения.

Это значит, что у каждого фактора есть минимальное и максимальное возможные значения, между которыми он может изменяться либо непрерывно, либо дискретно.

Если факторы совместимы, то границы образуют на плоскости некоторый прямоугольник, внутри которого лежат точки, соответствующие состояниям «черного ящика».

Пунктирными линиями на рисунке обозначены границы областей определения каждою из факторов, а сплошными – границы их совместной области определения.

Чтобы указать значение параметра оптимизации, требуется еще одна ось координат. Пространство, в котором строится поверхность отклика, мы будем называть факторным пространством. Оно задается координатными осями, по которым откладываются значения факторов и параметра оптимизации.

Размерность факторного пространства зависит от числа факторов.

При многих факторах поверхность отклика уже нельзя изобразить наглядно и приходится ограничиваться только алгебраическим языком.

Но для двух факторов можно даже не переходить к трехмерному пространству, а ограничиться плоскостью.

Для этого достаточно произвести сечение поверхности отклика плоскостями, параллельными плоскости X1OX2 и полученные в сечениях линии спроектировать на эту плоскость.

Каждая линия соответствует постоянному значению параметра оптимизации. Такая линия называется линией равного отклика.

За отказ от полного перебора состояний надо чем-то платить.

Цена – это предположения, которые мы должны сделать относительно свойств неизвестной нам модели до начала эксперимента.

Главное предположение – это непрерывность поверхности, ее гладкость и наличие единственного оптимума (быть может, и на границе области определения факторов).

Эти постулаты позволяют представить изучаемую функцию в виде степенного ряда в окрестности любой возможной точки факторного пространства (такие функции в математике называются аналитическими).

Кроме того, если мы придумаем какой-то способ постепенного приближения к оптимальной точке, нужно, чтобы результат не зависел от исходной точки.

Так как мы заранее считаем, что предпосылки выполняются, то надо максимально использовать возможности, которые при этом открываются.

Если, например, мы будем знать значения параметра оптимизации в нескольких соседних точках факторного пространства, мы сможем (в силу гладкости и непрерывности функции отклика) представить себе результаты, которые можно ожидать в других соседних точках.

Следовательно, можно найти такие точки, для которых ожидается наибольшее увеличение (или уменьшение, если мы ищем минимум) параметра оптимизации. Тогда ясно, что следующий эксперимент надо переносить именно в эти точки.

Надо продвигаться в этом направлении, пренебрегая остальными. Сделав новый эксперимент, снова можно оценить направление, в котором следует двигаться. В силу единственности оптимума мы, таким образом, рано или поздно непременно его достигнем. Это и есть шаговый принцип.

Сделаем пояснение.

Мы выбираем в факторном пространстве какую-то точку и рассматриваем множество точек в ее окрестности, т.е. выбираем в области определения факторов малую подобласть.

Здесь мы хотим провести эксперимент, на основании которого должна быть построена первая модель, которую мы хотим использовать для предсказания результатов опытов в тех точках, которые не входили в эксперимент.

Если эти точки лежат внутри нашей подобласти, то такое предсказание называется интерполяцией, а если вне – экстраполяцией.

Чем дальше от области эксперимента лежит точка, для которой мы хотим предсказать результат, теме меньшей уверенностью это можно делать.

Поэтому мы вынуждены экстраполировать вне небольшой окрестности и использовать результаты экстраполяции для выбора условий проведения следующего эксперимента, далее цикл повторяется.

Попутно полученную модель можно использовать для проверки различных гипотез о механизме изучаемого явления или о его отдельных сторонах. Например, если вы предполагаете, что увеличение значения некоторого фактора должно приводить к увеличению значения параметра оптимизации, то с помощью модели можно узнать, так ли это.

Такая проверка называется интерпретацией модели.

Исходя из выбранной стратегии, ясно, что главное требование к модели – это способность предсказывать направление дальнейших опытов, причем предсказывать с требуемой точностью. Так как до получения модели мы не знаем, какое направление нам понадобится, то естественно требовать, чтобы точность предсказания во всех возможных направлениях была одинакова.

Это значит, что в некоторой подобласти, в которую входят и координаты выполненных опытов, предсказанное с помощью модели значение отклика не должно отличаться от фактического больше чем на некоторую заранее заданную величину.

Модель, которая удовлетворяет такому или какому-либо аналогичному требованию, называется адекватной. Проверка выполнимости этого требования называется проверкой адекватности модели.

Если несколько различных моделей отвечают нужным требованиям, то следует предпочесть ту из них, которая является самой простой.

Фактически мы произвели выбор класса моделей. Мы сказали, что всегда, когда это возможно, будем искать модель среди полиномов.

Построение полинома возможно в окрестностях любой точки факторного пространства, поскольку мы предположили, что функция является аналитической.

Мы представили неизвестную нам функцию отклика полиномом. Операция замены одной функции другой в каком-то смысле эквивалентной функцией называется аппроксимацией.

Вопрос: полином какой степени следует взять на первом шаге?

Эксперимент нужен только для того, чтобы найти численные значения коэффициентов полинома.

Поэтому чем больше коэффициентов, тем больше опытов окажется необходимым. А мы стремимся сократить их число.

Следовательно, надо найти такой полином, который содержит как можно меньше коэффициентов, но удовлетворяет требованиям, предъявленным к модели. Чем ниже степень полинома при заданном числе факторов, тем меньше в нем коэффициентов.

Мы хотим, чтобы модель хорошо предсказывала направление наискорейшего улучшения параметра оптимизации.

Такое направление называется направлением градиента. Ясно, что движение в этом направлении приведет к успеху быстрее, чем движение в любом другом направлении (это значит, что будет достигнута экономия числа опытов).

Полином первой степени – линейная модель – это то, что нам нужно.

С одной стороны, он содержит информацию о направлении градиента, с другой – в нем минимально возможное число коэффициентов при данном числе факторов.

Единственное опасение в том, что неясно, будет ли линейная модель всегда адекватной. Ответ зависит еще и от объекта.

Вопрос в том, как выбрать подобласть в факторном пространстве, чтобы линейная модель оказалась адекватной.

Размер такой области заранее не известен, но адекватность можно проверять по результатам эксперимента. Значит, выбрав сначала произвольную подобласть, мы, рано или поздно, найдем требуемые размеры, далее воспользуемся движением по градиенту.

На следующем этапе мы будем искать линейную модель уже в другой подобласти. Цикл повторяется до тех пор, пока движение по градиенту не перестанет давать эффект.

Это значит, что мы попали и область, близкую к оптимуму. Такая область называется «почти стационарной». Здесь линейная модель уже не нужна. Либо попаданием в почти стационарную область задача решена, либо надо переходить к полиномам более высоких степеней, например второй степени, чтобы подробнее описать область оптимума.

Удачный выбор подобласти имеет большое значение для успеха всей работы. Он связан с интуитивными решениями, которые принимает экспериментатор на каждом этапе.

Кроме задачи оптимизации, иногда возникает задача построения интерполяционной модели. В этом случае нас не интересует оптимум.

Просто мы хотим предсказывать результат с требуемой точностью во всех точках некоторой заранее заданной области. Тут не приходится выбирать подобласть.

Необходимо последовательно увеличивать степень полинома до тех пор, пока модель не окажется адекватной. Если адекватной оказывается линейная, или неполная квадратная модель (без членов, содержащих квадраты факторов), то ее построение аналогично тому, что требуется для оптимизации.

Как выбрать локальную область факторного пространства, где ее выбирать и какого размера она должна быть?

Это важный этап принятия неформализованных решений, предшествующих построению плана первой серии эксперимента.

Весь процесс исследования можно считать состоящим из последовательности этапов, часть из которых полностью формализованы, а часть требуют «интуитивных» решений. Причем, по мере развития теории, формальные этапы будут играть все большую роль, но до конца не вытеснят неформализованные этапы.

При выборе области эксперимента должны учитываться следующие соображения.

Прежде всего, надо оценить границы областей определения факторов. При этом должны учитываться ограничения нескольких типов.

Первый тип: принципиальные ограничения для значений факторов, которые не могут быть нарушены ни при каких обстоятельствах. Например, если фактор – температура, то нижним пределом будет абсолютный нуль.

Второй тип – ограничения, связанные с технико-экономическими соображениями, например, со стоимостью сырья, дефицитностью отдельных компонентов, временем ведения процесса.

Третий тип ограничений, с которым чаще всего приходится иметь дело, определяется конкретными условиями проведения процесса, например, существующей аппаратурой, технологией, организацией. В реакторе, изготовленном из некоторого материала, температуру нельзя поднять выше температуры плавления этого материала или выше рабочей температуры данного катализатора.

Оптимизация обычно начинается в условиях, когда объект уже подвергался некоторым исследованиям. Информацию, содержащуюся в результатах предыдущих исследований, будем называть априорной (т.е. полученной до начала эксперимента).

Мы можем использовать априорную информацию для получения представления о параметре оптимизации, о факторах, о наилучших условиях ведения процесса и характере поверхности отклика, т.е. о том, как сильно меняется параметр оптимизации при небольших изменениях значений факторов, а также о кривизне поверхности.

Для этого можно использовать графики (или таблицы) однофакторных экспериментов, осуществлявшихся в предыдущих исследованиях или описанных в литературе.

Если однофакторную зависимость нельзя представить линейным уравнением (в рассматриваемой области), то в многомерном случае, несомненно, будет существенная кривизна. Обратное утверждение, к сожалению, не очевидно.

Итак, выбор экспериментальной области факторного пространства связан с тщательным анализом априорной информации.

Наилучшим условиям, определенным из анализа априорной информации, соответствует комбинация (или несколько комбинаций) уровней факторов. Каждая комбинация является многомерной точкой в факторном пространстве.

Ее можно рассматривать как исходную точку для построения плана эксперимента. Назовем ее основным (нулевым) уровнем. Построение плана эксперимента сводится к выбору экспериментальных точек, симметричных относительно нулевого уровня.

В разных случаях мы располагаем различными сведениями об области наилучших условий.

Если имеются сведения о координатах одной наилучшей точки и нет информации о границах определения факторов, то остается рассматривать эту точку в качестве основного уровня.

Аналогичное решение принимается, если границы известны и наилучшие условия лежат внутри области.

Положение усложняется, если эта точка лежит на границе (или весьма близко к границе) области.

Тогда приходится основной уровень выбирать с некоторым сдвигом от наилучших условий.

Может случиться, что координаты наилучшей точки неизвестны, но есть сведения о некоторой подобласти, в которой процесс идет достаточно хорошо. Тогда основной уровень выбирается либо в центре, либо в случайной точке этой подобласти.

Сведения о подобласти можно получить, анализируя изученные ранее подобные процессы, из теоретических соображений или из предыдущего эксперимента.

Наконец, возможен случай с несколькими эквивалентными точками, координаты которых различны. Когда отсутствуют дополнительные данные (технологического, экономического характера и т.д.), выбор произволен.

Конечно, если эксперимент недорог и требует немного времени, можно приступить к построению планов экспериментов вокруг нескольких точек.

Резюмируем наши рассуждения о принятии решений при выборе основного уровня в виде блок-схемы

После того как нулевой уровень выбран, переходим к следующему шагу – выбору интервалов варьирования.

Выбор интервалов варьирования

Теперь наша цель состоит в том, чтобы для каждого фактора выбрать два уровня, на которых он будет варьироваться в эксперименте.

Интервалом варьирования факторов называется некоторое число (свое для каждого фактора), прибавление которого к основному уровню дает верхний, а вычитание – нижний уровни фактора.

Другими словами, интервал варьирования – это расстояние на координатной оси между основным и верхним (или нижним) уровнем.

Таким образом, задача выбора уровней сводится к более простой задаче выбора интервала варьирования.

Заметим еще, что для упрощения записи условий эксперимента и обработки экспериментальных данных масштабы по осям выбираются так, чтобы верхний уровень соответствовал +1, нижний –1, а основной – нулю. Для факторов с непрерывной областью определения это всегда можно сделать с помощью преобразования

,

где

– кодированное значение фактора;

– натуральное значение фактора;

– натуральное значение основного уровня;

– интервал варьирования;

– номер фактора.

Для качественных факторов, имеющих два уровня, один уровень обозначается +1, а другой –1; порядок уровней не имеет значения.

На выбор интервалов варьирования накладываются естественные ограничения сверху и снизу. Интервал варьирования не может быть меньше той ошибки, с которой экспериментатор фиксирует уровень фактора. Иначе верхний и нижний уровни окажутся неразличимыми. С другой стороны, интервал не может быть настолько большим, чтобы верхний или нижний уровни оказались за пределами области определения. Внутри этих ограничений обычно еще остается значительная неопределенность выбора, которая устраняется с помощью интуитивных решений.

Обратите внимание, что при решении задачи оптимизации мы стремимся выбрать для первой серии экспериментов такую подобласть, которая давала бы возможность для шагового движения к оптимуму. В задачах же интерполяции интервал варьирования охватывает всю описываемую область.

Выбор интервалов варьирования – задача трудная, так как она связана с неформализованным этапом планирования эксперимента.

Возникает вопрос, какая априорная информация может быть полезна на данном этапе? Это – сведения о точности, с которой экспериментатор фиксирует значения факторов, о кривизне поверхности отклика и о диапазоне изменения параметра оптимизации.

Обычно эта информация является ориентировочной (в некоторых случаях она может оказаться просто ошибочной), но это единственная разумная основа, на которой можно начинать планировать эксперимент. В ходе эксперимента ее часто приходится корректировать.

Точность фиксирования факторов определяется точностью приборов и стабильностью уровня в ходе опыта. Для упрощения схемы принятия решений мы введем приближенную классификацию, полагая, что есть низкая, средняя и высокая точности.

Можно, например, считать, что поддержание температуры в реакторе с погрешностью не более 1% соответствует высокой, не более 5% – средней, а более 10% – низкой точности.

Источником сведений о кривизне поверхности отклика могут служить уже упоминавшиеся графики однофакторных зависимостей, а также теоретические соображения. Из графиков сведения о кривизне можно получить визуально.

Некоторое представление о кривизне дает анализ табличных данных, так как наличию кривизны соответствует непропорциональное изменение параметра оптимизации при равномерном изменении фактора.

Мы будем различать три случая: функция отклика линейна, функция отклика существенно нелинейна и информация о кривизне отсутствует.

Наконец, полезно знать, в каких диапазонах меняются значения параметра оптимизации в разных точках факторного пространства.

Если имеются результаты некоторого множества опытов, то всегда можно найти наибольшее или наименьшее значения параметра оптимизации.

Разность между этими значениями будем называть диапазоном изменения параметра оптимизации для данного множества опытов.

Условимся различать широкий и узкий диапазоны.

Диапазон будет узким, если он не существенно отличается от разброса значений параметра оптимизации в повторных опытах (этот разброс определяет ошибку опыта).

В противном случае будем считать диапазон широким. Учтем также случай, когда информация отсутствует.

Итак, для принятия решений используется априорная информация о точности фиксирования факторов, кривизне поверхности отклика и диапазоне изменения параметра оптимизации. Каждое сочетание градаций перечисленных признаков определяет ситуацию, в которой нужно принимать решение.

При принятых градациях возможно З3 = 27 различных ситуаций.

Теперь мы приблизились к принятию решения о выборе интервалов варьирования. Для интервалов также введем градацию. Будем рассматривать широкий, средний и узкий интервалы варьирования, а также случай, когда трудно принять однозначное решение. Размер интервала варьирования составляет некоторую долю от области определения фактора.

Можно, например, условиться о следующем: если интервал составляет не более 10% от области определения, считать его узким, не более 30% – средним, и в остальных случаях – широким. Это, конечно, весьма условно, и в каждой конкретной задаче приходится специально определять эти понятия, которые зависят не только от размера области определения, но и от характера поверхности отклика и от точности фиксирования факторов.

Перейдем к рассмотрению блок-схем принятия решений. На схеме представлены девять ситуаций, имеющих место при низкой точности фиксирования факторов.

При выборе решений учитываются информация о кривизне поверхности отклика и о диапазоне изменения параметра оптимизации. Типичное решение – широкий интервал варьирования, узкий интервал варьирования совершенно не используется, что вполне понятно при низкой точности.

Средний интервал варьирования в этой схеме выбирается дважды, причем в девятой ситуации как редко применяемая альтернатива. Здесь отсутствует информация об обоих признаках и выбор широкого интервала представляется более естественным.

Наибольшие трудности возникают, когда поверхность отклика является нелинейной. Появляется противоречие между низкой точностью фиксирования факторов и кривизной.

Первая требует расширения интервала, а вторая – сужения. Решение оказывается неоднозначным.

Возникает вопрос, как поступить в этом случае.

Приходится рассматривать дополнительные рекомендации (см. блок-схему).

Прежде всего, нужно выяснить, нельзя ли увеличить точность эксперимента либо за счет инженерных решений, либо за счет увеличения числа повторных опытов.

Если это возможно, то решения принимаются на основе блок-схемы для средней точности фиксирования факторов.

Если это невозможно, то для принятия решения нет достаточных оснований и оно становится интуитивным.

Эта блок-схема, как и последующие, служит весьма грубым приближением к действительности.

На практике учитывается ещё масса обстоятельств.

Например, решения, принимаемые по каждому фактору в отдельности, корректируются при рассмотрении совокупности факторов.




На рисунке изображена блок-схема для случая средней точности фиксирования фактора. Характерен выбор среднего интервала варьирования. Лишь в случае нелинейной поверхности и широкого диапазона рекомендуется узкий интервал варьирования.

При сочетаниях линейной поверхности с узким диапазоном и отсутствием информации о диапазоне выбирается широкий интервал варьирования.

Пунктиром, как и выше, показаны редко применяемые альтернативы.

Также построена блок-схема для случая высокой точности фиксирования фактора. Сочетание высокой точности с нелинейностью поверхности приводит к выбору узкого интервала.

Довольно часто выбирается средний интервал и лишь в двух случаях широкий. В обеих последних блок-схемах отсутствуют неоднозначные решения.

Полный факторный эксперимент

Первый этап планирования эксперимента для получения линейной модели основан на варьировании факторов на двух уровнях.

Если число факторов известно, можно сразу найти число опытов, необходимое для реализации всех возможных сочетаний уровней факторов.

В общем случае эксперимент, в котором реализуются всевозможные сочетания уровней факторов, называется полным факторным экспериментом.

Если число уровней каждого фактора равно двум, то имеем полный факторный эксперимент типа 2k.

Имеет место формула: , где N – число опытов, k – число факторов, 2 – число уровней.

Нетрудно написать все сочетания уровней в эксперименте с двумя факторами.

Напомним, что в планировании эксперимента используются кодированные значения факторов: +1 и –1 (часто для простоты записи единицы опускают).

Условия эксперимента можно записать в виде таблицы, где строки соответствуют различным опытам, а столбцы – значениям факторов.

Такие таблицы называются матрицами планирования эксперимента.

Матрица планирования для двух факторов имеет вид:

№ опыта

x1

x2

y

1

–1

–1

y1

2

+1

–1

y2

3

–1

+1

y3

4

+1

+1

y4


Каждый столбец в матрице планирования называют вектор-столбцом, а каждую строку – вектор-строкой.

Имеем 2 вектор-столбца независимых переменных и один вектор-столбец параметра оптимизации.

Если для двух факторов все возможные комбинации уровней легко найти прямым перебором (или просто запомнить), то с ростом числа факторов возникает необходимость в простом приеме построения матриц.

Обычно используется три приема, основанные на переходе от матриц меньшей размерности к матрицам большей размерности.

Рассмотрим первый. При добавлении нового фактора каждая комбинация уровней исходного плана встречается дважды: в сочетании с нижним и верхним уровнями нового фактора. Отсюда естественно появляется прием: записать исходный план для одного уровня нового фактора, а затем повторить его для другого уровня.

Вот как это выглядит при переходе от эксперимента 22 к 23:

№ опыта

x1

x2

x3

y

1

+

y1

2

+

+

y2

3

+

+

y3

4

+

+

+

y4

5

y5

6

+

y6

7

+

y7

8

+

+

y8


Этот прием распространяется на построение матриц любой размерности.

Рассмотрим второй прием. Для этого введем правило перемножения столбцов матрицы. При построчном перемножении двух столбцов матрицы произведение единиц с одноименными знаками дает +1, а с разноименными –1.

Воспользовавшись этим правилом, получим для случая, который мы рассматриваем, вектор-столбец произведения x1x2 в исходном плане.

Далее повторим еще раз исходный план, а у столбца произведений знаки поменяем на обратные.

Этот прием тоже можно перенести на построение матриц любой размерности, однако он сложнее, тем первый.

Третий прием основан на правиле чередования знаков. В первом столбце знаки меняются поочередно, во втором столбце они чередуются через два, в третьем – через 4, в четвертом – через 8 и т.д. по степеням двойки.

Свойства полного факторного эксперимента типа 2k

Мы научились строить матрицы планирования полных факторных экспериментов с факторами на двух уровнях.

Выясним, какими общими свойствами эти матрицы обладают независимо от числа факторов.

Говоря о свойствах матриц, мы имеем в виду те из них, которые определяют качество модели.

Ведь эксперимент и планируется для того, чтобы получить модель, обладающую некоторыми оптимальными свойствами.

Это значит, что оценки коэффициентов модели должны быть наилучшими и что точность предсказания параметра оптимизации не должна зависеть от направления в факторном пространстве, ибо заранее неясно, куда предстоит двигаться в поисках оптимума.

Два свойства следуют непосредственно из построения матрицы.

Первое из них – симметричность относительно центра эксперимента – формулируется следующим образом: алгебраическая сумма элементов вектор-столбца каждого фактора равна нулю, или, где j – номер фактора, N – число опытов, i = 1, 2, ..., k .

Второе свойство – так называемое условие нормировки – формулируется следующим образом: сумма квадратов элементов каждого столбца равна числу опытов, или .

Это следствие того, что значения факторов в матрице задаются +1 и –1.

Это свойства отдельных столбцов матрицы планирования.

Теперь остановимся на свойстве совокупности столбцов.

Сумма почленных произведений любых двух вектор-столбцов матрицы равна нулю, или

.

Это важное свойство называется ортогональностью матрицы планирования.

Последнее, четвертое свойство называется ротатабельностью.

Ротатабельность означает, что точки в матрице планирования подбираются так, что точность предсказания значений параметра оптимизации одинакова на равных расстояниях от центра эксперимента вне зависимости от направления.

Полный факторный эксперимент

Для движения к точке оптимума нам нужна линейная модель .

Наша цель – по результатам эксперимента найти значения неизвестных коэффициентов модели.

До сих пор мы не говорили о статистической оценке ее коэффициентов. Теперь необходимо сделать ряд замечаний по этому поводу.

Можно утверждать, что эксперимент проводится для проверки гипотезы о том, что линейная модель адекватна.

Греческие буквы использованы для обозначения «истинных» генеральных значений соответствующих неизвестных.

Эксперимент, содержащий конечное число опытов, позволяет только получить выборочные оценки для коэффициентов уравнения .

Точность и надежность зависят от свойств выборки и нуждаются в статистической проверке.

Как производится такая проверка, будет показано ниже.

Займемся вычислением оценок коэффициентов.

Их можно вычислить по замечательно простой формуле

,

Воспользуемся этой формулой для подсчёта коэффициентов и :

,

.

Благодаря кодированию факторов расчет коэффициентов превратился в простую процедуру.

Для подсчета коэффициента используется вектор-столбец х1, а для – столбец x2.

Остается неясным, как найти . Если уравнение справедливо, то оно верно и для средних арифметических значений переменных: . Но в силу свойства симметрии .

Следовательно, .

Мы показали, что есть среднее арифметическое значений параметра оптимизации. Чтобы его получить, необходимо сложить все y и разделить на число опытов.

Чтобы привести, эту процедуру в соответствие с формулой для вычисления коэффициентов, в матрицу планирования удобно ввести вектор-столбец фиктивной переменной x0, которая принимает во всех опытах значение +1.

Это было уже учтено в записи формулы, где j принимало значения от 0 до k.

Теперь у нас есть все необходимое, чтобы найти неизвестные коэффициенты линейной модели

.

Коэффициенты при независимых переменных указывают на силу влияния факторов. Чем больше численная величина коэффициента, тем большее влияние оказывает фактор.

Если коэффициент имеет знак плюс, то с увеличением значения фактора параметр оптимизации увеличивается, а если минус, то уменьшается.

Величина коэффициента соответствует вкладу данного фактора в величину параметра оптимизации при переходе фактора с нулевого уровня на верхний или нижний.

Иногда удобно оценивать вклад фактора при переходе от нижнего уровня к верхнему уровню.

Вклад, определенный таким образом, называется вкладом фактора (иногда его называют основным или главным эффектом).

Он численно равен удвоенному коэффициенту. Для качественных факторов, варьируемых на двух уровнях, основной уровень не имеет физического смысла.

Поэтому понятие «эффект фактора» является здесь естественным.

Планируя эксперимент, на первом этапе мы стремимся получить линейную модель. Однако у нас нет гарантии, что в выбранных интервалах варьирования процесс описывается линейной моделью.

Существуют способы проверки пригодности линейной модели (проверка адекватности).

А если модель нелинейна, как количественно оценить нелинейность, пользуясь полным факторным экспериментом?

Один из часто встречающихся видов нелинейности связан с тем, что эффект одного фактора зависит от уровня, на котором находится другой фактор.

В этом случае говорят, что имеет место эффект взаимодействия двух факторов.

Полный факторный эксперимент позволяет количественно оценивать эффекты взаимодействия. Для этого надо, пользуясь правилом перемножения столбцов, получить столбец произведения двух факторов.

При вычислении коэффициента, соответствующего эффекту взаимодействия, с новым вектор-столбцом можно обращаться так же, как с вектор-столбцом любого фактора.

Для полного факторного эксперимента 22 матрица планирования с учетом эффекта взаимодействия будет иметь вид

№ опыта

x0

x1

x2

x1x2

y

1

+1

+1

+1

+1

y1

2

+1

–1

+1

–1

y2

3

+1

–1

–1

+1

y3

4

+1

+1

–1

–1

y4


Очень важно, что при добавлении столбцов эффектов взаимодействий все рассмотренные свойства матриц планирования сохраняются.

Теперь модель выглядит следующим образом:

.

Коэффициент вычисляется обычным путем

.

Столбцы x1 и x2 задают планирование – по ним непосредственно определяются условия опытов, а столбцы x0 и x1x2 служат только для расчета.

Обращаем ваше внимание на то, что при оптимизации мы стремимся сделать эффекты взаимодействия возможно меньшими.

В задачах интерполяции, напротив, их выявление часто важно и интересно.

С ростом числа факторов число возможных взаимодействий быстро растет.

Мы рассмотрели самый простой случай, когда имелось одно взаимодействие. Обратимся теперь к полному факторному эксперименту 23.

№ опыта

x0

x1

x2

x3

x1x2

x1x3

x2x3

x1x2x3

y

1

+

+

+

+

y1

2

+

+

+

+

y2

3

+

+

+

+

y3

4

+

+

+

+

+

+

+

+

y4

5

+

+

+

+

y5

6

+

+

+

+

y6

7

+

+

+

+

y7

8

+

+

+

+

y8


Эффект взаимодействия x1x2x3 получается перемножением всех трех столбцов и называется эффектом взаимодействия второго порядка.

Эффект взаимодействия двух факторов называется эффектом взаимодействия первого порядка.

Вообще, эффект взаимодействия максимального порядка в полном факторном эксперименте имеет порядок, на единицу меньший числа факторов.

Довольно часто применяются синонимы: парные эффекты взаимодействия (x1x2, x2x3...), тройные (x1x2x3, x2x3x4...) и т.д.

Полное число всех возможных эффектов, включая b0, линейные эффекты и взаимодействия всех порядков, равно числу опытов полного факторного эксперимента.

Чтобы найти число возможных взаимодействий некоторого порядка, можно воспользоваться обычной формулой числа сочетаний

,

где k – число факторов, m – число элементов во взаимодействии.

Так, для плана 24 число парных взаимодействий равно шести

.

Поясним физический смысл эффекта взаимодействия следующим примером.

Пусть на некоторый химический процесс влияют два фактора: температура и время реакции. В области низких температур увеличение времени увеличивает выход продукта.

При переходе в область высоких температур эта закономерность нарушается.

Здесь, напротив, необходимо уменьшать время реакции. Это и есть проявление эффекта взаимодействия.

Ортогональность матрицы планирования позволяет получить независимые друг от друга оценки коэффициентов уравнения.

Это означает, что величина любого коэффициента не зависит от того, какие величины имеют другие коэффициенты.

Однако сформулированные выше утверждения справедливы лишь в том случае, если модель включает только линейные эффекты и эффекты взаимодействия.

Между тем, существенными могут оказаться коэффициенты при квадратах факторов, их кубах и т.д.

Так, для случая существенных квадратичных членов в двухфакторном эксперименте модель можно записать так:

.

Какую информацию о квадратичных членах можно извлечь из полного факторного эксперимента?

Попытка построения вектор-столбцов для и приводит к получению единичных столбцов, совпадающих друг с другом и со столбцом х0.

Так как эти столбцы неразличимы, то нельзя сказать, за счет чего получилась величина b0. Она включает значение свободного члена и вклады квадратичных членов.

В этом случае говорят, что имеет место смешанная оценка. Это символически записывается следующим образом:

,

где b0 – вычисленный нами коэффициент, а греческими буквами, как принято в статистике, обозначены неизвестные истинные значения свободного члена () и квадратичных коэффициентов (). Если бы мы сделали сколь угодно много опытов, то в пределе получили бы истинные значения коэффициентов. На практике реализуются лишь малые выборки, по которым вычисляются оценки истинных коэффициентов.

По отношению к квадратичной модели для двух факторов получается такая система смешивания:

, , , .

Следовательно, оценки всех коэффициентов, кроме b0, не смешаны.

Число опытов в полном факторном эксперименте превышает число коэффициентов линейной модели, причем тем больше, чем больше факторов.

Разность между числом опытов и числом коэффициентов во многих случаях оказывается очень велика, и возникает естественное желание сократить число необходимых опытов.

Дробный факторный эксперимент

Количество опытов в полном факторном эксперименте значительно превосходит число определяемых коэффициентов линейной модели.

Другими словами, полный факторный эксперимент обладает большой избыточностью опытов. Было бы заманчивым сократить их число за счет той информации, которая не очень существенна при построении линейных моделей.

При этом нужно стремиться, чтобы матрица планирования не лишилась своих оптимальных свойств.

Сделать это не так просто, но все же возможно. Итак, начнем поиск путей минимизации опытов.

Минимизация числа опытов

Начнем с самого простого – полного факторного эксперимента 2k. Запишем еще раз матрицу планирования

№ опыта

x0

x1

x2

(x3)

x1x2

y

1

+

+

y1

2

+

+

y2

3

+

+

y3

4

+

+

+

+

y4


Пользуясь таким планированием, можно вычислить четыре коэффициента и представить результаты эксперт в виде неполного квадратного уравнения

Если имеются основания считать, что в выбранных интервалах варьирования процесс может быть описан линейной моделью, то достаточно определить три коэффициента: b0, b1 и b2.

Остается одна степень свободы. Употребим ее для минимизации числа опытов. При линейном приближении и вектор-столбец x1x2можно использовать для нового фактора x3.

Поставим этот фактор в скобках над взаимодействием x1x2 и посмотрим, каковы будут оценки коэффициентов.

Здесь уже не будет тех раздельных оценок, которые мы имели в полном факторном эксперименте 2k.

Оценки смешаются следующим образом:

, , .

Но нас это не должно огорчать. Ведь мы постулируем линейную модель, и, следовательно, все парные взаимодействия незначимы.

Мы нашли способ минимизации числа опытов: вместо 8 опытов для изучения трех факторов оказывается можно поставить четыре!

При этом матрица планирования не теряет своих оптимальных свойств (ортогональность, ротатабельность и т.п.).

Найденное правило можно сформулировать так:

чтобы сократить число опытов, нужно новому фактору присвоить вектор-столбец матрицы, принадлежащий взаимодействию, которым можно пренебречь.

Тогда значение нового фактора в условиях опытов определяется знаками этого столбца.

Дробная реплика

Поставив четыре опыта для оценки влияния трех факторов, мы воспользовались половиной полного факторного эксперимента 23 или «полурепликой».

Если бы мы х3 приравняли к –x1x2, то получили бы вторую половину матрицы 23.

В этом случае , , .

При реализации обеих полуреплик можно получить раздельные оценки для линейных эффектов и эффектов взаимодействия, как и в полном факторном эксперименте 23. Объединение этих двух полуреплик и есть полный факторный эксперимент 23.

Матрица из восьми опытов для четырех факторного планирования будет полурепликой от полного факторного эксперимента 24, а для пятифакторного планирования – четверть-репликой от 25.

В последнем случае два линейных эффекта приравниваются к эффектам взаимодействия. Для обозначения дробных реплик, в которых pлинейных эффектов приравнены к эффектам взаимодействия, удобно пользоваться условным обозначением 2k-p.

Полуреплика от 23 запишется в виде 23-1 а четверть-реплика от 25 – в виде 25-2.

Выбор полуреплик. Генерирующие соотношения и определяющие контрасты

При построении полуреплики 23-1 существует всего две возможности: приравнять х3 к +x1x2 или к –x1x2.

Поэтому есть только две полуреплики 23-1.

№ опыта

x1

x2

x3

x1x2x3

1

+

+

+

+

2

+

+

3

+

+

4

+

+


№ опыта

x1

x2

x3

x1x2x3

1

+

+

2

3

+

+

4

+

+


Для произведения трех столбцов первой матрицы выполняется соотношение: , а для второй матрицы: .

Символическое обозначение произведения столбцов, равного +1 или –1, называется определяющим контрастом.

Контраст помогает определять смешанные эффекты.

Для того чтобы определить, какой эффект смешан с данным, нужно помножить обе части определяющего контраста на столбец, соответствующий данному эффекту. Так, если , то для x1 имеем

,

так как всегда .

Для x2 находим

,

для x3

.

Это значит, что коэффициенты линейного уравнения будут оценками

,

,

.

Соотношение, показывающее, с каким из эффектов смешан данный эффект, называется генерирующим соотношением.

Полуреплики, в которых основные эффекты смешаны с двухфакторными взаимодействиями, носят название планов с разрешающей способностью III (по наибольшему числу факторов в определяющем контрасте). Такие планы принято обозначать: .

При выборе полуреплики 24-1 возможны восемь решений:

  1. ,
  2. ,
  3. ,
  4. ,
  5. ,
  6. ,
  7. ,
  8. .

Разрешающая способность этих полуреплик различна. Так, реплики 1–6 имеют по три фактора в определяющем контрасте, а 7–8 по четыре.

Реплики 7 и 8 имеют максимальную разрешающую способность и называются главными. Разрешающая способность задается системой смешивания данной реплики.

Она будет максимальной, если линейные эффекты смешаны с эффектами взаимодействия наибольшего возможного порядка.

При отсутствии априорной информации об эффектах взаимодействия экспериментатор стремится выбрать реплику с наибольшей разрешающей способностью, так как тройные взаимодействия обычно менее важны, чем парные.

Если существует информация об эффектах взаимодействия, то она должна использоваться при выборе реплики.

Реплики, в которых нет ни одного главного эффекта, смешанного с другим главным эффектом или парным взаимодействием, а все парные взаимодействия смешаны друг с другом, носят название планов с разрешающей способностью IV (по наибольшему числу факторов в определяющем контрасте).

Они имеют обозначение .

Такие полуреплики называют главными полурепликами, так как они обладают наибольшей разрешающей способностью.

При выборе полуреплики 25-1 в распоряжении экспериментатора имеется множество вариантов.

Так, х5 можно приравнять к одному из 6 парных взаимодействий. В этом случае получим полуреплику с разрешающей способностью III.

Очевидно, это будет не лучший выбор полуреплики. Далее, х5 можно приравнять к одному из четырех тройных взаимодействий. Тогда получим план с разрешающей способностью IV, и все линейные эффекты будут смешаны с тройными взаимодействиями.

Наконец, полуреплика может быть задана генерирующими соотношениями или . Определяющими контрастами в этом случае будут.

и .

Такие реплики носят название планов с разрешающей способностью V и обозначаются .

Полурепликами 26-1 редко пользуются на практике.

Ведь полуреплика 26-1 требует 32 опыта, а для экспериментатора выгодны планы 26-2 или 26-3 требующие соответственно 16 и 8 опытов. Поэтому с ростом числа факторов возрастает дробность применяемых реплик.

Заметим, что при построении главных полуреплик в определяющий контраст надо включать наибольшее число факторов.

Выбор 1/4-реплик. Обобщающий определяющий контраст

При исследовании влияния пяти факторов можно поставить не 16 опытов, а только 8, т.е. воспользоваться репликой 25-2.

Здесь возможны двенадцать решений, если х4 приравнять парному взаимодействию, а х5 – тройному.

Допустим, выбран вариант и .

Тогда определяющими контрастами являются и .

Если перемножить эти определяющие контрасты, то получится третье соотношение, задающее элементы столбца .

Чтобы полностью охарактеризовать разрешающую способность реплики, необходимо записать обобщающий определяющий контраст.

.

Система смешивания определяется умножением обобщающего определяющего контраста последовательно на х1, х2, х3 и т.д.

,

,

,

,

,

,

.

Получается довольно сложная система смешивания линейных эффектов с эффектами взаимодействия первого, второго, третьего и четвертого порядков.

Если, например, коэффициенты и отличаются от нуля, то возникают сомнения, можно ли пренебрегать другими парными взаимодействиями, с которыми смешаны линейные эффекты.

Тогда следует поставить вторую серию опытов, выбрав нужным образом другую 1/4-реплику.

При этом можно воспользоваться методом «перевала».

Смысл этого метода заключается в том, что вторая четверть-реплика получается из первой путем изменения всех знаков матрицы на обратные.

Тогда в обобщающей определяющем контрасте тройные произведения имеют знак, противоположный их знаку в первой четверть-реплике.

Тройные произведения определяют парные взаимодействия в совместных оценках для линейных эффектов.

Усредняя результаты обеих четверть-реплик, можно получить линейные эффекты, не смешанные с парными взаимодействиями.

Реплики большой дробности

При выборе 1/8-реплики 26-3 можно воспользоваться вектор-столбцами трех взаимодействий, например, так:

  1. , , ;
  2. , , ;
  3. , , ;
  4. , , .

Для каждого из этих решений можно сделать шесть перестановок. Итого получается 24 возможности выбора 1/8-реплики.

Это при условии, что всюду выбираем положительные генерирующие соотношения.

Из четырех приведенных выше решений наименее удачно первое, поскольку все линейные эффекты смешиваются с парными взаимодействиями.

Если априори известно, что из всех взаимодействий наиболее существенно х1х2, то нужно выбрать второе решение, если х1х3 – третье, а если х2х3 четвертое.

Допустим, мы избрали четвертое решение, предполагая, что из факторов х4, х5, х6 наиболее существенным является х

Приравняем х4 тройному взаимодействию и запишем генерирующие соотношения

, , .

имеем следующие определяющие контрасты:

, , .

Если попарно перемножить эти определяющие контрасты, то получим

, , .

Произведение трех определяющих контрастов равно

.

Чтобы полностью охарактеризовать разрешающую способность данной 1/8-реплики, запишем обобщающий определяющий контраст

.

Получается следующая система смешивания (эффекты выше второго порядка опущены):

,

,

,

,

,

.

Рассмотрим пример 1/16-реплики от 27.

1/16 часть от полного факторного эксперимента 27 дает возможность сократить число опытов до 8 вместо 128.

Выберем следующие генерирующие соотношения:

, , , .

Для них имеем следующие определяющие контрасты:

, , , .

Обобщающий определяющий контраст

Такой обобщающий определяющий контраст получен в результате попарного перемножения исходных контрастов, затем – умножения по три и по четыре.

Если всеми коэффициентами взаимодействия, начиная с тройных, можно пренебречь, то коэффициенты будут совместными оценками:

,

,

,

,

,

,

.

Разрешающая способность такой реплики чрезвычайно мала, так как каждый линейный эффект определяется совместно с тремя парными взаимодействиями.

Такой репликой можно пользоваться только в том случае, если все парные взаимодействия равны нулю.

В большинстве случаев, начиная исследование процесса, трудно априорно предсказать, будут эффекты взаимодействия существенны или нет.

Поэтому экспериментатор должен наметить план дальнейших опытов для случая, если парные эффекты значимы и поиск оптимальных условий будет неэффективным.

Матрицу планирования для этой реплики можно получить из первой реплики, изменив в ней все знаки на обратные. Такая реплика задается генерирующими соотношениями

, , , .

В обобщающем определяющем контрасте все тройные произведения оказываются со знаком минус, и поэтому в совместных оценках для линейных эффектов не будет парных взаимодействий со знаком плюс.

Усредняя результаты вычислений для таких двух реплик, можно получить раздельные оценки для всех линейных эффектов.

С ростом числа факторов увеличивается дробность реплик и усложняется система смешивания.

Предельное число факторов для восьми опытов – семь.

В этом случае оценивается восемь коэффициентов линейного уравнения

и число степеней свободы равно нулю.

При числе факторов от 9 до 15 приходится ставить 16 опытов.

План с предельным числом факторов для данного числа опытов и заданной модели называется насыщенным.

В этом случае число опытов равно числу оцениваемых коэффициентов. Все рекомендации для выбора системы смешивания аналогичны приведенным выше.

Можно, далее, рассматривать построение дробных планов для числа факторов от 16 до 31 (при этом необходимо ставить 32 опыта), для числа факторов от 32 до 63 (здесь необходимы 64 опыта) и т.д.

Проведение эксперимента

Познакомимся с вычислением ошибки опыта, или, как ее часто называют, ошибки воспроизводимости.

Ошибки параллельных опытов

Каждый эксперимент содержит элемент неопределенности вследствие ограниченности экспериментального материала.

Постановка повторных (или параллельных) опытов не дает полностью совпадающих результатов, потому что всегда существует ошибка опыта (ошибка воспроизводимости).

Эту ошибку и нужно оценить по параллельным опытам.

Для этого опыт воспроизводится по возможности в одинаковых условиях несколько раз и затем берется среднее арифметическое всех результатов.

Среднее арифметическое равно сумме всех п отдельных результатов, деленной на количество параллельных опытов п

.

Отклонение результата любого опыта от среднего арифметического можно представить как разность где – результат отдельного опыта.

Наличие отклонения свидетельствует об изменчивости, вариации значений повторных опытов.

Для измерения этой изменчивости чаще всего используют дисперсию.

Дисперсией называется среднее значение квадрата отклонений величины от ее среднего значения.

Дисперсия обозначается 2 и выражается формулой

.

где (n – 1) – число степеней свободы, равное количеству опытов минус единица.

Одна степень свободы использована для вычисления среднего.

Корень квадратный из дисперсии, взятый с положительным знаком, называется средним квадратическим или стандартным отклонением.

Стандартное отклонение имеет размерность той величины, для которой он вычислен, это меры рассеяния, изменчивости.

Чем больше стандартное отклонение, тем больше рассеяны значения параллельных опытов около среднего значения.

Ошибка опыта являемся суммарной величиной, результатом многих ошибок: ошибок измерений факторов, ошибок измерений параметра оптимизации и др.

Каждую из этих ошибок можно, в свою очередь, разделить на составляющие.

Вопрос о классификации ошибок довольно сложный и вызывает много дискуссий.

В качестве примера одной из возможных схем классификации мы приведем схему из книги Ю.В. Кельница «Теория ошибок измерений» (М., изд-во «Недра», 1967).

Все ошибки принято разделять на два класса: систематические и случайные.

Систематические ошибки порождаются причинами, действующими регулярно, в определенном направлении. Чаще всего эти ошибки можно изучить и определить количественно.

Систематические ошибки находят, калибруя измерительные приборы и сопоставляя опытные данные с изменяющимися внешними условиями (например, при градуировке термопары по реперным точкам, при сравнении с эталонным прибором).

Если систематические ошибки вызываются внешними условиями (переменной температуры, сырья и т.д.), следует компенсировать их влияние.

Как это делать, будет показано ниже.

Случайными ошибками называются те, которые появляются нерегулярно, причины возникновения которых неизвестны и которые невозможно учесть заранее.

Систематические и случайные ошибки состоят из множества элементарных ошибок. Для того, чтобы исключать инструментальные ошибки, следует проверять приборы перед опытом, иногда в течение опыта и обязательно после опыта.

Ошибки при проведении самого опыта возникают вследствие неравномерного нагрева реакционной среды, разного способа перемешивания и т.п.

При повторении опытов такие ошибки могут вызвать большой разброс экспериментальных результатов.

Очень важно исключить из экспериментальных данных грубые ошибки, так называемый брак при повторных опытах.

Для отброса ошибочных опытов существуют правила. Для определения брака используют, например, критерий Стьюдента

.

Значение t берут из таблицы t-распределения Стьюдента.

Опыт считается бракованным, если экспериментальное значение критерия t по модулю больше табличного значения.

Дисперсия параметра оптимизации

Дисперсия всего эксперимента получается в результате усреднения дисперсий всех опытов.

По терминологии, принятой в планировании эксперимента, речь идет о подсчете дисперсии параметра оптимизации или, что то же самое, дисперсии воспроизводимости эксперимента

При подсчете дисперсии параметра оптимизации квадрат разности между значением yq в каждом опыте и средним значением из n повторных наблюдений y нужно просуммировать по числу опытов в матрице N, а затем разделить на N(n - 1):

,

Где i = 1, 2, …, N; q = 1, 2, …, n.

Такой формулой можно пользоваться в случаях, когда число повторных опытов одинаково во всей матрице.

Дисперсию воспроизводимости проще всего рассчитывать, когда соблюдается равенство числа повторных опытов во всех экспериментальных точках.

На практике весьма часто приходится сталкиваться со случаями, когда число повторных опытов различно.

Это происходит вследствие отброса грубых наблюдений, неуверенности экспериментатора в правильности некоторых результатов (в таких случаях возникает желание еще и еще раз повторить опыт) и т.п.

Тогда при усреднении дисперсий приходится пользоваться средним взвешенным значением дисперсий, взятым с учетом числа степеней свободы

,

где

– дисперсия i-го опыта;

– число степеней свободы i-м опыте, равное числу параллельных опытов ni минус 1.

Число степеней свободы средней дисперсии принимается равным сумме чисел степеней свободы дисперсий, из которых она вычислена.

Случай с неравным числом наблюдений, который мы рассмотрели выше, связан с нарушением ортогональности матрицы.

Поэтому здесь нельзя использовать расчетные формулы для коэффициентов, приведенные ранее.

Не следует забывать о проверке однородности дисперсий, неоднородные дисперсии усреднять нельзя!

Прежде чем пользовать приведённые формулы, нужно убедиться в однородности суммируемых дисперсий.

Проверка однородности дисперсий

Проверка однородности дисперсий производится с помощью различных статистических критериев.

Простейшим из них является критерий Фишера, предназначенный для сравнения двух дисперсий.

F-критерий представляет собою отношение большей дисперсии к меньшей.

Полученная величина сравнивается с табличной величиной F-критерия.

Если полученное значение дисперсионного отношения больше приведенного в таблице для соответствующих степеней свободы и выбранного уровня значимости, это означает, что дисперсии значимо отличаются друг от друга, т.е. что они неоднородны.

Если сравниваемое количество дисперсий больше двух и одна дисперсия значительно превышает остальные, можно воспользоваться критерием Кохрена.

Этот критерий пригоден для случаев, когда во всех точках имеется одинаковое число повторных опытов.

При этом подсчитывается дисперсия в каждой горизонтальной строке матрицы

,

а затем из всех дисперсий находится наибольшая которая делится на сумму всех дисперсий. Критерий Кохрена – это отношение максимальной дисперсии к сумме всех дисперсий

.

Гипотеза об однородности дисперсий подтверждается, если экспериментальное значение критерия Кохрена не превышает табличного значения.

Тогда можно усреднять дисперсии и пользоваться формулой

.

Если возникает предположение о наличии неоднородности дисперсий для случая, когда число повторных опытов неодинаково во всех точках, можно воспользоваться критерием Бартлета.

Дисперсия воспроизводимости равна:

.

Далее находится величина

,

где

.

Здесь число степеней свободы равно N–1, где N – число сравниваемых дисперсий.

При планировании эксперимента типа 2k это число равно числу опытов в матрице.

Бартлет показал, что величина приближенно подчиняется – распределению с (N–1) степенями свободы.

Значимость критерия Бартлета проверяется обычным способом.

Критерий Бартлета базируется на нормальном распределении. Если имеются отклонения от нормального распределения, то проверка неоднородности дисперсий может привести к ошибочным результатам.

Можно предложить использование F-критерия даже в тех случаях, когда число дисперсий больше двух. Делается это следующим образом.

Из всех дисперсий выделяются наибольшая и наименьшая.

По F-критерию производится проверка, значимо ли они различаются между собой. Ясно, что если наибольшая и наименьшая дисперсии не отличаются значимо, то дисперсии, имеющие промежуточные значения, также не могут значимо отличаться друг от друга.

Тогда всю группу дисперсий можно считать принадлежащей к единой совокупности.

В таких случаях нет надобности применять критерий Бартлета.

Рандомизация

Чтобы исключить влияние систематических ошибок, вызванных внешними условиями (переменой температуры, сырья, лаборанта и т.д.), рекомендуется случайная последовательность при постановке опытов, запланированных матрицей.

Опыты необходимо рандомизировать во времени. Термин «рандомизация» происходит от английского слова random – случайный.

Это ключевой принцип теории планирования эксперимента.

Разбиение матрицы типа 2k на блоки

Если экспериментатор располагает сведениями о возможных изменениях внешней среды, сырья, аппаратуры и т.п., то целесообразно планировать эксперимент таким образом, чтобы эффект влияния внешних условий был смешан с определенным взаимодействием, которое не жалко потерять.

Например, при наличии двух партий сырья матрицу 23 можно разбить на два блока таким образом, чтобы эффект сырья сказался на величине трехфакторного взаимодействия.

Тогда все линейные коэффициенты и парные взаимодействия будут освобождены от влияния неоднородности сырья.

№ блока

x0

x1

x2

x3

x1x2

x1x3

x2x3

x1x2x3

y

1

+

+

+

+

+

+

+

+

http://appmath.narod.ru/images/image145.png

+

+

+

+

+

+

+

+

+

+

+

+

2

+

+

+

+

y5

+

+

+

+

y6

+

+

+

+

y7

+

+

+

+

y8


В этой матрице при составлении блока 1 отобраны все строки, для которых , а при составления блока 2 – все строки, для которых .

Различие в сырье можно рассматривать как новый фактор .

Тогда матрица 23, разбитая на два блока, представляет собой полуреплику 24-1 с определяющим контрастом .

, ;

, ;

, ;

, ;

, ;

, ;

, ;

, ;

Эффект сырья отразился на подсчете свободного члена b0 и эффекта взаимодействия второго порядка b123.

Аналогично можно разбить на два блока любой эксперимент типа 23.

Главное – правильно выбрать взаимодействие, которым можно безболезненно пожертвовать.

При отсутствии априорных сведений выбирают взаимодействие самого высокого порядка: x1x2x3 для 23, x1x2x3х4 для 24, x1x2x3x4x5 25 и т.д.

Но если экспериментатору известно, что одно из парных взаимодействий лишено, например, физико-химического смысла, то можно пожертвовать парным взаимодействием.

Матрицу типа 2k можно разбить на количество блоков 2n (n – степень двойки) при . Так, матрица 23 разбивается на два блока по четыре опыта в каждом и на четыре блока по два опыта в каждом.

Матрица 24 – на два блока по 8 опытов в каждом, на четыре блока по четыре опыта и на восемь блоков по два опыта и т.д.

Обработка результатов эксперимента

Тщательное, скрупулезное выполнение эксперимента, несомненно, является главным условием успеха исследования.

Это общее правило, и планирование эксперимента не относится к исключениям.

Однако нам не безразлично, как обработать полученные данные. Мы хотим навлечь из них всю информацию и сделать соответствующие выводы. Как всегда, мы находимся между Сциллой и Харибдой.

С одной стороны, не извлечь из эксперимента все, что из него следует, – значит пренебречь нелегким трудом экспериментатора.

С другой стороны, сделать утверждения, не следующие из эксперимента, – значит создавать иллюзии, заниматься самообманом.

Статистические методы обработки результатов позволяют нам не перейти разумной меры риска.

Метод наименьших квадратов

Начнем с простого случая: один фактор, линейная модель.

Интересующая нас функция отклика имеет вид

Это уравнение прямой линии.

Наша цель – найти неизвестные коэффициенты b0и b1.

Как это сделать наилучшим образом?

Если бы все экспериментальные точки лежали строго на прямой линии, то для каждой из них было бы справедливо равенство

,

где i = 1, 2, ..., N – номер опыта.

Тогда не было бы никакой проблемы.

На практике это равенство нарушается и вместо него приходится писать

,

где – разность между экспериментальным и вычисленным по уравнению регрессии значениями y в i-й экспериментальной точке. Эту величину иногда невязкой.

Мы хотим найти такие коэффициенты регрессии, при которых невязки будут минимальны. Это требование можно записать по-разному.

В зависимости от этого мы будем получать разные оценки коэффициентов. Вот одна из возможных записей

,

которая приводит к методу наименьших квадратов.

Когда мы ставим эксперимент, то обычно стремимся провести больше (во всяком случае не меньше) опытов, чем число неизвестных коэффициентов.

Поэтому система линейных уравнений

оказывается переопределенной и часто противоречивой (т.е. она может иметь бесконечно много решений или может не иметь решений).

Переопределенность возникает, когда число уравнений больше числа неизвестных; противоречивость – когда некоторые из уравнений несовместимы друг с другом.

Только если все экспериментальные точки лежат па прямой, то система становится определенной и имеет единственное решение.

МНК обладает тем замечательным свойством, что он делает определенной любую, произвольную систему уравнений.

Он делает число уравнений равным числу неизвестных коэффициентов.

Для определения двух неизвестных коэффициентов требуется два уравнения.

Минимум некоторой функции, если он существует, достигается при одновременном равенстве нулю частных производных по всей неизвестным, т.е.

.

В явном виде это запишется как

,

.

Окончательные формулы для вычисления коэффициентов регрессии, которые удобно находить с помощью определителей, имеют вид

,

.

Величина называется остаточной суммой квадратов ( – значение параметра оптимизации, вычисленное из уравнения регрессии). МНК гарантирует, что эта величина минимально возможная.

Обобщение на многофакторный случай не связано с какими-либо принципиальными трудностями.

Воспользуемся тем, что матрицы планирования ортогональны и нормированы, т.е.

и

Для любого числа факторов коэффициенты будут вычисляться по формуле

В этой формуле j = 0, 1, 2 ..., k – номер фактора. Ноль записан для вычисления b0.

Так как каждый фактор (кроме x0) варьируется на двух уровнях +1 и –1, то вычисления сводятся к приписыванию столбцу y знаков соответствующего фактору столбца и алгебраическому сложению полученных значений.

Деление результата на число опытов в матрице планирования дает искомый коэффициент.

Регрессионный анализ

До сих пор мы пользовались МНК как вычислительным приемом.

Нам нигде не приходилось вспоминать о статистике.

Как только мы начинаем проверять какие-либо гипотезы о пригодности модели или о значимости коэффициентов, приходится вспоминать о статистике.

С этого момента МНК превращается в регрессионный анализ.

Регрессионный анализ как всякий статистический метод, применим при определенных предположениях, постулатах.

Первый постулат. Параметр оптимизации y есть случайная величина с нормальным законом распределения.

Дисперсия воспроизводимости – одна из характеристик нормального закона распределения.

В данном случае, как и по отношению к любым другим постулатам, нас интересуют два вопроса: как проверить его выполнимость и к чему приводят его нарушения?

При наличии большого экспериментального материала (десятки параллельных опытов) гипотезу о нормальном распределении можно проверить стандартными статистическими тестами (например, – критерием).

К сожалению, экспериментатор редко располагает такими данными, поэтому приходится принимать этот постулат на веру.

При нарушении нормальности мы лишаемся возможности установления вероятностей, с которыми справедливы те или иные высказывания.

В этом таится большая опасность. Мы рискуем загипнотизировать себя численными оценками и вероятностями, за которыми ничего не стоит.

Вот почему надо очень внимательно относиться к возможным нарушениям предпосылок.

Второй постулат. Дисперсия y не зависит от абсолютной величины Выполнимость этого постулата проверяется с помощью критериев однородности дисперсий в разных точках факторного пространства. Нарушение этого постулата недопустимо.

Всегда существует такое преобразование y, которое делает дисперсии однородными. Увы, его не всегда легко найти. Довольно часто помогает логарифмическое преобразование, с которого обычно начинают поиски.

Третий постулат. Значения факторов суть неслучайные величины. Это несколько неожиданное утверждение практически означает, что установление каждого фактора на заданный уровень и его поддержание существенно точнее, чем ошибка воспроизводимости.

Нарушение этого постулата приводит к трудностям при реализации матрицы планирования.

Более подробную информацию о методологии и технологии планировании эксперимента и его применении на современном производстве вы можете получить на курсах Академии Анализа Данных:

Предсказательные модели в промышленности и оптимизация производственных процессов

Введение в планирование экспериментов

Расширенный курс по планированию экспериментов


В начало

Содержание портала