WWW.DOC.KNIGI-X.RU
БЕСПЛАТНАЯ  ИНТЕРНЕТ  БИБЛИОТЕКА - Различные документы
 

«1. Статистический анализ данных типа времени жизни Пусть время наступления системного события – непрерывная случайная величина, значение которой зависит от ряда факторов, и ...»

1. Статистический анализ данных типа времени жизни

Пусть время наступления системного события – непрерывная случайная величина

, значение которой зависит от ряда факторов, и необходимо построить модель

зависимости времени наступления системного события от данных факторов, тогда

выборка может быть записана в виде

( t1, 1, x1 ), ( t2, 2, x2 ),..., ( tn, n, xn ),

где n – объем выборки, ti = min (Ti, Ci ) – значение наблюдения, Ti – время

наступления системного события, Ci – время завершения наблюдения за i -м объектом до наступления системного события, индикатор события i содержит информацию о причине прекращения наблюдения, i = 1, 2,..., n.

Объясняющие переменные, оказывающие влияние на продолжительность жизни или эксплуатации Ti, называются ковариатами (воздействиями) и представлены вектором xi.

Если наступление системного события произошло в ходе эксперимента, то ti = Ti, i = 1, и данное наблюдение называется полным. Если же нам неизвестно Ti по причине окончания наблюдения в момент Ci Ti, то ti = Ci, i = 0, и наблюдение называется цензурированным справа.

Цензурированные справа выборки, встречающиеся на практике, можно разделить на три основных типа и их комбинации.

Если время эксперимента ограничено, то есть наблюдение за объектами ведется до заранее определенного момента времени c, тогда i = 0 : Ci = c, и незавершенные до окончания эксперимента наблюдения называются цензурированными первого типа.

В случае, если эксперимент продолжается до наступления определенного количества ( r ) системных событий, и наблюдение за остальными объектами прекращается в момент наступления r -го системного события, то незавершенные наблюдения называются цензурированными второго типа, и i = 0 : Ci = T( r ), где T( r ) – время наступления последнего системного события.

Возможны ситуации, в которых цензурирование происходит в один момент времени – однократное цензурирование, или в различные моменты времени – многократное цензурирование. В случае многократного цензурирования моменты выбытий Ci могут быть зафиксированы, например, если при тестировании некоторых изделий в определенные моменты времени из исследования выводилось по несколько объектов.

В противном случае, если Ci – случайные величины с некоторой функцией распределения F C ( t ), то наблюдения со значениями Ci, i = 0 называются цензурированными по третьему типу или случайно цензурированными. Данный тип цензурирования, в свою очередь, делится на независимое (неинформативное) цензурирование, когда закон распределения F C ( t ) не зависит от F ( t ) – функции распределения значений Ti. При зависимом (информативном) цензурировании 3 третьего типа случайная величина Ci может зависеть от закона

–  –  –

число системных событий (вышедших из строя приборов) в момент ai, ri – число оставшихся в строю после момента ai ].

3. Параметрические модели законов, используемые в задачах исследования надежности и выживания Для одинаково распределенных случайных величин (без учета зависимости времени наступления системного события от ковариат) используется множество параметрических моделей, функции надежности и риска некоторых моделей представлены в таблице 1.

–  –  –

Оценивание параметров чаще всего производится методом максимального правдоподобия. Для случайно цензурированных выборок параметры закона распределения F ( t ) оцениваются по исходной выборке, тогда как оценки параметров распределения F C ( t ) находят по инвертированной выборке, в которой полные наблюдения рассматриваются как цензурированные и наоборот.

4. Критерии проверки однородности для цензурированных выборок

–  –  –

При справедливости нулевой гипотезы статистика логрангового критерия также принадлежит стандартному нормальному закону распределения (В асимптотике!).

5. Модифицированные критерии согласия

–  –  –

Теоретические функции распределения моментов цензурирования Сi, соответствующие закону Вейбулла и бета-распределению 1-го рода со значениями параметров, приведенными в таблице 2, представлены на рис. 1 и 2.

На этих же рисунках отображена функция распределения Вейбулла, рассматриваемая в качестве функции распределения отказов Ti, i = 1,2,..., n.

Рис. 1. Функция распределения отказов и функции распределения моментов цензурирования по законам Бета 1-го рода

–  –  –

20 0.0908 0.0935 0.0655 0.0664 30 0.0975 0.0994 0.0724 0.0707 40 0.1062 0.1077 0.0814 0.0768 50 0.1164 0.1198 0.0922 0.0857 60 0.1272 0.1369 0.1040 0.1000 70 0.1383 0.1613 0.1176 0.1216 80 0.1521 0.1899 0.1351 0.1539

–  –  –

На рис. 3 показаны изменения оценки математического ожидания статистики nDn с ростом объема выборки при степени цензурирования около 50% и различных законах распределения моментов цензурирования.

Рис. 3. Зависимость средних отклонений nDn от объема выборки при различных распределениях моментов цензурирования Как видим на рис. 3, в случае принадлежности моментов цензурирования бетараспределению 1-го рода оценка математического ожидания практически не зависит от объема выборки. В случае же принадлежности моментов цензурирования распределению Вейбулла исследуемая величина с ростом объема выборки заметно увеличивается. То есть, распределение моментов цензурирования существенно влияет на степень близости оценок Каплана-Мейера к истинной функции распределения отказов.

Методами компьютерного моделирования была исследована зависимость распределений статистик модифицированных критериев от объема выборок.

На рис. 4 представлены эмпирические распределения G ( S H 0 ) статистики модифицированного критерия Андерсона-Дарлинга при справедливости простой проверяемой гипотезы H 0 о принадлежности выборки распределению Вейбулла с параметрами Распределения статистики получены при моделировании (0, 2, 2).

N = 100000 случайно цензурированных выборок в случае принадлежности моментов цензурирования бета-распределению 1-го рода с параметрами (0, 7, 1, 1.24) при средней степени цензурирования 30%. В данном случае распределения статистики критерия практически не зависят от объема выборок n.

Рис. 4. Распределения статистики модифицированного критерия АндерсонаДарлинга при проверке простой гипотезы в случае принадлежности моментов цензурирования бета-распределению 1-го рода при различных объемах выборок На рис. 5 показаны эмпирические распределения статистики критерия АндерсонаДарлинга, полученные при тех же условиях проведения эксперимента, но в случае принадлежности моментов цензурирования распределению Вейбулла с параметрами (0, 2.48, 4.96). Средняя степень цензурирования также равна 30%. Однако в данном случае мы видим существенную зависимость распределения статистики от n.

Рис.5. Распределения статистики модифицированного критерия АндерсонаДарлинга при проверке простой гипотезы в случае принадлежности моментов цензурирования распределению Вейбулла при различных объемах выборок Таким образом, в общем случае распределения статистики модифицированного критерия Андерсона-Дарлинга зависят от объема выборки и от закона распределения моментов цензурирования. Если при степени цензурирования порядка 30% и принадлежности моментов цензурирования бета-распределению 1-го рода распределения статистики с ростом объема выборок практически не меняются, то с увеличением степени цензурирования (более 60%) распределения статистики становятся зависящими от объема выборок. И с ростом n область определения статистики смещается в сторону больших значений при любых (из рассмотренных) законах распределения моментов цензурирования. Такую зависимость распределений статистики можно легко объяснить, опираясь на результаты исследования математического ожидания величины nDn (см.

рис. 3). Аналогичные результаты были получены для распределений статистик модифицированных критериев Колмогорова и Крамера-Мизеса-Смирнова при проверке как простых, так и сложных гипотез.

Результаты исследований распределений статистик модифицированных критериев от степени цензурирования демонстрируются на примере проверки простых и сложных гипотез о принадлежности выборок распределению Вейбулла при объеме выборок n = 100.

На рис. 6 представлены распределения G ( S H 0 ) статистики модифицированного критерия Андерсона-Дарлинга при проверке простой гипотезы в случае принадлежности моментов цензурирования бета-распределению 1-го рода для степеней цензурирования 10-70 % (см. табл. 2). Для сравнения на рисунке показано распределение a2(S), являющееся предельным для критерия Андерсона-Дарлинга в случае полных выборок.

–  –  –

Как можно видеть, с увеличением степени цензурирования распределения G ( S H 0 ) статистики модифицированного критерия Андерсона-Дарлинга смещаются в область больших значений статистики. Понятно, что при проверке простых гипотез по случайно 35 цензурированным выборкам распределение a2(S) уже не является предельным распределением.

Вместе со степенью цензурирования на распределения статистик модифицированных критериев оказывает влияние и вид закона распределения моментов цензурирования FC ( x ). На рис. 7 показаны распределения статистики модифицированного критерия Андерсона-Дарлинга в случае принадлежности моментов цензурирования закону Вейбулла при степенях цензурирования 10-70 % (см. табл. 2). На рисунке для сравнения приведено также распределение a2(S). Как видим, в данном случае зависимость распределения статистики от степени цензурирования выражена менее ярко.

Рис. 7. Распределения статистики модифицированного критерия АндерсонаДарлинга при проверке простой гипотезы в случае принадлежности моментов цензурирования распределению Вейбулла при различных степенях цензурирования При цензурировании I и II типа моделирование распределений статистик критериев согласия и построение для них приближенных моделей не вызывает принципиальных трудностей как при проверке простых, так и сложных гипотез.

Но при случайном цензурировании показанные зависимости распределений статистик модифицированных критериев согласия от объемов выборок и, главное, от закона распределения моментов цензурирования ставят под вопрос возможность построения приближенных моделей распределений статистик даже для проверки конкретной простой гипотезы. Проблема заключается в том, что в реальных приложениях закон распределения моментов цензурирования, как правило, неизвестен.

В общем случае при проверке сложных гипотез распределения статистик непараметрических критериев согласия зависят от закона F0 ( x; ), с которым проверяется согласие, от числа и типа оцениваемых параметров этого закона, от метода оценивания и, возможно, от значения или значений конкретных параметров. При случайном цензурировании на это накладывается зависимость от закона распределения моментов цензурирования (и объема выборки).

Таким образом, для проверки как простых, так и сложных гипотез с использованием модифицированных критериев согласия типа Колмогорова, Крамера-Мизеса-Смирнова и Андерсона-Дарлинга необходимо иметь (знать) распределение статистики соответствующего критерия при справедливости проверяемой гипотезы (в конкретных условиях, соответствующих характеру регистрируемых наблюдений). Такие распределения могут быть найдены только в результате моделирования. А для моделирования распределений статистик необходимо подбирать распределение моментов цензурирования.

40 Для построения параметрической модели распределения моментов цензурирования необходимо иметь некоторую априорную информацию, а после построения убедиться в адекватности этой модели. (Этот путь возможен, если априорную информацию попытаться извлечь из самой цензурированной выборки. Однако, тогда мы имеем задачу идентификации закона по случайно цензурированным данным).

Поэтому для моделирования распределений статистик G ( S H 0 ) модифицированных критериев, необходимых при проверке гипотезы для определения достигнутого уровня { } ( ) значимости P S S * H 0 = 1 G S * H 0, где S * – вычисленное по выборке значение статистики критерия, был предложен и реализован следующий непараметрический алгоритм моделирования случайно цензурированных выборок (Ведерникова М.А., Чимитова Е.В.) Для того чтобы смоделировать случайно цензурированную выборку в соответствии с механизмом цензурирования исходной (анализируемой, эталонной) выборки, необходимо выполнить следующую последовательность действий.

1. Смоделировать методом обратной функции полную выборку объемом n по закону, соответствующему проверяемой гипотезе: Ti = F 1 ( i ; ), где i – псевдослучайная величина, равномерно распределенная на интервале (0,1), i = 1, 2,..., n.

2. Инвертировать исходную цензурированную выборку, изменив значения индикаторов цензурирования i на 1 i.

–  –  –

Работоспособность алгоритма исследовалась проверкой однородности случайно цензурированных выборок, генерируемых параметрическим методом (с известными законами F0 ( x; ), FС ( x ) ) и в соответствии с предложенным алгоритмом (с известным законом F0 ( x; ) и механизмом цензурирования, извлекаемым из выборки, полученной параметрическим методом).

Проверка гипотез об однородности получаемых выборок (при различной степени цензурирования) по критериям Гехана, Кокса-Мантела и логранговому показала, что с высокими значениями достигнутых уровней значимости гипотеза об однородности не должна отклоняться. Достигнутые уровни значимости при проверке однородности генерируемых выборок объемом n = 1000 приведены в таблице 4.

Таблица 4. Достигнутые уровни значимости при проверке однородности генерируемых выборок

–  –  –

На рис. 8 представлена оценка Каплана-Мейера, построенная по рассматриваемым данным, и теоретическая функция надежности, соответствующая распределению Вейбулла.

–  –  –

Для вычисления достигнутых уровней значимости необходимо найти распределение статистик при справедливости сложной проверяемой гипотезы. Для этого в соответствии с предложенным алгоритмом моделировалось N = 105 случайно цензурированных выборок, по каждой выборке оценивались параметры распределения Вейбулла и вычислялись значения статистик рассматриваемых критериев. При моделировании не наблюдалось существенного отличия между количеством цензурированных наблюдений в генерируемых выборках (среднее число цензурированных наблюдений равно 7) и в исходной выборке (см. табл. 5).

–  –  –

Применение рассмотренных модифицированных критериев согласия для анализа случайно цензурированных выборок возможно при наличии программного обеспечения, позволяющего найти необходимое для проверки гипотезы распределение статистики критерия при справедливости проверяемой гипотезы в результате моделирования, осуществляемого в интерактивном режиме. При этом моделирование случайно цензурированных выборок с законом распределения моментов цензурирования, соответствующим анализируемой выборке при справедливости H 0, может осуществляться в соответствии с предложенным алгоритмом.

6. Модели с ковариатами

6.1. Выборки с ковариатами Пусть время наступления системного события – непрерывная случайная величина, значение которой зависит от ряда факторов xi, и необходимо построить модель зависимости времени наступления системного события от данных факторов, тогда выборка может быть записана в виде ( t1, 1, x1 ), ( t2, 2, x2 ),..., ( tn, n, xn ),

–  –  –

Модель получила широкое распространение, поскольку в общем случае она не связана с какими-либо предположениями относительно распределения времен жизни (времен отказов). Для построения модели Кокса необходимо определить вид функции r ( x; ).

В качестве функции воздействия r ( x; ) наиболее часто выбираются следующие:

–  –  –

логарифмически линейная форма r ( x; ) = exp ( ' x ).

Модель пропорциональных интенсивностей с учетом введенной параметризации называется полупараметрической.

Если в модели Кокса вводится некоторое предположение о законе распределения времен жизни, то есть вводится параметризация как для функции воздействий r ( x; ), так и для базовой функции риска 0 ( t ), то модель является параметрической.

В качестве базового распределения при построении параметрической модели пропорциональных интенсивностей используются различные параметрические модели законов распределения случайных величин.

В качестве примеров на рисунке представлены функции выживаемости для параметрических моделей пропорциональных интенсивностей с различными базовыми распределениями отказов.

Рисунок 1 – Функции надежности параметрических моделей пропорциональных интенсивностей с разными базовыми распределениями

–  –  –

6.5. Идентификация параметрической модели пропорциональных интенсивностей Для идентификации параметрической модели пропорциональных интенсивностей (для выбора наиболее подходящего базового закона F0 ( t ; ) и функции от ковариат r ( x; ) ) необходимо для каждого из возможных способов параметризации базовой функции риска:

– оценить регрессионные параметры и параметры базового закона распределения ;

– вычислить значение статистики критерия Колмогорова, Крамера-Мизеса-Смирнова или Андерсона-Дарлинга;

– оценить достигнутый уровень значимости по соответствующему предельному распределению статистики.

Для выполнения последнего этапа требуется знание предельного распределения статистики критерия согласия, соответствующего проверке (простой или сложной) гипотезы относительно базового распределения F0 ( t ; ), используемого при построении модели (это может быть известное или полученное в результате моделирования эмпирическое распределение статистики).

Параметрическая модель, которой будет соответствовать наибольший достигнутый уровень значимости, будет являться наиболее предпочтительной для проведения дальнейшего анализа (с позиции применяемого критерия согласия).

6.6. Алгоритм построения модели пропорциональных интенсивностей Пусть имеется исходная выборка с ковариатами. Для построения параметрической модели пропорциональных интенсивностей необходимо выполнить следующую последовательность действий:

1. В зависимости от природы объясняющих переменных выбрать форму функции от ковариат r ( x; ). Часто выбирается логарифмически линейная функция воздействий, так как модель с данной параметризацией является достаточно универсальной и оказывается наиболее простой для дальнейшего анализа.

2. Выбрать базовый закон распределения F0 ( t ; ). Данный пункт необязателен, если есть обоснованные предположения относительно распределения моментов отказов.

В противном случае требуется идентификация параметрической модели.

3. Найти оценки максимального правдоподобия регрессионных параметров и параметров базового закона распределения.

4. Проверить адекватность построенной модели на основании проверки сложной гипотезы о принадлежности выборки остатков базовому закону распределения.

При проверке адекватности:

4.1. В случае полной исходной выборки и, следовательно, нецензурированной выборки остатков, сформированной на основе исходной выборки и построенной модели с параметрами и, могут применяться критерии Колмогорова, КрамераМизеса-Смирнова или Андерсона-Дарлинга. При этом для оценки достигаемого уровня значимости * в качестве предельных распределений статистик могут использоваться ранее построенные их аппроксимации. В случае отсутствия таких аппроксимаций для определенных F0 ( t ; ), требуемые эмпирические распределения статистик могут быть найдены в результате их моделирования.

–  –  –

4.3. Если достигаемый уровень значимости * окажется меньше заданного, то отклонить гипотезу об адекватности построенной модели.

7. Статистические модели ускоренных испытаний (AFT-модели)

7.1 Введение Задачи, связанные с исследованием надежности, анализом выживаемости, в которых оперируют данными типа времени жизни, рассматриваются во многих областях науки и техники, в медицине, биологии, в актуарных расчетах и т.п. В инженерных расчетах это могут быть времена отказов некоторых приборов или технических систем. В медицине такие данные могут представлять собой время до изменения некоторых биохимических показателей, время до ремиссии после определенного вида лечения или время жизни пациентов. В качестве факторов, влияющих на распределение продолжительности жизни, рассматривают различные программы лечения, прием настоящих лекарств и их аналогов. В качестве факторов может выступать возраст пациента, его хронические заболевания и вредные привычки.

Статистический анализ данных типа времени жизни позволяет получать некоторые выводы о неизвестных показателях продолжительности жизни объекта – о функции надежности (функции выживаемости), функции риска, среднему времени наработки до отказа и других.

В инженерных науках анализ данных типа времени жизни обычно связывают с понятием надежности различных технических систем и объектов. Надежность является одним из самых важных показателей современной техники, от нее зависят такие критерии, как качество и эффективность продукции.

Зачастую требования к различным показателям надежности технических систем известны заранее, а в результате экспериментов надо оценить эти показатели, чтобы подтвердить соответствие произведенной продукции этим требованиям. Далее на основании показателей надежности можно обосновать длительность и условия гарантийного обслуживания производимой продукции.

Как правило, общим свойством анализируемых данных (результатов измерений, результатов наблюдений над испытуемыми объектами) в таких задачах является их неполнота. Например, во время испытаний может выйти из строя лишь некоторая доля исследуемых объектов. Часть объектов по каким-то причинам может быть снята с испытаний.

Время испытаний может быть ограничено и к концу эксперимента значительная часть объектов останется работоспособной. Такие данные называют цензурированными справа. В условиях ограниченности эксперимента по времени получают цензурированную I типа выборку. Цензурирование II типа возникает, если испытания продолжаются до наступления заранее определенного количества отказов (результатов измерений).

Анализу данных типа времени жизни посвящено множество публикаций, разработаны способы описания и представления данных, предложены различные модели, учитывающие их особенности для различных приложений. В первых работах, посвященных анализу данных типа времени жизни, в основном рассматривались простые модели, различающиеся параметризацией функции надежности. Среди этих моделей можно выделить функции надежности, опирающиеся на экспоненциальный закон, на распределение Вейбулла, на гамма-распределение, на обратное гауссовское и другие.

Модели ускоренных испытаний (Accelerated Failure Time) занимают особое место в теории надежности. Интерес к ним в последнее время возрастает в связи с увеличением доли производства высоконадежных и высокотехнологичных изделий и систем.

Проектирование и создание таких устройств ориентировано на безотказную работу в течение длительного периода времени. За время, которое может быть отведено на испытания и исследование надежности при нормальных условиях эксплуатации, вероятность отказа устройства оказывается очень малой. Чтобы в подобной ситуации получить достаточное количество данных для анализа, испытания проводят при воздействиях, превышающих нагрузку, рассчитанную для нормальных условий.

Соответствующие испытания называют ускоренными. Применение повышенных воздействий укорачивает длительность жизни систем, и отказы будут наблюдаться в течение времени, отведенного на сбор экспериментальных данных.

AFT-модели предназначены для оценивания функции надежности изделий (систем), функционирующих в нормальных условиях эксплуатации (при воздействии нормальных нагрузок), по данным об отказах, полученным в результате ускоренных испытаний (при использовании повышенных нагрузок).

Не смотря на то, что вопросам построения параметрических AFT-моделей посвящено множество (в основном, зарубежных) публикаций, в этих задачах остается много нерешенных проблем.

Во-первых, на качество AFT-моделей (на оценки параметров) существенное влияние оказывает наличие цензурированных наблюдений. Во-вторых, налицо ряд проблем, связанных с проверкой адекватности построенных AFT-моделей.

Например, оценки максимального правдоподобия параметров законов распределения по цензурированным выборкам I-го или II-го типа являются асимптотически эффективными, то есть в асимптотике подчиняются нормальному закону. Однако при ограниченности объемов выборок и наличии значительной доли цензурированных наблюдений I-го или II-го типа распределения оценок параметров, наблюдаемых законов распределения вероятностей становятся асимметричными, а сами оценки оказываются смещенными. Естественно это отражается на качестве построенных моделей законов.

Кроме того, цензурирование отражается на процедурах проверки адекватности моделей. Например, при проверке сложных гипотез о принадлежности полных выборок некоторому теоретическому закону и оценивании параметров закона по той же самой выборке распределения статистик непараметрических критериев согласия зависят от следующих факторов: от закона, с которым проверяется согласие, от числа и типа оцененных параметров, от значения параметра формы. В случае цензурированных выборок к указанным факторам добавляется ещё и зависимость распределений статистик от степени цензурирования.

При построении и анализе AFT-моделей перечисленные проблемы, связанные с наличием цензурированных данных, сохраняются и усиливаются.

–  –  –

Отсюда можно найти момент времени t z. Таким образом, моменты t1 для 74 повышенного воздействия и t z для нормального воздействия эквивалентны в смысле вероятности отказа. Следовательно, мы можем сдвинуть часть функции надежности влево на величину t z t1. Таким образом, получим непрерывную кусочно-гладкую функцию с изломом в точке t1, то есть в точке смены воздействий (рис. 7.2).

S x (t ), t t1;

S (t ) = 1 S x0 (t + t z t1 ), t t1.

Рис. 7.2 – Вид функции надежности для рассматриваемой AFT-модели Данный принцип можно обобщить на произвольный план эксперимента с любым количеством точек смен воздействия. В случае ступенчатого воздействия, когда план испытаний определяется соотношением (3), функция надежности объекта, который отказал под воздействием xi, определяется выражением

–  –  –

где Fn ( t ) – оценка Каплана-Мейера функции распределения, F0 ( t ; ) – теоретическая функция распределения, соответствующая проверяемой гипотезе.

–  –  –

2. При необходимости в соответствии с заданной схемой цензурирования преобразовать полную выборку в цензурированную ( X 1, 1, x 1 ),..., ( X n, n, x n ).

3. Вычислить оценки максимального правдоподобия параметров и по выборке ( X,, x ),..., ( X, n, x n ).

1 1 n

4. Вычислить остатки для проверяемой модели (по (8) или (9)).

5. По выборке остатков вычислить значение статистики критерия (по (11), (12) или (13)).

6. Повторив пункты 1-5 N раз, получим эмпирическое распределение статистики GN ( S n | H 0 ).

Выбор объема N обусловлен желаемой точностью моделирования.

В результате исследования проблем, связанных с применением модифицированных критериев согласия для анализа выборок остатков, предложен и реализован интерактивный алгоритм проверки адекватности параметрической AFT-модели.

Разработанные в настоящей работе алгоритмы моделирования распределений статистик критериев согласия с параметрической AFT-моделью на основе выборок остатков реализованы в программной системе статистического анализа данных типа времени жизни LiTiS (http://amsa.conf.nstu.ru/amsa2011/Litis.msi). Данная программная система позволяет вычислять оценки максимального правдоподобия параметров AFTмодели для широкого круга базовых законов распределения и различных функций воздействия, корректно осуществлять проверку построенной AFT-модели с использованием модифицированных критериев согласия, а также моделировать распределения оценок и статистик критериев согласия для заданных AFT-моделей и планов проведения испытаний.

7.6. Исследование распределений статистик критериев в случае постоянных во времени воздействий Проведенные в данной работе исследования показали, что, как и следовало ожидать, в случае полных данных, когда соотношения для статистик (11)-(13) совпадают с классическими выражениями, распределения G ( S n H 0 ) рассматриваемых критериев не зависят от вида функции от воздействия r ().

Таким образом, для проверки гипотезы о принадлежности выборки остатков распределению F0 (t, ) (для проверки адекватности параметрических AFT-моделей) с 89 применением модифицированных критериев согласия можно использовать предельные распределения статистик G ( S n H 0 ), модели которых были получены ранее. Результаты статистического моделирования подтвердили, что даже при малых объемах выборок остатков распределения статистик непараметрических критериев совпадают с аппроксимациями распределений этих статистик, полученными для моделей без ковариат.

В случае цензурированных данных распределения статистик зависят как от степени, так и от типа цензурирования. При этом важным фактором оказывается схема цензурирования. Например, ограничение по времени (цензурирование I типа) или ограничение по количеству отказов (цензурирование II типа) может быть задано либо единым для всех n объектов, либо определено отдельно для каждой группы объектов. В последнем случае выборка остатков будет представлять собой многократно цензурированную выборку.

–  –  –

Рис. 7.3. Распределения статистики Колмогорова для различных планов проведения испытаний Для сравнения на рисунке представлена аппроксимация предельного распределения статистики Колмогорова при проверке сложной гипотезы о согласии с распределением Вейбулла, полученная для данных без ковариат (гамма-распределение с параметром сдвига 0.2598, масштаба 0.0563 и формы 6.6012).

Как видно на рисунке 7.3, даже при полных данных (не цензурированных) распределение статистики критерия согласия в случае зависящих от времени ковариат существенно отличается от аппроксимации предельного распределения этой статистики, имеющей место для моделей без ковариат.

Таким образом, в отличие от случая с постоянными во времени воздействиями, применение ранее построенных в моделей распределений статистик рассматриваемых критериев для вычисления достигнутого уровня значимости будет некорректным при проверке адекватности параметрической AFT-модели с зависящими о времени ковариатами. В этом случае распределения статистик могут быть получены с помощью методов статистического моделирования с использованием представленного выше алгоритма.

7.8. Выбор базовой функции надежности.

Одной из ключевых проблем при построении параметрических моделей функций надежности, в том числе моделей с ковариатами и AFT-моделей, является проблема выбора базового закона или семейства распределений. На практике, как правило, априорной информации для однозначного выбора базового закона или семейства распределений оказывается недостаточно.

В качестве меры, указывающей на предпочтительность выбора того или иного базового распределения вероятностей F0 ( x, ), можно использовать достигнутые уровни значимости, полученные при проверке гипотез о принадлежности выборки остатков базовому закону F0 ( x, ) с использованием критериев согласия.

Пример 1.

Продемонстрируем такую возможность на примере подбора базовой функции распределения для задачи построения функции надежности электроизоляционных жидкостей, результаты ускоренных испытаний которых приведены в (Lawless J.F., 2002). В данных испытаниях все объекты были разбиты на семь групп. Внутри каждой группы объекты наблюдались под постоянным повышенным напряжением от 26 до 38 kV. Цель ускоренных испытаний заключалась в оценке функции надежности электроизоляционных жидкостей под «нормальным» напряжением в 20 kV. Заметим, что в этих экспериментах все испытания заканчивались отказом испытуемого объекта, 94 следовательно, данные об отказах являются полными (нет цензурированных наблюдений). План испытаний и моменты отказов приведены в таблице 1. Следует обратить внимание, что время от начала испытания до момента отказа с повышением напряжения существенно сокращается, а ni указывает на число испытаний, проведенных под соответствующей нагрузкой.

Таблица 1. План испытаний и моменты отказов Напряжение, ni Моменты отказов [мин.

] kV 26 3 5.79, 1579.52, 2323.7 28 5 68.85, 426.07, 110.29, 108.29, 1067.6 30 11 17.05, 22.66, 21.02, 175.88, 139.07, 144.12, 20.46, 43.40, 194.90, 47.30, 7.74 0.40, 82.85, 9.88, 89.29, 215.10, 2.75, 0.79, 15.93, 3.91, 0.27, 0.69, 100.58, 27.80, 13.95, 53.24 0.96, 4.15, 0.19, 0.78, 8.01, 31.75, 7.35, 6.50, 8.27, 33.91, 32.52, 3.16, 4.85, 2.78, 4.67, 1.31, 12.06, 36.71, 72.89 36 15 1.97, 0.59, 2.58, 1.69, 2.71, 25.50, 0.35, 0.99, 3.99, 3.67, 2.07, 0.96, 5.35, 2.90, 13.77 38 8 0.47, 0.73, 1.40, 0.74, 0.39, 1.13, 0.09, 2.38

–  –  –

Так как в данном примере отсутствовали цензурированные измерения, при проверке адекватности и выборе наиболее подходящей AFT-модели в качестве распределений статистик применяемых критериев согласия использованы готовые результаты.

Как видно из таблицы 3, при уровне значимости 0.09 гипотеза о согласии не отвергается для всех моделей, кроме модели, построенной на основе экспоненциального закона. Однако для AFT-модели, построенной на основе обобщенного распределения Вейбулла, достигнутые уровни значимости по всем критериям существенно выше.

Следовательно, эта модель и является наиболее предпочтительной из рассмотренных базовых законов.

Пример 2. В качестве примера подбора модели по цензурированным измерениям рассмотрим данные об отказах моторов.

План испытаний и данные об отказах приведены в (Crawford D.E., 1970), анализ этих данных проводился в (Prentice R.L.,1973) и (Kalbeisch J.D., Prentice R.L.,2002).

В данных испытаниях исследуемые объекты были поделены на 4 группы, в каждой из которых они наблюдались под воздействием повышенной температуры. Время испытаний было ограничено для каждой из групп. Из наблюдаемых 40 объектов, отказали только 17. Цель исследований заключалась в оценке надежности объектов в нормальных условиях функционирования – при температуре в 130°C. В таблице 4 приведены значения повышенного воздействия для каждой из групп и моменты отказов.

–  –  –

2 = 0.0010 0.00 0.0013 = 13.2782 13.21 13.34

–  –  –

По значениям ln L для рассмотренных AFT-моделей можно предположить, что наиболее предпочтительными являются модели, опирающиеся на базовые законы распределения Вейбулла и обобщенного Вейбулла. Для определения наиболее подходящей AFTмодели с использованием непараметрических критериев согласия проверялись гипотезы о принадлежности выборок остатков соответствующему базовому закону.

Распределения статистик критериев, используемых для проверки сложных гипотез относительно рассматриваемых законов (при наличии имеющейся в данном случае степени цензурирования), неизвестны, но они необходимы для формирования окончательного вывода. Подчеркнем, что при проверке сложных гипотез относительно обобщенного распределения Вейбулла распределения статистик соответствующих критериев согласия G ( S n H 0 ) зависят от значения параметра 2 этого распределения.

Так как в описанном эксперименте использовано цензурирование I-го типа, то в данном случае для нахождения эмпирических распределений G ( S n H 0 ) статистик (11) – (13) модифицированных непараметрических критериев согласия Колмогорова, КрамераМизеса-Смирнова и Андерсона-Дарлинга использована методика компьютерного моделирования [30] и описанный выше алгоритм моделирования распределений статистик критериев согласия, применяемых в задачах анализа AFT-моделей. Эмпирические распределения статистик моделировались в соответствии с условиями испытаний, заданными в таблице 4 (нагрузках, моментах цензурирования, числе групп и количестве объектов в группе, при n = 40 ). А далее в соответствии с построенными распределениями G ( S n H 0 ) статистик и вычисленными по выборкам остатков значениями * статистик Sn критериев согласия определены достигнутые уровни значимости P{Sn S n }.

*

–  –  –

0.286 0.003 0.003 0.014 0.017 0.024 0.016 0.020 0.049 0.054 0.607 0.003 0.002 0.018 0.024 0.029 0.015 0.018 0.039 0.061 0.

969 0.003 0.003 0.014 0.013 0.013 0.007 0.018 0.030 0.045 1.389 0.002 0.003 0.011 0.011 0.023 0.009 0.014 0.041 0.052 1.884 0.002 0.003 0.018 0.018 0.012 0.007 0.016 0.024 0.045 2.491 0.002 0.002 0.016 0.011 0.012 0.009 0.019 0.029 0.044 3.273 0.002 0.003 0.008 0.010 0.022 0.018 0.012 0.040 0.042 4.375 0.001 0.003 0.019 0.029 0.036 0.023 0.020 0.045 0.067 6.259 0.002 0.002 0.013 0.013 0.018 0.015 0.009 0.044 0.051 Как видно из таблицы 8.1 в случае экспоненциальной модели и функции от ковариат без свободного параметра, оценки регрессионного параметра обладают хорошими свойствами – являются практически несмещенными и имеют небольшой разброс.

Распределения статистик критериев для данной модели хорошо согласуются с соответствующими предельными распределениями, о чем можно судить по величинам Dn. Также можно сказать, что значение момента смены воздействия не оказывает значительного влияния ни на свойства оценок, ни на распределения статистик критериев согласия.

В таблице 8.2 приведены результаты моделирования для экспоненциальной модели с функцией от ковариат вида: r ( x(t ), ) = e0 +1x ( t ), оценивались оба параметра 0.и 1.

Таблица 8.2 – Экспоненциальная AFT-модель с логлинейной функцией от ковариат со свободным параметром (оценивались оба параметра)

–  –  –

0.105 0.781 0.057 0.336 0.012 0.418 0.446 0.458 0.428 0.389 0.352 0.333 0.223 0.781 0.056 0.346 0.012 0.406 0.427 0.436 0.395 0.368 0.334 0.316 0.357 0.770 0.052 0.341 0.011 0.406 0.428 0.436 0.405 0.369 0.340 0.321 0.511 0.791 0.052 0.344 0.013 0.409 0.434 0.445 0.421 0.380 0.359 0.355 0.693 0.779 0.055 0.339 0.011 0.429 0.453 0.460 0.425 0.391 0.369 0.347 0.916 0.788 0.056 0.345 0.012 0.430 0.452 0.462 0.421 0.393 0.352 0.340 1.204 0.792 0.051 0.347 0.013 0.400 0.427 0.433 0.386 0.359 0.326 0.315 1.609 0.789 0.051 0.347 0.010 0.401 0.429 0.432 0.401 0.370 0.343 0.327 2.303 0.781 0.053 0.341 0.012 0.422 0.445 0.452 0.420 0.389 0.363 0.338

–  –  –

0.105 0.780 0.065 0.410 0.430 0.439 0.413 0.386 0.338 0.322 0.223 0.770 0.071 0.426 0.450 0.456 0.408 0.374 0.357 0.327 0.357 0.760 0.072 0.429 0.449 0.452 0.416 0.383 0.351 0.321 0.511 0.784 0.065 0.440 0.455 0.459 0.432 0.403 0.361 0.353 0.693 0.772 0.062 0.388 0.410 0.421 0.398 0.360 0.330 0.316 0.916 0.781 0.062 0.428 0.453 0.456 0.419 0.366 0.339 0.322 1.204 0.778 0.062 0.392 0.411 0.419 0.391 0.353 0.339 0.325 1.609 0.767 0.067 0.421 0.440 0.452 0.417 0.381 0.332 0.313 2.303 0.787 0.066 0.418 0.445 0.451 0.412 0.389 0.374 0.350 В таблице 8.4 приведены результаты моделирования для экспоненциальной модели с функцией от ковариат вида: r ( x(t ), ) = e0 +1x ( t ), оценивался только параметр 1.

–  –  –

0.105 0.773 0.016 0.398 0.415 0.422 0.389 0.366 0.341 0.337 0.223 0.777 0.016 0.396 0.416 0.417 0.379 0.348 0.336 0.319 0.357 0.768 0.017 0.419 0.444 0.448 0.426 0.392 0.375 0.361 0.511 0.777 0.016 0.411 0.432 0.437 0.398 0.370 0.347 0.334 0.693 0.773 0.016 0.429 0.445 0.451 0.412 0.391 0.360 0.346 0.916 0.762 0.017 0.447 0.468 0.471 0.446 0.416 0.394 0.386 1.204 0.772 0.017 0.416 0.435 0.442 0.398 0.371 0.342 0.340 1.609 0.773 0.017 0.423 0.443 0.451 0.416 0.395 0.379 0.369 2.303 0.778 0.016 0.401 0.432 0.441 0.395 0.369 0.336 0.320

–  –  –

0.325 1.139 0.005 0.220 0.007 0.010 0.003 1 1 1 1 1 1 1 0.472 1.144 0.004 0.218 0.005 0.013 0.003 1 1 1 1 1 1 1 0.597 1.141 0.005 0.222 0.006 0.012 0.003 1 1 1 1 1 1 1 0.715 1.144 0.004 0.219 0.006 0.010 0.003 1 1 1 1 1 1 1 0.833 1.142 0.005 0.224 0.006 0.012 0.003 1 1 1 1 1 1 1 0.957 1.142 0.005 0.220 0.007 0.010 0.003 1 1 1 1 1 1 1 1.097 1.144 0.004 0.219 0.006 0.011 0.003 1 1 1 1 1 1 1 1.269 1.143 0.004 0.220 0.006 0.010 0.003 1 1 1 1 1 1 1 1.517 1.141 0.005 0.224 0.007 0.013 0.003 1 1 1 1 1 1 1 В таблице 8.7 приведены результаты моделирования для модели Вейбулла с функцией от ковариат вида: r ( x(t ), ) = e0 +1x (t ), оценивался только свободный параметр 0.

Таблица 8.7 – AFT-модель Вейбулла с логлинейной функцией от ковариат со свободным параметром (оценивался только свободный параметр)

–  –  –

На основании результатов моделирования для модели Вейбулла с функцией от ковариат со свободным параметром, представленных в таблицах 8.6, 8.7 и 8.8, можно сделать вывод, что, также как и для экспоненциальной модели, наличие свободного параметра в функции от ковариат существенно влияет на свойства оценок и распределения статистик критериев согласия. Свойства оценок при наличии свободного параметра существенно ухудшились – оценки (как параметра формы, так и регрессионных параметров) стали сильно смещенными относительно своих истинных значений. Такие плохие оценки сказываются и на распределениях статистик критериев согласия – как видно из таблиц, эмпирические распределения статистик существенно отклоняются от соответствующих «предельных» распределений.

8.3 Исследования свойств оценок и распределений статистик по цензурированным выборкам В данном разделе приводятся исследования распределений статистик критериев согласия в случае цензурированных данных и зависящих от времени координат.

Условия, при которых проводилось моделирование абсолютно идентичны условиям, описанным в разделах 8.1 8.2. При моделировании распределений статистик критериев согласия было использовано цензурирование I типа. В качестве точки цензурирования tC были использованы моменты времени, которые различным образом расположены по отношению к точке смены воздействия t1.

На рисунке 8.3 приведены распределения статистик модифицированного критерия Колмогорова для экспоненциальной модели по цензурированным данным для различных значений момента смены воздействия t1 и момента цензурирования tC. В качестве функции от ковариат была выбрана логлинейная модель без свободного параметра.

Рисунок 8.3 – Распределения статистик критерия Колмогорова для экспоненциальной модели по цензурированным данным Как видно из рисунка 85.

3, выбор момента точки смены воздействия не оказывает влияния на распределение статистики модифицированного критерия Колмогорова, зато существенное влияние оказывает выбор момента цензурирования. Например, можно увидеть, что при одном и том же моменте цензурирования tC = 6.259 для разных моментов смены воздействия ( t1 = 0.286, t1 = 1.884, t1 = 4.375 ) распределения статистики модифицированного критерия Колмогорова практически совпадают. Однако для одного и того же момента смены воздействия t1 = 0.286 распределения статистик для моментов цензурирования tC = 1.884 и tC = 6.259 существенно отличаются.

Аналогичные результаты были получены для модифицированных критериев Крамера-Мизеса-Смирнова и Андерсона-Дарлинга.

На рисунке 8.4 приведены распределения статистик модифицированного критерия Колмогорова для экспоненциальной модели по цензурированным данным для различных значений момента смены воздействия t1 и момента цензурирования tC.

Рисунок 8.4 – Распределения статистик критерия Колмогорова для модели Вейбулла по цензурированным данным Из рисунка 8.

4 видно, что выводы относительно влияния значений моментов смены воздействия и момента цензурирования на распределение статистик модифицированного критерия Колмогорова, сделанные для экспоненциальной модели, справедливы и для модели Вейбулла.

Аналогичные результаты были получены для модифицированных критериев Крамера-Мизеса-Смирнова и Андерсона-Дарлинга.

Похожие работы:

«Аксенов Константин Валерьевич, канд. экон. наук, доцент, regionkos@mail.ru, Россия, Орел, ФГБОУ ВПО "Государственный университет – учебно-научнопроизводственный комплекс" THE DIMANICHESKY ACTIVITY PRINCIPLES FORMING AND FUNTSIONIROVANII INN...»

«Условия предоставления АО "РН Банк"1 (далее Банк) кредитов физическим лицам на приобретение автомобилей. Действительно с 22 февраля 2017 года. Новый автомобиль с Тип кредитного продукта Новый автомобиль Подержанный автомобиль отложенным платежом* Renault (Kaptur), Все модели любая иностранная м...»

«ПАСТАЎСКІ РАЁННЫ ПОСТАВСКИЙ РАЙОННЫЙ ВЫКАНАЎЧЫ КАМІТЭТ ИСПОЛНИТЕЛЬНЫЙ КОМИТЕТ (Пастаўскі райвыканкам) (Поставский райисполком) РАШЭННЕ РЕШЕНИЕ 5 лютага 2014 г. № 117 г. Паставы г. Поставы Об образовании участковых избирательных комиссий по выборам депутат...»

«ИНОСТРАННЫЙ ЯЗЫК Общая характеристика программы Примерная программа по иностранному языку для основной школы составлена на основе Фундаментального ядра содержания общего образования и Требований к результатам основного общего образования, представленных в федеральном государственном об...»

«ОГЛАВЛЕНИЕ О собаке О владельце Необходимые телефоны и адреса Прививки Рацион питания Изменение веса Лечение Общий курс дрессировки Восстановление забытых навыков Специальный курс дрессировки Восстановление забытых навыков Практика Подготовка служебной собаки Восстановление забытых навык...»

«Таджикистан Страновой отчет по выполнению Плана действий Стратегии содействия транспорту и торговле Подготовлен: Г-н Рустам Аминджанов, Советник национального координатора Г-н Бахридин Азаматов, Координатор ЦАРЭС 24 Апреля 2009 I. Содействие торговле и транспорту 1. Правительство Таджик...»

«Женщина и общество в философии феминизма второй волны (на основе творчества симоны де бовуар и бетти фридан) Крыкова Ирина Викторовна, аспирантка ТГУ им. Г.Р. Державина Аннотация. В статье рассматривается одна из центральных проблем философии феминизма проблема назначе...»

«Российская Академия Наук Институт философии творчество: эпистемологический анализ Москва УДК 165+155.4 ББК 15.56+88.4 Т 28 ответственный редактор доктор филос. наук Е.Н. Князева рецензенты доктор филос. наук Н.С. Автономова доктор филос. наук Б.И. Пружинин творчество: эпистемологический анали...»

«564 НАЧАЛЬНИКИ РО АРМИЙ ЧЕСАКОВ Илья Иванович 20.07.1909 г., г. Оренбург – ? Украинец. Полковник (25.11.1943). В Красной Ар мии с декабря 1929 г. Член компартии с 1937 г. Окон чил команду одногодич...»

«СОДЕРЖАНИЕ ОБЩИЕ СВЕДЕНИЯ СТРУКТУРНАЯ СХЕМА ИСО "ОРИОН" СОСТАВ СИСТЕМЫ ПРИНЦИП ПОСТРОЕНИЯ ИСО "ОРИОН" ФУНКЦИОНАЛЬНАЯ СТРУКТУРА СИСТЕМЫ СИСТЕМА ПОЖАРНОЙ СИГНАЛИЗАЦИИ Назначение и задачи ПС Принципы обнаружения факторов пожара Типы систем пожарной сигнализации Неадресная (традиционная) система пожарной сигнализаци...»

«Ю. Ю. Васькин Новосибирский государственный университет ул. Пирогова, 2, Новосибирск, 630090, Россия email: vaskin90@gmail.com И. В. Хомичева Институт цитологии и генетики СО РАН м.н.с. пр. Академика Лаврентьев...»

«Lingua mobilis № 6 (39), 2012 АНТРОПОНИМИЧЕСКОЕ ПОЛЕ РЕКЛАМЫ 90-Х ГГ. О. В. Кирпичева В статье описывается роль антропонимов в рекламе 90-х гг. (на примере роликов АО "МММ"). Автор анализирует различные виды личных имен, которые обусловили формирование феномена АО "МММ". Совокупность этих имен образует антропонимич...»









 
2017 www.doc.knigi-x.ru - «Бесплатная электронная библиотека - различные документы»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.