— Все документы — Нормативные документы по надзору в области строительства — Нормативные документы по санитарно-эпидемиологическому надзору — МУ 3.1.3.3394-16 МЕТОДИЧЕСКИЕ УКАЗАНИЯ ПО ПРОГНОЗИРОВАНИЮ ЭПИЗООТИЧЕСКОЙ АКТИВНОСТИ ПРИРОДНЫХ ОЧАГОВ ЧУМЫ РОССИЙСКОЙ ФЕДЕРАЦИИ


МУ 3.1.3.3394-16 МЕТОДИЧЕСКИЕ УКАЗАНИЯ ПО ПРОГНОЗИРОВАНИЮ ЭПИЗООТИЧЕСКОЙ АКТИВНОСТИ ПРИРОДНЫХ ОЧАГОВ ЧУМЫ РОССИЙСКОЙ ФЕДЕРАЦИИ

МУ 3.1.3.3394-16 МЕТОДИЧЕСКИЕ УКАЗАНИЯ ПО ПРОГНОЗИРОВАНИЮ ЭПИЗООТИЧЕСКОЙ АКТИВНОСТИ ПРИРОДНЫХ ОЧАГОВ ЧУМЫ РОССИЙСКОЙ ФЕДЕРАЦИИ

Утв. Главным государственным санитарным врачом РФ 19 августа 2016 г.
3.1.3. Эпидемиология. Профилактика инфекционных болезней. Кровяные инфекции
Методические указания МУ-3.1.3.3394-16
"МЕТОДИЧЕСКИЕ УКАЗАНИЯ ПО ПРОГНОЗИРОВАНИЮ ЭПИЗООТИЧЕСКОЙ АКТИВНОСТИ ПРИРОДНЫХ ОЧАГОВ ЧУМЫ РОССИЙСКОЙ ФЕДЕРАЦИИ"


1. Область применения

1. Настоящие методические указания определяют методологические основы и порядок проведения эпизоотологического мониторинга в природных очагах чумы на территории Российской Федерации для подготовки прогнозов их эпизоотической активности.

2. Методические указания предназначены для специалистов противочумных учреждений Федеральной службы по надзору в сфере защиты прав потребителей и благополучия человека, осуществляющих эпидемиологический надзор и прогнозирование эпизоотической активности природных очагов чумы на территории Российской Федерации.

2. Общие положения

Прогноз эпизоотической активности природных очагов чумы является основой планирования профилактических мероприятий. Внедрение в практику эпидемиологического надзора эколого-эпизоотологических и эпидемиологических прогнозов различной длительности позволяет значительно усовершенствовать стратегию и тактику мониторинга энзоотичных по чуме территорий Российской Федерации, минимизировать негативные эпидемиологические последствия роста эпизоотической активности природных очагов, обосновать приоритетность финансирования конкретных противоэпидемических мероприятий. Современная экономическая, социальная и экологическая обстановка диктует необходимость создания нового методического документа, направленного на разработку долгосрочных и краткосрочных эпизоотологических и эпидемиологических прогнозов.

Внедрение в практику эпидемиологического надзора за чумой эпизоотологических прогнозов различной длительности (на сезон, год и более) даст возможность более точно определять время, место и масштабность обострения эпизоотической обстановки, планировать и оперативно проводить упреждающие профилактические мероприятия, направленные на снижение риска заражения.

Настоящий документ основан на многолетнем опыте работы противочумных учреждений в области прогнозирования эпизоотической активности природных очагов чумы различной биоценотической структуры и разработан взамен "Методических рекомендаций по долгосрочному прогнозированию эпизоотической активности природных очагов чумы" (1991). Приведены конкретные примеры применения различных математических методов при составлении прогнозов эпизоотической активности равнинных и высокогорных природных очагов чумы на территории Российской Федерации.

3. Основные принципы прогнозирования эпизоотической активности природных очагов чумы

Основой прогнозов эпизоотологического профиля служат представления о наличии зависимости эпизоотической активности природных очагов чумы от уровня численности носителей и переносчиков этой инфекции и/или факторов внешней среды. Изменения эпизоотической активности природных очагов чумы во многом связаны с ритмикой атмосферных циркуляционных процессов, формирующих тот или иной гидрометеорологический фон. Важную роль в динамике эпизоотологического процесса играют сезонные и многолетние колебания численности фоновых видов носителей и их эктопаразитов, а также трофический фактор. Для построения эпизоотологических прогнозов различной длительности используют результаты многолетнего эпизоотологического обследования очаговых территорий, эколого-эпизоотологические данные, собранные на пунктах долговременных наблюдений. На основании анализа этих материалов определяют сезонные и многолетние особенности динамики паразитарных систем природных очагов различной биоценотической структуры, равно как и их эпизоотическую активность. В связи с тем, что количественные характеристики паразитарных систем природных очагов чумы получают, как правило, на основании ограниченных выборок, необходимо проводить тщательный подбор анализируемых показателей и статистическую оценку достоверности влияния исследуемых факторов.

Результаты анализа данных эпизоотологического обследования служат основанием для определения не только текущего состояние природного очага чумы, но и выявления основных тенденций дальнейшей динамики его эпизоотической активности. В качестве общего показателя интенсивности эпизоотии также используют долю проб полевого материала с положительным на чуму результатом от числа всех исследованных, а также проводят балльную оценку экстенсивных и интенсивных характеристик выявленной эпизоотии (табл. 1).

Оценку параметров эпизоотического состояния природного очага чумы проводят по формуле:

Х = (A + B + С + D + E) / 5, где

Х - показатель эпизоотического состояния природного очага;

А - показатель результатов бактериологических, иммунологических и генодиагностических исследований;

В - численность основных носителей;

С - численность переносчиков;

D - показатель состояния климатических факторов;

Е - численные показатели состояния астрофизических факторов (показатели приливообразующих сил, в отличие от чисел Вольфа, вычисляют заранее, что имеет большое прогностическое значение).

В зависимости от текущей ситуации по каждой из градаций (А-Е) выставляют соответствующие баллы, а затем вычисляют их среднюю арифметическую.

Соответственно, при среднем балле 1 следует ожидать (табл. 1) единичные проявления чумы или их отсутствие; 2 - отдельные проявления на незначительной территории; 3 - локальные эпизоотии и 4 - обширные разлитые эпизоотии чумы.

Таблица 1

Основные предикторы изменения эпизоотической активности природных очагов чумы

Характеристика эпизоотического состояния природных очагов чумы

Уровень значений основных предикторов изменения эпизоотической активности очагов

Количественная оценка используемых предикторов, баллы

положительные результаты бактериологических, иммунологических, геннодиагностических исследований

численность доминирующих носителей

общая численность переносчиков

климатические характеристики (увлажненность, температурный режим и др.)

астрофизические характеристики (числа Вольфа, приливообразующая сила)

X

А

В

С

D

Е

Отсутствие эпизоотий

Низкий или его резкое падение

Повышение или понижение* аридности климата

Ниже нормы

1

Единичные находки зараженных животных

Ниже среднемноголетних показателей

Соответствуют среднемноголетним показателям

Норма

2

Локальные эпизоотии

Соответствует среднемноголетним показателям

Снижение или повышение* аридности климата

Значительно выше нормы

3

Разлитые эпизоотии

Выше среднемноголетних показателей и (или) его быстрый рост

Аномальные отклонения от среднемноголетних показателей

Аномальные отклонения от нормы

4

* Для горных очагов Сибири

4. Методологические основы краткосрочных и долгосрочных прогнозов эпизоотической активности природных очагов чумы

Методические основы построения краткосрочного прогноза разделяют на два типа: экспертная оценка и количественный прогноз с использованием математической модели. При первом подходе оценивают современное состояние популяций основных и второстепенных носителей и переносчиков чумы, устанавливают тенденции динамики их численности, разрабатывают прогноз эпизоотической ситуации на следующий год (сезон). При этом обычно используется словосочетание "ожидаемая активность выше (ниже или равна) среднемноголетней". В заключение оценивают реальную возможность эпидемических осложнений и дают рекомендации по организации и объему профилактических мероприятий.

Экспертный краткосрочный прогноз состояния природных очагов чумы строится на анализе текущей эпизоотической обстановки на территории конкретного очага с учетом тенденций развития ведущих его биоценотических компонентов. Основой эпизоотологического прогноза являются данные, характеризующие сезонную и многолетнюю динамику эпизоотического состояния очага (сведения о находках переболевших и инфицированных животных, площадь и ландшафтная приуроченность эпизоотических участков, зараженность зверьков по видам в процентах к исследованным, зараженность блох, доля положительных посевов от числа сделанных в процентах, показатели численности носителей и переносчиков и т.д.).

Экспертный краткосрочный прогноз проводится в виде качественной оценки эпизоотического состояния очага, выраженной в четырех уровнях (градациях), соответствующих четырем фазам эпизоотического цикла: рост активности, пик, спад и депрессия. Такой прогноз дает важную информацию о тенденции изменения эпизоотической активности конкретного природного очага чумы. При этом прогностическая активность природного очага оценивается по следующим качественным показателям: единичные находки зараженных чумой животных или их отсутствие, локальные эпизоотии на участках их стойкого проявления, обширные эпизоотии. Поскольку каждый эпизоотический цикл конкретного природного очага чумы характеризуется определенными средними значениями основных показателей состояния его паразитарной системы (показатели численности и зараженности носителей и переносчиков), то с помощью качественного и количественного анализа состояния ведущих его биоценотических компонентов определяется текущий прогностический уровень эпизоотической активности рассматриваемой территории. Для фазы депрессивного состояния природного очага характерна низкая, для фаз роста и спада - средняя, для фазы пика - высокая эпизоотическая активность.

В природных очагах чумы с постоянной эпизоотической активностью качественная оценка текущей фазы эпизоотического цикла осуществляется, как правило, на основании проявляющейся связи между уровнями численности, носителей и переносчиков и показателями их эпизоотической активности. При этом рост эпизоотической активности обычно совпадает с периодом роста численности основных носителей и переносчика. Соответственно, пик эпизоотической активности природных очагов наблюдается в годы пика или начала спада численности основных носителей и переносчиков возбудителя чумы. Минимальная эпизоотическая активность природных очагов, вплоть до установления длительных межэпизоотических периодов, отмечается в периоды, характеризующиеся депрессивным состоянием численности фоновых видов грызунов и их эктопаразитов.

В связи с этим основой качественного прогноза изменения эпизоотической активности природных очагов чумы является соответствующий по длительности прогноз сезонной (многолетней) динамики численности основных носителей и переносчиков возбудителя чумы.

Соответственно, прогнозы численности грызунов - основных носителей возбудителя чумы, строятся на основании результатов оценки плотности их населения, распределения и общего состояния их популяций, а также разностороннего анализа ретроспективной и текущей обстановки на рассматриваемой территории (погодные условия, антропогенные воздействия и др.). Особое внимание следует уделять прогнозированию массовых размножений фоновых видов (обычно основных носителей возбудителя), способствующих активизации очагов и осложнению эпидемиологической обстановки.

Для построения краткосрочного прогноза численности фоновых видов грызунов и их эктопаразитов, а также эпизоотической активности природного очага используют также данные, полученные на пунктах долговременного наблюдения, а именно:

- метеоданные за теплый и холодный периоды года, аномальные погодные явления, состояние кормовых условий существования основных и второстепенных носителей чумы;

- характер переживания основными и второстепенными носителями чумной инфекции холодного периода года;

- показатели фоновой численности перезимовавшего поголовья зверьков;

- для популяций малого, длиннохвостого и даурского сусликов - даты пробуждения, расселения, залегания в спячку и т.д.;

- ход размножения основного носителя, а также видов грызунов и зайцеобразных, играющих заметную эпизоотологическую роль (начало, конец размножения, для полиэстральных видов - сроки и интенсивность вступления в размножение молодняка текущего года рождения, наличие повторного размножения перезимовавших самок);

- показатели численности основного носителя, равно как и других видов мелких млекопитающих, в первую очередь домовой мыши, в открытых и закрытых стациях;

- прогностические параметры численности основных и дополнительных переносчиков чумы в открытых стациях;

- данные по видовому составу и численности эктопаразитов в населенных пунктах;

- сведения о ходе размножения переносчиков чумы (особенности размножения в текущем году, сроки и интенсивность откладки яиц и выплода молодых, изменения возрастного состава популяций и т.д.);

- показатели численности и активность основных переносчиков чумы (характер изменения численности, периоды смены генераций, обилие мигрирующих блох, обилие блох на основных и второстепенных носителях чумы и т.д.).

На основании этих данных оценивают возможные причины происшедших изменений и вероятность дальнейших перестроек в биоценотических комплексах и эпизоотическом состоянии природных очагов чумы. В связи с этим только комплексный анализ факторов, оказывающих влияние на паразитарную систему природных очагов чумы, а также выделение среди них ведущих, является непременным условием при прогнозировании ожидаемых изменений их эпизоотической активности. В то же время следует учитывать, что все прогнозы природных явлений, находящихся под влиянием большого числа разнородных факторов, часто недостаточно точны, по своей сути сугубо относительны и характеризуются определенными пространственно-временными параметрами. В практике эпизоотологического мониторинга используют, как правило, краткосрочные прогнозы, составленные для конкретных территорий на ближайшие полгода или год.

При составлении эпизоотологического прогноза для конкретного природного очага чумы также оценивают реальную возможность эпидемических осложнений и дают рекомендации по организации комплекса профилактических мероприятий (содержание, сроки, дислокация и объемы дератизационных и дезинсекционных обработок, необходимость санпросветработы среди местного и приезжего населения, их вакцинации, специальной подготовки организаций общей медицинской сети к возможным обострениям эпидемиологической обстановки. С этой целью составляют прогнозы буферных зон (площади) эпизоотий, на которых необходимо проводить профилактические (противоэпидемические) мероприятия.

Теоретической предпосылкой долгосрочного прогнозирования служат представления о том, что крупные колебания эпизоотической активности очагов представляют собой результат совместного влияния составляющих их периодических флюктуаций меньшей длительности. При наложении пиков нескольких мелких периодов проявляется максимальное значение более крупного цикла. При этом ряд лет, вошедших в краткосрочные прогнозы, может стать основой для долгосрочного прогнозирования, так как он дает возможность выделить значимые факторы и оценить их статистически. При этом выбор критериев (предикторов) прогнозирования эпизоотической активности природных очагов чумы ведется с помощью статистических методов при программном обеспечении ПК пакетом Statistica или его аналогов.

Прогноз эпизоотической активности природных очагов чумы на территории Российской Федерации на первое полугодие представляется к 15 декабря; на второе полугодие - к 15 июля. Долгосрочный прогноз эпизоотической активности природных очагов чумы разрабатывается на 5 лет.

4.1. Методы выявления факторов, связанных с изменением эпизоотической активности природных очагов чумы

В настоящее время в биологических исследованиях широко применяют компьютерные программы Statistica и Excel и другие пакеты для статистической обработки данных.

Анализ данных следует начинать с ввода исходных количественных значений в электронную таблицу этих программ. Обычно по горизонтали (верхняя строка) вводятся наименования анализируемых показателей, по вертикали (столбцы или графы) - их количественные значения. В программе Statistica для этого используют модуль "Описательная статистика". Для сжатого описания временных рядов использованы статистические параметры: средняя арифметическая (характеризует центральную тенденцию) и период (интервал времени между двумя уровнями временного ряда с одинаковой фазой). Амплитуду колебаний значений временного ряда не анализировали, но при необходимости она может быть охарактеризована величиной показателя дисперсии, среднего квадратического отклонения или коэффициентом вариации. В программе Excel для такого анализа данных используют модуль "Анализ данных" => "Описательная статистика".

Существует два основных подхода к экстраполяции (прогнозу) значений временных рядов: путем выявления экологических предикторов (факторное прогнозирование) или моделирование тенденций развития исходной последовательности. Каждая статистическая компьютерная программа содержит определенный набор методов для решения этих задач. Выделить один метод в качестве наиболее "правильного" невозможно. Обусловлено это тем, что каждый из них лучше аппроксимирует временные ряды определенного типа, в разной степени отвечает решаемым на данный момент исследователем задачам, техническим возможностям, уровню подготовки исполнителя и т.д. Для целей выявления факторов, связанных с исходным временным рядом, используют корреляционный, регрессионный и дискриминантный анализы.

Корреляционный анализ

Корреляция - мера связи между переменными. Различают линейную и нелинейную зависимости. Линейная связь описывается коэффициентом корреляции Пирсона (r) и характеризует степень пропорциональности изменения переменных (тесноту связи). Коэффициент корреляции является безразмерной величиной. Значение коэффициента корреляции не зависит от масштаба измерения и изменяется в пределах от -1, 0 до +1, 0. Значение, равное 1, 0, (по абсолютной величине) показывает, что переменные связаны функционально. Если |r|≤0, 3 - связь считается слабой; при 0, 3<|r|<0, 7 - умеренной; |r|>0, 7 - указывает на тесную зависимость между исследуемыми переменными.

Если связь между переменными нельзя описать прямой (или близкой к ней) линией, то либо связи нет, либо корреляция между переменными носит нелинейный характер. Для выявления связи нелинейного характера используется непараметрический коэффициент корреляции Спирмена. Его значения также изменяются в пределах от -1, 0 до +1, 0. Используя модуль "Анализ данных" => "Гистограмма", нужно проверить форму распределения данных. Если распределение значительно отличается от нормального, необходимо использовать непараметрические методы статистики (Спирмена или Кендала).

Главным источником информации о надежности корреляции служит уровень значимости (р), который зависит от объема проведенных наблюдений. Уровень значимости более 0, 05 свидетельствует, что связь между значениями переменных не доказана.

Применение корреляционного анализа следует, по возможности, сопровождать биологической интерпретацией полученных результатов, так как само наличие связи не является доказательством причинно-следственной обусловленности явлений.

Перед проведением корреляционного анализа определяют тип связи: линейный или нелинейный.

Например, в программе Statistica для этого применяется вложение "Графики", которое выводит результаты на экран. Если зависимость носит нелинейный характер (точки не укладываются на изображенную линию регрессии), дальнейшую обработку материалов проводят с применением коэффициент корреляции Спирмена, который выводится на экран в виде таблицы (табл. 2).

Таблица 2

Итоговая таблица в программе Statistica

...

Valid

Spearman

t(N - 2)

p-level

Признак

...

...

...

...

Примечание. Valid - число измерений признаков, Spearman - значение коэффициента корреляции Спирмена, t(N-2) - число степеней свободы, p-level - уровень значимости. Жирным шрифтом в таблице выделяются значения коэффициента корреляции при уровне значимости менее 0, 05 (то есть, достоверные)

При линейной связи в программе Excel для вычисления коэффициента корреляции Пирсона в меню "функция" вызывают команду "КОРРЕЛ", а дальше необходимо следовать инструкциям ее диалогового окна. Коэффициент корреляции Спирмена эта программа не вычисляет. Но его можно рассчитать "вручную", воспользовавшись возможностями Excel по ранжированию значений временных рядов. При этом каждый ряд ранжируется отдельно. Меньшему значению в ряде присваивается ранг 1, наибольшему - ранг, соответствующий числу сравниваемых наблюдений (естественно, их число в рядах должно быть одинаковым). Корреляция Спирмена рассчитывается по формуле:

image001.gif, где

∑d2 - сумма квадратов разностей между попарно связанными рангами значений;

n - число пар сравниваемых значений.

Оценка достоверности коэффициента корреляции может быть проведена исходя из числа степеней свободы (n - 2). Достоверны коэффициенты корреляции, которые превышают табличные значения при уровне значимости 0, 05 и меньше.

В случае если интересует связь исследуемой переменной с несколькими факторами, возможно проведение одновременного корреляционного анализа всех рядов. Для этого необходимо построить матрицу парных коэффициентов корреляции (табл. 3).

Таблица 3

Общий вид матрицы парных коэффициентов корреляции в программе Excel

Исследуемые ряды

А

В

С

D

А

1

rab

rac

rad

В

rba

1

rbc

rbd

С

rca

rcb

1

rcd

D

rda

rdb

rdc

1

Так как коэффициент корреляции - мера связи симметричная (т.е., rab=rba; rac=rca и т.д.), то достаточно анализировать лишь верхнюю (над диагональю) или нижнюю части таблицы. Значения диагонали равны единице в силу полной связи значений каждого ряда, при коррелировании его самим с собой.

Матрицу парных коэффициентов корреляции можно рассчитать в любой из компьютерных статистических программ. Так, в Excel для этого необходимо войти в диалоговое окно "Сервис", затем - "Анализ данных..." и "Корреляция". Если команда "Анализ данных" не высвечена в меню "Сервис", так как ранее никогда не использовалась, то ее можно активировать. Для этого необходимо войти в пункт "Надстройки" диалогового окна "Сервис" и активировать команду "Пакет анализа".

Таким образом, с помощью корреляционного анализа выявляются факторы, достоверно и в наибольшей степени связанные с зависимой переменной, которые могут быть в дальнейшем использованы для построения статистических моделей прогноза. Однако необходимо помнить, что перед выбором метода корреляционного анализа нужно определить характер распределения данных и выбрать соответствующий метод корреляционного анализа.

Регрессионный анализ

Регрессия показывает, насколько изменится (и какие значения примет) исследуемая переменная при изменении независимой переменной на единицу.

При этом можно изучать обилие видов, показатели приспособленности особей, изменение факторов окружающей среды и т.д. Переменная, описывающая обилие или любую другую характеристику вида (например, уровень рождаемости, смертности, активности и т.д.), является зависимой (объясняемой, обозначается Y), а переменные, характеризующие время или действие факторов среды - независимыми (объясняющими) переменными (обозначаются X1, X2…Xn).

Зависимость между переменными величинами Y и Х можно выразить математически с помощью формул и уравнений, а также графически в виде геометрического места точек в системе прямоугольных координат (диаграмма рассеяния). В регрессионном анализе программа строит линию регрессии так, чтобы минимизировать квадраты отклонений этой линии от реально наблюдаемого разброса точек. В практических исследованиях с целью прогнозирования возникает необходимость описать диаграмму рассеяния математическим уравнением.

При рассмотрении изменения двух переменных (в двухмерном пространстве) прямая линия на плоскости задается уравнением

Y = a + bX, где

Y - зависимая переменная (обилие, площадь эпизоотий, число культур возбудителя и т.д.);

a - константа (свободный член уравнения регрессии);

b - угловой коэффициент (регрессионный);

Х - независимая переменная (обычно - это год, месяц и т.д.).

В случае рассмотрения влияния на эпизоотический процесс нескольких факторов (многомерный анализ), когда имеется более одной независимой переменной, процедура множественной регрессии будет оценивать параметры линейного уравнения вида:

Y=a+b1X1+b2X2+…+bnXn, где

а - константа;

b1, b2, bn - регрессионные коэффициенты, отражающие вклады каждой независимой переменной (X1, X2, Xn) в предсказание зависимой переменной.

Парная и множественная регрессия применимы к данным, зависимость между которыми носит линейный характер. При этом линия регрессии выражает наилучшее предсказание Y по X. На практике природные явления очень редко бывают полностью предсказуемыми, поэтому на графике наблюдается существенный разброс точек относительно идеально построенной прямой. Отклонение отдельной точки от линии регрессии называется остатком. Чем меньше величина значений остатков по отношению к общему разбросу значений, тем более точным является прогноз. Следует учитывать, что увеличение числа изученных факторов, которые влияют на исследуемую переменную, увеличивает точность прогноза, но требует увеличения длины временного ряда. Для корректного факторного прогноза на каждый предиктор должно приходиться не менее 10-15 исследуемых наблюдений. Из итоговой таблицы регрессионного анализа в уравнение регрессии берутся данные по количественным значениям константы а- и b-коэффициента с учетом их знака. При этом в уравнение включаются только параметры, для которых уровень значимости р < 0, 05. Таким образом, уравнение прогноза и выбор количества используемых в нем предикторов опирается на: 1) оценку их значимости; 2) необходимую для корректного прогноза длину временного ряда. То есть в случае 45 наблюдений в уравнение прогноза нельзя включать более 3 предикторов. В случае 100 наблюдений - более 7 и т.д.

Множественный регрессионный анализ может быть выполнен в Excel или Statistica.

Для расчетов множественной регрессии в Excel следует пользоваться пунктом "Регрессия" диалогового окна "Анализ данных", который находится в основном меню "Сервис".

При работе методом регрессионного анализа данные в электронную таблицу Statistica вводятся следующим образом: в первый столбец вводятся количественные значения зависимой переменной (Y), в остальные - значения измеренных параметров (X1, X2…Xn), на основе которых предполагается прогнозирование поведения зависимой переменной.

В ходе применения анализа множественной регрессии на экран выводится информационное окно, в котором содержатся количественные значения промежуточных расчетов коэффициентов и полная информация об анализе.

Конечные результаты регрессионного анализа выдают в виде табл. 4, в которой представлены количественные значения всех коэффициентов регрессии.

Таблица 4

Пример итоговой таблицы регрессионного анализа в программе Statistica

Beta

Std. Err. of Beta

b

Std. Err. of b

p-level

Intercept (а)

...

...

...

...

...

Параметр 1

...

...

...

...

...

Параметр 2

...

...

...

...

...

Параметр 3

...

...

...

...

...

Параметр 4

...

...

...

...

...

Примечание. Intercept (а) - свободный член уравнения регрессии; Beta - стандартизированный коэффициент регрессионного уравнения (коэффициент при независимой переменной); Std.Err. of Beta - стандартная ошибка Beta; b - угловой коэффициент для каждой переменной; Std.Err. of b - стандартная ошибка углового коэффициента; p-level - уровень значимости; выделены значимые коэффициенты при уровне значимости р < 0, 05

Из итоговой таблицы в уравнение регрессии берут данные по количественным значениям константы а- и b-коэффициентов с учетом их знака. При этом в уравнение включают только параметры, для которых уровень значимости р < 0, 05, причем в количестве, которое позволяет анализировать имеющаяся длина временного ряда.

По итогам применения регрессионного анализа делают вывод, какие из проанализированных независимых переменных вносят наибольший вклад в предсказание поведения зависимой переменной.

В ходе корреляционного анализа нередко выявляется, что факторы, влияющие на независимую переменную, достоверно и в сильной степени (то есть, r > 0, 7) коррелируют между собой (видно из матрицы корреляций - табл. 3). В этом случае в уравнении линии регрессии следует использовать лишь один из двух факторов, обычно в наибольшей степени связанный с зависимой переменной.

Для применения регрессионного анализа необходимо наличие тесных корреляционных связей между объектом и признаком (переменной). Кроме того, связь объекта прогнозирования с признаком с течением времени может слабеть и даже меняться на противоположную. Поэтому такие модели требуют ежегодной корректировки. Обычно прогнозирование методами регрессии без корректировки укладывается в пределы доверительного интервала только на 2-3 прогнозных периода.

Дискриминантный анализ

Этот вид анализа используется для принятия решения о том, какие переменные разделяют (дискриминируют) две или более формирующиеся совокупности наблюдений. Для осуществления данного анализа необходимо иметь одну качественную характеристику объекта и несколько количественных (не менее 5). В конечном итоге нужно сделать выводы о строгом соответствии количественных характеристик определенным качественным или, напротив, о невозможности четкого разделения объектов на основе количественных параметров.

Ввод данных в электронную таблицу Statistica осуществляют следующим образом: по горизонтали - признаки объектов, по вертикали - классифицируемые объекты по порядковым номерам групп. На основе анализа выбирают переменные, имеющие наибольшие (по модулю) значения линейных коэффициентов и вносящие наибольший вклад в разделение групп. На основе итоговой таблицы оценивают процент правильных отнесений объектов к каждой группе. Если процент высок, то можно говорить о высокой предсказательной способности дискриминантной функции.

Апробированные методы обработки материалов эколого-эпизоотологического профиля позволяют рекомендовать этот комплекс статистических методов анализа для разработки статистических моделей динамики эпизоотической активности природных очагов чумы.

4.2. Анализ временного ряда на неслучайность и стационарность

Общий алгоритм последовательного анализа временного ряда с целью его экстраполяции (прогноза) отражен на рис. 1. На первом этапе анализа необходимо убедиться, что исследуемый временной ряд не является случайным набором наблюдений, не связанных между собой никакими закономерностями. Для этого можно воспользоваться рассмотрением графиков процесса. Однако визуальный анализ при отсутствии выраженных линейных трендов не всегда позволяет выявить наличие закономерностей, т.е. неслучайность временного ряда. Одним из методов объективного решения этой задачи является нахождение коэффициента автокорреляции (ra), характеризующего связь между последовательными наблюдениями этого же временного ряда.

Очевидно, что в предположении о случайном характере колебаний наблюдений в исследуемом ряду связи между предыдущими и последующими значениями быть не должно. В этом случае прогноз невозможен (рис. 1). Альтернативное предположение допускает зависимость величины последовательных значений друг от друга или, иными словами, неслучайность временного ряда.

Для расчета коэффициента автокорреляции в программе Excel интересующий ряд значений эпизоотической активности природного очага чумы необходимо повторно копировать в электронную таблицу значения исходного ряда таким образом, чтобы первое его значение совпадало со вторым, затем с третьим и так далее. Затем между первым (исходным) рядом и каждой следующей его копией вычисляют обычный коэффициент корреляции Пирсона (разд. 4.1), но так как этот показатель рассчитывается между значениями одного и того же ряда, то он имеет специальное название - коэффициент автокорреляции (ra). Применение коэффициента автокорреляции "на практике" дано на рис. 4 прилож. 2.

image002.jpg

Значения ra изменяются в пределах: -1<ra<+1. Как и для обычного коэффициента корреляции, чем ближе значения ra к 1 по абсолютной величине, тем сильнее связь между наблюдениями в ряду.

Если ra1 значим, то ряд неслучаен. Следовательно, возможен прогноз его значений после выяснения закономерности, которой он подчиняется. Кроме того, величина коэффициента автокорреляции позволяет делать предварительные выводы о периоде колебаний. Высокие положительные значения достоверного ra1 указывают либо на наличие выраженного тренда (что обычно видно визуально на графике), либо на низкочастотные (длиннопериодические) колебания. Значимый отрицательный коэффициент свидетельствует о высокочастотных колебаниях.

Совокупность последовательных значений ra (ra1, ra2, ... ran) называют коррелограммой. Если значим хотя бы один коэффициент из серии ra, то это является основанием, чтобы отвергнуть предположение о случайности исходного временного ряда. Вместе с тем с увеличением порядка вычисляемого коэффициента автокорреляции надежность оценки ra резко уменьшается. В настоящее время принято считать, что корректен расчет ra порядка, не превышающего величины отношения n/4, где n - длина исходного временного ряда.

Программа Statistica после ввода в нее исходного ряда может выдать график или последовательные значения коррелограммы этого ряда с указанием границ. В случае выхода за пределы границ одного из коэффициентов автокорреляции исходный ряд можно отнести к неслучайным. Эта процедура легко выполняется в модуле Time Series/Forecating, переход в который осуществляется в меню "Переключатель модулей" (Module Switch).

4.3. Трансформация временного ряда к стационарному виду

В данном разделе рассмотрим два способа трансформации нестационарного ряда к стационарному в качестве этапа подготовки модели прогноза (рис. 1): метод последовательных разностей и удаление тренда из исходного ряда путем нахождения аппроксимирующего его уравнения. Оба способа легко реализуются в модуле Time Series/Forecating программы Statistica. Кроме того, соответствующие расчеты могут быть проведены в программе Excel.

Для преобразования нестационарного временного ряда (рис. 2, А) к стационарному можно использовать прием взятия разностей между двумя последовательными значениями наблюдений (рис. 2, Б). Такие разности называются первыми. Если в ряду, представляющем, первые разности, вновь найти последовательные разности, то получим ряд вторых разностей и так далее. Считается, что нахождение первой-второй разности - процедура вполне достаточная для удаления трендов и приведения большинства временных рядов к стационарному виду.

Существует также способ приведения исходного ряда (рис. 2, А) к стационарному путем удаления из него тренда (рис. 2, В). При этом на первом этапе определяют тип тренда. Эта процедура называется также заданием аналитического уравнения тренда. Любая компьютерная программа статистических расчетов содержит несколько простых функций для аппроксимации данных, то есть создания аналитических уравнений.

В Excel это можно сделать по следующей схеме.

1. Создать график исходного временного ряда с помощью диалогового окна "Мастер диаграмм" основного меню программы.

2. Установив курсор мышки на исследуемой кривой, путем нажатия правой клавиши вызвать диалоговое окно, содержащее команду "Добавить линию тренда...". Программа позволяет выбрать для аппроксимации имеющихся данных четыре простых (линейный, логарифмический, степенной, экспоненциальный) и полиномиальный тренды.

image003.jpg

3. Перейдя в меню "Параметры" этой же панели управления, отметить необходимость вывода на график формулы аналитического уравнения выбранного тренда и величины коэффициента детерминации (R2). Чем больше R2, тем лучше уравнение тренда описывает исходные данные. Желательно, чтобы R2 в подобранном аналитическом уравнении был не ниже 0, 7-0, 8.

4. Рассчитать ожидаемые значения временного ряда по полученному аналитическому уравнению тренда. Если в ряду есть выраженный линейный тренд или подобранное аналитическое уравнение его хорошо описывает, то данный этап может стать и последним. То есть, остается по полученному уравнению определить показатель эпизоотической активности природного очага чумы на следующий сезон. Если же исходный временной ряд циклический и нестационарный, то надлежит перейти к следующему этапу его трансформации к стационарному виду.

5. Из каждого исходного наблюдения временного ряда необходимо вычесть значение, полученное по уравнению тренда. В результате временной ряд остатков становится стационарным (рис. 2, В). При этом если получивший после удаления тренда преобразованный ряд описывается как случайный, то прогноз изучаемого процесса нужно проводить по уравнению тренда. Если исследуемый временной ряд (например, эпизоотическая активность природного очага чумы) не представляет набора случайных чисел и является стационарным относительно центральной тенденции (рис. 2, Б и В), можно перейти к аппроксимации его значений в будущее одним из ниже рассмотренных методов (прилож. 2).

Приложение 1
(справочное)

Статистические термины и понятия, используемые в МУ

Автокорреляция (ra) - корреляционная зависимость между соседними уровнями временного ряда.

Амплитуда колебаний - размах изменчивости уровней ряда, обычно выражаемый стандартным отклонением, дисперсией или коэффициентом вариации.

Временной ряд - последовательность числовых значений (уровней) определенного статистического показателя, характеризующего изменения изучаемого явления или процесса за определенные промежутки времени.

Высокочастотные колебания - циклические изменения с малым периодом (высокой частотой).

Диаграмма рассеяния - расположение точек наблюдений на графике, отражающем связь между зависимой и независимой переменными.

Комбинированный временной ряд - включает кроме случайной компоненты не менее двух других составляющих (например, тренд и циклическую компоненту, две различных циклических и т.д.).

Коррелограмма - ряд последовательных значений коэффициента автокорреляции.

Корреляционная связь - сопряженное изменение уровней (показателей, наблюдений) двух и более рядов. Прямая связь (положительная) - с увеличением (уменьшением) значений уровней одного ряда соответствующие наблюдения другого ряда увеличиваются (уменьшаются). Обратная связь (отрицательная) - с увеличением (уменьшением) значений уровней одного ряда соответствующие наблюдения другого ряда уменьшаются (увеличиваются).

Коэффициент детерминации (R2) показывает значение доли изменчивости зависимой переменной, объясненной за счет независимых переменных, включенных в модель в качестве факторов (предикторов).

Коэффициент регрессии (bi) показывает, насколько в среднем изменяется значение зависимой переменной при изменении независимой (факторной) на одну единицу собственного измерения.

Линейная связь - статистическая связь между значениями ряда, выраженная уравнением прямой линии регрессии.

Множественная регрессия - статистическая модель, характеризующая связь между тремя и более переменными.

Множественный коэффициент корреляции - связь между зависимой переменной и несколькими предикторами.

Нелинейная связь - статистическая связь между значениями ряда, описываемая уравнением параболы, гиперболы, синусоиды и т.п.

Нестационарный ряд - содержит нециклический тренд и/или закономерно меняющуюся во времени амплитуду колебаний.

Низкочастотные колебания - циклические изменения с большим периодом (долго- периодические).

Объем совокупности - число единиц временного ряда.

Основная тенденция (тренд) - достаточно плавное и устойчивое изменение уровней ряда во времени. Тренд можно представить либо аналитически - в виде описывающего его уравнения (модели), либо графически.

Переменные - значения (уровни ряда), которые можно измерить и оценить в исследованиях. Значения зависимой переменной не выбираются экспериментатором и обычно отражаются на графиках связи между явлениями или процессами по оси ординат (Y). Значения независимой переменной контролируются или задаются экспериментатором и откладываются на графиках по оси абсцисс (X). Для временных рядов это показатель времени.

Период - интервал времени между двумя уровнями с одинаковой фазой (равен двум фазам).

Предиктор (независимая переменная) - фактор, оказывающий влияние на изменение оцениваемого показателя (зависимую переменную).

Причинно-следственные отношения - связь явлений и процессов, когда изменения одного из них - причины - ведет к изменению другого - следствия. Функциональная связь - связь, при которой определенному значению факторного признака соответствует строго определенное значение результативного признака.

Ранг - порядковый номер уровня ряда (значения признака, переменной), который он получает при их расположении в порядке возрастания (убывания).

Ранжирование - процедура упорядочения объектов путем их расположения в порядке возрастания (убывания).

Регрессионный анализ - аналитическое выражение связи (с помощью уравнения, которое описывает модель изучаемого процесса) между изменением зависимой переменной и одной или несколькими независимыми переменными (факторами).

Ретроспективный прогноз (экстраполяция) - прогноз на основе базовой части временного ряда для нахождение будущих его уровней (значений) за пределами изученного периода времени.

Средняя арифметическая - статистический параметр, характеризующий центральную тенденцию временного ряда.

Стационарный ряд - ряд, имеющий постоянную амплитуду колебаний вокруг постоянной по величине средней тенденции (с отсутствующим нециклическим трендом).

Число степеней свободы (df) - вспомогательный показатель, применяемый при оценке значимости статистических критериев, обычно равен числу наблюдений (объему совокупности) минус два.

Приложение 2
(рекомендуемое)

Примеры построения прогнозов (краткосрочных, долгосрочных) эпизоотической активности природных очагов чумы

1. Пример проведения прогноза на основе аппроксимации исходного временного ряда уравнением линейной регрессии

При этом способе прогноза в качестве независимой переменной рассматривают фактор времени. Прогнозировать можно только тот процесс, который не имеет стохастической (случайной) природы. При коротких временных рядах это хорошо видно на графиках, а статистическим подтверждением надежности выбранной математической модели (например, линейной регрессии) является высокое значение коэффициента детерминации R2 (0, 6 и больше).

Для реализации линейного прогноза в Excel используют следующую последовательность команд: "Сервис", "Анализ данных...", "Регрессия". В результате получают три таблички, содержащие данные об оценке надежности линии аппроксимации, о величине свободного члена и коэффициенте наклона линии регрессии, а также значения их ошибок при определенном уровне значимости. Для проведения прогноза необходимо и достаточно в полученное уравнение подставить очередное значение X.

Рассмотрим пример по изменению количества жилых нор монгольской пищухи (основной носитель, обеспечивающий циркуляцию возбудителя чумы алтайского подвида) на эндемичных территориях в Горно-Алтайском высокогорном природном очаге чумы за 1991-1999 гг. (табл. 5) и сделаем прогноз этого показателя на 2000 г. Для расчета параметров линии регрессии в программе Excel следует использовать приводимый ниже "пошаговый" алгоритм анализа временного ряда.

1. Внести данные из табл. 5 в Excel.

2. Выделить курсором графу, отражающую количество нор пищухи.

3. Активизировать команду "Мастер диаграмм" верхней панели программы.

4. Выбрать команду "график" из появившегося диалогового окна, а в ней активировать пункт "график с маркерами".

Таблица 5

Данные по изменению количества жилых нор монгольской пищухи - основного носителя возбудителя чумы алтайского подвида в Горно-Алтайском высокогорном природном очаге

Год

Число жилых нор монгольской пищухи на 1 га

Число жилых нор на 1 га, рассчитанное по линейному тренду

Квадраты остатков после удаления тренда (Ytt)2

1991

5, 8

5, 6

0, 035

1992

6, 8

5, 9

0, 796

1993

6, 2

6, 2

0, 000

1994

5, 4

6, 5

1, 210

1995

6, 7

6, 8

0, 009

1996

6, 6

7, 1

0, 242

1997

6, 7

7, 4

0, 473

1998

8, 8

7, 7

1, 245

1999

8, 2

8, 0

0, 048

2000 г. фактически: 9, 1

2000 г. прогноз: 8, 3

Сумма квадратов остатков: 4, 060

5. Построить график исходного временного ряда.

6. Добавить на график линию тренда типом "линейный", а также помещаем на график уравнение аппроксимации и коэффициент детерминации - R2 (правила выполнения этих процедур описаны выше).

В результате на рисунке временного ряда в программе Excel получим уравнение линейного тренда: у = 0, 296х + 5, 316 с величиной R2=0, 565 (рис. 2).

Это означает, что применение данного уравнения позволяет объяснить около 57% наблюдавшихся изменений количества жилых нор монгольской пищухи.

Выполнение всех перечисленных операций (исключая ввод информации в программу) и получение готового аналитического уравнения занимает не более 15 секунд. Программа при построении уравнений по графикам всегда производит расчеты исходя из ряда значений, различающихся на единицу: в виде 1, 2, 3, ...n или 1997, 1998, 1999 ... и т.д. Следовательно, если данные по X имеют другой шаг различий, то для построения уравнения регрессии необходимо воспользоваться в Excel командой "Регрессия" из пакета "Анализ данных".

Исходя из полученного уравнения, в 2000 г. количество жилых нор монгольской пищухи должно быть равно 8, 3 на 1 га, что достаточно близко к значению (9, 1), фактически наблюдавшемуся в тот сезон (табл. 5). Отклонение ожидаемого значения от наблюдаемого, через которое можно охарактеризовать точность прогноза, составляет в нашем случае 5, 5% фактической величины. Следует учесть, что вероятность точной реализации точечного прогноза крайне мала. Прогноз должен сопровождаться оценкой величины доверительного интервала:

Yp±taSp, где

ta - табличное значение критерия Стьюдента для принятого уровня значимости и соответствующего числа степеней свободы;

Sp - ошибка прогноза.

В свою очередь ошибку прогноза определяют по формуле:

Sp=Syθ, где

Sy - колеблемость ряда относительно тренда;

θ- поправочный коэффициент, который зависит от типа тренда и периода упреждения (предсказания).

Ошибка прогноза для уравнения линейной регрессии будет иметь следующий вид:

image004.gif, где

yt - фактические значения наблюдений;

ηt - расчетные значения уровней ряда по линейному тренду;

n - длина временного ряда;

m - число параметров в уравнении тренда без свободного члена;

l - период упреждения. Причем время должно быть представлено рядом натуральных чисел от 1 до n.

В нашем примере (табл. 5) при составлении прогноза на 2000 г. l = 1 и m = 1. Следовательно:

image005.gif

Прежде чем рассчитать доверительный интервал, необходимо решить, какой уровень ошибки прогноза мы бы считали приемлемым. Допустимо применение 10%-й ошибки. Исходя из величины ошибки 10% (т.е. р < 0, 1) и числа степеней свободы исследуемого временного ряда (df = n - 2), равного 7, величина критерия Стьюдента (t) составляет 1, 90. Следовательно, доверительный интервал точечного прогноза равен 1, 64.

Таким образом, в 2000 г. количество жилых колоний монгольской пищухи должно с вероятностью 90% находиться внутри интервала 8, 3±1, 64, т.е. составлять от 6, 7 до 9, 9 нор на 1 га.

При проведении факторного прогноза необходимо придерживаться нескольких эмпирических правил.

1. В уравнения прогноза (статистическую модель) не должны включаться предикторы, которые имеют коэффициент корреляции друг с другом больший или равный 0, 8. При высокой корреляции двух и более предикторов между собой обычно в модели оставляют только один из них, имеющий наибольший уровень связи с зависимой переменной (например, с эпизоотической активностью).

2. В статистическую модель должно входить как можно меньше предикторов. Модель должна быть наиболее простой из возможных. На каждый предиктор должно приходиться не менее 10-15 наблюдений зависимой переменной.

3. Рекомендуется не подставлять в уравнения прогноза значения предикторов, отличающиеся больше чем на 1/3 от минимальной и максимальной величины значений, наблюдавшихся в исходном временном ряде.

4. Необходимо проверять адекватность построенной модели, причем не на данных, по которым построено уравнение прогноза.

2. Пример проведения прогноза на основе гармонического анализа

Рассмотрим особенности применения метода гармонического анализа для прогнозирования временного ряда с регулярными циклами (Фурье - аппроксимация).

С помощью ряда Фурье динамика явления представляется функцией времени, в которой слагаемые расположены по убыванию их периодов:

image006.gif

Величина k определяет гармонику ряда Фурье и берется как целое число, начиная с 1. Часто для аппроксимации временного ряда достаточно рассмотрения 3-4 гармоник. Параметры уравнения рассчитывают методом наименьших квадратов:

image007.gif- то есть простая средняя арифметическая ряда;

image008.gifи image009.gif

image010.gifи image011.gif

image012.gifи image013.gifи т.д.,

или в общем виде:

image014.gifи image015.gif

Первому наблюдению (t) обычно присваивают значение 1 (или 0). К каждому следующему прибавляют величину 2×π/n, где n - длина ряда.

Ряд Фурье с одной гармоникой записывают как:

t=a0+a1cost+b1sint

Ряд Фурье с двумя гармониками:

t=a0+a1cost+b1sint+a2cos2t+b2sin2t

Ряд Фурье с тремя гармониками:

t=a0+a1cost+b1sint+a2cos2t+b2sin2t+a3cos3t+b3sin3t

и так далее.

Для прогноза (экстраполяции) в уравнение с выбранным числом гармоник подставляют значение времени (t) необходимого порядка.

Следует отметить, что для прогнозирования этим методом не рекомендуется брать исходный ряд слишком большой длины. Достаточно рассмотреть динамику наблюдений за три циклических периода, ближайших к экстраполируемым значениям, причем начало и конец кривой, по которой строится уравнение ее аппроксимации, должны приходиться на одну и ту же фазу (начало, середину или конец цикла). В целом гармонический анализ хорошо подходит для описания низкочастотных периодических колебаний.

В качестве примера проведем гармонический анализ временного ряда, характеризующего площади буферной зоны эпизоотии (км2), т.е. площади, где надо проводить профилактические (противоэпидемические) мероприятия, на территории Прикаспийского песчаного природного очага чумы за 1979-1990 гг. (табл. 6).

Отсчет t начнем с 1, прибавляя каждый раз к его значению величину 2π/n, то есть в нашем случае 0, 523. Очень важно, чтобы все расчеты были проведены в "радианах".

Таблица 6

Площади буферной зоны эпизоотий на территории Прикаспийского песчаного природного очага чумы

Год

Площадь буферной зоны эпизоотии, км2

Год

Площадь буферной зоны эпизоотии, км2

1979

1 548

1991

2611

1980

78

1992

1 004

1981

741

1993

894

1982

955

1994

1 112

1983

2 689

1995

1 971

1984

1 941

1996

495

1985

1 827

1997

0

1986

2 267

1998

331

1987

2 653

1999

313

1988

2 604

2000

258

1989

1 979

2001

1 187

1990

2 844

2002

232

Табл. 7 содержит параметры ряда Фурье, необходимые для составления уравнения прогноза с использованием от одной до четырех гармоник.


Таблица 7

Параметры ряда Фурье, необходимые для составления уравнения прогноза с использованием 4 гармоник

Год

N
п/п

У

t

y·cost

y·sint

y·cos2t

y·sin2t

y·cos3t

y·sin3t

y·cos4t

y·sin4t

1979

1

1 548

1

836, 4

1 302, 6

-644, 2

1 407, 6

-1 532, 5

218, 5

-1 011, 8

-1 171, 5

1980

2

78

1, 5

3, 7

77, 9

-77, 6

7, 4

-11, 1

-77, 2

76, 6

-14, 7

1981

3

741

2, 0

-339, 5

658, 7

-430, 0

-603, 5

733, 4

-105, 7

-242, 0

700, 4

1982

4

955

2, 6

-803, 2

516, 6

396, 0

-869, 0

137, 0

945, 1

-626, 5

-720, 8

1983

5

2 689

3, 1

-2 685, 9

129, 7

2 676, 5

-259, 1

-2 660, 9

387, 9

2 639, 1

-515, 9

1984

6

1 941

3, 6

-1 726, 1

-887, 8

1 128, 8

1 579, 0

-281, 6

-1 920, 5

-628, 0

1 836, 6

1985

7

1 827

4, 1

-989, 6

-1 535, 8

-755, 0

1 663, 7

1 807, 5

-266, 5

-1 203, 0

-1 375, 0

1986

8

2 267

4, 7

-111, 2

-2 264, 3

-2 256, 1

222, 1

332, 4

2 242, 5

2 223, 5

-442, 0

1987

9

2 653

5, 2

1 211, 6

-2 360, 2

-1 546, 3

-2 155, 8

-2 624, 0

391, 1

-850, 4

2 513, 0

1988

10

2 604

5, 7

2 187, 8

-1 412, 2

1 072, 3

-2 373, 0

-385, 9

-2 575, 2

-1 720, 8

-1 954, 4

1989

11

1 979

6, 2

1 976, 5

-98, 6

1 969, 2

-197, 0

1 956, 9

-294, 9

1 939, 8

-392, 0

1990

12

2 844

6, 8

2 531, 1

1 296, 8

1 661, 3

2 308, 3

426, 0

2 811, 9

-903, 1

2 696, 8

Сумма

22 126

46, 54

2 091, 9

-4 576, 5

3 194, 9

730, 7

-2 102, 7

1 757, 1

-306, 8

1 160, 5


Чтобы найти коэффициенты при синусах и косинусах, а также свободный член уравнения, в табл. 7 приведены значения сумм соответствующих граф. Исходя из них, имеем:

A0=1 843, 8; A1=348, 6; A2=532, 5; A3=-350, 5; A4=-51, 1;

B1=-762, 7; B2=121, 8; B3=292, 8; B4=193, 4

Окончательные результаты гармонического анализа ряда, включающие 4 гармоники, приведены в табл. 8.


Таблица 8

Расчет четырех периодических составляющих и уравнений, характеризующих площади буферной зоны эпизоотий на территории Прикаспийского песчаного природного очага чумы

Число гармоник

Уравнения динамики эпизоотической активности, включающие от одной до четырех гармоник

1

Yt=1843, 8+348, 6cost-762, 7sint

2

Yt=1843, 8+348, 6cost-762, 7sint+532, 5cos2t+121, 8sin2t

3

Yt=1843, 8+348, 6cost-762, 7sint+532, 5cos2t+121, 8sin2t-350, 5cos3t+292, 8sin3t

4

Yt=1843, 8+348, 6cost-762, 7sint+532, 5cos2t+121, 8sin2t-350, 5cos3t+292, 8sin3t-51, 1cos4t+193, 4sin4t


Необходимо определить, какое из уравнений в табл. 8 лучше других аппроксимирует исходный ряд. Для решения вопроса используют данные табл. 9, где приведены значения исходного временного ряда и уровни ряда, рассчитанные с использованием разного числа гармоник. Суждение о степени сходства рядов следует основывать на оценке величины коэффициента корреляции Пирсона и коэффициента детерминации.

Из табл. 9 следует, что уже уравнение с двумя гармониками неплохо описывает исходный ряд. Уравнение с 4 гармониками объясняет 89, 8% колебаний уровней исследуемого временного ряда. Вместе с тем и уравнение, содержащее три периодических составляющих, вполне хорошо аппроксимирует исходную последовательность (R2=86, 9%). Поэтому для прогноза необходимо использовать более простой ряд Фурье с 3 гармониками.

Проводится расчет ожидаемой площади буферной зоны эпизоотии на территории Прикаспийского песчаного природного очага чумы на период с 1991 по 1995 год (с n = 13 по n = 17) и сравнение ее с фактической. Для этого в соответствующее уравнение табл. 9 подставим искомые значения параметра времени: 13, 14, ... 17, преобразованные в t как это сделано в табл. 7.

Таблица 9

Сравнение исходного временного ряда буферной зоны эпизоотии на территории Прикаспийского песчаного природного очага чумы с расчетными уровнями, полученными с использованием различного числа гармоник

Год

Исходные уровни ряда

Расчетные значения уровней ряда, полученные на основе уравнений, содержащих перечисленное число гармоник

1

2

3

4

1979

1 548

1 390, 4

1 279, 5

1 667, 8

1 554, 8

1980

78

1 098, 5

579, 9

339, 8

253, 1

1981

741

1 006, 1

597, 9

209, 3

408, 8

1982

955

1 138, 0

1 248, 0

1 487, 5

1 375, 1

1983

2 689

1 458, 8

1 977, 1

2 366, 1

2 278, 8

1984

1 941

1 882, 7

2 291, 4

2 052, 5

2 252, 1

1985

1 827

2 296, 2

2 187, 0

1 797, 6

1 685, 7

1986

2 267

2 588, 6

2 070, 6

2 308, 9

2 221, 0

1987

2 653

2 681, 6

2 272, 3

2 662, 1

2 861, 7

1988

2 604

2 550, 4

2 658, 7

2 421, 0

2 309, 7

1989

1 979

2 230, 1

2 747, 8

2 357, 6

2 269, 2

1990

2 844

1 806, 3

2 216, 2

2 453, 3

2 652, 9

Корреляция исходного ряда с расчетными (r)

0, 71

0, 85

0, 93

0, 95

Коэффициент детерминации (R2), %

50, 4

71, 8

86, 9

89, 8

Результаты проведенных расчетов приведены в табл. 10.

Таблица 10

Прогноз буферной зоны эпизоотии на территории Прикаспийского песчаного природного очага чумы на 1991-1994 гг. на основе ряда Фурье с тремя гармониками

Год

Фактическая площадь эпизоотий (по табл. 6)

Период времени прогноза

(с 1991 г., т.е. t = 6, 8 + 0, 523 для каждого следующего года по табл. 7)

Yt расчетные значения по ряду Фурье с тремя гармониками (табл. 9)

1991

2 611

7, 3

1 676, 6

1992

1 004

7, 8

347, 2

1993

894

8, 3

203, 1

1994

1 112

8, 8

1 475, 3

Корреляция Пирсона уровней исходного ряда и расчетного (r)

0, 73

Коэффициент детерминации для оценки точности единичных прогнозов (R2), %

53, 3

Полученный прогноз на четыре года, если обсуждать оценку тенденций изменения эпизоотической активности очага, достаточно надежный, о чем свидетельствует высокое значение (0, 90) коэффициента корреляции Спирмэна. Однако отклонения численных значений ожидаемой и фактической площади буферной зоны эпизоотии на территории Прикаспийского песчаного природного очага чумы остаются высокими (величина отклонений по четырем годам колеблется от 33 до 77%).

Ожидаемое (табл. 10) и фактическое (табл. 6 и 10) увеличение площади буферной зоны эпизоотии на территории Прикаспийского песчаного природного очага чумы в 1994 г. можно было бы предотвратить (или уменьшить), если бы на основе данных прогноза были предприняты соответствующие меры профилактики.

3. Пример анализа и прогноза эпизоотической активности Горно-Алтайского высокогорного природного очага чумы

Каждый природный очаг чумы обладает особенностями биоценотической и пространственной структуры, характера и интенсивности эпизоотических проявлений, динамики эпизоотической активности в пространстве и времени. Поэтому при составлении эпизоотологических прогнозов для определенного очага необходимо учитывать его характерные черты. Для каждого природного очага чумы могут быть определены конкретные прогностические признаки, которые позволяют прогнозировать изменения его эпизоотической активности. На основании многолетнего изучения Горно-Алтайского высокогорного природного очага чумы установлено, что между ежегодным уровнем эпизоотической активности и уровнем численности монгольской пищухи - основного носителя возбудителя чумы алтайского подвида - наблюдается статистически существенная связь. Выявленные закономерности в изменениях численности населения монгольской пищухи и эпизоотической активности очага, обусловленной циркуляцией возбудителя чумы алтайского подвида, позволяют статистически обоснованно давать объективный краткосрочный эпизоотологический прогноз в очаге.

Предлагаемый алгоритм направлен на прогноз эпизоотической активности Горно-Алтайского высокогорного природного очага при циркуляции чумного микроба алтайского подвида. Прогнозирование интенсивности эпизоотических проявлений с участием возбудителя чумы основного подвида (выявлена его циркуляция на ряде территорий с 2012 г.) должно основываться на использовании других прогностических признаков.

Основой эпизоотологического прогноза являются многолетние показатели уровней численности монгольской пищухи и эпизоотической активности, которые представляются в виде соответствующих временных рядов. Эти характеристики определяются ежегодно при проведении эпизоотологического обследования очага. После получения показателей в текущем году их добавляют к имеющимся временным рядам в программе Microsoft Office Excel и отображают графически.

Ниже рассматриваются основные этапы получения данных, анализа временных рядов, что необходимо для статистического обоснования составления эпизоотологического прогноза и непосредственно выполнения прогноза.

Динамика численности населения монгольской пищухи. Численность монгольской пищухи определяют в весенний (апрель-июнь) и осенний (август-октябрь) периоды по количеству жилых нор-колоний на 1 га. Для этого на каждом участке эпизоотологического обследования на 2-4-километровых маршрутах подсчитывают все норы-колонии в полосе 10-30 м, после чего пересчитывают их число на 1 га. Для оценки уровня численности населения зверька в очаге все учеты, проведенные в определенный сезон текущего года, усредняют. Поскольку между временными рядами весенней и осенней численности наблюдается тесная статистически значимая связь (коэффициент корреляции Пирсона около 0, 7), то для прогноза используют среднегодовую численность населения монгольской пищухи на территории очага, которая рассчитывается как средняя арифметическая от средних значений весенних и осенних показателей. Определение показателя численности всего населения за год основывается на оценках нескольких независимых выборочных совокупностей. Используемый подход позволяет достаточно объективно охарактеризовать состояние населения по всей площади очага. Изменения численности монгольской пищухи в отдельных популяциях, расположенных в очаге, характеризуются определенными различиями, однако в целом циклы в разных популяциях синхронны, то есть пики и депрессии численности в них чаще всего совпадают, что дает основание рассматривать общую тенденцию в динамике численности зверька на территории очага.

Динамика среднегодовой численности населения монгольской пищухи с 1971 года по 2015 год представлена на рис. 3. Этот процесс имеет комбинированный характер.

image016.jpg

Он складывается из направленного долговременного роста и определенных колебаний численности. Оценка центральной тенденции изменения численности с помощью регрессионного анализа показывает, что коэффициент регрессии высоко значим (b=0, 084±0, 0170, df = 43, t = 4, 92, р < 0, 001). Исходя из уравнения линейной регрессии среднегодовая численность в 1971 г. составляла 4, 0, а в 2015 г. - 7, 7 жилых нор на 1 га. Для определения закономерности процесса колебаний численности была проведена описанная выше процедура приведения временного ряда к стационарному виду. Она проводилась путем вычитания теоретических значений, полученных из уравнения линейной регрессии, от эмпирических, полученных при непосредственной оценке ежегодных показателей. Выявлено, что колебания численности населения монгольской пищухи на территории очага имеет неслучайный характер. Коэффициент автокорреляции стационарного временного ряда составил 0, 408 (n = 44, р < 0, 01), что свидетельствует о наличии низкочастотных циклических колебаний численности (иными словами - с большим периодом). Непосредственное обращение к данным, описывающим динамику численности (рис. 3), показывает, что период колебаний находится в пределах семи-девяти лет. Статистическая оценка величины периода циклических колебаний может быть проведена на основе построения коррелограммы. Построенная коррелограмма показывает, что период циклических колебаний численности населения монгольской пищухи в Горно-Алтайском природном очаге чумы составляет семь-восемь лет (рис. 4).

image017.jpg

Динамика эпизоотической активности. Начиная со времени обнаружения очага в 1961 г., возбудитель чумы выделяют в нем ежегодно. При этом эпизоотическая активность очага по годам значительно варьирует.

Ежегодную эпизоотическую активность Горно-Алтайского высокогорного природного очага чумы оценивают по двум параметрам: площади эпизоотий и количеству секторов, в которых зарегистрированы эпизоотические проявления. Площадь эпизоотий вычисляется формально-территориальным способом, по суммарной площади секторов в границах участков эпизоотологического обследования, в которых были обнаружены зараженные чумой носители и переносчики или зарегистрированы следы циркуляции чумного микроба (положительные результаты иммунологических исследований с превышением титров РНАг над РНГА в 4 и более раза).

Динамика показателей эпизоотической активности с 1971 года по 2015 год приведена на рис. 5. Линейный тренд временных рядов площади эпизоотий и количества эпизоотических секторов высокозначим (соответственно b=11, 610±2, 1363; df = 43; t = 5, 43; р < 0, 001 и b=0, 211±0, 0361; df = 43; t = 5, 84; р < 0, 001), что свидетельствует о возрастании эпизоотической активности очага во времени.

image018.jpg

Поскольку во временных рядах площади эпизоотий и количества эпизоотических секторов наблюдается существенный тренд на увеличение, для анализа их циклической составляющей была проведена процедура преобразования числовых последовательностей в стационарные временные ряды, как это было описано выше. Коэффициент автокорреляции (ra1) стационарного временного ряда первого показателя равен 0, 587, второго - 0, 674 (n = 44; р < 0, 01). Это свидетельствует о неслучайном характере колебаний эпизоотической активности очага. Однако циклические колебания с периодом, характерным для численности населения основного носителя, с помощью построения коррелограмм не обнаруживаются.

Оценка связи между показателями эпизоотической активности и численности населения монгольской пищухи. Полученные временные ряды численности и эпизоотической активности отображаются на одном графике (рис. 5), проводится их визуальное сравнение и статистическая оценка уровня связи между ними. При этом хорошо видно, что центральные тенденции временных рядов показателей, отражающих эпизоотическую активность очага и численность населения основного носителя, совпадают. Коэффициент корреляции Пирсона между эмпирическими временными рядами численности и площадей эпизоотий составил 0, 685 (df = 43, р < 0, 001), на таком же уровне находится теснота связи между первым показателем и числом эпизоотических секторов (r = 0, 696, df = 43, р < 0, 001). Сравнение циклических составляющих (стационарных временных рядов) показателей эпизоотической активности и численности монгольской пищухи показывает, что между ними имеется достоверная корреляция: r = 0, 450 для площадей эпизоотий и r = 0, 458 для количества эпизоотических секторов (в обоих случаях df = 43, р < 0, 01).

Из проведенного анализа следует, что в Горно-Алтайском высокогорном природном очаге чумы, во-первых, при долговременном росте численности монгольской пищухи происходит увеличение эпизоотической активности очага, во-вторых, периодические изменения эпизоотической активности связаны с циклическими колебаниями численности населения зверька. В каждом цикле динамики численности, как правило, в фазе роста происходит возрастание эпизоотической активности очага, пик последней совпадает с пиком численности зверька, при депрессии и на начальном этапе роста численности активность очага наименьшая.

После проведения анализа связи между выбранным предиктором (в данном случае среднегодовым уровнем численности монгольской пищухи) и эпизоотической активностью очага на основе выявленных закономерностей проводится краткосрочный прогноз эпизоотического состояния очага на следующий год.

Следует подчеркнуть, что с конца 90-х годов XX века и до настоящего времени эпизоотическая активность Горно-Алтайского высокогорного природного очага чумы в целом оценивается как высокая. Это определяется, в первую очередь, направленным ростом численности населения монгольской пищухи и расширением ее ареала в Юго-Восточном Алтае. Весьма вероятно, что общая высокая эпизоотическая активность очага будет наблюдаться при сохранении уровня численности основного носителя на высоком уровне. Вместе с этим наблюдаются и выраженные циклические колебания эпизоотической активности очага. В настоящих МУ рассматривается прогнозирование циклических изменений эпизоотической активности, происходящих на фоне довольно высокого ее уровня.

Прогноз эпизоотической активности. Предлагаемый прогноз эпизоотической активности Горно-Алтайского высокогорного природного очага чумы является факторным, базирующимся на характере изменения временного ряда предиктора, в качестве которого выступают уровни среднегодовой численности населения монгольской пищухи. Он достаточно информативен и объективен, поскольку показатель численности зверьков представляет собой реальный биологический параметр, определяющийся на основании количественной оценки состояния популяций млекопитающих. Циклы динамики численности населения монгольской пищухи проявляются достаточно четко.

После завершения очередного эпизоотического цикла и цикла численности населения монгольской пищухи все статистические показатели, по которым оцениваются эти процессы, следует пересчитать. Это обусловлено тем, что выявленные общие биологические закономерности характерны, как минимум, для оцениваемого временного периода. С течением времени они могут трансформироваться.

После установления уровня весенней и осенней численности населения монгольской пищухи в текущем году определяется среднегодовой показатель, это значение дополняется к имеющемуся многолетнему временному ряду в электронной базе данных и он отображается графически, как это представлено на рис. 3. На основании анализа многолетней тенденции изменения временного ряда численности монгольской пищухи определяется текущая фаза динамики этого процесса.

Прогноз проводится в виде качественной оценки эпизоотического состояния очага, выраженной в четырех уровнях (градациях), соответствующих четырем фазам эпизоотического цикла: рост активности, пик, спад и депрессия. Такой прогноз дает важную информацию о тенденции изменения эпизоотической активности. Он существенно дополняет сведения, получаемые на основании прогноза, выполняемого в соответствии с разделом 4, по которому ожидаемая эпизоотическая активность оценивается по следующим качественным критериям: отсутствие эпизоотий, единичные находки зараженных животных, локальные эпизоотии, разлитые эпизоотии. Поскольку каждый эпизоотический цикл в Горно-Алтайском природном очаге чумы характеризуется определенными средними уровнями по показателям эпизоотической активности, то можно дополнительно определить относительный уровень эпизоотической активности в текущем цикле. Для фазы депрессии - как низкий, для фаз роста и спада - как средний, для фазы пика - как высокий.

Предлагаемая оценка эпизоотического состояния определяется еще и тем, что энзоотичная по чуме территория в Горно-Алтайском высокогорном природном очаге относительно невелика, долговременных межэпизоотических периодов за все время изучения очага не зарегистрировано и пока нет никаких объективных предпосылок их проявления.

На основе оценки текущей фазы цикла динамики численности монгольской пищухи проводится краткосрочный прогноз эпизоотической активности очага на следующий год. Он осуществляется на основании проявляющейся связи между уровнями численности монгольской пищухи и показателями эпизоотической активности. Качественная характеристика связанных циклов следующая:

- рост эпизоотической активности соответствует фазе роста численности основного носителя;

- пик эпизоотической активности соответствует фазе пика или началу спада численности монгольской пищухи;

- уменьшение эпизоотической активности соответствует фазе спада численности носителя;

- минимальная эпизоотическая активность соответствует фазе депрессии и началу роста численности.

Для удобства применения описанного подхода качественные характеристики циклических колебаний численности монгольской пищухи и прогнозируемого состояния очага сведены в табл. 11.

Таблица 11

Краткосрочный прогноз эпизоотической активности Горно-Алтайского высокогорного природного очага чумы на основе индикаторного подхода (предиктор - фаза цикла динамики численности монгольской пищухи)

Фаза цикла динамики численности населения монгольской пищухи в текущем году

Фаза эпизоотического цикла в следующем году (наиболее вероятный уровень эпизоотической активности)

Начальный период роста

Депрессия (низкий) или начало роста (средний)

Интенсивный рост

Рост (средний) или пик (высокий)

Пик

Пик или начало спада (высокий)

Начальный период спада

Начало спада (высокий) или спад (средний)

Спад

Спад (средний)

Депрессия

Конец спада или депрессия (низкий)

Наиболее сложной оценка будущего эпизоотического состояния очага представляется во время "переломов" циклов, т.е. когда наблюдается переход из одной фазы в другую. При этом могут быть сомнения в определении дальнейшего изменения численности носителя. В этом случае следует учитывать и сам ход кривой, описывающей эпизоотическую активность.

Уровень весенней численности монгольской пищухи следует использовать для краткосрочного эпизоотологического прогноза уже в текущем году, поскольку сезонная активизация эпизоотической активности очага наблюдается в осенний период, что при необходимости, связанной, например, с резким изменением погодных условий, позволит внести коррективы в сделанный в предыдущем году прогноз.

4. Алгоритм построения долгосрочного прогноза на примере Центрально-Кавказского высокогорного природного очага чумы

Особенностью эпизоотической активности Центрально-Кавказского высокогорного природного очага чумы является четкое разделение на два периода: период выделения штаммов чумы (1971-2007 гг.) и межэпизоотический период (2008-2015 гг., рис. 6).

image019.jpg

Межэпизоотический период является еще достаточно коротким и это сказывается на точности долгосрочного прогноза. Прогноз сделан по алгоритму, описанному в методических рекомендациях по долгосрочному прогнозированию эпизоотической активности природных очагов чумы (Саратов, 1991), но автоматизирован в таблице Microsoft Excel. Прогнозировалось, будет ли хотя бы один сектор, в котором из пробы полевого материала будет выделен штамм микроба чумы ("зараженный" сектор). Результаты представлены в табл. 12.

Таблица 12

Шансы появления "зараженного" сектора

Год

Сумма шансов

Фактическая зараженность пунктов

1

2

3

1971

71, 83333

2

1972

66, 75

7

1973

60

11

1974

73

13

1975

55, 08333

10

1976

76

12

1977

58

10

1978

63, 75

11

1979

58, 83333

12

1980

66

7

1981

61, 25

8

1982

71

10

1983

58, 83333

12

1984

62, 75

8

1985

58, 5

11

1986

70, 5

9

1987

54, 58333

14, 00

1988

67, 5

11, 00

1989

57, 5

12, 00

1990

61, 25

10, 00

1991

59, 83333

12, 00

1992

67, 5

15, 00

1993

56, 25

7, 00

1994

64

11, 00

1995

58, 83333

7, 00

1996

66, 25

6, 00

1997

59

8, 00

1998

66

9, 00

1999

60, 58333

11, 00

2000

66

4, 00

2001

68

6, 00

2002

68, 75

3, 00

2003

69, 33333

4, 00

2004

77

4, 00

2005

39, 75

0, 00

2006

84, 5

1, 00

2007

49, 83333

0, 00

2008

53, 75

0, 00

2009

55

0, 00

2010

61

0, 00

2011

62, 08333

0, 00

2012

62, 5

0, 00

2013

59

0, 00

2014

58, 25

0, 00

2015

53, 83333

0

2016

79

2017

64, 75

2018

71, 5

2019

63, 83333

2020

66, 75

2021

63, 5

2022

68

2023

56, 58333

2024

67, 5

2025

56, 5

2026

64, 25

Среднее количество шансов в годы, когда имелся хотя бы один "зараженный" сектор, равно 64, 7. Среднее количество шансов в годы межэпизоотического периода равно 55, 5. Исходя из этих данных, можно ожидать проявления эпизоотий в 2016-2018, 2020, 2022, 2024 и 2026 гг. Вероятность реализации прогноза составляет около 70%, в остальные годы она несколько меньше.

Руководитель Федеральной службы
по надзору в сфере защиты прав
потребителей и благополучия человека,
Главный государственный санитарный
врач Российской Федерации

А.Ю. Попова


Возврат к списку

(Нет голосов)

Комментарии (0)


Чтобы оставить комментарий вам необходимо авторизоваться
Новости
Все новости