Трудно найти какую-либо область науки, техники, биологии, эконо-
мики или естествознания, в которой не проводятся различные наблюде-
ния, измерения или экспериментальные исследования. Во всех этих об-
ластях возникают вопросы описания, анализа и извлечения полезной
информации из полученных данных. В свою очередь, полученные данные,
как правило, могут изменяться случайным образом, и основные методы
их описания приводят к необходимости рассмотрения разнообразных мо-
делей случайных функций.
Вопросам построения вероятностных моделей, статистическим мето-
дам исследований и общей теории случайных функций посвящено доста-
точно много хороших изданных монографий, учебников и учебных посо-
бий, некоторые из которых перечислены во Введении.
Данная книга по своей общей направленности также связана с рас-
смотрением прикладных вопросов использования моделей случайных
функций в решении различных практических задач, однако по своему
характеру она существенно отличается от всех известных изданных книг.
Отличается по общему содержанию, по форме представления и характеру
изложения основных результатов. Эти отличительные особенности можно
заметить уже на этапе предварительного просмотра оглавления, введения
и кратких аннотаций, которыми открывается каждая глава.
Изложение основного материала в данной работе начинается с расши-
ренного Введения. Здесь делается попытка хотя бы приближенно очертить
состояние исследований, разнообразие областей и спектр практических
приложений, связанных с общей проблематикой обработки и анализа слу-
чайных данных. После вводной части все содержание книги разделено на
пять глав. В первой главе показываются обобщенные модели получения,
преобразования и обработки информации, проводится общая классифи-
кация случайных функций, и выделяются особенности типовых задач те-
ории статистических решений. Материал последующих четырех глав по-
священ рассмотрению моделей и результатов анализа основных классов
случайных функций: анализу временных рядов или случайных последова-
тельностей (глава 2), исследованиям непрерывных случайных процессов
(глава 3), рассмотрению случайных потоков событий и случайных точеч-
ных процессов (глава 4), анализу пространственно-временных данных на
уровне моделей случайных полей и изображений (глава 5).
В каждой главе показываются основные модели процессов и резуль-
таты их анализа, выделяются наиболее важные характеристики, и при-
водятся примеры различных прикладных задач. В книге представлено
большое количество новых результатов. В основном они относятся к веро-
ятностному описанию неоднородных данных, исследованиям детальной
вероятностной структуры процессов, представлениям случайных функ-
ций на фазовой плоскости и анализу диаграмм рассеяния, исследовани-
ям структуры случайных точечных процессов и исследованиям простран-
ственно-временных характеристик случайных полей.
Все основные результаты, приводимые в работе, имеют достаточно
строгие математические доказательства и обоснования. Однако сами до-
казательства здесь не рассматривались, так как не это являлось основной
целью. Отбор и характер изложения основного материала ведется здесь
таким образом, чтобы, по возможности, избежать излишнего формализ-
ма, выявить содержательную, физическую сторону рассматриваемых про-
цессов и облегчить практическое использование результатов. Кроме того,
здесь делалась попытка показать разнообразие прикладных задач, которые
решаются (или могут решаться) на основе рассмотренных моделей вре-
менных рядов, случайных процессов, случайных потоков событий, про-
странственно-временных полей и изображений.
Помимо этого нужно отметить, что для большей наглядности изложе-
ния и удобства пользования книгой, весь иллюстративный материал пред-
ставлен здесь в виде отдельных схем. Эти схемы обладают определенной
самостоятельностью, дают много дополнительной информации и в боль-
шинстве случаев могут рассматриваться независимо от основного текста.
В целом предлагаемая книга подготавливалась так, чтобы она могла
быть полезной для тех, кто изучает, исследует и применяет на практике
модели и методы анализа различных по своей физической природе слу-
чайных данных.
ВВЕДЕНИЕ
ОБЩАЯ ПРОБЛЕМА ОБРАБОТКИ
И АНАЛИЗА ДАННЫХ
1. Одной из наиболее общих проблем в физике и технике, биологии
и медицине, социологии, экономике и различных областях естествознания
является проблема описания и извлечения информации из эксперимен-
тальных данных. Под термином «данные», в зависимости от конкретной
области, могут при этом пониматься самые разнообразные информацион-
ные процессы, сигналы, результаты наблюдений или измерений.
В соответствии с традиционным определением, информационные
сигналы и данные – это изменения какой-либо физической величины,
отражающей информацию о некотором явлении, событии, состоянии
исследуемой системы или состоянии наблюдаемого объекта. Состояния
реальных (не идеализированных) систем могут изменяться случайным
образом, а поэтому «сигналы и данные» по самой своей сути должны рас-
сматриваться как некоторые случайные функции.
Следовательно, если рассматривать задачи описания, обработки
и анализа данных, то можно заметить, что по своему содержанию подоб-
ные задачи эквивалентны задачам описания и исследования случайных
функций. Принципиально такие задачи относятся к классу статистиче-
ских или вероятностных задач. Основой для решения таких задач явля-
ются теория вероятностей, теория случайных процессов и математиче-
ская статистика (схема 0.1). Теория вероятностей используется при этом
для построения моделей и исследования случайных явлений, случайных
событий, случайных величин. Изучение временной и пространственной
структуры случайных функций, вероятностных зависимостей, различных
линейных и нелинейных преобразований сигналов и данных выполняется
на основе теории случайных процессов. Методы математической стати-
стики позволяют решать задачи оптимального планирования эксперимен-
тов, задачи оценивания параметров, классификации случайных данных,
распознавания образов и многие другие задачи, связанные с проблемой
статистических решений и статистических выводов.
2. Приведенное общее определение информационных сигналов и дан-
ных настолько широкое, что может относиться к самым различным об-
ластям исследований. Это может быть, например, область исследования
основных закономерностей материального мира, изучение процессов
развития живой природы, исследование технических систем, социальных
явлений и экономических процессов. Хорошо известно также и то, что ве-
роятностные и статистические методы анализа относятся к междисципли-
нарным методам. Они позволяют описывать информационные процессы,
исследовать поведение сложных систем, находить оптимальные алгорит-
мы обработки и анализа данных независимо от их физической природы.
Все эти особенности наглядно проявляются в многообразии сформи-
ровавшихся к настоящему времени самостоятельных «статистических»
направлений исследований (схема 0.2).
Само развитие и многочисленность подобных направлений исследо-
ваний, с одной стороны, подтверждает, что вероятностные и статистиче-
ские методы действительно полезны и эффективны в различных областях
естествознания.
С другой стороны, важно заметить, что формирование самостоятель-
ных «статистических» направлений объясняется тем, что без вероятност-
ного подхода, без статистического рассмотрения большинство традицион-
ных естественно-научных направлений уже просто не могут развиваться.
Многие реальные практические задачи без учета случайных изменений
«состояния» изучаемых процессов и систем становятся бессодержатель-
ными.
какой-либо самостоятельной предметной области необходимо, чтобы
эта область имела:
1) свои модели процессов и систем,
2) свой круг задач,
3) свои методы решения этих задач и, конечно,
4) свою область приложения практических результатов.
Все перечисленные признаки относятся к отличительным особенно-
стям; именно ими определяется специфика каждого направления иссле-
дований и степень его самостоятельности.
Если теперь к этим же отличительным признакам подойти с несколь-
ко иной точки зрения, то многие из них могут одновременно рассматри-
ваться и как объединяющие признаки для общей проблематики статисти-
ческого анализа информации (схема 0.3).
Действительно, модели событий, процессов и систем в физике, тех-
нике, биологии, при всем их многообразии и различии, – это все-таки
вероятностные модели случайных функций. Класс решаемых задач, ка-
кой бы спецификой они ни обладали, по своему содержанию – это задачи
вероятностного анализа моделей и задачи статистической обработки на-
блюдений. Методы решения таких задач – это методы теории случайных
функций и методы математической статистики (схема 0.3).
И, наконец, остается еще одна характерная черта направления – об-
ласть приложения результатов. Этап использования результатов тесно
связан с начальным этапом исходной «содержательной» формулировки
решаемой задачи. Здесь наиболее полно проявляется специфика пред-
метной области и, конечно же, на этом этапе проявляются существенные
различия физических, биологических, экономических или каких-либо
других приложений. Однако даже на этом этапе, помимо использования
полученных результатов в рассматриваемой конкретной области, важно
оценить потенциальную полезность новых результатов в других предмет-
ных областях.
Выделенные в данном разделе особенности характеризуют
общее состояние и направленность исследований по проблематике
статистической обработки и анализа случайных данных. С учетом
этих особенностей и с учетом практической полезности результатов
для различных областей физики, техники, биологии, медицины,
в основных главах книги отбираются и исследуются вероятностные
модели случайных функций. Подобный подход к рассмотрению об-
щей вероятностной структуры, анализу основных свойств и харак-
теристик выбранных моделей приводит к более общим и более важ-
ным результатам по сравнению с результатами решения какой-либо
отдельной самостоятельной задачи.
ЛИТЕРАТУРА К ВВЕДЕНИЮ
1. Рейф Ф. Статистическая физика. – М.: Наука, 1986.
2. Климонтович Ю.Л. Статистическая физика. – М.: Наука, 1982.
3. Фейнман Р. Статистическая механика. – М.: Мир, 1975.
4. Репке Г. Неравновесная статистическая механика. – М.: Мир, 1990.
5. Киттель Ч. Статистическая термодинамика. – М.: Наука, 1977.
6. Зубарев Д.Н. Неравновесная статистическая термодинамика. –
М.: Наука, 1971.
7. Гудмен Дж. Статистическая оптика. – М.: Мир, 1988.
8. О'Нейл Э. Введение в статистическую оптику. – М.: Мир, 1966.
9. Хименко В.И., Тигин Д.В. Статистическая акустооптика и обработка
сигналов. – СПб.: Изд-во С.-Петерб. ун-та, 1996.
10. Троицкий И.Н., Устинов Н.Д. Статистическая теория голографии. –
М.: Радио и связь, 1981.
11. Троицкий И.Н. Статистическая теория томографии. – М.: Радио
и связь, 1989.
12. Дерффель К. Статистика в аналитической химии. – М.: Мир, 1994.
13. Зайцев Г.Н. Математическая статистика в экспериментальной бота-
нике. – М.: Наука, 1984.
14. Крамбейн У., Грейбилл Ф. Статистические модели в геологии. –
М.: Мир, 1969.
15. Троян В.Н., Киселев Ю.В. Статистические методы обработки геофи-
зических данных. – СПб.: Изд-во С.-Петерб. ун-та, 2000.
16. Ахманов С.А., Дьяков Ю.Е., Чиркин А.С. Статистическая радиофизика
и оптика. – М.: Физматлит, 2010.
17. Тихонов В.И. Статистическая радиотехника. – М.: Радио и связь,1982.
18. Вопросы статистической теории радиолокации / Под ред. Г.П. Тарта-
ковского. – М.: Сов. радио, 1963.
19. Сосулин Ю.Г. Теоретические основы радиолокации и радионавига-
ции. – М.: Радио и связь, 1992.
20. Миддлтон Д. Введение в статистическую теорию связи. – М.: Сов.
радио, 1961.
21. Статистическая теория связи и ее практические приложения / Под
ред. Б.Р. Левина. – М.: Связь, 1979.
22. Шифрин Я.С. Вопросы статистической теории антенн. – М.: Сов.
радио, 1970.
23. Пугачев В.С., Казаков И.Е., Евланов Л.Г. Основы статистической
теории автоматических систем. – М.: Машиностроение, 1974.
Литература к введению 15
24. Острем К. Введение в стохастическую теорию управления. –
М.: Мир, 1973.
25. Фукунага К. Введение в статистическую теорию распознавания
образов. – М.: Наука, 1979.
26. Распознавание образов: состояние и перспективы / К. Верхаген,
Р. Дейн, Ф. Грун и др. – М.: Радио и связь, 1985.
27. Налимов В.В., Чернова Н.А. Статистические методы планирования
экстремальных экспериментов. – М.: Наука, 1965.
28. Джонсон Н., Лион Ф. Статистика и планирование эксперимента
в технике и науке. – М.: Мир, 1980.
29. Статистические методы в прикладной кибернетике / Под ред.
Р.М. Юсупова. – Л.: Мин. обороны СССР, 1980.
30. Дмитриев А.К., Юсупов Р.М. Идентификация и техническая диагно-
стика. – М.: Мин. обороны СССР, 1987.
31. Вопросы математической теории надежности / Под ред. Б.В. Гнеден-
ко. – М.: Радио и связь, 1983.
32. Гнеденко Б.В., Коваленко И.Н. Введение в теорию массового обслу-
живания. – М.: Наука, 1987.
33. Пановский Г.А., Брайер Г.В. Статистические методы в метеороло-
гии. – Л.: Гидрометеоиздат, 1972.
34. Казакевич Д.И. Основы теории случайных функций в задачах гидро-
метеорологии. – Л.: Гидрометеоиздат, 1989.
35. Хаттон Л., Уэрдингтон М., Мейкин Дж. Обработка сейсмических дан-
ных. – М.: Мир, 1989.
36. Картвелишвили Н.А. Теория вероятностных процессов в гидроло-
гии. – Л.: Гидрометеоиздат, 1985.
37. Рожков В.А. Методы вероятностного анализа океанологических
процессов. – Л.: Гидрометеоиздат, 1979.
38. Прабху Н. Стохастические процессы теории запасов. – М.: Мир,
1984.
39. Блекуэлл Д., Гиршик М.А. Теория игр и статистических решений. –
М.: Изд-во ИЛ, 1958.
40. Лакин Г.Ф. Биометрия. – М.: Высшая школа, 1990.
41. Медик В.А., Токмачев М.С., Фишман Б.Б. Статистика в медицине
и биологии. – М.: Медицина, 2000.
42. Вербик М. Путеводитель по современной эконометрике. – М.: Науч-
ная книга, 2008.
43. Носко В.П. Эконометрика. Кн. 1,2. – М.: Издательский дом «Дело»,
2011.
44. Сигел Э. Практическая бизнес-статистика. – М.: Издательский дом
«Вильямс», 2004.
45. Соложенцев Е.Д. Сценарное логико-вероятностное управление ри-
ском в бизнесе и технике. – СПб.: Изд-во «Бизнес-пресса», 2004.
46. Управление риском: Риск. Устойчивое развитие. Синергетика. –
М.: Наука, 2000.
47. Королев В.Ю., Бенинг В.Е., Шоргин С.Я. Математические основы
теории риска. – М.: Физматлит, 2011.
48. Бродецкий Г.Л. Экономико-математические методы и модели в логи-
стике. – М.: Академия, 2011.
49. Васильева Э.К., Юзбашев М.М. Выборочный метод в социально-эко-
номической статистике. – М.: Финансы и статистика, 2010.
50. Дубина И.Н. Математико-статистические методы в социально-эко-
номических исследованиях. – М.: Финансы и статистика, 2010.
ГЛАВА 1
СИГНАЛЫ, ПОМЕХИ,
НАБЛЮДЕНИЯ И РЕШЕНИЯ
• Особенности получения и преобразования информации
• Модели обработки информационных процессов
• Общая классификация и примеры случайных функций
• Основные задачи теории принятия решений
• Взаимосвязь вероятностного анализа и синтеза
По своему содержанию данная глава носит вводный характер. В ней
рассматриваются особенности получения, преобразования и обработки
информации. Вводятся простые обобщенные модели, и на их основе по-
казывается, что математическое описание сигналов, помех, наблюдений
и решений в задачах обработки информации по своей сути приводит к опи-
санию и анализу случайных функций. Для использования такого подхода
на практике в данной главе проводится общая классификация случайных
функций и для каждого выделенного класса показываются примеры ре-
альных экспериментальных данных из различных областей естествозна-
ния. В последних разделах главы выделяются особенности формулиров-
ки типовых задач обнаружения и различения сигналов, задач оценивания
параметров и задач фильтрации информационных процессов. Показыва-
ются основные этапы вероятностного анализа и статистического синтеза,
подчеркиваются их отличительные особенности и взаимосвязи.
1.1. Обобщенная модель преобразования
информации
Обычно все основные процедуры сбора, преобразования и обработки
информации существенно зависят от содержания и конкретных условий
решаемой задачи. Большое разнообразие практических задач приводит
к разнообразию экспериментальных исследований, разнообразию систем
обработки и анализа данных. Однако, несмотря на это, принцип получе-
ния информации и основные этапы преобразования информационных
процессов условно можно представить в виде обобщенной модели (схе-
ма 1.1.1).
Такая модель включает в себя источник информации, операции пер-
вичного преобразования, передачи, приема и обработки данных. Источником информации является здесь изучаемый объект или какая-либо
исследуемая система. Любая реальная (не идеализированная) система
функционирует в условиях случайных внешних воздействий, параметры
самой системы также могут изменяться случайным образом, и поэто-
му «состояние системы» должно рассматриваться как некоторая случай-
ная функция x(t, r), зависящая от времени t и координат пространства r.
Операция первичного преобразования предназначена для выделения инфор-
мационных параметров или признаков, которые характеризуют состояние
исследуемого объекта. Такая операция может выполняться, например, дат-
чиками, чувствительными элементами, сенсорными устройствами. После
первичного преобразования информационные сигналы передаются по каналу
передачи в систему обработки и анализа данных (схема 1.1.1). Характери-
стики каналов передачи информации могут изменяться случайным об-
разом в процессе работы. Практическая реализация основных преобразо-
ваний всегда сопровождается некоторыми погрешностями. Кроме того,
разнообразные внутренние и внешние случайные воздействия оказывают
неизбежное влияние на параметры исследуемых процессов.
Все эти особенности приводят к необходимости построения вероят-
ностных моделей для описания изучаемых систем, процессов и преобра-
зований.
Представленная на схеме 1.1.1 обобщенная структура по своей сути
отражает «содержательную» сторону проблематики получения, преобразо-
вания и обработки информации. При решении задач обработки и анализа
данных основой являются математические методы, и для их использова-
ния необходимо перейти от содержательного описания к формализован-
ному представлению информационных процессов.
На схеме 1.1.2 показана обобщенная формализованная модель обра-
ботки информации. Такая модель полностью эквивалентна рассмотрен-
ной ранее структурной схеме и отличается лишь большей формализацией.
Приведенные в данном разделе обобщенные модели позво-
ляют на разных уровнях описывать последовательность основных
операций получения, преобразования и обработки информацион-
ных процессов. Такое описание может выполняться на этапах со-
держательной постановки задач, когда основные узлы структурной
модели (схема 1.1.1) конкретизируются в соответствии с исследуе-
мой системой или исследуемым источником информации. Может
выполняться такое описание и на этапах формализованного пред-
ставления решаемых задач, когда обобщенная модель (схема 1.1.2)
не зависит от физической природы рассматриваемых систем и ис-
следуемых информационных процессов.
1.2. Определение и общая классификация
случайных функций
Обобщенные модели преобразования и обработки информации
(п. 1.1) достаточно наглядно подтверждают, что математическое описа-
ние динамических систем, информационных процессов и помеховых
воздействий должно выполняться на основе теории случайных функций.
Для того чтобы воспользоваться этой теорией, целесообразно, прежде
всего, дать общее определение случайной функции и рассмотреть воз-
можность предварительной «грубой» классификации таких функций.
Подобный подход позволяет выделить основные классы вероятностных
моделей и привести характерные примеры их практического использо-
вания.
В наиболее общем виде случайная функция формально определяется
как семейство случайных переменных:
см. уравнение в книге
в котором s – параметр, X – пространство состояний переменной ,
S – множество возможных значений параметра s. Если из рассматривае-
мого семейства {(s)} выбрать лишь одну функцию (s), то такую функцию
(s) принято называть выборочной функцией или отдельной реализацией.
Классификация случайных функций, как и любая классификация,
существенно зависит от целей и содержания решаемых задач. Она может
выполняться различными способами и по самым различным признакам.
На данном этапе за основу классификации удобно взять общее определе-
ние случайной функции {(s), X, s S} и путем конкретизации мно-
жеств X и S разделить все многообразие функций {(s)} на самостоятель-
ные классы (схема 1.2.1).
Разделение случайных функций {(s)} = {(s), X, s S} по виду про-
странства состояний X и виду параметрического множества S сразу же раз-
деляет эти функции и по характерному виду их реализаций {(s)}. В зада-
чах обработки и анализа информации такое деление необходимо, так как
от вида реализаций существенно зависят и сами методы анализа.
Выделим здесь несколько основных классов случайных функций (схе-
ма 1.2.2), модели которых наиболее часто используются в практических
приложениях [10, 23].
1. Случайные последовательности и временные ряды
Предположим, что в определении случайной функции {(s), X,
s S} пространство состояний X является непрерывным скалярным мно-
жеством, параметр s представляет собой время, а параметрическое множество S – дискретное, то есть s = t – время, S = T = {tn, n = 0, 1, 2, ... }.
Для случайной функции удобно при этом использовать обозначение
{(s)} = {(tn)} = {n}, где n = 0, 1, 2, ... . Называется такая функция непре-
рывной случайной последовательностью. В некоторых задачах ее назы-
вают также временным рядом или непрерывным случайным процессом
с дискретным временем. Обычно в данном определении считается, что
t0 < t1 < t2 < ... и t = ti – ti–1 = const при любых i = 1, 2, ... , m.
Если предположить здесь, что пространство состояний X не непрерыв-
ное, а дискретное множество, то функция {n} будет называться дискрет-
ной случайной последовательностью.
В более общей ситуации можно рассматривать векторную после-
довательность {n} = {1n , 2n , ... , qn}, каждая компонента которой jn,
j = 1, 2, ... , q сама является непрерывной или дискретной случайной функ-
цией. В качестве иллюстрации на схеме 1.2.2 показан характерный вид
реализаций наиболее распространенных типов случайных последователь-
ностей.
2. Непрерывные случайные процессы
Если теперь предположить, что в общем определении случайной
функции {(s)} = {(s), X, s S} параметр s = t – время, а простран-
ство состояний X и параметрическое множество S = T являются непре-
рывными множествами, то полученная функция {(t)} = {(t), X, t T}
будет соответствовать определению непрерывного случайного процес-
са. Как правило, T представляет собой некоторый интервал временной
оси, то есть t [t0, t0 + T] = [0, T]. Значения случайных переменных (t)
могут быть при этом либо действительными (скалярными), либо ком-
плексными, либо векторными. Соответственно, и исследуемые про-
цессы будут называться скалярными, комплексными или векторными
случайными процессами. На схеме 1.2.2 показан характер реализаций
скалярного непрерывного случайного процесса (t), векторного двумер-
ного (t) = (1(t), 2(t)) = (x(t), y(t)) и векторного трехмерного процесса
(t) = (1(t), 2(t), 3(t)) = (x(t), y(t), z(t)). Составляющие компоненты i(t),
i = 1, 2, 3 могут здесь рассматриваться как зависимые или независимые не-
прерывные скалярные случайные процессы.
3. Случайные точечные процессы и потоки событий
Точечные процессы представляют собой такую математическую мо-
дель, в которой пространство состояний X – это дискретное множество
точек. Обычно каждой точке ставится в соответствие какое-либо событие
и тогда пространство X интерпретируется как дискретное множество одно-
родных событий. Если события происходят во времени, то параметр s = t,
t T и случайный процесс (t) эквивалентен последовательности точек
{tn, n = 1, 2, ...}, соответствующих случайным моментам t1, t2, ... появлеми однородных событий. Описание последовательности событий {tn},
t1 < t2 < t3 < ... во многих задачах может быть выполнено и как описание
целочисленного случайного процесса {n(t)}, характеризующего число n(t)
событий (точек) на текущем интервале времени [0, t).
Модели точечных процессов допускают различные обобщения. Так,
например, случайное множество точек можно рассматривать не только
на временной оси [0, t), но и на плоскости (x, y), или в каком-либо про-
странстве (x, y, z). В зависимости от содержания решаемых задач, подоб-
ные модели могут рассматриваться как случайные точечные процессы,
или, в более общей ситуации, как случайные точечные поля, изменяющи-
еся и во времени, и в пространстве (схема 1.2.2).
4. Случайные поля
Если в общем определении случайной функции {(s)} = {(s), X,
s S} параметрическое множество S имеет размерность k 2, то такая
функция называется случайным полем. В практических приложениях наи-
больший интерес обычно представляют пространственно-временные поля
{(t, r)}, для которых случайные переменные (t, r) зависят от времени t
и координат r пространства (x, y, z). Налагая определенные ограничения
на пространство состояний X случайной функции {(t, r)}, можно выде-
лить классы непрерывных и дискретных, скалярных и векторных случай-
ных полей.
На схеме 1.2.2 показан характер реализации наиболее простого непре-
рывного пространственно-временного случайного поля (t, x, y).
Конечно, следует подчеркнуть, что выделенные классы слу-
чайных функций не охватывают всего многообразия существующих
типов вероятностных моделей. Однако подобная классификация
разделяет случайные функции по виду их реализаций. Это позволяет
частично систематизировать и обобщить различные по своему со-
держанию приложения теории случайных функций для задач обра-
ботки и анализа информационных процессов.
1.3. Многообразие случайных функций
в прикладных задачах
Определение и общая классификация случайных функций, приведен-
ные в п. 1.2, относятся к формализованным представлениям. Такой подход
необходим для математического описания исследуемых систем и привле-
чения общих методов теории случайных процессов к решению задач об-
работки и анализа данных.
Если же говорить о содержательной стороне исследований, то нужно
заметить, что и физическая интерпретация, и характер поведения отдель-
ных реализаций случайных функций могут быть весьма разнообразными.
Зависит это от рассматриваемой области и конкретного содержания реша-
емой задачи.
Приведем здесь некоторые примеры случайных функций, характер-
ных для различных областей физических, технических, медико-биологи-
ческих исследований. Разделение на самостоятельные классы будем при
этом проводить в соответствии с общей классификацией, предложенной
в п. 1.2.
1. Примеры простых случайных последовательностей
Обычно случайные последовательности можно интерпретировать сле-
дующим образом. При исследовании некоторой сложной системы или
при изучении протекающих процессов проводятся измерения какого-
либо параметра – например, измеряется температура, давление, значение
биопотенциалов, значения скорости, ускорения, … . Измерения проводят-
ся в дискретные моменты времени t1, t2, t3, ... через равные интервалы t.
В результате таких измерений получается последовательность наблюдений
(t1), (t2), (t3) ... или, в более простой форме записи, 1, 2, 3, ... . Если
при этом измеряемый параметр (t) меняется непрерывно во времени,
то получаемая последовательность 1, 2, 3, ... относится к классу непре-
рывных случайных последовательностей. Если же исследуемый параметр
или процедура регистрации имеет дискретный характер, то и случайная
последовательность будет относиться к классу дискретных.
В качестве примера на схеме 1.3.1 показаны экспериментальные ре-
зультаты нескольких различных по своему содержанию исследований.
При построении математических моделей и при решении задач обработ-
ки и анализа данных все подобные результаты (независимо от физической
природы изучаемых процессов) могут исследоваться на основе теории слу-
чайных последовательностей или случайных временных рядов.
2. Примеры непрерывных случайных процессов
Большинство исследуемых природных явлений и процессов относят-
ся к процессам, протекающим непрерывно во времени. Принципиально
они могут рассматриваться как некоторые непрерывные функции време-
ни (t). Если такие процессы наблюдаются (регистрируются) непрерывно
на некотором временном интервале [t0, t0 + T] = [0, T] длительностью T,
то в результате наблюдения получается реализация или траектория, или
выборочная функция исследуемого процесса (t), t T.
На схеме 1.3.2 и 1.3.3 показаны примеры нескольких различных реа-
лизаций, которые по своей сути могут описываться и анализироваться как
реализации непрерывных случайных процессов.
3. Примеры случайных точечных процессов
Необходимость рассмотрения случайных точечных процессов обычно
возникает при исследованиях случайных потоков однородных событий.
В зависимости от конкретно решаемой задачи содержательная интерпре-
тация потоков событий может быть весьма разнообразна. Это могут быть,
например, потоки однородных импульсов в радиолокационных системах,
случайные потоки импульсов в нейронных сетях, случайные потоки от-
каза аппаратуры, потоки заявок в системах массового обслуживания, по-
токи импульсных воздействий в системах управления. Все подобные при-
меры относятся к исследованиям однородных событий, происходящих
последовательно одно за другим в некоторые случайные моменты време-
ни. Если потоки однородных событий изменяются не только во времени,
но и в пространстве, то для их описания и анализа могут использоваться
модели пространственно-временных потоков или модели точечных про-
странственно-временных случайных полей.
На схеме 1.3.4 показано несколько характерных примеров, относя-
щихся к исследованиям случайных потоков однородных событий.
4. Примеры случайных полей
Принципиальной особенностью случайных полей, с точки зрения об-
щей теории случайных функций, является то, что они относятся к функ-
циям, зависящим от нескольких аргументов. Если, например, это про-
странственно-временные поля, то исследуемая функция (t, r) изменяется
одновременно и во времени, и в пространстве, т.е. ее значения зависят
от выбранного момента времени t и от координат (x, y, z) пространства r.
Наиболее распространенными примерами появления таких функ-
ций являются результаты исследования оптических изображений, анализ
взволнованных и шероховатых поверхностей, анализ изображений в рент-
генографии, ультразвуковых исследованиях, электронной микроскопии,
голографии, томографии.
Несколько характерных примеров экспериментальных результатов,
относящихся к анализу пространственно-временных случайных полей,
приведены на схеме 1.3.5 и 1.3.6.
1.4. Типовые задачи теории статистических
решений
Задачи, связанные с обработкой информации, чрезвычайно разно-
образны по своему содержанию. К ним, в частности, относятся задачи
обнаружения информационных сигналов, задачи распознавания образов,
различения и классификации данных, задачи оценивания параметров,
задачи прогноза состояния исследуемых объектов, задачи оптимального
управления процессами и динамическими системами, задачи функциональной, структурной и параметрической идентификации изучаемых объ-
ектов и сред.
Все подобные задачи обладают своей спецификой, их решения зависят
от конкретных условий, исходных данных, целей и критериев оптималь-
ности. Вместе с тем, при математической формализации большинство пе-
речисленных задач могут быть систематизированы и описаны в терминах
общей статистической теории принятия решений. Если воспользоваться
таким подходом, то сама процедура обработки и анализа данных, в соот-
ветствии с обобщенной моделью обработки (схема 1.1.2), может рассма-
триваться как процедура перехода от некоторого пространства наблюде-
ний {} к некоторому пространству решений {z}. Такой переход {} {z}
выполняется на основе определенного правила решений G{|z}, которое
по своей сути задает алгоритм обработки данных (схема 1.4.1).
Приведенная модель носит достаточно общий характер. На ее основе
можно рассматривать задачи обработки информации в физике и технике,
биологии и медицине, социологии и экономике. Выделим здесь некото-
рые особенности конкретизации такой модели применительно к типовым
задачам теории статистических решений [17, 20, 27].
1. Задачи классификации, различения, обнаружения
Процедуры классификации, обнаружения, различения по своему со-
держанию состоят в том, чтобы по наблюдаемым данным (объектам, сиг-
налам, измерениям, признакам, …) вынести решение о принадлежности
их к тому или иному классу. Предположим, например, что на некотором
интервале времени t [t0, t0 + T] = [0, T] длительностью T наблюдению
доступна реализация (t), t [0, T] исследуемого случайного процесса (t).
Известно, что этот процесс может принадлежать одному из m классов:
(t) = i(t) = si(t) n(t), i = 1, 2, ... , m,
где si(t) – полезные информационные компоненты или информационные
сигналы, n(t) – случайные помеховые воздействия, а символ отража-
ет операцию взаимодействия сигнала с помехой (сложение, перемноже-
ние, …).
Задача состоит при этом в определении класса i, к которому относится
наблюдаемая реализация (t). Все подобные задачи в теории статистиче-
ских решений формулируются как задачи проверки статистических гипо-
тез. При этом для гипотез вводятся обозначения H0, H1, H2, ... , Hm и предполагается, что гипотеза H0 соответствует ситуации, когда в наблюдаемом
процессе (t) отсутствует полезная информационная составляющая, а ги-
потеза Hi отражает присутствие полезного сигнала i-го класса, то есть:
H0 : (t) = n(t),
Hi : (t) = i(t) = si(t) n(t), i =
–
1
–
,
–
m
–
.
В результате обработки реализации (t), t [0, T] требуется принять
одно из возможных решений zk, то есть принять одну из (m + 1) рассматри-
ваемых гипотез Hk, и отклонить остальные гипотезы Hi, i k. Обобщенная
модель такой задачи показана на схеме 1.4.2.
Если рассмотреть наиболее простую ситуацию, когда проверяется
лишь две гипотезы:
H0 : (t) = n(t),
H1 : (t) = s(t) n(t),
то формулировка задачи классификации или различения переходит в фор-
мулировку задачи обнаружения информационного сигнала s(t) на фоне
мешающих помех n(t).
Нужно заметить, что при формулировке подобных задач (схема 1.4.2)
в качестве пространства наблюдений {} и информационных сигналов
могут рассматриваться различные множества случайных функций – слу-
чайные величины, случайные последовательности, случайные процессы
или случайные поля. Зависит это от содержательной постановки задач
и от конкретных математических моделей, используемых для описания
информационных процессов.
2. Задачи оценивания параметров
Состояние исследуемых динамических систем, характер изучаемых
явлений и процессов, результаты экспериментальных исследований –
все это обычно описывается совокупностью некоторых параметров 1,
2, ... , m. Измерения таких параметров всегда сопровождаются случайны-
ми внешними и внутренними помехами, неизбежными погрешностями,
флюктуациями, случайными ошибками. Именно поэтому задачи измере-
ния по своему содержанию являются статистическими и формулируются
как задачи оценивания параметров.
Предположим, что исследуется некоторый случайный процесс (t),
который представляет собой смесь информационной компоненты – сиг-
нала s(t, ) и случайной помехи n(t). На интервале времени t [0, T] дли-
тельностью T наблюдению доступна реализация процесса:
(t) = s(t, ) n(t), t [0, T], где = [1, 2, ... , m] – вектор неизвестных параметров. Задача оцени-
вания формулируется при этом как задача нахождения наилучшей оцен-
ки вектора параметров . Определение «наилучшей» понимается здесь
в смысле некоторого заданного по условиям задачи критерия качества.
Упрощенная модель такой задачи показана на схеме 1.4.3.
3. Задачи фильтрации, интерполяции, прогноза
Рассмотрим теперь ситуацию, когда исследуемый случайный процесс
(t) содержит информационную составляющую s(t, (t)) и помеховую со-
ставляющую n(t):
(t) = s(t, (t)) n(t),
причем, в отличие от предыдущей задачи оценивания, будем считать,
что полезная компонента s(t, (t)) является функцией времени t и
за висит от совокупности некоторых информационных параметров (t) =
= [1(t), 2(t), ... , m(t)], которые также изменяются во времени.
В подобной ситуации для оценивания вектора неизвестных параме-
тров (t) может быть сформулирована общая задача фильтрации. При ее
постановке предполагается, что исследуемый процесс (t) наблюдается
на текущем интервале времени [0, t), и требуется получить оптимальную
(в смысле выбранного критерия) оценку (t + ).
В зависимости от введенного временного сдвига здесь возможны три
различных варианта задач (схема 1.4.3):
при = 0 – данная задача соответствует текущей фильтрации;
при < 0 – задача соответствует фильтрации с запаздыванием, или
задаче интерполяции, или задаче сглаживания;
при > 0 – задача фильтрации переходит в фильтрацию с упрежде-
нием, или задачу экстраполяции, или задачу прогнозирования.
Приведенная формулировка основных задач показывает, что зада-
ча фильтрации и задача оценивания параметров достаточно близки по
своему содержа нию. Основные различия заключаются здесь в том, что
процедура оценивания параметров рассматривается в предположении
фиксированного интервала наблюдения [0, T] и в предположении, что па-
раметры 1, 2, ... , m исследуемого процесса (t) за время наблюдения [0, T]
не успевают существенно измениться. В задачах фильтрации подобные ус-
ловия не ставятся, параметры см. уравнение в книге. исследуемого процесса (t)
могут изменяться на интервале наблюдения и поэтому обработка данных
ведется в реальном масштабе времени на текущем интервале [0, t).
Сформулированные в данном разделе задачи относятся к клас-
су типовых задач теории статистических решений. По своему содер-
жанию они охватывают большинство задач, связанных с обработкой
и анализом данных. Вместе с тем, существуют и различные обобще-
ния или разновидности рассмотренных формулировок. Так, напри-
мер, могут быть сформулированы задачи совместного обнаружения
и различения, задачи совместного различения и оценивания параме-
тров.
1.5. Вероятностный анализ и синтез алгоритмов
Все основные задачи обработки информации обычно формулируются
в терминах теории статистических решений. Обобщенная модель обработ-
ки (схемы 1.1.2 и 1.4.1) показывает, что сама процедура принятия решений
определяется алгоритмом обработки или правилом решений G{|z} – пра-
вилом перехода от пространства наблюдений {} к пространству решений
{z}. В свою очередь, для нахождения алгоритмов обработки и исследова-
ния их основных свойств необходимо решать самостоятельные задачи ве-
роятностного анализа и статистического синтеза.
1. При формулировке задач синтеза предполагается, что известны не-
обходимые априорные данные о вероятностных свойствах сигналов, по-
мех и их взаимодействиях. Кроме того, задаются некоторые желаемые
свойства алгоритмов и в результате синтеза необходимо определить струк-
туру самого алгоритма обработки.
Такие задачи связаны с принципами оптимизации и, следовательно,
синтезированные алгоритмы должны удовлетворять определенному кри-
терию качества. Выбор критерия проводится в соответствии с физическим
смыслом и целевой направленностью конкретно решаемой задачи. Чем
больше априорных данных известно, тем проще и точнее решаются про-
блемы синтеза. Основным результатом решения задач синтеза является
оптимальный (в смысле выбранного критерия) алгоритм обработки на-
блюдений.
В большинстве случаев синтез выполняется без учета возможностей
практической реализации алгоритмов, и поэтому далеко не всегда удается
точно реализовать синтезированный оптимальный алгоритм обработки.
Причинами здесь могут быть и чрезмерная сложность оптимального алго-
ритма, и отсутствие технических средств, которые адекватно осуществля-
ют требуемые математические операции. Вопрос о возможностях точной
или приближенной реализации синтезированных алгоритмов, как прави-
ло, должен рассматриваться самостоятельно в каждой конкретной задаче.
2. Проблемы вероятностного анализа обычно возникают на этапе
предварительного исследования статистических свойств информацион-
ных процессов, при построении и анализе вероятностных моделей сиг-
налов и помех, при исследовании различных линейных и нелинейных
преобразований случайных функций. На основе методов вероятностного
анализа исследуется качество или эффективность синтезированных алго-
ритмов, определяются потенциально достижимые характеристики, оце-
ниваются возможности подоптимальных вариантов реализации, иссле-
дуются вопросы устойчивости и чувствительности алгоритмов обработки
к отклонениям от заданных априорных данных.
Для наглядности на схеме 1.5.1 показана последовательность основ-
ных этапов построения произвольной системы обработки информации.
Из нее, в частности, видна взаимосвязь задач статистического синтеза
и вероятностного анализа. Основные методы синтеза и анализа являют-
ся здесь достаточно общими, они не зависят от физической природы ис-
следуемых процессов и не зависят от принципов технической реализации
алгоритмов.
Заключение
В данной главе рассмотрена обобщенная модель получения, преоб-
разования и обработки информации, показаны особенности общей клас-
сификации случайных функций и приведены конкретные примеры экс-
периментальных данных, отражающих многообразие случайных функций
в прикладных задачах обработки и анализа информационных процессов.
Рассмотрена формализованная постановка наиболее распространенных
задач теории статистических решений, показана последовательность ос-
новных этапов вероятностного анализа и статистического синтеза алго-
ритмов.
В целом, на основе представленных в данной главе результатов можно
сделать некоторые общие выводы.
При исследовании информационных процессов все основные этапы
получения, преобразования и обработки информации могут быть пред-
ставлены в виде обобщенных структурных моделей. Подобные модели
позволяют выполнять и содержательное, и формализованное описание
структуры различных по своей физической природе систем обработки.
В задачах обработки информации при описании состояния иссле-
дуемых систем, описании информационных процессов и описании по-
меховых воздействий основными математическими моделями являются
статистические модели процессов или вероятностные модели случайных
функций.
Предложенная в данной главе общая классификация случайных
функций основана на конкретизации пространства состояний и конкре-
тизации множества параметров функции. Такой подход позволяет выде-
лить из всего многообразия вероятностных моделей основные самостоя-
тельные классы: случайные последовательности, случайные непрерывные
процессы, случайные потоки событий, случайные поля. Эти классы функ-
ций существенно различаются не только по своему математическому пред-
ставлению, но и по общему виду своих реализаций. В задачах обработки
информации подобное деление особенно важно, так как от характера ре-
ализаций существенно зависят методы анализа и алгоритмы обработки
процессов.
Математическая постановка и формализация большинства задач об-
работки информации обычно выполняется в терминах общей статистиче-
ской теории принятия решений. При этом могут быть выделены несколько наиболее распространенных типовых задач: 1) задачи классификации,
различения, обнаружения; 2) задачи оценивания параметров; 3) задачи
текущей фильтрации, интерполяции, прогноза.
Нахождение эффективных алгоритмов обработки обычно связано
с решением задач вероятностного анализа и статистического синтеза. Ве-
роятностный анализ позволяет исследовать вероятностные модели сигна-
лов и помех, исследовать эффективность алгоритмов, оценивать их устой-
чивость к изменениям априорных данных и к изменениям помеховой
обстановки. Основной задачей статистического синтеза является нахож-
дение структуры оптимальных (по заданному критерию оптимальности)
алгоритмов обработки информационных процессов.