МИНИСТЕРСТВО СЕЛЬСКОГО ХОЗЯЙСТВА РОССИЙСКОЙ ФЕДЕРАЦИИ
ФГОУ ВПО "КУБАНСКИЙ ГОСУДАРСТВЕННЫЙ АГРАРНЫЙ УНИВЕРСИТЕТ"
ФАКУЛЬТЕТ ПРИКЛАДНОЙ ИНФОРМАТИКИ
Е.В. ЛУЦЕНКО, В.И.ЛОЙКО, Л.О. ВЕЛИКАНОВА
ПРОГНОЗИРОВАНИЕ И ПРИНЯТИЕ РЕШЕНИЙ
В РАСТЕНИЕВОДСТВЕ С ПРИМЕНЕНИЕМ
ТЕХНОЛОГИЙ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА
Поддержано грантом КубГАУ
КРАСНОДАР – 2008
УДК
681.5
Л
86
Луценко Е. В., Лойко В.И., Великанова Л.О.
Л 86 Прогнозирование и принятие решений в растениеводстве с применением технологий искусственного интеллекта: Монография (научное издание). – Краснодар: КубГАУ, 2008. – 257 с.
ISBN 978-5-94672-312-1
В монографии задачи управления урожайностью и качеством продукции растениеводства и плодоводства решаются на единой стандартизированной методологической и инструментально-технологической основе системно-когнитивного анализа, обеспечивающего как синтез, адаптацию и верификацию семантических информационных моделей, так и их использование для прогнозирования и поддержки принятия решений (управления) в агропромышленном комплексе, а также для научного исследования предметной области.
Рассчитано на слушателей центров дополнительного агрономического образования, студентов очной и заочной форм обучения, аспирантов, преподавателей и научных работников, интересующихся применением современных интеллектуальных информационных технологий вообще и системно-когнитивного анализа в частности для решения задач прогнозирования и поддержки принятия решений в растениеводстве.
Сп.лит. 112 наим., рис. 76, табл. 55
РЕЦЕНЗЕНТЫ:
О.М. Горелик, доктор экономических наук, профессор
(Тольяттинский государственный институт сервиса)
Н.Г. Малюга, доктор сельскохозяйственных наук, профессор
(Кубанский государственный аграрный университет)
ISBN 978-5-94672-312-1
Е.В. Луценко, В.И.Лойко, Л.О.Великанова, 2008
ФГОУ ВПО "Кубанский государственный
аграрный университет", 2008
ОГЛАВЛЕНИЕ
ВВЕДЕНИЕ 10
ГЛАВА-1. ОПИСАНИЕ МЕТОДА СК-АНАЛИЗА 16
1.1. Теоретические предпосылки СК-анализа 16
1.2. Математическая модель СК-анализа 19
1.3. Методика численных расчетов СК-анализа 34
1.4. Специальный программный инструментарий СК-анализа – система "Эйдос" 36
ГЛАВА-2. ПРОГНОЗИРОВАНИЕ РЕЗУЛЬТАТОВ ВЫРАЩИВАНИЯ СЕЛЬСКОХОЗЯЙСТВЕННЫХ КУЛЬТУР И ПОДДЕРЖКА ПРИНЯТИЯ РЕШЕНИЙ ПО РАЦИОНАЛЬНОМУ ВЫБОРУ АГРОТЕХНОЛОГИЙ 42
2.1. Решение задач прогнозирования и поддержки приянтия решений в растениводстве с применением системы "ЭЙДОС" в 1993-1996 годах 42
2.2. Постановка задачи, синтез и исследование модели прогнозирования урожайности зерновых колосовых и поддержки принятия решений по рациональному выбору агротехнологий 50
ГЛАВА-3. ПОСТАНОВКА АГРОМЕТЕОРОЛОГИЧЕСКИХ ЗАДАЧ ВЫБОРА МИКРОЗОН И КУЛЬТУР ДЛЯ ВЫРАЩИВАНИЯ 100
3.1. Актуальность исследования 100
3.2. Общие положения 101
3.3. Основная задача исследования и этапы ее решения 101
3.4. Формальная постановка частных и обеспечивающих задач 106
3.5. Выводы 112
ГЛАВА-4. ПРОГНОЗИРОВАНИЕ ПРОДУКТИВНОСТИ И КАЧЕСТВА КУЛЬТУР НА ОСНОВЕ ДАННЫХ МЕТЕОПРОГНОЗОВ 112
4.1. Постановка задачи и выбор метода ее решения 114
4.2. Когнитивная структуризация, формальная постановка задачи и синтез модели 122
4.3. Исследование семантический информационной модели 158
4.4. Эффективность применения полученного решения, его ограничения и перспективы развития 171
4.5. Выводы 173
ГЛАВА-5. СОВЕРШЕНСТВОВАНИЕ МЕТОДОВ КОМПЬЮТЕРНОЙ СЕЛЕКЦИИ ПОДСОЛНЕЧНИКА 174
5.1. Постановка задачи и выбор метода ее решения 176
5.2. Когнитивная структуризация, формальная постановка задачи и синтез модели 180
5.3. Исследование семантический информационной модели 203
5.4. Эффективность применения полученного решения, его ограничения и перспективы развития 229
5.5. Выводы 231
ЗАКЛЮЧЕНИЕ 232
КРАТКИЙ ТОЛКОВЫЙ СЛОВАРЬ ТЕРМИНОВ ПО СИСТЕМНО-КОГНИТИВНОМУ АНАЛИЗУ И СИСТЕМАМ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА 233
ЛИТЕРАТУРА 248
ОСНОВНАЯ ЛИТЕРАТУРА 248
ДОПОЛНИТЕЛЬНАЯ ЛИТЕРАТУРА 249
INTERNET-САЙТЫ 264
СОДЕРЖАНИЕ
ВВЕДЕНИЕ 10
ГЛАВА-1. ОПИСАНИЕ МЕТОДА СК-АНАЛИЗА 16
1.1. Теоретические предпосылки СК-анализа 16
1.2. Математическая модель СК-анализа 19
1.2.1. Системное обобщение формулы Хартли 19
1.2.2. Гипотеза о Законе возрастания эмерджентности 20
1.2.2.1. Математическая формулировка: 21
1.2.2.2. Интерпретация 21
1.2.3. Системное обобщение формулы Харкевича 21
1.2.3.1. Классическая формула Харкевича 22
1.2.3.2. Выражение классической формулы Харкевича через частоты фактов 23
1.2.3.3. Вывод коэффициента эмерджентности Харкевича на основе принципа соответствия с выражением Хартли в детерминистском случае 23
1.2.3.4. Вывод системного обобщения формулы Харкевича 23
1.2.3.5. Окончательное выражение для системного обобщения формулы Харкевича 24
1.2.4. Связь системной теории информации (СТИ) с теорией Хартли-Найквиста-Больцмана и теорией Шеннона 24
1.2.5. Интерпретация коэффициентов эмерджентности СТИ 26
1.2.6. Матрица абсолютных частот 27
1.2.7. Матрица информативностей 28
1.2.8. Неметрический интегральный критерий сходства, основанный на лемме Неймана-Пирсона 30
1.2.9. Связь системной меры целесообразности информации с критерием 2 31
1.2.10. Оценка адекватности семантической информационной модели в СК-анализе и бутстрепные методы 32
1.2.11. Непараметричность модели. Робастные процедуры и фильтры для исключения артефактов 33
1.3. Методика численных расчетов СК-анализа 34
1.3.1. Детальный список БКОСА и их алгоритмов 34
1.3.2. Иерархическая структура данных семантической информационной модели СК-анализа 35
1.4. Специальный программный инструментарий СК-анализа – система "Эйдос" 36
1.4.1. Цели и основные функции системы "Эйдос" 36
1.4.1.1. Синтез содержательной информационной модели предметной области 38
1.4.1.2. Идентификация и прогнозирование состояния объекта управления, выработка управляющих воздействий 38
1.4.1.3. Углубленный анализ содержательной информационной модели предметной области 38
1.4.2. Обобщенная структура системы "Эйдос" 39
ГЛАВА-2. ПРОГНОЗИРОВАНИЕ РЕЗУЛЬТАТОВ ВЫРАЩИВАНИЯ СЕЛЬСКОХОЗЯЙСТВЕННЫХ КУЛЬТУР И ПОДДЕРЖКА ПРИНЯТИЯ РЕШЕНИЙ ПО РАЦИОНАЛЬНОМУ ВЫБОРУ АГРОТЕХНОЛОГИЙ 42
2.1. Решение задач прогнозирования и поддержки приянтия решений в растениводстве с применением системы "ЭЙДОС" в 1993-1996 годах 42
2.2. Постановка задачи, синтез и исследование модели прогнозирования урожайности зерновых колосовых и поддержки принятия решений по рациональному выбору агротехнологий 50
2.2.1. Проблематика работы 50
2.2.2. Задача 1. Обосновать требования к методу решения задачи и определить степень соответствия известных методов обоснованным требованиям. 52
2.2.3. Задача 2. Выбрать наиболее подходящий по обоснованным критериям метод решения проблемы. 54
2.2.4. Задача 3. Кратко описать суть выбранного метода. 55
2.2.4.1. Теоретические основы СК-анализа (включая базовую когнитивную концепцию). 55
2.2.4.2. Математическая модель (системная теория информации) и методика численных расчетов СК-анализа (структуры данных и алгоритмы их обработки). 57
2.2.4.3. Специальный программный инструментарий СК-анализа, реализующий математическую модель и методику численных расчетов (универсальная когнитивная аналитическая система "Эйдос"). 58
2.2.4.3.1. Основные функции системы "Эйдос" 58
2.2.4.3.5. Синтез содержательной информационной модели предметной области 59
2.2.4.3.6. Идентификация и прогнозирование состояния объекта управления, выработка управляющих воздействий 59
2.2.4.3.7. Углубленный анализ содержательной информационной модели предметной области 59
2.2.4.3.8. Обобщенная структура системы "Эйдос" 60
2.2.5. Задача 4. Описать методику применения выбранного метода для решения поставленной проблемы. 62
2.2.5.1. Основные этапы методики применения автоматизированного системно-когнитивного анализа 63
2.2.5.2. Когнитивная структуризация, а затем и формализация предметной области. 64
2.2.5.3. Ввод данных мониторинга в базу прецедентов (обучающую выборку) за период, в течение которого имеется необходимая информация в электронной форме. 67
2.2.5.4. Синтез семантической информационной модели (СИМ). 71
2.2.5.5. Оптимизация СИМ. 72
2.2.5.6. Проверка адекватности СИМ (измерение внутренней и внешней, дифференциальной и интегральной валидности). 72
2.2.5.7. Решение задач идентификации состояний объекта управления, прогнозирования и поддержки принятия решений по управлению с применением СИМ. 77
2.2.5.7.1. Задача прогнозирования 77
2.2.5.7.2. Задача поддержки принятия решений 81
2.2.5.8. Системно-когнитивный и кластерно-конструктивный анализ СИМ. 85
2.2.5.8.1. Задача выявления силы и направления влияния факторов 85
2.2.5.8.2. СК-анализ, как метод вариабельных контрольных групп 87
2.2.5.8.3. Семантические сети классов и факторов. 88
2.2.5.8.4. Когнитивные диаграммы классов и факторов. 91
2.2.5.8.5. Когнитивные карты (классические и интегральные). 95
2.2.6. Задача 5. Описать результаты применения методики (эффективность, научные результаты и выводы, практические рекомендации). 97
2.2.7. Задача 6. Рассмотреть ограничения метода и методики его применения, перспективы их развития и использования. 99
ГЛАВА-3. ПОСТАНОВКА АГРОМЕТЕОРОЛОГИЧЕСКИХ ЗАДАЧ ВЫБОРА МИКРОЗОН И КУЛЬТУР ДЛЯ ВЫРАЩИВАНИЯ 100
3.1. Актуальность исследования 100
3.2. Общие положения 101
3.3. Основная задача исследования и этапы ее решения 101
3.3.1. Этап 1-й: выявление причинно-следственных зависимостей между метеоусловиями и результатами выращивания сельскохозяйственных культур 103
3.3.2. Этап 2-й: использование знания выявленных причинно-следственных зависимостей для прогнозирования количественных и качественных результатов выращивания заданной культуры в конкретном пункте выращивания 105
3.4. Формальная постановка частных и обеспечивающих задач 106
3.4.1. Задача 1.1 106
3.4.1.1. Исходные данные 106
3.4.1.2. Алгоритм решения 106
3.4.1.3. Результат решения 107
3.4.2. Задача 1.2 107
3.4.2.1. Исходные данные 107
3.4.2.2. Алгоритм решения 108
3.4.2.3. Результат решения 108
3.4.3. Задача 2.1 108
3.4.3.1. Исходные данные 108
3.4.3.2. Алгоритм решения 109
3.4.3.3. Результат решения 109
3.4.4. Задача триангуляции 109
3.4.4.1. Исходные данные 109
3.4.4.2. Алгоритм решения 109
3.4.4.3. Результат решения 110
3.4.5. Задача пространственной интерполяции 110
3.4.5.1. Исходные данные: 111
3.4.5.2. Алгоритм решения 111
3.4.5.3. Результат решения 112
3.5. Выводы 112
ГЛАВА-4. ПРОГНОЗИРОВАНИЕ ПРОДУКТИВНОСТИ И КАЧЕСТВА КУЛЬТУР НА ОСНОВЕ ДАННЫХ МЕТЕОПРОГНОЗОВ 112
4.1. Постановка задачи и выбор метода ее решения 114
4.1.1. Актуальность, объект и предмет, цель и задачи исследования 114
4.1.2. Источники исходных данных 117
4.1.3. Характеристика исходных данных и обоснование требований к методу решения поставленных задач 120
4.1.4. Традиционные методы решения 121
4.1.5. Выводы 121
4.2. Когнитивная структуризация, формальная постановка задачи и синтез модели 122
4.2.1. Обоснование выбора метода и концепция решения задачи 122
4.2.2. Когнитивная структуризация предметной области, формальная постановка задачи и формирование обучающей выборки 123
4.2.2.1. Когнитивная структуризация предметной области и формальная постановка задачи, проектирование структуры и состава исходных данных 124
4.2.2.1.1. Когнитивная структуризация предметной области 124
4.2.2.1.2. Формализация предметной области 127
4.2.2.2. Получение исходных данных запланированного состава в той форме, в которой они накапливаются в поставляющей их организации (журналы) 133
4.2.2.3. Разработка электронной формы для представления исходных данных 134
4.2.2.4. Преобразование исходных данных в электронную форму 135
4.2.2.5. Контроль достоверности исходных данных и исправление ошибок 135
4.2.2.6. Преобразование исходных данных из формы по датам в стандартную форму по фенофазам 136
4.2.2.7. Импорт исходных данных из стандартной формы по фенофазам в базы данных системы "Эйдос" 143
4.2.3. Синтез семантической информационной модели, ее оптимизация и проверка на адекватность 145
4.2.3.1. Синтез семантической информационной модели (СИМ) 145
4.2.3.2. Оптимизация СИМ 145
4.2.3.3. Измерение адекватности СИМ 146
4.2.3.3.1. Внутренняя дифференциальная и интегральная валидность 146
4.2.3.3.2. Внешняя дифференциальная и интегральная валидность 154
4.2.4. Выводы 158
4.3. Исследование семантический информационной модели 158
4.3.1. Прогнозирование результатов выращивания заданной культуры в заданной точке 158
4.3.1.1. Задача определения периодов фенофаз для заданного сорта в данной зоне и микрозоне выращивания 158
4.3.1.2. Задача определения значений метеопараметров в заданной точке по их значениям в трех ближайших метеостанциях 159
4.3.1.3. Прогнозирование результатов выращивания заданной культуры в заданной точке 159
4.3.2. Поддержка принятия решений по рациональному выбору зон и микрозон выращивания данной культуры и сорта 164
4.3.3. Поддержка принятия решений по рациональному выбору культур для выращивания в данной зоне и микрозоне 164
4.3.4. Кластерно-конструктивный и системно-когнитивный анализ результатов выращивания и факторов 165
4.3.5. Выводы 170
4.4. Эффективность применения полученного решения, его ограничения и перспективы развития 171
4.4.1. Применение в проектных организациях 171
4.4.2. Применение в производственных организациях 171
4.4.3. Применение в образовательных учреждениях 171
4.4.4. Ограничения разработанной технологии и перспективы ее развития 172
4.4.5. Выводы 173
4.5. Выводы 173
ГЛАВА-5. СОВЕРШЕНСТВОВАНИЕ МЕТОДОВ КОМПЬЮТЕРНОЙ СЕЛЕКЦИИ ПОДСОЛНЕЧНИКА 174
5.1. Постановка задачи и выбор метода ее решения 176
5.1.1. Проблема, решаемая в работе, традиционные пути ее решения и их недостатки 176
5.1.2. Идея решения проблемы 177
5.1.3. Актуальность, объект и предмет, цель и задачи исследования 178
5.1.4. Характеристика исходных данных и обоснование требований к методу решения поставленных задач 179
5.1.4.1. Источники исходных данных 179
5.1.4.2. Характеристика исходных данных 180
5.1.5. Выводы 180
5.2. Когнитивная структуризация, формальная постановка задачи и синтез модели 180
5.2.1. Обоснование выбора метода и концепция решения задачи 180
5.2.1.1. Традиционные методы решения и их недостатки 181
5.2.1.2. Выбор метода системно-когнитивного анализа 181
5.2.2. Когнитивная структуризация предметной области, формальная постановка задачи и формирование обучающей выборки 184
5.2.2.1. Когнитивная структуризация предметной области и формальная постановка задачи, проектирование структуры и состава исходных данных 184
5.2.2.1.1. Когнитивная структуризация предметной области 184
5.2.2.1.2. Формализация предметной области 185
5.2.2.2. Получение исходных данных запланированного состава в той форме, в которой они накапливаются в поставляющей их организации (журналы) 189
5.2.2.3. Разработка электронной формы для представления исходных данных 189
5.2.2.4. Преобразование исходных данных в электронную форму 190
5.2.2.5. Контроль достоверности исходных данных и исправление ошибок 190
5.2.2.6. Импорт исходных данных из входной электронной формы в базы данных системы "Эйдос" 190
5.2.3. Синтез семантической информационной модели, ее оптимизация и проверка на адекватность 193
5.2.3.1. Синтез семантической информационной модели (СИМ) 193
5.2.3.2. Оптимизация СИМ 193
5.2.3.3. Измерение адекватности СИМ 194
5.2.3.3.1. Внутренняя дифференциальная и интегральная валидность 194
5.2.3.3.2. Внешняя дифференциальная и интегральная валидность 200
5.2.4. Выводы 203
5.3. Исследование семантический информационной модели 203
5.3.1. Задача 1: выявление причинно-следственных зависимостей между фенотипическими признаками подсолнечника и его хозяйственными свойствами 204
5.3.2. Задача 2: разработка методики прогнозирования хозяйственных свойств растений подсолнечника на основе анализа их фенотипических признаков 206
5.3.3. Задача 3: разработка методики поддержки принятия решений по отбору растений для селекции не по их хозяйственным свойствам, а на основе анализа фенотипических признаков 209
5.3.4. Кластерно-конструктивный и системно-когнитивный анализ результатов выращивания и факторов 218
5.3.5. Выводы 228
5.4. Эффективность применения полученного решения, его ограничения и перспективы развития 229
5.4.1. Применение в научно-селекционных организациях 229
5.4.2. Применение в образовательных учреждениях 229
5.4.3. Ограничения разработанной технологии и перспективы ее развития 229
5.4.4. Выводы 230
5.5. Выводы 231
ЗАКЛЮЧЕНИЕ 232
КРАТКИЙ ТОЛКОВЫЙ СЛОВАРЬ ТЕРМИНОВ ПО СИСТЕМНО-КОГНИТИВНОМУ АНАЛИЗУ И СИСТЕМАМ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА 233
ЛИТЕРАТУРА 248
ОСНОВНАЯ ЛИТЕРАТУРА 248
ДОПОЛНИТЕЛЬНАЯ ЛИТЕРАТУРА 249
INTERNET-САЙТЫ 264
ВВЕДЕНИЕ
Агропромышленный комплекс (АПК) представляет собой реальный сектор экономики, во многом определяющий продовольственную безопасность и само существование страны (глобальная цель АПК). Государственная аграрная политика направлена на достижение глобальной цели АПК путем согласования и корректировки целей хозяйств, отраслей и регионов с использованием в основном экономических рычагов.
Наработанные за прошедшие десятилетия экономические схемы хозяйствования, технологии производства, заготовки, хранения и переработки сельскохозяйственной продукции, ориентированные на приоритеты плановой экономики, в настоящее время быстро теряют адекватность и настоятельно требуют пересмотра. Разработка новых подходов к управлению в АПК, основанных на непредвзятом учете и признании складывающихся макроэкономических реалий, критериях эффективности и качества рыночной экономики, требует срочных согласованных усилий ученых – аграриев и является одним из приоритетов экономической теории и практики.
Управление в АПК всегда представляло собой определенную проблему, имеющую комплексную, межотраслевую природу. Проблема состоит как в рациональном выборе целей производства для конкретных хозяйств, так и в оценке их достижимости и выборе путей достижения.
Экономической целью каждого хозяйства в АПК в рыночных условиях безусловно является получение максимальной прибыли. Достичь этой цели хозяйство может путем производства и реализации на рынке наиболее рентабельных видов продукции в необходимых объемах. Поэтому для достижения экономической цели хозяйству необходимо:
1. Поставить предварительную цель производству, как производство востребованных видов продукции, на основе прогнозирования спроса (коньюктуры рынка) на сельскохозяйственную продукцию в номенклатуре в натуральном и стоимостном выражении.
2. Выработать реальную цель производства путем корректировки предварительной цели с учетом ограничений: прогнозируемых возможностей производственного потенциала хозяйства (прогнозирования предложения) при различной рентабельности видов продукции.
Оценка производственного потенциала хозяйства должна осуществляться по каждому виду продукции в натуральном и стоимостном выражении по количественному и качественному критериям. Для этого необходимо: а) для каждого пункта выращивания (зоны и подзоны) ранжировать культуры по степени соответствия их генотипа условиям данного пункта; б) для каждой культуры ранжировать зоны и подзоны выращивания по степени соответствия их условий требованиям генотипа.
3. Выбрать пути достижения целей (выбор способа управления), т.е. реализовать поддержку принятия решений по рациональному выбору агротехнологий (агротехнологических факторов), обеспечивающих перевод объекта управления в заданное целевое состояние, соответствующее поставленной реальной цели производства.
В монографии сформулированные подпроблемы (рационального выбора целей производства, оценки их достижимости и выбора путей достижения) рассматриваются под углом зрения, принятом при проектировании информационных технологий и автоматизированных систем управления (АСУ). Решение этих подпроблем с помощью стандартных математических методов и инструментария математической экономики наталкивается на ряд сложностей, причина которых видится в:
– специфике объектов АПК, как объектов управления, а именно – в их слабодетерминированности, многофакторности и активности, а также в малоисследованном характере реагирования объекта управления на управляющие факторы;
– комплексном многофакторном характере управляющих воздействий; очень большой длительности цикла управления (от одного года до 5-10 и более лет);
– неполноте (фрагментарности), неточности, зашумленности исходной информации;
– в сложности доступа к ней, в частности – в отсутствии или недоступности (часто из-за местнических или узко понимаемых профессиональных интересов) электронных баз данных, которые могли бы стать основной для современных систем поддержки принятия управленческих решений.
Рассмотрим подробнее некоторые специфические свойства объекта управления в АПК, являющиеся главными причинами названных подпроблем.
Слабодетерминированность и многофакторность взаимосвязаны: если факторов много – то среди них нет очень сильных и тем более ни один из них не является определяющим. Для адекватного описания объектов управления в АПК необходимо использовать тысячи факторов различной природы (многофакторность), но на практике это сделать очень сложно, так как ученым – агрономам остается неизвестным (не смотря на все наши усилия) метод системно-когнитивного анализа (СК-анализ) и соответствующая ему методика численных расчетов, а также реализующий их программный инструментарий – универсальная автоматизированная система "Эйдос", позволяющие создавать и исследовать семантические информационные модели необходимой размерности на основе зашумленных и фрагментированных (неполных) данных различной природы (измеряемых в различных единицах измерения). Поэтому они считают, что адекватный для этой цели математический метод и соответствующий реализующий его программный инструментарий не существуют (отсутствуют). По этим причинам исследования проводятся по узким направлениям (по группам факторов) различными разобщенными группами ученых, на разных кафедрах, в различных научно-исследовательских институтах, не основываются на общей базе данных в электронной форме и системном подходе. Таким образом, ощущается острый дефицит междисциплинарных системных исследований объектов управления в АПК, охватывающих все эти группы факторов. В результате, в одних исследованиях учитывается влияние климатических факторов на количественные и качественные результаты выращивания сельскохозяйственных культур (сельскохозяйственная метеорология), в других влияние технологий, в третьих – влияние почв, предшественников (севооборот), структуры и организации машинно-тракторного парка, финансовых и материальных потоков (логистика) и т.д. Сами агротехнологии в свою очередь включают массу различных групп факторов: способы вспашки; количество, виды и способы внесения удобрений; нормы высева, полива, вид обрезки, способ формирования кроны, и т.д. Однако ни одна из этих групп факторов не является определяющей в получении хозяйственного результата (слабодетерминированность).
Необходимость применения системного подхода в подобных исследованиях очевидна, однако это осложняется нелинейным системным взаимодействием факторов, огромными размерностями задач, отсутствием обеспечивающих эти размерности математических моделей и соответствующего программного инструментария, практической невозможностью проведения многофакторных экспериментов на реальных размерностях данных.
В результате неучета многофакторности объекта управления в АПК, например, решения о размещении садов и выборе сортов для выращивания принимаются по данным эмпирических испытаний в отдельных точках, чаще всего привязанных к крупным плодовым хозяйствам без возможности проводить испытания или прогнозирование результатов выращивания всего набора культур, без анализа и учета адаптивного и природно-ресурсного потенциала конкретного пункта выращивания. Подобный подход к принятию ответственных решений приводит к тому, что культуры выращиваются не там, где для этого есть природные условия, а там, где имеется необходимая инфраструктура (населенные пункты), в результате, например, ни один сортоучасток в Краснодарском крае не дает урожай абрикоса больше 4-х раз в 10 лет. Аналогично обстоит дело и с выбором культур для выращивания на полях, а также с выбором агротехнологий для их выращивания.
Сложность математического моделирования многофакторных слабодетерминированных объектов состоит в выборе вида модели, способной обрабатывать тысячи и десятки тысяч факторов при неполных (фрагментированных), неточных и зашумленных исходных данных, не подчиняющихся нормальному распределению. В данной монографии авторы в пределах своих сил и имеющихся в их распоряжении исходных данных попытались показать возможности применения системного анализа вообще и системно-когнитивного анализа (СК-анализа) в частности для системного решения поставленных проблем.
Авторы благодарны заведующей кафедрой системного анализа и обработки информации Кубанского государственного аграрного университета доктору экономических наук профессору Барановской Татьяне Петровне за многочисленные конкретные советы и предложения, высказанные при написании данной монографии.
Для студентов, аспирантов, преподавателей и научных работников, интересующихся проблематикой систем искусственного интеллекта и возможностями их применения в АПК.
Авторы:
проф. Луценко Е.В.
проф. Лойко В.И.
доц. Великанова Л.О.
Краснодар, 27.03.2008.
ГЛАВА-1. ОПИСАНИЕ МЕТОДА СК-АНАЛИЗА
1.1. Теоретические предпосылки СК-анализа
Системно-когнитивный анализ представляет собой системный анализ, рассматриваемый как метод познания и структурированный по базовым когнитивным (познавательным) операциям (БКОСА) [27, 35, 36].
Сам набор БКОСА следует из предложенной в [27] формализуемой когнитивной концепции, рассматривающей процесс познания, как многоуровневую иерархическую систему обработки информации в которой когнитивные структуры каждого уровня являются результатом интеграции структур предыдущего уровня.
На 1-м уровне этой системы находятся дискретные элементы потока чувственного восприятия, которые на 2-м уровне интегрируются в чувственный образ конкретного объекта. Те, в свою очередь, на 3-м уровне интегрируются в обобщенные образы классов и факторов, образующие на 4-м уровне кластеры, а на 5-м конструкты. Система конструктов на 6-м уровне образуют текущую парадигму реальности (т.е. человек познает мир путем синтеза и применения конструктов). На 7-м же уровне обнаруживается, что текущая парадигма не единственно-возможная (рисунок 1).
Ключевым для когнитивной концепции является понятие факта, под которым понимается соответствие дискретного и интегрального элементов познания (т.е. элементов разных уровней интеграции-иерархии), обнаруженное на опыте. Факт рассматривается как квант смысла, что является основой для его формализации.
Таким образом, происхождение смысла связывается со своего рода "разностью потенциалов", существующей между смежными уровнями интеграции-иерархии обработки информации в процессах познания. В полном виде когнитивная концепция приведена в работах 1-5 основного списка литературы.
Из данной концепции выводятся структура когнитивного конфигуратора, система базовых когнитивных операций и обобщенная схема автоматизированного системного анализа, структурированного до уровня базовых когнитивных операций (СК-анализ) (рисунок 2).
Между когнитивными структурами разных уровней иерархии существует отношение "дискретное – интегральное". Именно это служит основой формализации смысла.
Когнитивный конфигуратор, представляет собой минимальную полную систему когнитивных операций, названных "базовые когнитивные операции системного анализа" (БКОСА). Всего выявлено 10 таких операций, каждая из которых достаточно элементарна для формализации и программной реализации:
1) присвоение имен;
2) восприятие;
3) обобщение (синтез, индукция);
4) абстрагирование;
5) оценка адекватности модели;
6) сравнение, идентификация и прогнозирование;
7) дедукция и абдукция;
8) классификация и генерация конструктов;
9) содержательное сравнение;
10) планирование и принятие решений об управлении.
В работе [27] предложены математическая модель, методика счисленных расчетов, включающая структуры данных и алгоритмы реализации БКОСА, а также программный инструментарий СК-анализа – универсальная когнитивная аналитическая система "Эйдос".
Рисунок 2. Обобщенная схема
системно-когнитивного анализа (СК-анализа)
1.2. Математическая модель СК-анализа
1.2.1. Системное обобщение формулы Хартли
Математическая модель СК-анализа, т.е. системная теория информации (СТИ), является реализацией в области теории информации программной идеи системного обобщения математики, предложенной автором [29, 50, 48, 49].
В выражении (3) приведено системное обобщение формулы Хартли для равновероятных состояний объекта управления.
(1)
(4)
(2)
(5)
(3)
с очень малой и быстро уменьшающейся погрешностью
(6)
W – количество чистых (классических) состояний системы.
– коэффициент эмерджентности Хартли (уровень системной организации объекта, имеющего W чистых состояний).
1.2.2. Гипотеза о Законе возрастания эмерджентности
Исследование математических выражений системной теории информации (7 – 12) позволило сформулировать гипотезу о существовании "Закона возрастания эмерджентности". Суть этой гипотезы в том, что в самих элементах системы содержится сравнительно небольшая доля всей содержащейся в ней информации, а основной ее объем составляет системная информация, содержащаяся в подсистемах различного уровня иерархии.
Различие между классическим и предложенным системным понятиями информации соответствует различию между понятиями МНОЖЕСТВА И СИСТЕМЫ, на основе которых они сформированы.
(7)
(8)
(9)
(10)
(11)
(12)
1.2.2.1. Математическая формулировка:
1.2.2.2. Интерпретация
1.2.3. Системное обобщение формулы Харкевича
Ниже приведен вывод системного обобщения формулы Харкевича, а именно:
– классическая формула Харкевича через вероятности перехода системы в целевое состояние при условии сообщения ей определенной информации и самопроизвольно (13);
– выражение классической формулы Харкевича через частоты (14, 15);
– вывод коэффициента эмерджентности Харкевича на основе принципа соответствия с выражением Хартли в детерминистском случае (16 –19);
– вывод системного обобщения формулы Харкевича;
– окончательное выражение для системного обобщения формулы Харкевича (21).
1.2.3.1. Классическая формула Харкевича
(13)
Pij – вероятность перехода объекта управления в j-е состояние в условиях действия i-го фактора;
Pj – вероятность самопроизвольного перехода объекта управления в j-е состояние, т.е. в условиях отсутствия действия i-го фактора или всреднем.
Известно, что корреляция не является мерой причинно-следственных связей. Если корреляция между действием некоторого фактора и переходом объекта управления в определенное состояние высока, то это еще не значит, что данный фактор является причиной этого перехода. Для того чтобы по корреляции можно было судить о наличии причинно-следственной связи необходимо сравнить исследуемую группу с контрольной группой, т.е. с группой, в которой данный фактор не действовал.
Также и высокая вероятность перехода объекта управления в определенное состояние в условиях действия некоторого фактора сама по себе не говорит о наличии причинно-следственной связи между ними, т.е. о том, что данный фактор обусловил переход объекта в это состояние. Это связано с тем, что вероятность перехода объекта в это состояние может быть вообще очень высокой независимо от действия фактора. Поэтому в качестве меры силы причинной обусловленности определенного состояния объекта действием некоторого фактора Харкевич предложил логарифм отношения вероятностей перехода в объекта в это состояние в условиях действия фактора и при его отсутствии или в среднем (13).
Таким образом семантическая мера информации Харкевича является мерой наличия причинно-следственных связей между факторами и состояниями объекта управления.
1.2.3.2. Выражение классической формулы Харкевича через частоты фактов
(14)
(15)
1.2.3.3. Вывод коэффициента эмерджентности Харкевича на основе принципа соответствия с выражением Хартли в детерминистском случае
Однако мера Харкевича (13) не удовлетворяет принципу соответствия мерой Хартли как мера Шеннона, т.е. не переходит в меру Хартли в детерминистском случае, т.е. когда каждому будущему состоянию объекта управления соответствует единственный уникальный фактор и между факторами и состояниями имеется взаимно однозначное соответствие (17).
1.2.3.5. Окончательное выражение для системного обобщения формулы Харкевича
(21)
1.2.4. Связь системной теории информации (СТИ) с теорией Хартли-Найквиста-Больцмана и теорией Шеннона
Связь между выражениями для плотности информации в теориях Хартли, Шеннона и СТИ приведена на рисунке 3.
Рисунок 3. Связь между выражениями для плотности информации в теориях Хартли, Шеннона и СТИ
1.2.5. Интерпретация коэффициентов эмерджентности СТИ
Интерпретация коэффициентов эмерджентности, предложенных в рамках системной теории информации, приведена на рисунке 4.
Коэффициент эмерджентности Хартли (4) представляет собой относительное превышение количества информации о системе при учете системных эффектов (смешанных состояний, иерархической структуры ее подсистем и т.п.) над количеством информации без учета системности, т.е. этот коэффициент является аналитическим выражением для уровня системности объекта.
Коэффициент эмерджентности Харкевича , изменяется от 0 до 1 и определяет степень детерминированности системы.
Коэффициенты эмерджентности навзаны автором системной теории информации Е.В.Луценко в честь выдающихся ученых, внесших огромный вклад в создание теории информации, коэффициетами эемеердженности Хартли и Харкевича.
Таким образом, в предложенном системном обобщении формулы Харкевича (21) впервые непосредственно в аналитическом выражении для самого понятия "Информация" отражены такие фундаментальные свойства систем, как "Уровень системности" и "Степень детерминированности" системы.
1.2.6. Матрица абсолютных частот
Основной формой первичного обобщения эмпирической информации в модели является матрица абсолютных частот (таблица 1). В этой матрице строки соответствуют факторам, столбцы – будущим целевым и нежелательным состояниям объекта управления, а на их пересечении приведено количество наблюдения фактов (по данным обучающей выборки), когда действовал некоторый i-й фактор и объект управления перешел в некоторое j-е состояние.
Таблица 1 – МАТРИЦА АБСОЛЮТНЫХ ЧАСТОТ
1.2.7. Матрица информативностей
Непосредственно на основе матрицы абсолютных частот с использованием системного обобщения формулы Харкевича (21) рассчитывается матрица информативностей (таблица 2).
Таблица 2 – МАТРИЦА ИНФОРМАТИВНОСТЕЙ
Матрица информативностей является универсальной формой представления смысла эмпирических данных в единстве их дискретного и интегрального представления (причины – последствия, факторы – результирующие состояния, признаки – обобщенные образы классов, образное – логическое, дискретное – интегральное).
Весовые коэффициенты матрицы информативностей непосредственно определяют, какое количество информации Iij система управления получает о наступлении события: "объект управления перейдет в j–е состояние", из сообщения: "на объект управления действует i–й фактор".
Когда количество информации Iij>0 – i–й фактор способствует переходу объекта управления в j–е состояние, когда Iij<0 – препятствует этому переходу, когда же Iij=0 – никак не влияет на это.
Таким образом, предлагаемая семантическая информационная модель позволяет непосредственно на основе эмпирических данных и независимо от предметной области рассчитать, какие количество информации содержится в любом событии о любом другом событии.
Этот вывод является ключевым для данной работы, т.к. конкретно показывает возможность числовой обработки в СК-анализе как числовой, так и нечисловой информации.
Матрица информативностей является также обобщенной (неклассической) таблицей решений, в которой входы (факторы) и выходы (будущие состояния объекта управления) связаны друг с другом не с помощью классических (Аристотелевских) импликаций, принимающих только значения: "Истина" и "Ложь", а различными значениями истинности, выраженными в битах и принимающими значения от положительного теоретически-максимально-возможного, до теоретически неограниченного отрицательного. Некоторые неклассические высказывания, генерируемые на основе матрицы информативности, приведены на плакате.
1.2.8. Неметрический интегральный критерий сходства, основанный на лемме Неймана-Пирсона
В выражениях (22 – 24) приведен неметрический интегральный критерий сходства, основанный на фундаментальной лемме Неймана-Пирсона, обеспечивающий идентификацию и прогнозирование в предложенных неортонормированных семантических пространствах с финитной метрикой, в которых в качестве координат векторов будущих состояний объекта управления и факторов выступает количество информации, рассчитанное в соответствии с системной теорией информации (21), а не Булевы координаты или частоты, как обычно.
(22)
(23)
Или в координатной форме:
(24)
(25)
– вектор j–го состояния объекта управления;
– вектор состояния предметной области, включающий все виды факторов, характеризующих объект управления, возможные управляющие воздействия и окружающую среду (массив–локатор), т.е.:
(26)
(27)
– средняя информативность по вектору класса;
– среднее по вектору идентифицируемой ситуации (объекта).
– среднеквадратичное отклонение информативностей вектора класса;
– среднеквадратичное отклонение по вектору распознаваемого объекта.
1.2.9. Связь системной меры целесообразности информации с критерием 2
В (28 – 33) показана связь системной меры целесообразности информации с известным критерием 2, а также предложен новый критерий уровня системности предметной области, являющийся нормированным объемом семантического пространства (34, 35).
(28)
(29)
– Nij – фактическое количество встреч i-го признака у объектов j-го класса;
– t – ожидаемое количество встреч i-го признака у объектов j-го класса.
(30)
(31)
(32)
(33)
(34)
(35)
Предлагается более точный критерий уровня системности модели является объем неортонормированного семантического пространства, рассчитанный как объем многомерного параллелепипеда, ребрами которого являются оси семантического пространства. Однако для этой меры сложнее в общем виде записать аналитическое выражение и для ее вычисления могут быть использованы численные методы с использованием многомерного обобщения смешанного произведения векторов.
Абстрагирование (ортонормирование) существенно уменьшает размерность семантического пространства без существенного уменьшения его объема.
1.2.10. Оценка адекватности семантической информационной модели в СК-анализе и бутстрепные методы
Под адекватностью модели СК-анализа понимается ее внутренняя и внешняя дифференциальная и интегральная валидность. Понятие валидности является уточнением понятия адекватности, для которого определены процедуры количественного измерения, т.е. валидность – это количественная адекватность. Это понятие количественно отражает способность модели давать правильные результаты идентификации, прогнозирования и способность вырабатывать правильные рекомендации по управлению.
Под внутренней валидностью понимается валидность модели, измеренная после синтеза модели путем идентификации объектов обучающей выборки.
Под внешней валидностью понимается валидность модели, измеренная после синтеза модели путем идентификации объектов, не входящих в обучающую выборку.
Под дифференциальной валидностью модели понимается достоверность идентификации объектов в разрезе по классам.
Под интегральной валидностью средневзвешенная дифференциальная валидность.
Возможны все сочетания: внутренняя дифференциальная валидность, внешняя интегральная валидность и т.д.
Основная идея бутстрепа по Б.Эфрону [45] состоит в том, что методом Монте-Карло (статистических испытаний) многократно извлекаются выборки из эмпирического распределения. Эти выборки, естественно, являются вариантами исходной, напоминают ее.
Эта идея позволяет сконструировать алгоритм измерения адекватности модели, состоящий из двух этапов:
1. Синтез модели на одном случайном подмножестве обучающей выборки.
2. Измерение валидности модели на оставшемся подмножестве обучающей выборки, не использованном для синтеза модели.
Поскольку оба случайных подмножества имеют переменный состав по объектам обучающей выборки, то подобная процедура должна повторяться много раз, после чего могут быть рассчитаны статистические характеристики адекватности модели, например, такие как:
– средняя внешняя валидность;
– среднеквадратичное отклонение текущей внешней валидности от средней и другие.
Достоинство бутстрепного подхода к оценке адекватности модели состоит в том, что он позволяет измерить внешнюю валидность на уже имеющейся выборке и изучить статистические характеристики, характеризующие адекватность модели при изменении объема и состава выборки.
1.2.11. Непараметричность модели. Робастные процедуры и фильтры для исключения артефактов
Предложенная семантическая информационная модель является непараметрической, т.к. базируется на системной теории информации [27], которая никоим образом не основана на предположениях о нормальности распределений исследуемой выборки.
Под робастными понимаются процедуры, обеспечивающие устойчивую работу модели на исходных данных, зашумленных артефактами, т.е. данными, выпадающими из общих статистических закономерностей, которым подчиняется исследуемая выборка.
Критерий выявления артефактов, реализованный в СК-анализе, основан на том, что при увеличении объема статистики частоты значимых атрибутов растут, какправило, пропорционально объему выборки, а частоты артефактов так и остаются чрезвычайно малыми, близкими к единице. Таким образом, выявление артефактов возможно только при достаточно большой статистике, т.к. в противном случае недостаточно информации о поведении частот атрибутов с увеличением объема выборки.
В модели реализована такая процедура удаления наиболее вероятных артефактов, и она, как показывает опыт, существенно повышает качество (адекватность) модели.
1.3. Методика численных расчетов СК-анализа
1.3.1. Детальный список БКОСА и их алгоритмов
В таблице 3 приведен детальный список базовых когнитивных операций системного анализа, которым соответствует 24 алгоритма, которые здесь привести нет возможности из-за их объемности. Но они все приведены в полном виде в работе [27].
Таблица 3 – ДЕТАЛЬНЫЙ СПИСОК БАЗОВЫХ КОГНИТИВНЫХ ОПЕРАЦИЙ СИСТЕМНОГО АНАЛИЗА (БКОСА)
№
алгоритма
Код БКОСА
по схеме
СК-анализа
№
БКОСА
Наименование БКОСА
Полное наименование базовых когнитивных операций системного анализа (БКОСА)
Присвоение имен атрибутам
(экстенсиональная, дискретная репрезентация)
1
2.1.
2
Восприятие
Восприятие и запоминание исходной обучающей
информации
2
2.2.
Репрезентация. Сопоставление индивидуального
опыта с коллективным (общественным)
3
3.1.1.
3
Обобщение
(синтез,
индукция).
Накопление первичных данных
4
3.1.2.
Исключение артефактов
5
3.1.3.
Расчет истинности смысловых связей между
предпосылками и результатами
(обобщенных таблиц решений)
6
3.2.
Определение значимости шкал и градаций факторов, уровней Мерлина
7
3.3.
Определение значимости шкал и градаций классов, уровней Мерлина
8
4.1.
4
Абстраги-
рование
Абстрагирование факторов (снижение размерности семантического пространства факторов)
9
4.2.
Абстрагирование классов (снижение размерности семантического пространства классов)
10
5.
5
Оценка
адекватности
Оценка адекватности информационной модели
предметной области
11
7.
6
Сравнение, идентификация и прогнозирование
Сравнение, идентификация и прогнозирование. Распознавание состояний конкретных объектов (объектный анализ)
12
9.1.
7
Анализ,
дедукция
и абдукция
Анализ, дедукция и абдукция классов (семантический анализ обобщенных образов классов, решение
обратной задачи прогнозирования)
13
9.2.
Анализ, дедукция и абдукция факторов
(семантический анализ факторов)
14
10.1.1.
8
Классификация
и генерация
конструктов
Классификация обобщенных образов классов
15
10.1.2.
Формирование бинарных конструктов классов
16
10.1.3.
Визуализация семантических сетей классов
17
10.2.1.
Классификация факторов
18
10.2.2.
Формирование бинарных конструктов факторов
19
10.2.3.
Расчет и отображение многомногозначных когнитивных диаграмм, в т.ч. диаграмм Мерлина
22
10.4.1.
Содержательное сравнение факторов
23
10.4.2.
Расчет и отображение многомногозначных когнитивных диаграмм, в т.ч. инвертированных диаграмм Мерлина
24
11.
10
Планирование
и управление
Многовариантное планирование и принятие решения о применении системы управляющих факторов
1.3.2. Иерархическая структура данных семантической информационной модели СК-анализа
На рисунке 5 приведена в обобщенном виде иерархическая структура баз данных семантической информационной модели системно-когнитивного анализа. На этой схеме базы данных обозначены прямоугольниками, а базовые когнитивные операции системного анализа, преобразующие одну базу в другую – стрелками с надписями. Имеются также базовые когнитивные операции, формирующие выходные графические формы. Из этой схемы видно, что одни базовые когнитивные операции готовят данные для других операций, относящихся к более высоким уровням иерархии системы процессов познания. Этим определяется возможная последовательность выполнения базовых когнитивных операций.
Рисунок 5. Иерархическая структура данных СК-анализа
1.4. Специальный программный инструментарий
СК-анализа – система "Эйдос"
1.4.1. Цели и основные функции системы "Эйдос"
Универсальная когнитивная аналитическая система "Эйдос" является отечественным лицензионным программным продуктом [85, 88], созданным исключительно с использованием официально приобретенного лицензионного программного обеспечения. По системе "Эйдос" и различным аспектам ее применения имеется более 150 публикаций ряда авторов [1-111 и др.]. Титульная видеограмма системы приведена на рисунке 6:
Рисунок 6. Титульная видеограмма системы "Эйдос"
Система "Эйдос" является одним из элементов предлагаемого решения проблемы и достижения цели данной работы, т.к. она обеспечивает решение следующих задач:
1. Синтез и адаптация семантической информационной модели предметной области, включая объект активный управления и окружающую среду.
2. Идентификация и прогнозирование состояния активного объекта управления, а также разработка управляющих воздействий для его перевода в заданные целевые состояния.
3. Углубленный анализ семантической информационной модели предметной области.
Таким образом, система "Эйдос" является инструментарием, решающим проблему данной работы.
1.4.1.1. Синтез содержательной информационной модели предметной области
Для разработки информационной модели предметной области необходимо владеть основными принципами ее когнитивной структуризации и формализованного описания. Синтез содержательной информационной модели включает следующие этапы:
1. Формализация (когнитивная структуризация предметной области).
2. Формирование исследуемой выборки и управление ею.
3. Синтез или адаптация модели.
4. Оптимизация модели.
5. Измерение адекватности модели (внутренней и внешней, интегральной и дифференциальной валидности), ее скорости сходимости и семантической устойчивости.
1.4.1.2. Идентификация и прогнозирование состояния объекта управления, выработка управляющих воздействий
Данный вид работ включает:
1. Ввод распознаваемой выборки.
2. Пакетное распознавание.
3. Вывод результатов распознавания и их оценку.
1.4.1.3. Углубленный анализ содержательной информационной модели предметной области
Углубленный анализ выполняется в подсистеме "Типология" и включает:
1. Информационный и семантический анализ классов и признаков.
2. Кластерно–конструктивный анализ классов распознавания и признаков, включая визуализацию результатов анализа в оригинальной графической форме когнитивной графики (семантические сети классов и признаков).
3. Когнитивный анализ классов и признаков (когнитивные диаграммы и диаграммы Вольфа Мерлина).
1.4.2. Обобщенная структура системы "Эйдос"
Данной обобщенной структуре соответствуют и структура управления и дерево диалога системы (таблица 4):
Таблица 4 – ОБОБЩЕННАЯ СТРУКТУРА СИСТЕМЫ "ЭЙДОС"
(текущей версии 12.5 от 20.04.2008)
Подсистема
Режим
Функция
Операция
1.
Формализация ПО
1. Классификационные шкалы и градации
2. Описательные шкалы (и градации)
3. Градации описательных шкал (признаки)
4. Иерархические уровни систем
1. Уровни классов
2. Уровни признаков
5. Программные интерфейсы для импорта данных
1. Импорт данных из TXT-фалов стандарта DOS-текст
2. Импорт данных из DBF-файлов стандарта проф. А.Н.Лебедева
3. Импорт из транспонированных DBF-файлов проф. А.Н.Лебедева
4. Генерация шкал и обучающей выборки RND-модели
5. Генерация шкал и обучающей выборки для исследования чисел
6. Транспонирование DBF-матриц исходных данных
7. Импорт данных из DBF-файлов стандарта Евгения Лебедева
6. Почтовая служба по НСИ
1. Обмен по классам
2. Обмен по обобщенным признакам
3. Обмен по первичным признакам
7. Печать анкеты
Подсистема
Режим
Функция
Операция
2.
Синтез СИМ
1. Ввод–корректировка обучающей выборки
2. Управление обучающей выборкой
1. Параметрическое задание объектов для обработки
2. Измерение адекватности семантической информационной модели
3. Измерение независимости классов и признаков
4. Просмотр профилей классов и признаков
5. Графическое отображение нелокальных нейронов
6. Отображение Паретто-подмножеств нейронной сети
7. Классические и интегральные когнитивные карты
7.
Сервис
1. Генерация (сброс) БД
1. Все базы данных
2. НСИ
1. Всех баз данных НСИ
2. БД классов
3. БД первичных признаков
4. БД обобщенных признаков
3. Обучающая выборка
4. Распознаваемая выборка
5. Базы данных статистики
2. Переиндексация всех баз данных
3. Печать БД абсолютных частот
4. Печать БД условных процентных распределений СИМ-1 и СИМ-2
5. Печать БД информативностей СИМ-1 и СИМ-2
6. Интеллектуальная дескрипторная информационно–поисковая система
7. Копирование основных баз данных СИМ
8. Сделать текущей матрицу информативностей СИМ-1
9. Сделать текущей матрицу информативностей СИМ-1
Подробнее подсистемы, режимы, функции и операции, реализуемые системой "Эйдос", описаны в работе [27].
1.5. Выводы
Из вышеизложенного можно сделать обоснованный вывод о том, что математическая модель, методика численных рассчетов (структуры данных и алгоритмы), специальный программный инструментарий СК-анализа (система "Эйдос"), а также методика и технология их применения являются адекватным интсрумертом для прогнозирования и поддержки принятия решений в растениеводстве.
ГЛАВА-2. ПРОГНОЗИРОВАНИЕ РЕЗУЛЬТАТОВ ВЫРАЩИВАНИЯ СЕЛЬСКОХОЗЯЙСТВЕННЫХ КУЛЬТУР И ПОДДЕРЖКА ПРИНЯТИЯ РЕШЕНИЙ ПО РАЦИОНАЛЬНОМУ ВЫБОРУ АГРОТЕХНОЛОГИЙ
2.1. Решение задач прогнозирования и поддержки
приянтия решений в растениводстве с применением
системы "ЭЙДОС" в 1993-1996 годах
Исследование проведено совместно с д.б.н., к.т.н., профессором О.А.Засухиной на базе Кубанского государственного аграрного университета в 1993-1996 годах [27], ей принадлежала и идея этого исследования. Методологической и инструментально-технологической основой данного исследования являлись системно-когнитивный анализ (СК-анализ) и система "Эйдос" [27], ранее использовавшиеся для решения математически-подобных задач в других предметных областях.
С помощью сформированной содержательной информационной модели прогнозировались результаты выращивания сельскохозяйственных культур и вырабатывались научно-обоснованных рекомендации по управлению урожайностью и качеством сельскохозяйственной продукции.
Созданная модель включала:
– объект управления (сельскохозяйственную культуру: зерновые колосовые);
– классы (будущие состояния объекта управления, т.е. количественные и качественные результаты выращивания);
– факторы управляющей системы (агротехнологии, т.е. нормы высева, виды и нормы внесения удобрений, методы вспашки, ротация севооборота и т.п.);
– факторы окружающей среды (вид почв, культуры–предшественники по предшествующим годам и др.).
Размерность модели составила: 35 прогнозируемых результатов выращивания, 188 градаций факторов, 217 прецедентов в обучающей выборке, 18594 факта.
На основе предложенной технологии СК-анализа в среде системы "Эйдос" разработано конкретное приложение, обеспечивающее управление продуктивностью (урожайностью) и качеством сельскохозяйственных культур путем выбора и применения оптимальной агротехнологии в зависимости от таких факторов, как:
– поставленная цель (максимальное количество или максимальное качество продукции);
– вид почв;
– метод вспашки;
– культура-предшественник;
– нормы высева;
– виды и нормы внесения удобрений;
– ротация севооборота;
а также ряда других параметров объекта управления и окружающей среды.
1. Формулировка целей методики и в соответствии с ними разработка перечня прогнозируемых хозяйственных ситуаций, т.е. результатов выращивания (например, для классификации будущих состояний, в том числе целевых, могут быть использованы "шкала качества" и "шкала количества", рисунок 7):
Рисунок 7. Будущие состояния объекта управления: количественные и качественные результаты выращивания сельхозкультуры (зерновые колосовые)
2. Разработка формализованного паспорта результатов выращивания сельхозкультур, позволяющего описать в пригодной для компьютерной обработки форме результаты выращивания конкретной сельхозкультуры на конкретном поле и по конкретной технологии.
Формализованный паспорт состоит из трех частей:
– первая включает целевые и нежелательные будущие состояния объекта управления;
– вторая содержит описательные шкалы и градации, описывающие не зависящие от воли человека факторы окружающей среды;
– третья – зависящие от человека, т.е. технологические факторы, которые можно рассматривать как средство достижения желаемых хозяйственных результатов (рисунок 8).
Рисунок 8. Видеограмма с фрагментом справочника
описательных шкал (факторы)
3. Использование бумажного архива по выращиванию сельхозкультур для заполнения формализованных паспортов и ввода в программную инструментальную систему "Эйдос" в качестве примеров выращивания (обучающей выборки) (рисунок 9).
Рисунок 9. Интерфейс ввода обучающей выборки
4. Выявление (на основе предъявленных реальных примеров выращивания сельхозкультур) взаимосвязей между применяемыми технологиями и полученными результатами и формирование информационных портретов по каждому возможному результату выращивания.
Информационный портрет хозяйственной ситуации представляет собой перечень технологических факторов с количественным указанием того, какое влияние оказывает каждый из них на осуществление данной ситуации (рисунок 10):
Рисунок 10. Примеры информационных портретов
результатов выращивания "высокое количество"
и "высокое качество"
5. Каждый из технологических факторов на основе приведенных примеров характеризуется тем, какое влияние он оказывает на осуществление каждой (целевой или нежелательной) хозяйственной ситуации (рисунок 11):
Рисунок 11. Семантический портрет признака:
"Предшественники – бобовые многолетние травы"
6. Сравнение различных хозяйственных ситуаций и формирование групп наиболее сходных из них (кластеров), а также определение кластеров, наиболее сильно отличаются друг от друга (конструктов). При этом на экспериментальной базе данных был выявлен конструкт "качество-оличество", означающий, что для получения высокого качества и большого количества необходимы совершенно противоположные и несовместимые (т.е. невозможные одновременно) почвы: предшественники и агротехнологические приемы (рисунок 12):
Рисунок 12. Конструкт классов: "Качество – количество" и семантическая сеть классов по шкалам: "Качество – количество"
7. Группировка технологических факторов в кластеры и конструкты. Кластерно-конструктивный анализ факторов показал, что некоторые различные по своей природе факторы имеют сходное влияние на хозяйственные результаты. Эти факторы предложено использовать для замены друг друга в случае необходимости (рисунок 13):
Рисунок 13. Конструкт факторов: "Предшественники бобовые … – Ротация первая…" и семантической сети факторов: "Предшественники – Глубина обработки почвы"
8. Проверка способности созданного приложения правильно прогнозировать хозяйственные результаты на массиве уже введенных формализованных паспортов показала, что валидность оказалась недостаточно высокой для практического применения: на уровне 58%. Причиной этого являются артефакты, из-за которых некоторые хозяйственные ситуации оказались слабо детерминированными (рисунок 14). Удаление артефактов привело к повышению интегральной валидности до 80%, что достаточно для практического использования методики (рисунок 15)
Рисунок 14. Интегральная и дифференциальная валидность методики до исключения артефактов
Рисунок 15. Интегральная и дифференциальная валидность методики после исключения артефактов
Таким образом, решены две основные задачи:
1. Прогнозирование того, какие хозяйственные результаты наиболее вероятны (а какие практически невозможны) на данном виде почв и с данными предшественниками, а также при условии применения имеющихся в распоряжении агротехнологий (рисунок 16). Указана мера сходства прогнозируемой ситуации с каждым будущим состоянием.
Рисунок 16. Пример карточки прогнозирования для конкретных условий выращивания
2. Поодержка принятия решений по выбору управляющих воздействий, т.е. консультирование по вопросам о том, какие виды почв, предшественники и агротехнологии должны быть, чтобы можно было рассчитывать с определенной уверенностью на заданный хозяйственный результат. Для этого достаточно вывести информационный портрет заданного целевого состояния.
Система "Эйдос" позволяет оценивать степень достоверности своих прогнозов и рекомендаций по управлению, т.е. она не просто дает рекомендацию, но и количественно оценивает степень ее надежности. Кроме того, система дает характеристику влияния каждого технологического приема и рекомендации по замене желательных, но очень дорогих или не имеющихся в наличии технологических приемов, другими, более дешевыми и доступными, и, при этом, имеющими сходное влияние на хозяйственные результаты.
Таким образом, данная методика позволяет "просматривать" различные варианты технологии, прогнозировать последствия применения различных технологических приемов, и на этой основе вырабатывать научно обоснованные рекомендации по выбору возделываемой культуры и оптимальной для поставленных целей агротехнологии.
В данном исследовании в количественной форме были обнаружены как уже известные закономерности по влиянию предшественников, почв, удобрений, способов вспашки и т.д. на результаты выращивания сельхозкультур, так и новые, ранее неизвестные.
2.2. Постановка задачи, синтез и исследование модели
прогнозирования урожайности зерновых колосовых
и поддержки принятия решений
по рациональному выбору агротехнологий
2.2.1. Проблематика работы
В растениеводстве, в частности науке и практике возделывания зерновых колосовых, известно большое количество технологических схем (карт), разработанных за многие годы труда агрономов, в основном еще в период плановой, затратной экономики, когда никого особо не интересовало какой ценой дается урожай. В наше время такой подход уже устраивает, т.к. обязательным условием хозяйствования в современных условиях является рентабельность производства.
Поэтому учеными ведется интенсивная работа по созданию новых экономически эффективных сортов и агротехнологических приемов, в частности таких как: подготовка почвы, удобрения и средства защиты растений, и эта работа ведется успешно. Однако сразу после создания широко применять эти новые сорта и агротехнологии неразумно, т.к. вообще говоря неизвестно, какие это даст результаты в наших конкретных условиях. Для прогнозирования результатов и научно-обоснованного выбора рациональных агротехнологий, обеспечивающих желаемый результат, все эти новые сорта и агротехнологии предварительно должны быть изучены, причем обязательно в условиях региона выращивания, т.е. в конкретных агрометеорологических условиях Краснодарского края.
Таким образом, проблема, решаемая в работе, состоит в том, что с одной стороны появляются новые сорта и агротехнологии, позиционируемые на рынке как экономически эффективные, а с другой стороны в конкретных условиях Краснодарского края последствия их применения изучены недостаточно, что усложняет принятие решений по их применению.
Практическая значимость решения этой проблемы для хозяйств очевидна, т.к. достоверное прогнозирование результатов применения и научно-обоснованные рекомендации по рациональному выбору агротехнологий позволят повысить экономическую эффективность хозяйствования.
Научная новизна решения данной проблемы состоит в том, что в данной работе впервые предлагается и апробируется вариант ее решения на основе применения современных информационных технологий путем интеллектуальной обработки ретроспективных данных, отражающих фактический опыт выращивания исследуемых сортов, т.е. без специального планирования и проведения длительных и дорогостоящих полевых испытаний сортов в условиях применения различных агротехнологий.
Актуальность исследования обусловлена ее практической значимостью и научной новиной.
Объектом исследования является технология выращивания зерновых колосовых, а предметом исследования: изучение влияния различных агротехнологий на урожайность пшеницы сортов и ячменя в конкретных агрометеорологических условиях Краснодарского края.
Поэтому целью исследования является разработка технологии и методики прогнозирования хозяйственных результатов применения тех или иных агротехнологий, а также поддержки принятия решений по выбору таких сортов и рациональных агротехнологий для выращивания, которые бы с высокой вероятностью дали бы заранее заданный желаемый хозяйственный результат.
Задачи исследования вытекают и его цели путем ее декомпозиции и являются этапами ее достижения:
Задача 1. Обосновать требования к методу решения задачи и определить степень соответствия известных методов обоснованным требованиям.
Задача 2. Выбрать наиболее подходящий по обоснованным критериям метод решения проблемы.
Задача 3. Кратко описать суть выбранного метода.
Задача 4. Описать методику применения выбранного метода для решения поставленной проблемы.
Задача 5. Описать результаты применения методики (эффективность, научные результаты и выводы, практические рекомендации).
Задача 6. Рассмотреть ограничения метода и методики его применения, перспективы их развития и применения.
Кратко, на сколько это возможно в рамках работы, рассмотрим решение поставленных задач.
2.2.2. Задача 1.
Обосновать требования к методу решения задачи
и определить степень соответствия известных методов
обоснованным требованиям.
Возникает вопрос о том, каким образом в современных условиях можно было бы наиболее рационально и эффективно решить поставленную проблему и достичь цели исследования.
Традиционные технологии разработки технологических карт требуют многолетних целенаправленных тщательно заранее спланированных исследований и связаны с проведением экспериментов по выращиванию в условиях применения различных агротехнологий возделывания. Все это требует очень и очень значительных временных и финансовых затрат, а также других видов ресурсов.
Поэтому ученые-агрономы постоянно ищут новые возможности выявления и исследования зависимостей в эмпирических данных. Все чаще для этих целей применяются современные информационные технологии, в частности статистические методы и реализующие их программных системы. Однако и на этом пути возникают свои специфические проблемы.
В частности наиболее распространенный метод выявления зависимостей: многофакторный анализ по ряду причин не позволяет исследовать всю систему факторов, действующих в реальных агросистемах. К этим причинам относятся прежде всего следующие:
1. Большое количество реально действующих факторов: не 2-7, а десятки, сотни и даже тысячи.
2. Значительная зашумленность (или низкая точность и достоверность) исходных данных.
3. Требование к нормальному характеру распределения исходных данных (т.к. метод параметрический).
4. Наличие доступного программного инструментария, реализующего метод.
5. Требование к полноте исходных данных, т.е. к наличию в них всех сочетаний значений исследуемых факторов.
6. Возможность разумной содержательной интерпретации результатов применения метода.
На практике выполнение всех этих условий нереально даже при нескольких факторах, либо, как уже говорилось, требует очень значительных затрат времени и других ресурсов.
Рассмотрим, например 4-е требование. Довольно типичной является ситуация, когда какой-то подходящий по литературному описанию для решения поставленной проблемы математический метод на практике применить не удается, так как не разработана соответствующая методика численных расчетов и отсутствует или недоступен реализующий их программный инструментарий. Например, подобная ситуация сложилась с многокритериальным методом поддержки принятия решений, описанным в классической работе [91] или теорией информационного поля [4].
Попытка выполнить 5-е требование всего при 3-х факторах с 10-ю значениями каждого порождает необходимость исследования 1000 результатов выращивания. Конечно же на практике это нереально, не говоря уже о десятках, сотнях или тысячах факторов. Необходимо отметить, что на практике подобных данных взять просто негде, т.к. в реальных данных обычно наблюдаются лишь очень небольшие подматрицы без пропусков, т.е. со всеми сочетаниями значений факторов. Заполнять же пропуски путем интерполяции обычно некорректно (хотя это и делается), т.к. это возможно только если в строке и столбце, на пересечениях которых находится клетка с пропуском больше нет пропусков. Если же они есть то заполнение пропущенной клетки вообще говоря приведет к изменению остальных незаполненных значений, что фактически делает их вообще неопределенными.
Считается, что 6-е требование в случае многофакторного анализа трудно выполнимо уже при 5 факторах и более.
На практике все эти причины в совокупности (а ведь действует еще и субъективный фактор) приводят к весьма ограниченному применению математических методов при решении поставленной проблемы, по крайней мере если судить по защищаемым в области агрономии диссертациям, как правило дело сводится к исследованию влияния одного фактора на значения какого либо одного же результирующего параметра, например глубины вспашки на содержание клейковины для какого-либо конкретного сорта пшеницы при всех прочих равных условиях.
Поэтому к методу исследования предъявляются следующие требования, т.е. метод должен:
– обеспечивать выявление силы и направления влияния сотен или даже тысяч факторов;
– быть непараметрическим, чтобы не требовалось доказательство гипотез о нормальности исследуемой выборки;
– корректно обрабатывать неполные (фрагментированные) данные, т.е. данные, в которых встречаются не все сочетания значений исследуемых факторов;
– эффективно подавлять шум в данных и выявлять закономерности на фоне шума, значительно превосходящего сигнал по амплитуде (при достаточно большой выборке);
– имеет доступный программный инструментарий, реализующий метод;
– обеспечивать возможность разумной содержательной интерпретации результатов применения метода.
2.2.3. Задача 2.
Выбрать наиболее подходящий
по обоснованным критериям
метод решения проблемы.
Для решения поставленной проблемы предлагается применить новый математический метод системно-когнитивного анализа (СК-анализ), который: обеспечивает выявление силы и направления влияния сотен или даже тысяч факторов; является непараметрическим; позволяет корректно обрабатывать неполные (фрагментированные) данные; эффективно подавлять шум в данных и выявлять закономерности на фоне шума; имеет доступный программный инструментарий, реализующий метод (универсальная когнитивная аналитическая система "Эйдос"); обеспечивает возможность разумной содержательной интерпретации результатов применения метода [27].
2.2.4. Задача 3.
Кратко описать суть выбранного метода.
Системно-когнитивный анализ представляет собой системный анализ, рассматриваемый как метод познания и структурированный по базовым когнитивным (познавательным) операциям (БКОСА) [27].
СК-анализ включает:
– теоретические основы, включая базовую когнитивную концепцию;
– математическую модель (системную теорию информации);
– методику численных расчетов (структуры данных и алгоритмы их обработки);
– специальный программный инструментарий, реализующий математическую модель и методику численных расчетов СК-анализа (универсальная когнитивная аналитическая система "Эйдос").
2.2.4.1. Теоретические основы СК-анализа (включая базовую когнитивную концепцию).
Сам набор БКОСА следует из предложенной в [27] формализуемой когнитивной концепции, рассматривающей процесс познания, как многоуровневую иерархическую систему обработки информации в которой когнитивные структуры каждого уровня являются результатом интеграции структур предыдущего уровня.
На 1-м уровне этой системы находятся дискретные элементы потока чувственного восприятия, которые на 2-м уровне интегрируются в чувственный образ конкретного объекта. Те, в свою очередь, на 3-м уровне интегрируются в обобщенные образы классов и факторов, образующие на 4-м уровне кластеры, а на 5-м конструкты. Система конструктов на 6-м уровне образуют текущую парадигму реальности (т.е. человек познает мир путем синтеза и применения конструктов). На 7-м же уровне обнаруживается, что текущая парадигма не единственно-возможная (рисунок 17).
Ключевым для когнитивной концепции является понятие факта, под которым понимается соответствие дискретного и интегрального элементов познания (т.е. элементов разных уровней интеграции-иерархии), обнаруженное на опыте. Факт рассматривается как квант смысла, что является основой для его формализации.
Из данной концепции выводятся структура когнитивного конфигуратора, система базовых когнитивных операций и обобщенная схема автоматизированного системного анализа, структурированного до уровня базовых когнитивных операций (СК-анализ).
Между когнитивными структурами разных уровней иерархии существует отношение "дискретное – интегральное". Именно это служит основой формализации смысла.
Когнитивный конфигуратор, представляет собой минимальную полную систему когнитивных операций, названных "базовые когнитивные операции системного анализа" (БКОСА). Всего выявлено 10 таких операций, каждая из которых достаточно элементарна для формализации и программной реализации:
1) присвоение имен;
2) восприятие;
3) обобщение (синтез, индукция, многопараметрическая типизация);
4) абстрагирование;
5) оценка адекватности модели;
6) сравнение, идентификация и прогнозирование;
7) дедукция и абдукция;
8) классификация и генерация конструктов;
9) содержательное сравнение;
10) планирование и принятие решений об управлении.
В работе [27] предложены математическая модель, методика счисленных расчетов, включающая структуры данных и алгоритмы реализации БКОСА, а также программный инструментарий СК-анализа – универсальная когнитивная аналитическая система "Эйдос" [27].
2.2.4.2. Математическая модель (системная теория информации) и методика численных расчетов СК-анализа (структуры данных и алгоритмы их обработки).
Математическая модель и методика численных расчетов СК-анализа предложены и подробно описаны в работах [27], и здесь их приводить нецелесообразно. Отметим лишь, что модель обеспечивает выявление знаний [56] непосредственно из эмпирических фактов, при этом для каждой группы объектов, по которой проводится многопараметрическая типизация (обобщение), в качестве контрольной группы (нормы) выступает вся исследуемая выборка (теоретически вся генеральная совокупность, которую эта выборка представляет). О математической модели СК-анализа, т.е. системной теории информации (СТИ), необходимо еще сказать, что она является одним из возможных вариантов реализации в области теории информации программной идеи системного обобщения математики, предложенной автором [29, 48, 49, 50].
2.2.4.3. Специальный программный инструментарий СК-анализа, реализующий математическую модель и методику численных расчетов (универсальная когнитивная аналитическая система "Эйдос").
2.2.4.3.1. Основные функции системы "Эйдос"
Универсальная когнитивная аналитическая система "Эйдос" является отечественным лицензионным программным продуктом на который имеется ряд свидетельств РосПатента РФ1, созданным исключительно с использованием официально приобретенного лицензионного программного обеспечения. По системе "Эйдос" и различным аспектам ее применения имеется более 150 публикаций ряда авторов.
Система "Эйдос" является одним из элементов предлагаемого решения проблемы и достижения цели данной работы, т.к. она обеспечивает решение следующих задач:
1. Синтез и адаптация семантической информационной модели предметной области, включая объект активный управления и окружающую среду.
2. Идентификация и прогнозирование состояния активного объекта управления, а также разработка управляющих воздействий для его перевода в заданные целевые состояния.
3. Углубленный анализ семантической информационной модели предметной области.
Таким образом, система "Эйдос" является инструментарием, решающим проблему данной работы.
2.2.4.3.5. Синтез содержательной информационной модели предметной области
Для разработки информационной модели предметной области необходимо владеть основными принципами ее когнитивной структуризации и формализованного описания. Синтез содержательной информационной модели включает следующие этапы:
1. Когнитивная структуризация и формализация предметной области.
2. Формирование исследуемой выборки и управление ею.
3. Синтез или адаптация модели.
4. Оптимизация модели.
5. Измерение адекватности модели (внутренней и внешней, интегральной и дифференциальной валидности), ее скорости сходимости и семантической устойчивости.
2.2.4.3.6. Идентификация и прогнозирование состояния объекта управления, выработка управляющих воздействий
Данный вид работ включает:
1. Ввод распознаваемой выборки.
2. Пакетное распознавание.
3. Вывод результатов распознавания и их оценку.
2.2.4.3.7. Углубленный анализ содержательной информационной модели предметной области
Углубленный анализ выполняется в подсистеме "Типология" и включает:
1. Информационный и семантический анализ классов и признаков.
2. Кластерно-конструктивный анализ классов распознавания и признаков, включая визуализацию результатов анализа в оригинальной графической форме когнитивной графики (семантические сети классов и признаков).
3. Когнитивный анализ классов и признаков (когнитивные диаграммы и диаграммы Вольфа Мерлина, нейросетевой анализ, классические и интегральные когнитивные карты).
2.2.4.3.8. Обобщенная структура системы "Эйдос"
Данной обобщенной структуре соответствуют и структура управления и дерево диалога системы (таблица 5):
Подробнее подсистемы, режимы, функции и операции, реализуемые системой "Эйдос", описаны в работе [27].
Таблица 5 – ОБОБЩЕННАЯ СТРУКТУРА СИСТЕМЫ "ЭЙДОС"
(текущей версии 12.5 от 20.04.2008)
Подсистема
Режим
Функция
Операция
1.
Формализация ПО
1. Классификационные шкалы и градации
2. Описательные шкалы (и градации)
3. Градации описательных шкал (признаки)
4. Иерархические уровни систем
1. Уровни классов
2. Уровни признаков
5. Программные интерфейсы для импорта данных
1. Импорт данных из TXT-фалов стандарта DOS-текст
2. Импорт данных из DBF-файлов стандарта проф. А.Н.Лебедева
3. Импорт из транспонированных DBF-файлов проф. А.Н.Лебедева
4. Генерация шкал и обучающей выборки RND-модели
5. Генерация шкал и обучающей выборки для исследования чисел
6. Транспонирование DBF-матриц исходных данных
7. Импорт данных из DBF-файлов стандарта Евгения Лебедева
2. Измерение адекватности семантической информационной модели
3. Измерение независимости классов и признаков
4. Просмотр профилей классов и признаков
5. Графическое отображение нелокальных нейронов
6. Отображение Паретто-подмножеств нейронной сети
7. Классические и интегральные когнитивные карты
7.
Сервис
1. Генерация (сброс) БД
1. Все базы данных
2. НСИ
1. Всех баз данных НСИ
2. БД классов
3. БД первичных признаков
4. БД обобщенных признаков
3. Обучающая выборка
4. Распознаваемая выборка
5. Базы данных статистики
2. Переиндексация всех баз данных
3. Печать БД абсолютных частот
4. Печать БД условных процентных распределений СИМ-1 и СИМ-2
5. Печать БД информативностей СИМ-1 и СИМ-2
6. Интеллектуальная дескрипторная информационно–поисковая система
7. Копирование основных баз данных СИМ
8. Сделать текущей матрицу информативностей СИМ-1
9. Сделать текущей матрицу информативностей СИМ-1
Метод СК-анализа был успешно применен для решения ряда задач, сходных с решаемыми в данной работе [23-111 и др]2.
2.2.5. Задача 4.
Описать методику применения выбранного метода
для решения поставленной проблемы.
СК-анализ представляет собой метод решения поставленной проблемы, включающий теорию и математическую модель..Для того, чтобы это метод, как впрочем и любой другой, стало возможным применить на практике его нужно оснастить методикой, т.е. необходимо разработать методику численных расчетов, реализующую счисленную модель, а также программный инструментарий, реализующий эту в общем виде эту методику численных расчетов. Рассмотрим подробнее применение этой методики для решения проблемы, сформулированной в данном разделе.
2.2.5.1. Основные этапы методики применения автоматизированного системно-когнитивного анализа
Автоматизированный системно-когнитивный анализ (АСК-анализ) [27, 35, 36] представляет собой метод СК-анализа, технологию, основанную на применении инструментария СК-анализа – системы "Эйдос" и методику применения этой системы для формирования семантической информационной модели предметной области (СИМ) и включает следующие этапы:
1. Когнитивная структуризация, а затем и формализация предметной области.
2. Ввод данных мониторинга в базу прецедентов (обучающую выборку) за период, в течение которого имеется необходимая информация в электронной форме.
3. Синтез семантической информационной модели (СИМ).
4. Оптимизация СИМ.
5. Проверка адекватности СИМ (измерение внутренней и внешней, дифференциальной и интегральной валидности).
6. Решение задач идентификации состояний объекта управления, прогнозирования и поддержки принятия управленческих решений по управлению с применением СИМ.
7. Системно-когнитивный и кластерно-конструктивный анализ СИМ.
На первых двух этапах АСК-анализа, детально рассмотренных в работах [27, 35, 36], числовые величины сводятся к интервальным оценкам, как и информация об объектах нечисловой природы (фактах, событиях). Этот этап реализуется и в методах интервальной статистики.
На третьем этапе СК-анализа всем этим величинам по единой методике, основанной на системном обобщении семантической теории информации А.Харкевича, сопоставляются количественные величины, с которыми в дальнейшем и производятся все операции моделирования.
Последовательное выполнение всех этих этапов и представляет собой решение сформулированной в данной работе проблемы.
Рассмотрим эти этапы.
2.2.5.2. Когнитивная структуризация, а затем и формализация предметной области.
Подробно типовая методика когнитивной структуризации и формализации предметной области приведена в работе [60], поэтому здесь мы не будем давать определения этих понятий и приводить теоретическую часть, а сразу опишем результаты применения этой методики при решении проблемы, сформулированной в данной работе.
На этапе когнитивной структуризации предметной области в качестве классификационных шкал выберем результирующие состояния объекта управления:
1. Культура
2. Сорт
3. Урожайность (точн.знач)
4. Урожайность (инт.оценка)
5. Качество
6. Культура + сорт + урожайность
7. Культура + сорт + качество
8. Культура + урожайность (округленная)
9. Культура + качество
В качестве факторов (т.е. описательных шкал), обуславливающих переход объекта управления в эти результирующие состояния, выберем следующие:
1. Предшественники
2. Уровень плодородия
3. Обработка почвы
4. Удобрение
5. Защита растений
На этапе формализации предметной области конкретизируем градации классификационных и описательных шкал (таблицы 6 и 7).
Таблица 7 – ОПИСАТЕЛЬНЫЕ ШКАЛЫ И ГРАДАЦИИ
Код
Наименование описательных шкал и градаций
[ 1]
10. ПРЕДШЕСТВЕННИКИ
1
10. ПРЕДШЕСТВЕННИКИ-.
2
10. ПРЕДШЕСТВЕННИКИ-Кукуруза.
3
10. ПРЕДШЕСТВЕННИКИ-Многолетние травы
4
10. ПРЕДШЕСТВЕННИКИ-Сахарная свекла
[ 2]
11. УРОВЕНЬ ПЛОДОРОДИЯ
5
11. УРОВЕНЬ ПЛОДОРОДИЯ-Высокий.
6
11. УРОВЕНЬ ПЛОДОРОДИЯ-Низкий
7
11. УРОВЕНЬ ПЛОДОРОДИЯ-Средний.
[ 3]
12. ОБРАБОТКА ПОЧВЫ
8
12. ОБРАБОТКА ПОЧВЫ-Безотвальная.
9
12. ОБРАБОТКА ПОЧВЫ-Отвальная
10
12. ОБРАБОТКА ПОЧВЫ-Поверхностная
[ 4]
13. УДОБРЕНИЕ
11
13. УДОБРЕНИЕ-Минеральная система
12
13. УДОБРЕНИЕ-Органическая система.
13
13. УДОБРЕНИЕ-Органическо-минеральная
14
13. УДОБРЕНИЕ-Отсутствует
[ 5]
14. ЗАЩИТА РАСТЕНИЙ
15
14. ЗАЩИТА РАСТЕНИЙ- Бактороденцид 3 кг/га : Фосфид цинка т.п. (5%) 4 кг/га
2.2.5.3. Ввод данных мониторинга в базу прецедентов (обучающую выборку) за период, в течение которого имеется необходимая информация в электронной форме.
Этот ввод осуществлялся с помощью специально предназначенного для подобных случаев универсального программного интерфейса между внешними базами данных и системой "Эйдос" (рисунок 18).
Рисунок 18. Экранная форма универсального программного интерфейса между внешними базами данных и системой "Эйдос"
Данный программный интерфейс обеспечивает автоматическое формирование классификационных и описательных шкал и градаций и обучающей выборки на основе DBF-файла с сходными данными приведенного ниже стандарта.
Этот DBF-файл должен иметь имя: Inp_data.dbf и может быть получен в Excel, если выбрать "Сохранить как" и задать тип файла: DBF 4, dBASE IV. Каждая строка файла содержит данные об одном объекте обучающей выборки. Все столбцы этого файла могут быть как текстового, так и числового типа
1-й столбец содержит наименование источника данных длиной < 16 символов.
Столбцы со 2-го по N-й являются классификационными шкалами и содержат информацию о классах, к которым принадлежат объекты обучающей выборки.
Столбцы с N+1 по последний являются описательными шкалами и содержат информацию о признаках, характеризующих эти объекты.
Русские наименования классификационных и описательных шкал должны быть строками в файле с именем Inp_name.txt стандарта: MS DOS (кириллица).
Система автоматически находит минимальное и максимальное числовые значения в каждом столбце классов или признаков и формирует заданное в диалоге количество ОДИНАКОВЫХ для каждой шкалы числовых интервалов. Затем числовые значения заменяются их интервальными значениями. Каждое УНИКАЛЬНОЕ текстовое или интервальное значение считается градацией классификационной или описательной шкалы, характеризующей объект.
Затем с использованием этой информации генерируется обучающая выборка, в которой каждой строке DBF-файла исходных данных соответствует одна физическая анкета, содержащая столько логических анкет, сколько уникальных классов в диапазоне столбцов классов, и коды признаков, которые соответствуют попаданиям числовых значений признаков в интервалы.
В таблице 8 представлен фрагмент исходного Excel-файла. Файл Inp_data.dbf по структуре не отличается от экселевского за исключением того, что наименования полей в нем вида: N1, N2,..., N15. Из-за того, что таблица не помещается в стандартный лист по лирине она показана по частям (вправо). Для того, чтобы исключить длинные текстовые кириллические наименования полей из экселевского файла нужно перед записью выделить блоком часть таблицы с латинскими наименованиями полей и нужными данными. Интервальные значения и сочетания классов в Excel-файле образованы средствами Excel.
В результате работы данного программного интерфейса (рисунок 18) на основе файлов Inp_data.dbf и Inp_name.txt автоматически формируются классификационные и описательные шкалы и градации (таблицы 6 и 7), обучающая выборка (таблица 9).
Таблица 8 – EXCEL-ФАЙЛ С ИСХОДНЫМИ ДАННЫМИ (ФРАГМЕНТ)
№
Культура
Сорт
Урожайность
Продолжение таблицы 8
№
Обработка почвы
Удобрение
Защита растений
N1
N13
N14
N15
1
Отвальная
Отсутствует
Бактороденцид 3 кг/га :
Фосфид цинка т.п. (5%) 4 кг/га
2
Безотвальная
Отсутствует
Тоже самое
3
Поверхностная
Отсутствует
Тоже самое
4
Отвальная
Минеральная система
Тоже самое
5
Безотвальная
Минеральная система
Тоже самое
6
Поверхностная
Минеральная система
Тоже самое
7
Отвальная
Органическая система
Тоже самое
8
Безотвальная
Органическая система
Тоже самое
9
Поверхностная
Органическая система
Тоже самое
10
Отвальная
Органическо-минеральная
Тоже самое
11
Безотвальная
Органическо-минеральная
Тоже самое
12
Поверхностная
Органическо-минеральная
Тоже самое
13
Отвальная
Отсутствует
Тоже самое
14
Безотвальная
Отсутствует
Тоже самое
15
Поверхностная
Отсутствует
Тоже самое
16
Отвальная
Минеральная система
Тоже самое
17
Безотвальная
Минеральная система
Тоже самое
18
Поверхностная
Минеральная система
Тоже самое
19
Отвальная
Органическая система
Тоже самое
20
Безотвальная
Органическая система
Тоже самое
21
Поверхностная
Органическая система
Тоже самое
Всего обучающая выборка включает описания 308 случаев выращивания озимой пшеницы нескольких сортов, озимого и ярового ячменя и здесь не приводится из-за большого объема.
2.2.5.4. Синтез семантической информационной модели (СИМ).
Стандартными средствами системы "Эйдос" (режим: _235) был выполнен синтез семантической информационной модели (СИМ).
2.2.5.5. Оптимизация СИМ.
В системе "Эйдос" реализовано несколько различных методов оптимизации (в смысле улучшения адекватности) модели: это и исключение из модели статистически малопредставленных классов и факторов (артефактов), и исключение незначимых факторов, и ремонт (взвешивание) данных, что обеспечивает не только классическую, но и структурную репрезентативность исследуемой выборки по отношению к генеральной совокупности, и итерационное разделение классов на типичную и нетипичную части, и генерация моделей больших размерностей с сочетанными признаками.
Однако проведенные численные эксперименты с применением этих методов оптимизации модели показали, что их применение нецелесообразно по двум причинам:
1. Полученная исходная модель и так обладает достаточно хорошими характеристиками адекватности.
2. Применение методов улучшения адекватности модели не дает ощутимых результатов.
Пункт 2 можно объяснить тем, что когда модель хорошая, то дальше ее улучшать сложнее, чем модель с низкой адекватностью.
2.2.5.6. Проверка адекватности СИМ (измерение внутренней и внешней, дифференциальной и интегральной валидности).
Контрольное измерение адекватности СИМ было проведено на исходной выборке, включающей 308 случаев, т.е. физических анкет, состоящих из 2774 логических анкет Каждый случай выращивания описан в одной физической анкете (строке Excel-файла), но используется для формирования нескольких классов, в среднем 9, т.е. каждая физическая анкета включает в среднем 9 логических анкет.
При этом были получены результаты, представленные в таблице 10.
Итоговые средневзвешенные показатели адекватности модели приведены ниже:
11. Среднее количество и % логических анкет, правильно отнесенных к классу: 81.547, т.е. 85.306%
12. Среднее количество и % логических анкет, ошибочно не отнесенных к классу: 14.047, т.е. 14.694%
13. Среднее количество и % логических анкет, ошибочно отнесенных к классу: 60.461, т.е. 28.465%
14. Среднее количество и % логических анкет, правильно не отнесенных к классу: 151.945, т.е. 71.535%
15. Средневзвешенная вероятность случайного угадывания принадлежности объекта к классу: 31.037%.
16. Средневзвешенная эффективность применения модели по сравнению со случайным угадыванием: 7.095 раз.
Например, класс: "1. КУЛЬТУРА-Озимый Ячмень" в исследуемой выборке встретился 48 раз, значит вероятность случайного угадывания того, что случай выращивания относится именно к данному классу составляет: 48/308*100=15,584(%), с использованием же модели к этому классу были отнесены все случаи, в действительности к нему относящиеся, т.е. 100%, что в 6.417 раз выше вероятности случайного угадывания. Напомним, что уже при вероятности правильной идентификации в 2.5 раз выше, чем вероятность случайного угадывания, считается, что с достоверностью 95% в модели обнаружена закономерность.
В общем эти показатели адекватности модели можно считать достаточными для решения проблемы, сформулированной в данной работе, т.е. для решения задач прогнозирования и поддержки принятия решений. Кроме того, поскольку модель адекватна, т.е. верно отражает предметную область, то исследование модели можно считать исследованием самой предметной области.
Таблица 10 – ИЗМЕРЕНИЕ АДЕКВАТНОСТИ СЕМАНТИЧЕСКОЙ ИНФОРМАЦИОННОЙ МОДЕЛИ
Всего физических анкет: 308 (100% для п.15)
Всего логических анкет: 2774
4. Средняя достоверность идентификации логических анкет с учетом сходства : 13.388%
5. Среднее сходство логических анкет, правильно отнесенных к классу : 6.643%
6. Среднее сходство логических анкет, ошибочно не отнесенных к классу : 1.679%
7. Среднее сходство логических анкет, ошибочно отнесенных к классу : 5.507%
8. Среднее сходство логических анкет, правильно не отнесенных к классу : 13.932%
9. Средняя достоверность идентификации логических анкет с учетом кол-ва : 51.618%
10. Среднее количество физич-х анкет, действительно относящихся к классу: 95.594 (100% для п.11 и п.12)
Среднее количество физич-х анкет, действительно не относящихся к классу: 212.406 (100% для п.13 и п.14)
Всего физических анкет: 308.000 (100% для п.15)
11. Среднее количество и % лог-их анкет, правильно отнесенных к классу: 81.547, т.е. 85.306%
12. Среднее количество и % лог-их анкет, ошибочно не отнесенных к классу: 14.047, т.е. 14.694%
13. Среднее количество и % лог-их анкет, ошибочно отнесенных к классу: 60.461, т.е. 28.465%
14. Среднее количество и % лог-их анкет, правильно не отнесенных к классу: 151.945, т.е. 71.535%
15. Средневзвешенная вероятность случайного угадывания принадлежности объекта к классу ( % ): 31.037
16. Средневзвешенная эффективность применения модели по сравнению со случ. угадыванием (раз): 7.095
№
Наименование класса
Достов.
идентиф.
лог.анк.
с уч.ко-
личества
эвр.крит
Кол-во
лог.анк.
дейст-но
относя-
щихся
к классу
Количество логических анкет
правильно или ошибочно отнесенных
или не отнесенных к классу
Вероятн.
случай-
ного
угадыва-
ния (%)
=NLA/NFA
Эффектив
модели
по срав.
со случ.
угадыв.
(раз)
Правиль.
отнесен.
Ошибочно
не отнес
Ощибочно
отнесен.
Правиль.
не отнес
ФОРМУЛЫ РАСЧЕТА ПОКАЗАТЕЛЕЙ ДИФФЕРЕНЦИАЛЬНОЙ ВАЛИДНОСТИ (ПО КЛАССАМ):
C04[k] = C05[k] - C06[k] - C07[k] + C08[k]
C09[k] = ( C11[k] - C12[k] - C13[k] + C14[k] ) / ( C11[k] + C12[k] + C13[k] + C14[k] ) * 100
C10[k] = C11[k] + C12[k]
C15[k] = C10[k] / NFiz * 100
C16[k] = C09[k] / C15[k]
где k - класс (соответствует строке)
где NFiz - суммарное количество физических анкет (объектов) в распознаваемой выборке
ФОРМУЛЫ РАСЧЕТА ПОКАЗАТЕЛЕЙ ИНТЕГРАЛЬНОЙ ВАЛИДНОСТИ (СРЕДНЕВЗВЕШЕННОЕ ПО ВСЕМ КЛАССАМ):
Ci = СУММА_по_k( Ci[k] * C10[k] ) / NLog
где i = { 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16 }
где NLog = СУММА_по_k(C10[k]) - суммарное количество логических анкет в распознаваемой выборке
ПРИМЕЧАНИЕ: учтены только результаты идентификации с модулем сходства не менее: 0
1. Как видно из приведенной в таблице 10 информации, созданная семантическая информационная модель обладает довольно высокой степенью достоверности, т.е. достаточно адекватно отражает исследуемую предметную область.
2. Это означает, что эту модель можно корректно использовать для:
– решения задачи прогнозирования урожайности озимой пшеницы исследованных сортов и озимого ячменя;
– для решения задач поддержки принятия решений по рациональному выбору агротехнологий, с наиболее высокой вероятностью приводящих к заранее заданному желаемому хозяйственному и экономическому результату;
– исследование данной модели корректно считать исследованием самой моделируемой (отраженной в модели) предметной области.
2.2.5.7. Решение задач идентификации состояний объекта управления, прогнозирования и поддержки принятия решений по управлению с применением СИМ.
2.2.5.7.1. Задача прогнозирования
Отметим, что задачи идентификации (распознавания) и прогнозирования в СК-анализе математически ничем не отличаются кроме того, что в задаче идентификации признаки объекта и принадлежность его состояния к определенному классу практически одновременны (или очень незначительно отстоят друг от друга во времени), тогда как при прогнозировании признаки состояния или детерминирующие его значения факторов (градации описательных шкал) относятся к прошлому или настоящему, а состояния объекта – к будущему.
В нашем случае задача прогнозирования состоит в том, чтобы по планируемым к применению или уже применяемым агротехнологиям спрогнозировать наиболее вероятные хозяйственные результаты.
Для решения задачи прогнозирования информация о планируемых к применению агротехнологиях заносится в систему "Эйдос" в режиме ввода анкет распознаваемой выборки. Например, в анкете №2 введена информация о применении следующих агротехнологий (таблица 11):
Таблица 11 – АНКЕТА РАСПОЗНАВАЕМОЙ ВЫБОРКИ №2
23-04-08 12:11:22 г.Краснодар
Код
Наименование описательных шкал и градаций
3
10. ПРЕДШЕСТВЕННИКИ-Многолетние травы
7
11. УРОВЕНЬ ПЛОДОРОДИЯ-Средний.
8
12. ОБРАБОТКА ПОЧВЫ-Безотвальная.
14
13. УДОБРЕНИЕ-Отсутствует
15
14. ЗАЩИТА РАСТЕНИЙ- Бактороденцид 3 кг/га : Фосфид цинка т.п. (5%) 4 кг/га
Универсальная когнитивная аналитическая система НПП *ЭЙДОС*
Результаты сравнения конкретного образа, описанного данными значениями факторов, приведены в экранной форме на рисунке 19.
Рисунок 19. Экранная форма с результатами прогнозирования
для набора агротехнологий, описанного в анкете №2
В экранной форме наименования классов видны не полностью и показаны только те классы, с которыми данная конкретная ситуация наиболее сходна или наиболее различна. Полная информация о результатах прогнозирования представлена в распечатке (таблица 12).
Классы, к которым объект (ситуация) действительно относится, отмечены символом: "√".
Важно, что инструментарий СК-анализа система "Эйдос" не только обеспечивает прогнозирование, но и оценивает достоверность этого прогнозирования. Это делается на нескольких уровнях:
1. На рисунке 19 и в таблице 12 в карточке идентификации есть параметр: "% Сх", обозначающий процент сходства конкретного образа объекта и обобщенного образа класса.
2. В таблице 10 есть информация о степени достоверности идентификации, посчитанный для каждого класса по всем объектам, действительно относящимся к нему, а также с учетом ошибочно к нему отнесенных.
3. В карточке идентификации рисунке 19 и в таблице 12 есть параметр: "Качество результата распознавания:" (в примере он равен 16.184%).
Таблица 12 – РЕЗУЛЬТАТ ПРОГНОЗИРОВАНИЯ РЕЗУЛЬТАТОВ ВЫРАЩИВАНИЯ В УСЛОВИЯХ ПРИМЕНЕНИЯ НАБОРА АГРОТЕХНОЛОГИЙ ИЗ ТАБЛИЦЫ №11
1-й и 2-й параметры используются совместно: если мы знаем что по данному классу результаты идентификации в данной модели обычно недостоверны, то не следует доверять такому результату, даже если этот класс первый в карточке идентификации и с ним высокий уровень сходства. 3-й параметр представляет собой эвристический критерий, сходный по форме со средне-квадратичным отклонением, но с весовым коэффициентом, увеличивающим роль первых строк гистограммы и отражает результаты идентификации по всей карточке в целом: он увеличивается при увеличении уровня сходства с классами в начале гистограммы и увеличением разницы в уровне сходства между разными классами.
2.2.5.7.2. Задача поддержки принятия решений
Задача поддержки принятия решений является обратной по отношению к задаче прогнозирования: если в задаче прогнозирования требуется по значениям факторов определить в какие состояния может под их влиянием перейти объект управления, то в задаче поддержки принятия решений наоборот, по заданному будущему состоянию объекта управления (обычно целевому) определить значения факторов, которые с наибольшей вероятностью переведут объект управления в это состояние.
Примечание: мы называем задачу выработки научно-обоснованных рекомендаций по выбору агротехнологий задачей поддержки принятия решений, а не задачей приятия решений, т.к. считаем, что в нашем случае компьютер и интеллектуальная система не принимают решений, что является прерогативой специалиста, а лишь консультируют специалиста о наиболее вероятных последствиях тех или иных решений. Таким образом, компьютер и интеллектуальная система являются лишь инструментом, помогающим специалисту выполнять работу, за результаты которой именно он и несет ответственность.
Предположим нас, как руководителя или специалиста хозяйства, интересует вопрос о том, какие необходимо применить агротехнологии, чтобы получить очень высокую урожайность озимой пшеницы сорта Пебеда-50.
Для ответа на это вопрос необходимо в системе "Эйдос" войти в подсистему "Типология" и выбрав режим: _511 "Информационные портреты классов", а затем в нем выбрать класс, система детерминации которого нас интересует, в данном случае класс с кодом 33. Послед нажатия клавиши Enter появится экранная форма, приведенная на рисунке 20.
Рисунок 20. Экранная форма, отображающая
систему детерминации класса 33.
Распечатка информационного портрета данного класса (с более подробной и полной информацией) приведена в таблице 13.
Таблица 13 – ИНФОРМАЦИОННЫЙ ПОРТРЕТ КЛАССА
Код класса: 33
Классификационная шкала: 6. КУЛЬТУРА+СОРТ+УРОЖАЙНОСТЬ
Градация классификационной шкалы: -Озимая пшеница+Победа-50+{69,8-87,3}
№
Код
Наименование фактора и его значения
Количество информации
Теоретически максимально возможная информативность – это количество информации, которое мы в принципе можем получить из факта действия некоторого значения фактора, который однозначно переводит объект управления в заранее заданное состояние. Это количество информации определяется только количеством классов (градаций классификационных шкал) по формуле: Imax=Log2(70) и в нашем случае, когда у нас в модели 70 классов (см. таблицу 6) равно: 6,129 бита.
Данные таблицы 13 средствами системы "Эйдос" могут быть представлены в форме круговой диаграммы и нелокального нейрона (рисунки 21 и 22).
Из информационного портрета, приведенного в на рисунках 21 и 22, а также в таблице 13, видно, что более 3/4 суммарного влияния на получение хозяйственного результата: "Озимая пшеница+Победа-50+{69,8-87,3}" обеспечивается системным (т.к. СИМ учитывает взаимодействие факторов) действием всего трех факторов: предшественники многолетние травы и кукуруза и органическо-минеральная система удобрений. При этом обработка почвы не играет особой роли, но желательна отвальная, а не поверхностная (которая препятствует этому результату). Возможно это несколько парадоксально, но данный хозяйственный результат получается на почвах низкого или среднего плодородия, а не на плодородных почвах, как можно было бы ожидать. По-видимому, это связано с тем, что на плодородных почвах не применяются интенсивные технологии, в основном обуславливающие этот результат.
Рисунок 22. Нелокальный нейрон класса:
"Озимая пшеница+Победа-50+{69,8-87,3}"
2.2.5.8. Системно-когнитивный и кластерно-конструктивный анализ СИМ.
Необходимо отметить, что система "Эйдос" возможности исследования СИМ в системе "Эйдос" весьма разнообразны: достаточно сказать, что система генерирует 50 видов текстовых форм (отформатированных для MS Word и MS Excel), и 52 вида графических форм, подавляющее большинство которых не имеет аналога в Excel и других системах обработки данных и предложена автором [27]. В данном разделе мы рассмотрим лишь некоторые из них, чтобы не перегружать работу излишними деталями.
2.2.5.8.1. Задача выявления силы и направления влияния факторов
Прежде всего обратим внимание на то, что, значения разных агротехнологических факторов имеют разные силу и направление влияния на различные хозяйственный результаты. Информацию об этом можно получить из матрицы информативностей, приведенной в таблице 14.
Каждое значение фактора имеет некоторую вариабельность в матрице информативностей, количественное значение которой (среднеквадратичное отклонение) и принято в СК-анализе за ценность этого признака для решения задач прогнозирования и поддержки принятия решений. На рисунке 23 приведена Паррето-кривая (накопительная) ценности градаций факторов:
Рисунок 23. Паррето-кривая ценности градаций факторов
Но есть в СК-анализе и характеристика силы влияния описательной шкалы (фактора) в целом: это среднее от силы влияния всех градаций этой описательной шкалы. В таблице 15 приведены описательные шкалы с количественной оценкой силы их влияния.
Таблица 15 – ОПИСАТЕЛЬНЫЕ ШКАЛЫ
С КОЛИЧЕСТВЕННОЙ ОЦЕНКОЙ СИЛЫ ИХ ВЛИЯНИЯ
N°
п/п
Код
шкалы
Наименования
описательных шкал
Значимость
шкалы
Коды градаций
4
4
13. УДОБРЕНИЕ
0.26107
11
12
13
14
5
5
14. ЗАЩИТА РАСТЕНИЙ
0.00000
15
Из таблицы 11 мы видим, что наибольшее влияние на результат имеют предшественники и уровень плодородия почвы.
2.2.5.8.2. СК-анализ, как метод вариабельных контрольных групп
Возникаетзакономерный вопрос о том, почему фактор: "14. ЗАЩИТА РАСТЕНИЙ" имеет нулевое влияние. Ответ на этот вопрос прост: "Потому, что у него одна-единственная градация и она есть во всех приведенных примерах выращивания, т.е. по градациям этой шкалы нулевая вариабельность".
Если бы в обучающей выборке были указаны разные варианты защиты растений, т.е. были бы контрольные группы по этому параметру, как они есть по остальным3, то тогда появилась бы возможность определить, каким образом каждый из этих вариантов защиты растений влияет на хозяйственные результаты, т.е. определить силу и направление влияния значений этого фактора на все, исследуемые в модели результаты применения агротехнологий.
Аналогично, если посчитать влияние на урожайность зерновых колосовых фактора "Наличие солнечного освещения", то получится тоже ноль, если не сравнить результаты с контрольной группой, выращиваемых в условиях абсолютной темноты, например в какой-нибудь пещере, причем не обязательно при всех прочих равных условиях.
Отметим, что если бы в исходных данных была вариабельность по качеству пшеницы (в исследованных данных была только ценная пшеница), то модель позволила бы определить сиу и направление влияния технологических факторов и на этот показатель, а если бы в исходных данных были указаны предшественники не только прошлого года, как сейчас, но и позапрошлого, и 3, 4, 5, 6, 7, 8, 9, 10 и более лет назад, то семантическая информационная модель позволила бы исследовать их влияние на количество и качество урожая зерновых колосовых, а также количественно выявить и использовать для автоматизированного прогнозирования и поддержки принятия решений в растениеводстве законы севооборота.
2.2.5.8.3. Семантические сети классов и факторов.
Система "Эйдос" в режимах кластерно-конструктивного анализа позволяет исследовать классы по сходству их системы детерминации и факторы по их влиянию на поведение объекта управления.
Состояния объекта управления, соответствующие классам, сходным по их системам детерминации могут быть достигнуты одновременно, а различные (образующие полюса конструкта) являются альтернативными и одновременно получены быть не могут.
Значения факторов, сходные по их влиянию на поведение объекта управления могут быть использованы в качестве замены друг друга, если они имеют разную стоимость или какой-то из них нет возможности или нерационально использовать, а другой есть возможность или более рационально.
По этим причинам результаты кластерно-конструктивного анализа модели представляют не только научный, но и вполне прагматический интерес.
В таблицах 16 и 17 приведены фрагменты матриц сходства классов и значений факторов, а на рисунках 8 и 9 фрагменты соответствующих, т.е. отображающих эти матрицы, семантических сетей классов и факторов.
На рисунке 24 приведена семантическая сеть, показывающая степень сходства различных классов по системе детерминирующих их значений агротехнологических факторов.
На рисунке 25 приведена семантическая сеть значений факторов, показывающая их сходство и различие по силе и направлению влияния на поведение объекта управления, т.е. получение хозяйственных результатов
Рисунок 24. Семантическая сеть классов, соответствующих различным урожайностям исследуемых сортов озимой пшеницы: Батько, Победа-50, Руфа и Юна.
Рисунок 25. Семантическая сеть значений агротехнологических факторов, показывающая их сходство и различие по силе и направлению влияния на поведение объекта управления, т.е. получение хозяйственных результатов
На рисунках 24 и 25 цветом показан знак отношения (связи): красными линиями показаны отношения сходства, а синими – различия, толщина линий отражает силу связи по модулю.
2.2.5.8.4. Когнитивные диаграммы классов и факторов.
Если семантические сети классов показывают сходство и различие многих классов между собой по системе детерминирующих их значений факторов, но при этом структура каждой связи содержательно не раскрывается, т.е. на сети не показано, какие значения какой вклад вносят в сходство-различие классов, то на когнитивной диаграмме мы содержательно и на сколько возможно детально видим именно структуру связи, но только между двумя выбранными классами.
Когнитивная диаграмма имеет следующую структуру:
– справа и слева мы видим информационные портреты выбранных классов;
– в каждом информационном портрете в верхней части красным цветом изображены значения факторов, способствующих переходу объекта управления в состояние, соответствующее данному классу; в нижней части синим цветом изображены значения факторов, препятствующих переходу объекта управления в это состояние;
– линии красного цвета показывают вклад в сходство двух классов, а синие – вносящие вклад в различие, толщина линий отражает силу их вклада в сходство-различие по модулю.
Рассмотрим когнитивную диаграмму на рисунке 26.
Рисунок 26. Когнитивная диаграмма двух классов:
Озимая пшеница+Победа-50+{34,9-52,4}
Озимая пшеница+Победа-50+{69,8-87,3}
Эта когнитивная диаграмма содержательно отражает в наглядной графической форме сходство и различие систем детерминации состояний, соответствующих высокой и низкой урожайности озимой пшеницы сорта Победа-50. Основной вклад в сходство этих двух состояний вносит то, что для них обоих характерны предшественники-многолетние травы. Однако на этом сходство заканчивается: если для высокой урожайности характерно применение органическо-минерального удобрения и отвальная обработка почвы, то при низкой урожайности удобрения не применяются и почва обрабатывается поверхностно. Видимо это различие в агротехнологиях и обуславливает различие в хозяйственном результате выращивания, в данном случае в урожайности озимой пшеницы сорта Победа-50 по этим агротехнологиям.
Если семантические сети значений факторов показывают сходство и различие многих значений факторов между собой по тому, какие классы они детерминируют, но при этом структура каждой связи содержательно не раскрывается, т.е. на сети не показано, какие значения какой вклад вносят в сходство-различие значений факторов, то на инвертированной когнитивной диаграмме мы содержательно и на сколько возможно детально видим именно структуру связи, но только между двумя выбранными значениями факторов.
Инвертированная когнитивная диаграмма имеет следующую структуру:
– справа и слева мы видим семантические информационные портреты выбранных значений факторов;
– в каждом информационном портрете в верхней части красным цветом изображены классы, переходу в которые данное значение фактора способствует; в нижней части синим цветом изображены классы, переходу в которые данное значение фактора препятствует;
– линии красного цвета показывают вклад в сходство двух значений факторов, а синие – вносящие вклад в различие, толщина линий отражает силу их вклада в сходство-различие по модулю.
Рассмотрим инвертированную когнитивную диаграмму на рисунке 27.
Рисунок 27. Содержательное сравнение силы и направления влияния
двух значений факторов на урожайность озимой пшеницы
сорта Победа-50
Эта инвертированная когнитивная диаграмма содержательно отражает в наглядной графической форме сходство и различие двух значений факторов, по тому, какую урожайность озимой пшеницы сорта Победа-50 они детерминируют. Из этой диаграммы видно, что применение органическо-минерального удобрения детерминирует получение очень высокой урожайности, тогда как отсутствие удобрений наоборот, детерминирует очень низкую урожайность.
2.2.5.8.5. Когнитивные карты (классические и интегральные).
Если объединить нелокальный нейрон (рисунок 22) семантической сетью значений факторов (рисунок 25), то получим классическую или простую когнитивную карту (рисунок 28).
Рисунок 28. Классическая когнитивная карта, отражающая систему детерминации класса: "Озимая пшеница+Победа-50+{69,8-87,3}" с учетом сходства и различия силы и направления влияния значений факторов на это состояние
Данная когнитивная карта отображает в наглядной графической форме систему детерминации состояния с объекта управления, т.е. класса с кодом 33: "Озимая пшеница+Победа-50+{69,8-87,3}" (очень высокая урожайность). В нижней части карты указаны коды значений технологических факторов, расшифровка смысла которых дана в таблице 7. Красные и синие линии, соединяющие значения факторов, отражают соответственно их сходство и различие по влиянию на поведение объекта управления, т.е. его переход во все состояния, соответствующие всем классам (таблица 6) а толщина этих линий отражает величину этого сходства или различия. Вертикальные линии отражают силу и направление влияния значений факторов на переход объекта управления в состояние с кодом 33: сиреневые линии обозначают способствующие этому факторы, а зелеными – препятствующие, толщина линий обозначает силу влияния.
Приведем пример интегральной когнитивной карты, представляющей собой небольшой фрагмент системно-когнитивной модели предметной области (рисунок 29). Не смотря на то, что эта модель сформирована в системе "Эйдос" отобразить ее целиком не представляется возможным по чисто техническим причинам из-за ее большой размерности.
Рисунок 29. Пример интегральной когнитивной карты
Интегральная когнитивная карта представляет собой систему из семантических сетей классов и значений факторов, при этом каждый класс соединен как нелокальный нейрон линиями детерминации с системой детерминирующих его значений факторов.
Интегральная когнитивная карта представляет собой суперпозицию нескольких простых когнитивных карт, каждая из которых устроена так, как описано в пояснении к рисунку 28.
В верхней части карты указаны коды классов, соответствующих будущим состояниям объекта управления, расшифровка смысла которых дана в таблице 6. Красные и синие линии, соединяющие классы, отражают соответственно их сходство и различие по системе их детерминации, т.е. значениям факторов, обуславливающих переход объекта управления во все состояния, соответствующие всем классам (таблица 6), а толщина этих линий отражает величину этого сходства или различия.
2.2.6. Задача 5.
Описать результаты применения методики (эффективность, научные результаты и выводы,
практические рекомендации).
Ученые-агрономы, увидев какие знания мы выявили с применением СК-анализа из эмпирических данных могу возразить: "Но ведь это же все давно известно!"
Что на это можно ответить?
1-е: едва ли эти закономерности были известны в количественной форме да еще с такой точностью.
2-е: в научной литературе и учебных пособиях эти знания содержаться в текстовой форме, не позволяющей непосредственно использовать их для решения задач прогнозирования и поддержки принятия решений.
3-е: форма, в которой в системе "Эйдос" содержаться эти знания непосредственно позволяет решать задачи прогнозирования и поддержки принятия решений, в т.ч. в перспективе и в режиме on-line доступа к серверу через Internet (для этого необходима программная разработка).
4-е: это хорошо, что знания, выявленные нами с применением технологии СК-анализа непосредственно из эмпирических данных, совпали с точкой зрения специалистов и экспертов в данной предметной области. Это подтверждает работоспособность метода СК-анализа и позволяет предположить и надеяться, что те знания, которые с помощью этого метода можно выявить в других предметных областях, в которых еще нет экспертов, также будут адекватны в смысле соответствия действительности, а это означает, что у нас в распоряжении новый инструмент научного познания с уникальными возможностями.
5-е: наличие технологии СК-анализа позволяет в принципе уточнять эти знания, как в явной, так и в неявной форме внося в них учет локальных (местных) особенностей как регионов, так и районов и даже отдельных хозяйств, а также учитывать изменения, происходящие с течением времени (динамику). Ожидается, что эти уточненные, "локализованные", "адаптированные" знания будут более адекватны, а значит и более эффективны на практике, чем знания, не учитывающие местную специфику, взятые из общероссийских или иностранных научных работ и учебников.
6-е: интеллектуальные системы, подобные системе "Эйдос", способны накапливать огромные базы эмпирических данных, эквивалентные опыту многих тысяч специалистов, посвятивших возделыванию данной культуры всю свою жизнь, и не просто накапливать, но и выявлять знания непосредственно из этих эмпирических данных, и обрабатывать эти знания и использовать их для прогнозирования, поддержки принятия решений и исследования предметной области. Авторы выражают уверенность, что применение подобных систем и баз знаний на практике может предостеречь молодых специалистов, а в некоторых случаев даже и более опытных, от просчетов и ошибок в планировании технологических процессов, повысить качество их работы.
7-е: основной научный вывод, который можно сделать из проделанной работы, состоит в том, что существует, более того, находятся в нашем распоряжении, работоспособные интеллектуальные технологии, обеспечивающие выявление знаний непосредственно из эмпирических данных, и эти технологии позволяют использовать эти знания для решения задач прогнозирования результатов применения тех или иных агротехнологий в растениеводстве, а также для поддержки принятия решений по выбору рациональных агротехнологий, с наивысшей вероятностью обуславливающих заранее заданный хозяйственный и экономический результат.
8-е: на основе вышеизложенного можно обоснованно дать практическую рекомендацию применять подобные интеллектуальные технологии на уровне КубГАУ и департамента сельского хозяйства для чего необходимо создать соответствующую инфраструктуру (подразделение, типа аналитического и консалтингового центра).
9-е: материал данной работы может стать основой полноценной лекции и лабораторной работы по дисциплине "Интеллектуальные информационные системы" для факультета прикладной информатики, а также спецкурса по применению современных информационных технологий для студентов и специалистов агрономических специальностей и курсов повышения квалификации.
2.2.7. Задача 6.
Рассмотреть ограничения метода
и методики его применения,
перспективы их развития и использования.
Рассмотренный в данной работевариант решения проблемы ограничен как по самому набору агротехнологических факторов, так и их по вариабельности и объему исследуемой выборки.
Набор агротехнологических факторов ограничен в связи со сложностью и ограничениями доступа к первичной фактографической информации, содержащейся в журналах агрономов. Этой же причиной обусловлен и довольно ограниченный объем исследуемой выборки: всего 3-9 случаев выращивания. Вариабельность исследуемых факторов ограничена в связи с тем, что информация, которую удалось получить и обработать и описать это в данной работесоответствует применению стандартных технологических карт, которым обязаны следовать агрономы в соответствии с условиями договоров на научное обслуживание хозяйств.
Конечно такая исходная база данных далека от желаемой. Ограниченностью исходной информации обусловлена относительная скромность результатов, которые удалось продемонстрировать. По этой причине авторы предлагают рассматривать данную работулишь в качестве примера, демонстрирующего принципиальные возможности предлагаемой технологии и показывающей какие задачи и как можно было бы решать, если бы исследователям и разработчикам был обеспечен доступ к реальной исходной информации по истории выращивания тех или иных культур в хозяйствах за длительный период времени.
Заключение
В заключение хотелось бы выразить благодарность доктору сельскохозяйственных наук, профессору Малюге Николаю Григорьевичу за предоставленную исходную информацию, также выразить надежду, что данная работа будет продолжена.
ГЛАВА-3. ПОСТАНОВКА АГРОМЕТЕОРОЛОГИЧЕСКИХ ЗАДАЧ ВЫБОРА МИКРОЗОН И КУЛЬТУР ДЛЯ ВЫРАЩИВАНИЯ
3.1. Актуальность исследования
Накоплен многолетний фактографический материал по выращиванию плодовых культур в разных условиях среды. Однако, этот материал находится в форме бумажных документов различных стандартов, что не позволяет обработать его с применением современных математических методов и компьютерных технологий и выявить причинно-следственные зависимости в системе генотип-среда. Интересы сельскохозяйственной науки и практики требуют активного использования этой информации для мониторинга, анализа, прогнозирования и поддержки управленческих решений по выращиванию плодовых культур и сортов.
3.2. Общие положения
В данном разделе формулируются частные и обеспечивающие задачи, необходимые для решения задачи прогнозирования количественных и качественных результатов выращивания заданной культуры в заданной точке. Это задачи выявления причинно-следственных закономерностей между метофакторами и результатами выращивания, прогнозирования периодов фенофаз по динамике метеопараметров, а также задачи триангуляции и пространственной интерполяции. Показана взаимосвязь между этими задачами в контексте раскрытия логики решения основной задачи.
3.3. Основная задача исследования
и этапы ее решения
Прогнозирование количественных и качественных результатов выращивания различных культур в заданных точках (микрозонах). На основе решения данной основной задачи для различных культур и точек выращивания могут быть решены следующие две подзадачи:
1. Определен потенциал выращивания заданной культуры в различных микрозонах.
2. Определен потенциал выращивания различных культур в заданной микрозоне.
Результаты решения 1-й подзадачи подаются в наглядной и удобной для принятия решений форме геоинформационной визуализации в виде зональных географических карт, на которых зоны с одинаковым потенциалом для выращивания некоторой культуры закрашены одним условным цветом.
Решение основной задачи состоит из двух этапов.
На 1-м этапе выявляются причинно-следственные зависимости между метеоусловиями и результатами выращивания сельскохозяйственных культур.
На 2-м этапе используются знания выявленных причинно-следственных зависимостей для прогнозирования количественных и качественных результатов выращивания заданной культуры в конкретном пункте выращивания.
Будем считать, что биологический потенциал географической точки определяется многолетней динамикой метеопараметров в этой точке.
Отметим, что влияние почв и агротехнологий в данном исследовании не учитывается, но предлагаемые математические модели и реализующий их программный инструментарий пригодны и для этого (имеется положительный опыт в этом направлении).
Решение основной задачи базируется на гипотезе о том, что закономерности влияния динамики метеопараметров на переход культуры от одной фенофазы к другой и на количественные и качественные результаты ее выращивания определяются только генотипом данной культуры и не меняются от точки к точке и в течение времени для данной культуры. Если данная гипотеза верна, то закономерности влияния факторов среды на результаты выращивания данной культуры, выявленные на основе обработки эмпирических данных, полученных за определенный период времени в одних точках, применимы для прогнозирования результатов выращивания этой культуры и в других точках.
Известно (Драгавцев А.П.), что влияние одних и тех же метеопараметров на количественные и качественные результаты выращивания культуры зависит не только от самих значений этих метеопараметров, но в огромной степени – от фенофазы, в течение которой эти параметры действовали. Поэтому вся метеоинформация должна обрабатываться с привязкой к периодам фенофаз, характеризующим темп биологического времени для различных культур, а не просто – к физическому (календарному) времени.
В принципе многие закономерности влияния метеоусловий на результаты выращивания известны и описаны в специальной литературе, в том числе и авторами данного исследования [5-12, 15, 23, 68-75, 84, 87]. Однако для достижения цели исследования все эти задачи должны быть решены на новом качественном уровне, соответствующем современному уровню развития математических методов и информационных технологий, в частности в рамках одной инструментальной системы. Дело в том, что решение этих задач, реализованное в различных инструментальных системах, не обеспечивает возможности обмена информацией между ними, а значит, проведения реальных исследований и прогнозирования в промышленном режиме.
Рассмотрим подробнее, каким образом осуществляется декомпозиция основной задачи в определенную последовательность этапов, частных и обеспечивающих задач (рисунок 30).
Рисунок 30. Декомпозиция основной задачи исследования
в ряд частных и обеспечивающих задач
3.3.1. Этап 1-й: выявление причинно-следственных зависимостей между метеоусловиями и результатами выращивания сельскохозяйственных культур
Задача 1.1: На основе обработки эмпирической информации об условиях и результатах выращивании различных культур в конкретных микрозонах выявить причинно-следственные закономерности влияния метеопараметров, действующих в течение определенных фенотипических фаз развития, на количественные и качественные результаты выращивания.
Исходные данные:
– фактические периоды начала и окончания фенофаз;
– фактические посуточные значения метеопараметров.
Результат решения:
Для каждого значения каждого метеопараметра, действующего в период определенной фенофазы, установлены сила и направление его влияния на количественные и качественные результаты выращивания каждой конкретной культуры.
Однако в данном пункте выращивания может и не быть метеостанции для регистрации метеопараметров.
Поэтому задача 1.1 не может быть решена без решения задачи пространственной интерполяции: определение значений метеопараметров в заданной точке по их значениям в точках нахождения трех ближайших метеостанций путем взвешивания значений с учетом поправок на рельеф и расстояния. Данная задача, в свою очередь, предполагает предварительное решение задачи триангуляции: определение трех ближайших к заданной точке метеостанций по географическим координатам этой точки и метеостанций. Последняя задача связана с необходимостью преобразования значений метеопараметров, известных для нерегулярной сетки (решетки), в узлах которой расположены метеостанции, в регулярную сетку потенциальных точек выращивания, которая более удобна для геоинформационной визуализации.
Для потенциальных точек выращивания, по которым необходимо прогнозировать количественные и качественные результаты, периоды начала и окончания различных фенофаз для различных культур, неизвестны. Поэтому возникает задача 1.2: на основе обработки эмпирической информации об условиях и динамике фенотипического развития различных культур в конкретных микрозонах выявить причинно-следственные зависимости влияния динамики метеопараметров на сроки начала и окончания фенофаз для этих культур.
Исходные данные:
– фактические периоды начала и окончания фенофаз;
– динамика метеопараметров.
Результат решения:
Математическая модель и методика численных расчетов, позволяющие с минимальной погрешностью определить сроки наступления и окончания фенофаз для различных культур как в фактических, так и предполагаемых точках их выращивания по известной динамике метеопараметров в этих точках.
Задача 1.2 так же, как и 1.1 включает в качестве вспомогательных задачи триангуляции и пространственной интерполяции.
3.3.2. Этап 2-й: использование знания выявленных причинно-следственных зависимостей для прогнозирования количественных и качественных результатов выращивания заданной культуры в конкретном пункте выращивания
Когда задачи 1-го этапа реализованы, то решение основной задачи сводится к выполнению следующих шагов:
1. Определение трех ближайших к заданной точке метеостанций по географическим координатам этой точки и метеостанций (триангуляция).
2. Определение динамики метеопараметров в заданной точке путем взвешивания значений метеопараметров в трех ближайших метеостанциях с учетом расстояний и рельефа местности (пространственная интерполяция).
3. Прогнозирование наиболее вероятных сроков начала и окончания фенофаз для заданной культуры в заданной точке по известной динамике метеопараметров (задача 1.2).
4. Задача 2.1: Прогнозирование количественных и качественных результатов выращивания культуры по известным значениям метеопараметров, действующих в прогнозируемые периоды фенофаз (результат решения задачи 1.2), и известным закономерностям влияния метеопараметров на результаты выращивания (результат решения задачи 1.1).
Каждая из этих задач имеет свою формальную постановку, которую мы далее коротко рассмотрим.
3.4. Формальная постановка частных
и обеспечивающих задач
3.4.1. Задача 1.1
На основе обработки эмпирической информации об условиях и результатах выращивании различных культур в конкретных микрозонах выявить причинно-следственные закономерности влияния метеопараметров, действующих в течение определенных фенотипических фаз развития, на количественные и качественные результаты выращивания.
3.4.1.1. Исходные данные
– фактические периоды начала и окончания фенофаз;
– фактические посуточные значения метеопараметров.
3.4.1.2. Алгоритм решения
Применяются два основных метода решения данной задачи:
1. Метод оценки индексов среды и экологической пластичности сортов по продуктивности.
2. Метод автоматизированного системно-когнитивного анализа (АСК-анализ).
1-й метод подробно рассмотрен в фундаментальной монографии [27], поэтому освещать его нецелесообразно.
2-й метод основан на системной теории информации и автоматизации системного анализа путем его декомпозиции по базовым когнитивным операциям [27]. Суть это метода состоит в том, что:
– для формализации результатов выращивания используются две классификационные шкалы: шкала качества и шкала количества;
– для формализации действия метеофакторов применяются описательные шкалы, соответствующие сочетаниям: фенофаза метеопараметр;
– для формализации опыта выращивания используется обучающая выборка, включающая в формальном виде описания всех случаев выращивания всех культур во всех микрозонах, по которым есть информация по первым двум группам шкал;
– на основе предыдущего осуществляется синтез семантической информационной модели (СИМ), отражающей силу и направление влияния всех значений метеофакторов, действующих во всех фенофазах, на количественные и качественные результаты выращивания сельскохозяйственных культур;
– СИМ проверяется на адекватность (верифицируется) и оптимизируется, из нее исключаются артефакты и незначимая исходная информация, а также градации классификационных и описательных шкал, по которым оказалось недостаточно данных;
– проводится системно-когнитивный анализ СИМ, включающий изучение системы детерминации будущих состояний объекта управления, сходства и различия будущих состояний по системе детерминации, сходства и различия факторов по их влиянию на объект управления, построение семантических сетей классов и факторов, когнитивных диаграмм, классических и интегральных когнитивных карт.
3.4.1.3. Результат решения
Для каждого значения каждого метеопараметра, действующего в период определенной фенофазы, установлены сила и направление его влияния на количественные и качественные результаты выращивания каждой конкретной культуры и строятся уравнения регрессии.
3.4.2. Задача 1.2
На основе обработки эмпирической информации об условиях и динамике фенотипического развития различных культур в конкретных микрозонах выявить причинно-следственные зависимости влияния динамики метеопараметров на сроки начала и окончания фенофаз для этих культур.
3.4.2.1. Исходные данные
– фактические периоды начала и окончания фенофаз;
– динамика метеопараметров.
3.4.2.2. Алгоритм решения
Считается, что на сроки наступления и окончания фенофаз в основном оказывают влияние накопительные значения средней температуры. Однако в специальной литературе нигде не конкретизируется математическая модель и методика численных расчетов, позволяющие действительно прогнозировать эти сроки, не сравниваются различные модели по погрешности прогнозирования (степени адекватности).
Поэтому возникает ряд вопросов, например:
– средние каких температур использовать: воздуха или почвы, минимальной, средней или максимальной;
– с какой календарной даты или фенофазы начинать накопление;
– какие конкретные значения сумматора соответствуют началу или окончанию тех или иных фаз у тех или иных культур.
По сути, эту математическую модель необходимо разработать и верифицировать самим, что входит в задачи данного исследования.
3.4.2.3. Результат решения
Математическая модель и методика численных расчетов, позволяющие с минимальной погрешностью определить сроки наступления и окончания фенофаз для различных культур как в фактических, так и предполагаемых точках их выращивания по известной динамике метеопараметров в этих точках.
3.4.3. Задача 2.1
Прогнозирование количественных и качественных результатов выращивания культуры по известным значениям метеопараметров, действующих в прогнозируемые периоды фенофаз (результат решения задачи 1.2) и известным закономерностям влияния метеопараметров на результаты выращивания (результат решения задачи 1.1).
3.4.3.1. Исходные данные
– фактические значения метеопараметров за ряд лет в данной точке.
3.4.3.2. Алгоритм решения
Для всех лет, по которым в базе метеоданных имеется информация о значениях метеопараметров, прогнозируются количественные и качественные результаты выращивания конкретной культуры, а затем за исследуемый период подсчитывается средняя вероятность получения различных результатов выращивания. Предполагается, что погода изменяется медленно, генотип еще медленней, и поэтому определенная таким образом вероятность имеет силу и на данный момент времени.
3.4.3.3. Результат решения
Вероятности различных количественных и качественных результатов выращивания различных культур в заданных точках. Например, вероятность получения высокого урожая абрикоса 1-го сорта в данной точке составляет 72 %.
3.4.4. Задача триангуляции
Определение трех ближайших к заданной точке метеостанций по географическим координатам этой точки и метеостанций (триангуляция).
3.4.4.1. Исходные данные
Географические координаты метеостанций и точек выращивания. Для метеостанций сетка нерегулярная, а для точек выращивания, как правило, регулярная (квадратная с равным шагом ячейки).
3.4.4.2. Алгоритм решения
Существуют различные оптимальные по различным критериям и просто рациональные алгоритмы решения этой задачи, например алгоритм Делоне. Однако в данном случае их применение вряд ли оправданно, т. к. вычислительные ресурсы стандартного персонального компьютера вполне позволяют решить эту задачу простейшим в реализации "методом прямого перебора в течение вполне приемлемого реального времени", тем более эта задача может решаться редко, т. к. исходные данные меняются очень редко и незначительно.
Шаг 0: Вход.
Шаг 1: Организуется цикл по потенциальным точкам выращивания.
Шаг 2: Организуется цикл по метеостанциям.
Шаг 3: Географические координаты преобразуются в декартовы (что вполне корректно из-за очень небольших угловых расстояний между точкой выращивания и метеостанцией).
Шаг 4: Вычисляется расстояние по поверхности Земли между текущей точкой и метеостанцией.
Шаг 5: Результат вычисления расстояний заносится в первую базу данных.
Шаг 6: Все метеостанции рассмотрены?
Если нет – переход на шаг 3, иначе – на 7.
Шаг 7: Сортировка 1-й базы данных (расстояний от заданной точки до метеостанций) в порядке увеличения расстояния.
Шаг 8: Выбрать из базы данных три метеостанции с минимальными расстояниями до заданной точки выращивания и поместить эту информацию во 2-ю базу данных.
Шаг 9: Все точки выращивания просмотрены?
Если нет – переход на шаг 2, иначе – на 10.
Шаг 10. Выход.
3.4.4.3. Результат решения
База данных, в которой содержится информация о всех точках выращивания и трех ближайших к каждой точке метеостанциях.
3.4.5. Задача пространственной интерполяции
Определение динамики метеопараметров в заданной точке путем взвешивания значений метеопараметров в трех ближайших метеостанциях с учетом расстояний и рельефа местности (пространственная интерполяция). Эта задача называется также задачей "восстановления полей элементов в узлах регулярной сетки".
3.4.5.1. Исходные данные:
– известны суточные значения ряда метеопараметров в точках расположения метеостанций;
– известны три ближайшие к любой заданной точке метеостанции.
3.4.5.2. Алгоритм решения
Восстановление полей элементов численными методами, получившее название объективного анализа, в настоящее время широко применяется в гидрометеорологии не только в научных исследованиях, но и в оперативной практике. Независимо от применяемых методов расчета, все известные схемы объективного анализа предусматривают предвычисление значений элемента в узлах регулярной сетки по данным окружающих пунктов наблюдений.
Из численных методов восстановления полей элементов наиболее широко известны метод оптимальной интерполяции, метод полиномиальной аппроксимации, метод последовательных приближений. Имеется ряд других методов, многие из которых представляют собой модификации перечисленных методов.
В отечественной гидрометеорологии наибольшее распространение получил метод оптимальной интерполяции. В кратком изложении суть метода сводится к следующему.
1. Описываем пункты наблюдений, используя для этого крупномасштабные карты: гипсометрическую, почвенную, ландшафтную. Снимаются географические координаты пункта, его декартовы координаты по условной сетке с шагом 10 км, высота над уровнем моря, экспозиция склона.
2. Описываем узлы регулярной сетки. С этой целью определяем для каждого узла все указанные выше характеристики, а также ближайшие оказывающие влияние метеостанции.
3. Вводим необходимую гидрометеорологическую информацию по станциям региона.
4. Используем комплекс программ, реализующих метод оптимальной интерполяции.
Метод реализован на IBM PC. Проведенные контрольные расчеты показали работоспособность созданных программ, а также адекватность полученных данных реальным условиям.
3.4.5.3. Результат решения
Значения всех метеопараметров на любые сутки прошедшего периода можно считать достоверно известными для любой географической точки, находящейся между метеостанциями.
3.5. Выводы
Сформулированные задачи, будучи реализованные в одной программной системе, обеспечивают решение основной задачи, поставленной в настоящем исследовании: прогнозирование количественных и качественных результатов выращивания различных культур в заданных точках (микрозонах). Необходимо отметить, что данная система позволяет реализовать не все перечисленные задачи и находится в постоянном совершенствовании и развитии.
ГЛАВА-4. ПРОГНОЗИРОВАНИЕ ПРОДУКТИВНОСТИ
И КАЧЕСТВА КУЛЬТУР НА ОСНОВЕ ДАННЫХ МЕТЕОПРОГНОЗОВ
Исследование посвящено решению актуальных задач прогнозирования количественных и качественных результатов выращивания семечковых плодовых культур (на примере яблок), на основе выявления причинно-следственных зависимостей между метеофакторами и этими результатами.
В разделе 1: "Постановка задачи и выбор метода ее решения" обоснованы актуальность, объект и предмет, цель и задачи исследования, приведены источники исходных данных, дана характеристика исходных данных и обоснованы требования к методу решения поставленных задач, кратко описаны традиционные методы решения, и сделан основной вывод о недостаточности традиционных подходов и целесообразности применения новых методов для решения поставленных задач.
В разделе 2: "Когнитивная структуризация, формальная постановка задачи и синтез модели" обоснованы выбор метода и концепция решения задачи, дано краткое описание метода системно-когнитивного анализа (СК-анализ), раскрыты его теоретические предпосылки, описаны математическая модель, методика численных расчетов, специальный программный инструментарий СК-анализа (система "Эйдос"), проведены когнитивная структуризация предметной области, формальная постановка задачи и формирование обучающей выборки. В частности, разработаны классификационные и описательные шкалы и градации, а также электронная форма для представления исходных данных и применен программный интерфейс СК-анализа для преобразования исходных данных из формы по датам в стандартную форму по фенофазам, осуществлен импорт исходных данных из стандартной формы по фенофазам в базы данных системы "Эйдос", а затем и синтез семантической информационной модели, ее оптимизация и проверка на адекватность. По результатам второй главы сделан главный вывод о том, что сформированная модель имеет достаточно высокую адекватность для того, чтобы ее исследование считать исследованием самого объекта.
В разделе 3: "Исследование семантический информационной модели" решены следующие задачи:
1. Прогнозирование результатов выращивания заданной культуры в заданной точке.
2. Поддержка принятия решений по рациональному выбору зон и микрозон выращивания данной культуры и сорта.
3. Поддержка принятия решений по рациональному выбору культур для выращивания в данной зоне и микрозоне.
4. Кластерно-конструктивный и системно-когнитивный анализ результатов выращивания и факторов.
Показано, что для решения перечисленных задач предварительно необходимо решить задачу определения периодов фенофаз для заданного сорта в данной зоне и микрозоне выращивания и задачу определения значений метеопараметров в заданной точке по их значениям в трех ближайших метеостанциях, что не является предметом данной работы. В третьей главе сделан вывод о том, что предложенный подход позволяет успешно решить поставленные задачи и достичь цели работы.
В разделе 4: "Эффективность применения полученного решения, его ограничения и перспективы развития" кратко описаны возможности применения предложенной технологии в проектных и производственных организациях, а также в образовательных учреждениях. Показаны ограничения разработанной технологии и перспективы ее развития. Сделан вывод об эффективности предложенной технологии и целесообразности ее применения и дальнейшего развития.
В выводах кратко перечислены полученные результаты, констатировано достижение цели работы, сформулирована научная новизна и практическая значимость проведенного исследования.
4.1. Постановка задачи и выбор метода ее решения
4.1.1. Актуальность, объект и предмет, цель и задачи исследования
Актуальность темы работы определяется возможностью применения ее результатов на практике в ряде организаций различных направлений деятельности: проектных; производственных; образовательных.
В проектных организациях методы надежного прогнозирования количественных и качественных результатов выращивания яблок могли бы стать основой для принятия ряда ответственных решений, связанных с проектированием новых садов.
С этим связано решение двух задач:
1. Решение о размещении сада (обоснованный выбор зоны и подзоны выращивания конкретных сортов и культур).
2. Выбор сортов для выращивания (обоснованныйвыбор сортов и культур для выращивания в конкретной зоне и подзоне).
В настоящее время эти решения принимаются по данным эмпирических испытаний в отдельных точках, чаще всего привязанных к крупным плодовым хозяйствам без возможности проводить испытание всего набора культур и без учета и анализа адаптивного и природно-ресурсного потенциала конкретного пункта выращивания. Подобный подход приводит к тому, что культуры выращиваются не там, где для этого есть природные условия, а там, где имеется необходимая инфраструктура (населенные пункты). В результате, например, ни один сортоучасток в Краснодарском крае не дает урожай абрикосов больше 4-х раз в 10 лет. Аналогично обстоит дело и с выбором культур для выращивания на полях, а также с выбором агротехнологий для их выращивания.
В производственных организациях методы надежного прогнозирования количественных и качественных результатов выращивания яблок могли бы стать основой для принятия ряда ответственных решений, связанных с заблаговременным выбором способа использования произведенной продукции (продажа, хранение, переработка), и, этим самым, созданием благоприятных условий для осуществления выбранного способа:
– определением цен и оформление партнерских отношений по фьючерсным и лизинговым сделкам;
– подготовкой материально-технической базы хранения и переработки.
В учебном процессе методы надежного прогнозирования количественных и качественных результатов выращивания яблок могут быть использованы для разработки полноценной лабораторной работы по дисциплине: "Интеллектуальные информационные системы", изучаемой на 5-м курсе специальности 351400 – Прикладная информатика.
Актуальность данной работы определяется также ее научной новизной. В настоящее время подобные исследования и разработки проводились под руководством заслуженного деятеля науки РФ, доктора сельскохозяйственных наук профессора И.А.Драгавцевой по косточковым плодовым культурам: персик и абрикос [6], и по семечковым, в частности яблокам, насколько известно по литературным данным, подобная работа проводится впервые.
Таким образом, объектом исследования является изучение влияния факторов различной природы на количественные и качественные результаты выращивания сельхозкультур.
Предмет исследования состоит в изучении влияния климатических факторов на урожайность и качество яблок пяти сортов: "Джонатан", "Ред Делишес", "Ренет Симеренко", "Ренет Шампанское", "Старкрымсон".
Цель исследования: выявление причинно-следственных зависимостей между климатическими факторами с одной стороны, и урожайностью и качеством различных сортов яблок с другой стороны, и, на основе этого, разработка соответствующей методики прогнозирования.
Цель достигается путем поэтапного решения следующих задач:
1. Когнитивная структуризация предметной области и формальная постановка задачи, проектирование структуры и состава исходных данных.
2. Получение исходных данных запланированного состава в той форме, в которой они накапливаются в поставляющей их организации (журналы).
3. Разработка электронной формы для представления исходных данных.
4. Преобразование исходных данных в электронную форму.
5. Контроль достоверности исходных данных и исправление ошибок.
6. Использование программного интерфейса для преобразования исходных данных из формы по датам в стандартную форму по фенофазам.
7. Использование программного интерфейса для преобразования исходных данных из стандартной формы по фенофазам в базы данных, используемые в инструментарии системно-когнитивного анализа (СК-анализ) – когнитивной аналитической системе "Эйдос" (система "Эйдос").
8. Синтез семантической информационной модели (СИМ).
9. Оптимизация СИМ.
10. Измерение адекватности СИМ.
11. Решение задачи №1: "Прогнозирование результатов выращивания заданной культуры в заданной точке".
12. Решение задачи №2: "Поддержка принятия решений по рациональному выбору зон и микрозон выращивания данной культуры и сорта".
13. Решение задачи №3: "Поддержка принятия решений по рациональному выбору культур для выращивания в данной зоне и микрозоне".
14. Решение задачи №4: "Кластерно-конструктивный и системно-когнитивный анализ результатов выращивания и факторов".
15. Разработка принципов оценки экономической эффективности разработанных технологий при их применении:
– в проектных организациях;
– в производственных организациях;
– в образовательных учреждениях.
16. Исследование ограничений разработанной технологии и перспектив ее развития.
4.1.2. Источники исходных данных
Основой для выполнения данной работы являются данные, предоставленные ЗАО Агрофирмой "Сад – Гигант" (353565, Россия, Краснодарский края, г. Славянск-на-Кубани, ул. Школьная, 615), которая является крупнейшим хозяйством России и мира в своей отрасли (http://sadgigant.ru).
Свою историю агрофирма "Сад-Гигант" отсчитывает с 1929 года, и, на протяжении 70-ти лет, хозяйство крупнейшим производителем фруктов в стране (рисунок 31).
Рисунок 31. Агрофирма "Сад – Гигант", центральный офис
Более 15 лет возглавляет агрофирму "Сад-Гигант" Кладь Александр Анатольевич – известный ученый, профессор, доктор сельскохозяйственных наук в области садоводства, заслуженный работник сельского хозяйства России, прогрессивный руководитель, депутат краевого законодательного собрания.
Сегодня агрофирма - одно из ведущих хозяйств в России по производству плодовой продукции.
И можно с уверенностью сказать, что АФ "Сад- Гигант" крепко стоит на ногах, не пользуется заемными средствами, своевременно оплачивает налоги в бюджеты всех уровней, взносы во внебюджетные фонды и заработную плату своим работникам.
"Сад-Гигант" - это 3500 гектаров земельных угодий, из которых 2000 занято плодовыми насаждениями, где только плодоносящих яблонь около сорока сортов.
"Сад-Гигант" - это более 30 тысяч тонн свежих фруктов ежегодно.
На базе агрофирмы работает госсортоучасток, где ведется изучение и совершенствование сортимента плодовых культур. Здесь на площади 50 гектаров в конкурсном испытании заложено около 400 сортоопытов по пяти культурам: яблоня, груша, слива, алыча, черешня. Ежегодно коллекцию пополняет до 20 новых сортов и гибридов плодовых культур. На основе испытаний определяются перспективные сорта плодовых культур для промышленной основы в условиях нашего хозяйства. Так, за последний год, выделены по качеству, урожайности и рекомендованы следующие сорта: яблоня - "Алые паруса", "Флорина"; черешня - "Ярославна", "Роксалана", "Опус", "Эпос"; слива - "Блек Стар"; алыча - "Глобус".
Интенсивные технологии выращивания садов, новые перспективные сорта, хранение их в фруктохранилищах с регулируемой газовой атмосферой, товарная обработка плодов на голландской линии в фирменную гофротару - все это позволяет продукции агрофирмы в новых рыночных условиях быть конкурентоспособной.
В фирме организован и ведется систематический сбор и учет данных, необходимых для осуществления основной деятельности предприятия (плановых мероприятий по подкормке, обработке и уходу за культурами), а также для планирования и прогнозирования будущих результатов деятельности (качества и количества урожая).
Ответственными за этот учет являются:
– метеорологический центр;
– плановый отдел;
– лаборатория;
– отдел маркетинга.
Для выполнения данной работы использовались таблицы основных метеоданных за каждый день с 01.01.1993 по 31.12.2002 года, полученные в метеорологический центре, по следующим показателям:
– температуре воздуха;
– почвы;
– относительная и абсолютная влажность;
– осадки;
– атмосферное давление;
– облачность;
– скорость и азимут ветра;
– атмосферные явления.
Плановый отдел предоставил информацию по количеству и качеству выращенной продукции тон/гектар пяти сортов яблок за десять лет.
В лаборатории отобраны данные по времени начала и окончания фенологических фаз состояния и роста культур с момента набухания почки до завершения листопада.
4.1.3. Характеристика исходных данных и обоснование требований к методу решения поставленных задач
Исходные данные представлены нами в форме Excel-таблицы, включающей показатели различных типов данных:
– "дата" – 27;
– "текст" – 1;
– "число" – 22;
– "список" – 1.
Эта таблица состоит из 51 столбца (показателя) и 18260 строк, т.е. имеет довольно большую размерность и имеет размер около 7 мегабайт.
Строки содержат суточные метеоданные, наблюдаемые при выращивании 5 сортов яблок в течение 10 лет.
4 числовых показателя содержат количественные и качественные результаты выращивания (урожайность всего и в разрезе по сортам качества) каждого из 5 сортов, что составляет 99 классов.
18 числовых и 1 списочный показатель содержат метеоданные и информацию о 18 типах метеоявлений по каждой фенотипической фазе развития растений, которых всего 13.
Соответственно, эти показатели при преобразовании даже в шкалы отношений образуют 559 шкал, что дает 2795 градаций уже при 5 интервалах, а при увеличении числа интервалов количество градаций еще больше возрастает.
Следовательно, используемый математический метод должен обеспечивать выявление причинно-следственных зависимостей между метеофакторами (причины), и количественными и качественными результатами выращивания (следствия) на основе совместной обработки разнотипных данных больших размерностей.
4.1.4. Традиционные методы решения
Традиционные статистические модели:
– имеют жесткие ограничения по количеству исследуемых факторов, как правило, не более 10, тогда как в исследуемой модели факторов 559 шкал суммарно с 2795 градациями;
– требуют информации о результатах действия всех сочетаний исследуемых факторов ("повторности") [27], что в исследуемой предметной области практически невыполнимо даже при нескольких факторах.
Необходимо особо подчеркнуть, что восполнить отсутствующие данные из опыта не представляется возможным, т.к. объект исследования принципиально не допускает повторение условий прошедших периодов с заданными сочетаниями факторов, которые не зависят от воли человека. Восполнение данных путем интерполяции также некорректно, т.к. в каждой строке и столбце корреляционной матрицы имеется более одного пропуска.
Кроме того, статистические модели очень сложно содержательно интерпретировать, для чего требуются большой труд квалифицированных аналитиков.
Таким образом, можно сделать вывод, что для моделирования такого сложного и малоисследованного объекта, каким является искусственная экосистема яблочного сада, применение традиционных математических моделей является проблематичным.
4.1.5. Выводы
Традиционные методы обработки имеющихся исходных данных не обеспечивают решение поставленных задач и необходимо использование нового подхода, обеспечивающего выявление причинно-следственных зависимостей между метеофакторами (причины), и количественными и качественными результатами выращивания (следствия) на основе совместной обработки разнотипных данных больших размерностей.
4.2. Когнитивная структуризация,
формальная постановка задачи и синтез модели
4.2.1. Обоснование выбора метода
и концепция решения задачи
По-видимому, решение поставленных задач может быть получено путем применения системно-когнитивного анализа (СК-анализ) [27], – нового перспективного математического метода системного анализа, основанного на теории информации, системном анализе и когнитивном моделировании.
Метод является непараметрическим, позволяет сопоставимо обрабатывать тысячи градаций факторов и будущих состояний объекта управления при неполных (фрагментированных), зашумленных данных различной природы.
Для метода СК-анализа разработаны и методика численных расчетов, и соответствующий программный инструментарий, а также технология и методика их применения. Они прошли успешную апробацию при решении ряда задач в различных предметных областях [27].
Наличие инструментария СК-анализа позволяет не только осуществить синтез СИМ, но и периодически поводить адаптацию и синтез новых версий семантической информационной модели, обеспечивая тем самым отслеживание динамики предметной области и сохраняя высокую адекватность модели в изменяющихся условиях.
В работах [27, 35, 36] приведен перечень этапов системно-когнитивного анализа, которые необходимо выполнить, чтобы осуществить синтез модели и исследование модели объекта управления:
1. Когнитивная структуризация, а затем и формализация предметной области.
2. Ввод данных мониторинга в базу прецедентов за период, в течение которого имеется необходимая информация в электронной форме.
3. Синтез семантической информационной модели (СИМ).
4. Оптимизация СИМ.
5. Проверка адекватности СИМ (измерение внутренней и внешней, дифференциальной и интегральной валидности).
6. Анализ СИМ.
7. Решение задач идентификации состояний объекта управления, прогнозирование и поддержка принятия управленческих решений по управлению с применением СИМ.
В СК-анализе нечисловым величинам тем же методом, что и числовым, приписываются сопоставимые в пространстве и времени, а также между собой, количественные значения, позволяющие обрабатывать их как числовые:
– на первых двух этапах СК-анализа числовые величины сводятся к интервальным оценкам, как и информация об объектах нечисловой природы (фактах, событиях) (этот этап реализуется и в методах интервальной статистики);
– на третьем этапе СК-анализа всем этим величинам по единой методике, основанной на системном обобщении семантической теории информации А.Харкевича, сопоставляются количественные величины, с которыми в дальнейшем и производятся все операции моделирования (этот этап является уникальным для СК-анализа).
4.2.2. Когнитивная структуризация предметной области,
формальная постановка задачи
и формирование обучающей выборки
Рассмотрим подробнее пути реализации первого этапа СК-анализа. На этом этапе:
– конкретно определяются факторы и будущие состояния объекта управления;
– измеряется область изменения числовых значений факторов и интервалы (диапазоны), а также макропараметров, определяющих состояния объекта управления;
– конструируются классификационные и описательные шкалы и градации и их кодирование;
– исходные данные кодируются в системе классификационных и описательных шкал и градаций, и формируется обучающая выборка (база прецедентов, содержащая в формализованный опыт управления перерабатывающим комплексом региона за ряд лет).
4.2.2.1. Когнитивная структуризация предметной области и формальная постановка задачи, проектирование структуры и состава исходных данных
4.2.2.1.1. Когнитивная структуризация предметной области
Под когнитивной структуризацией понимается определение будущих состояний системы, т.е. ее желательных (целевых) и нежелательных будущих состояний, а также системы факторов, детерминирующих эти будущие состояния.
В общем случае, как факторы могут рассматриваться и факторы окружающей среды, и технологические факторы, и параметры объекта исследования на низких уровнях ее иерархической структурно-функциональной организации. В данном исследовании как факторы рассматриваются климатические факторы и явления.
Предлагаем для исследования в модели следующие состояния объекта исследования (классы) (таблица 18) и детерминирующие их факторы (признаки) (таблица 19).
В таблице 19 приведены наименования 172-х шкал для 4-х фаз. Аналогичны наименования и остальных шкал для всех 13 фаз (всего 559 шкал), приведенные в таблице 20.
Таблица 20 – РАСШИФРОВКА УСЛОВНЫХ НАИМЕНОВАНИЙ
№
Условное
наименование
Расшифровка
1
01TVOZDSR
Температура воздуха средняя (°С)
2
01TVOZDMAX
Температура воздуха максимальная (°С)
3
01TVOZDMIN
Температура воздуха минимальная (°С)
4
01TPOCHSR
Температура почвы средняя (°С)
5
01TPOCHMAX
Температура почвы максимальная (°С)
6
01TPOCHMIN
Температура почвы минимальная (°С)
7
01VLOTNSR
Влажность относительная средняя
8
01VLOTNMIN
Влажность относительная минимальная
9
01VLABS
Влажность абсолютная
10
01OSAD_DAY
Количество осадков днем
11
01OSAD_NIG
Количество осадков за ночь
12
01OSAD_SUT
Количество осадков за сутки
13
01DAVL_STA
Атмосферное давление на уровне метеостанции
14
01DAVL_SEA
Атмосферное давление на уровне моря
15
01OBL_VSEG
Облачность всего
16
01OBL_DOWN
Облачность низкая
17
01VETER_AZ
Ветер азимут (способ кодирования в таблица 8)
18
01VETER_SK
Ветер скорость
19
01ATM_00
Штиль
20
01ATM_01
Дождь
21
01ATM_02
Ливневый дождь
22
01ATM_03
Морось
23
01ATM_04
Снег
24
01ATM_05
Ливневый снег
25
01ATM_06
Снежная крупа
26
01ATM_07
Снежные зерна
27
01ATM_08
Ледяная крупа
28
01ATM_09
Ледяной дождь
29
01ATM_10
Град
30
01ATM_11
Мокрый снег
31
01ATM_12
Ливневый мокрый снег
32
01ATM_13
Роса
33
01ATM_14
Иней
34
01ATM_15
Гололед
35
01ATM_16
Зернистая изморось
36
01ATM_17
Кристаллическая изморось
37
01ATM_18
Гололедица
38
01ATM_19
Туман
39
01ATM_20
Просвечивающийся туман
40
01ATM_21
Дымка
41
01ATM_22
Гроза
42
01ATM_23
Зарница
42
01ATM_24
Шквал
Двузначный номер в начале условного наименования в таблицах 19, 20 и далее означает номер фазы и изменяется от 1 до 13.
В таблице 50 приведен способ кодирования азимута ветра.
Таблица 21 – СПОСОБ КОДИРОВАНИЯ
АЗИМУТА ВЕТРА
Код
Расшифровка
0
Северный
45
Северо-западный
90
Западный
135
Юго-западный
180
Южный
225
Юго-восточный
270
Восточный.
315
Северо-восточный
4.2.2.1.2. Формализация предметной области
Формализация предметной области осуществляется на основе ее когнитивной структуризации, проведенной в предыдущем разделе.
Формализация предметной области – это конструирование классификационных (таблица 18) и описательных шкал и градаций (таблицы 19 и 20), как правило, порядкового типа с использованием интервальных оценок, в системе которых предметная область описывается в форме, пригодной для обработки на компьютере с использованием математических моделей [27].
В соответствии с методом СК-анализа каждый числовой фактор, независимо от его смысла и единиц измерения, рассматривается как переменная числовая величина, принимающая определенное множество значений. Подобные величины формализуются путем сведения к интервальным значениям, т.е. путем введения некоторого количества диапазонов, охватывающих все множество значений фактора, и установления фактов попадания конкретного значения величины в определенный диапазон.
Для каждого фактора устанавливаются свои границы диапазонов, исходя из их количества и множества значений величины фактора.
Количество диапазонов может быть различным для разных факторов, но на практике удобнее выбирать их одинаковым. Каковы же соображения, из которых исходят при выборе количества диапазонов? Чем больше диапазонов, тем точнее интервальные оценки. Однако это так только тогда, когда, по крайней мере, для большинства диапазонов наблюдаются факты попадания значений факторов в них. Очевидно, для этого необходимо достаточно большое количество данных. Если же их нет, то многие диапазоны могут оказаться пустыми и модель приближается к детерминистскому типу. Тогда имеет смысл уменьшить их количество и тем самым укрупнить их.
Из этих рассуждений следует вывод о том, что при большом количестве данных оправданно увеличивать количество диапазонов и имеется возможность повысить точность исследования. Когда же данных недостаточно, приходится укрупнять диапазоны, что приводит к некоторой потере точности выводов, но делает их более обоснованными статистически. По-видимому, это утверждение можно считать одной из форм теоремы Котельникова об отсчетах.
СК-анализ предусматривает также возможность использования вторичных показателей, являющихся различными функциями первичных показателей. Но этот подход требует данных большего объема и за больший период времени и, поэтому, в данном исследовании применяться не будет.
Основываясь на этих соображениях нами, прежде всего, было определено количество диапазонов, количество которых было выбрано равным 5.
Затем были определены границы каждого диапазона. Для этого:
– для каждого фактора были определены минимальное и максимальное значения;
– весь интервал значений был разделен на пять равных частей (это означает, что фактически используется не порядковая шкала, как это выглядит на первый взгляд, а шкала отношений).
Исходя из этого были сконстурированы классифкационные и описательные шкалы и градации (таблицы 22 – 24).
4.2.2.2. Получение исходных данных запланированного состава в той форме, в которой они накапливаются в поставляющей их организации (журналы)
В ЗАО Агрофирме "Сад-Гигант" организован и ведется систематический сбор и учет данных, необходимых для осуществления основной деятельности предприятия (плановых мероприятий по подкормке, обработке и уходу за культурами), а также для планирования и прогнозирования будущих результатов деятельности (качества и количества урожая).
Ответственными за этот учет являются:
– метеорологический центр;
– плановый отдел;
– лаборатория;
– отдел маркетинга.
Эти подразделения предоставили информацию по выбранным для обработки показателям. Основной объем этой информации составляли журналы агрономов, которые в данной работе не приводятся из-за большого объема.
4.2.2.3. Разработка электронной формы для представления исходных данных
Для ввода исходных данных (непосредственно из журналов агрономов) была разработана Excel-таблица, горизонтальная шапка которой приводится ниже (таблица 25).
Вертикальная шапка таблицы включает ежедневные данные по каждому из 5 сортов яблок за 10 летний период с 1003 по 2002 годы, всего 18250 строк: 5 сортов 365 дней 10 лет = 18250 строк. Фрагмент таблицы исходных данных приведен на рисунке 32.
При распечатке шириной в один лист в высоту данная таблица составит более 300 листов и по этой причине здесь не приводится.
Таблица 25 – ШАПКА EXCEL-ТАБЛИЦЫ
ДЛЯ ВВОДА ИСХОДНЫХ ДАННЫХ
Дата
Сорт яблок
Результаты выращивания
Фазы
Начало
Окончание
Начало
Окончание
Начало
Окончание
Начало
Окончание
t1_faza2
t2_faza2
t1_faza3
t2_faza3
t1_faza4
t2_faza4
t1_faza5
t2_faza5
9
10
11
12
13
14
15
16
Фазы
Конец цветения
Формирование плодов
Окончание роста
побегов
Вызревание древесины
Начало
Окончание
Начало
Окончание
Начало
Окончание
Начало
Окончание
t1_faza6
t2_faza6
t1_faza7
t2_faza7
t1_faza8
t2_faza8
t1_faza9
t2_faza9
17
18
19
20
21
22
23
24
Фазы
Съемная спелость
Осеннее расцвечивание листьев
Листопад
Вторичный рост побегов
Начало
Окончание
Начало
Окончание
Начало
Окончание
Начало
Окончание
t1_faza10
t2_faza10
t1_faza11
t2_faza11
t1_faza12
t2_faza12
t1_faza13
t2_faza13
25
26
27
28
29
30
31
32
Погодные факторы по дням
Температура воздуха
Температура почвы
Относительная влажность
Абсолютная влажность.
Осадки (мм)
Средняя
MAX
MIN
Средняя
MAX
MIN
Средняя
Минимал.
День
Ночь
Сутки
t_vozd_sr
t_vozd_max
t_vozd_min
t_poch_sr
t_poch_max
t_poch_min
vl_otn_sr
vl_otn_min
vl_abs
osad_day
osad_night
osad_sutki
33
34
35
36
37
38
39
40
41
42
43
44
Погодные факторы по дням
Атмосферное
явление
Давление (мил.бар)
Облачность
Ветер
На ур. станции
На ур. моря
Общ.
Ниж.
Направление
Скорость
Рисунок 32. Фрагмент таблицы исходных данных
4.2.2.4. Преобразование исходных данных в электронную форму
Этот этап работ представляет собой ввод исходных данных из бумажных журналов агрономов в электронную Excel-таблицу (таблица 25) и осуществлялся на компьютере вручную.
4.2.2.5. Контроль достоверности исходных данных и исправление ошибок
После ввода исходных данных в Excel-таблицу, который осуществлялся вручную, было осуществлено автоматическое выявление ошибок ввода нескольких видов:
– среднее значение показателя меньше максимального;
– максимальное значение показателя меньше минимального;
– длительность фенофазы больше года;
– отсутствие данных.
Для этого в Excel-книге, в которой в качестве листа была таблица исходных данных, был создан второй лист "Error", в котором в позициях показателей, отображались пробелы, если показатель верный и ERROR, если он ошибочный.
Затем все ошибочно введенные показатели были исправлены вручную с использованием бумажной формы исходных данных.
4.2.2.6. Преобразование исходных данных из формы по датам в стандартную форму по фенофазам
Эта операция выполняется в несколько этапов:
1. Преобразование Excel-таблицы исходных данных в DBF-файл с именем INP_DATA.DBF.
2. Формирование помежуточной формы INP_FAZA.DBF, соержащей информацию и переиодах начала и окончания каждой фенофазы и номерах соотвсвующих записей в базе данных INP_DATA.DBF по каждому сорту за все годы.
3. Формирование файла данных с именем INP12.DBF, в стандарте внешнего файла системы "Эйдос" (стандарт профессора А.Н.Лебедева).
Для выполнения 1-го этапа:
– удаляется строка 5 с номерами столбцов;
– отмечается блоком часть таблицы со строки 4 с наименованиями полей и до конца таблицы (все столбцы);
– выбирается режим сохранения: "Файл – сохранить как – тип файла: DBF 4 (dBASE IV) *.dbf – имя файла: Inp_data.dbf";
– нажать кнопку "Сохранить".
В результате формируется DBF-файл, содержащий исходные данные, со следующей структурой (таблица 26).
Таблица 26 – СТРУКТУРА DBF-ФАЙЛА
С ИСХОДНЫМИ ДАННЫМИ
№
Наименование
поля
Тип
дан-
ных
Длина
поля
Кол-во
дес.
разр.
№
Наименование
поля
Тип
дан-
ных
Длина
поля
Кол-во
дес.
разр.
1
DATE
D
8
0
27
T1_FAZA11
D
8
0
2
SORT_NAME
C
16
0
28
T2_FAZA11
D
8
0
3
UROGAY
N
8
0
29
T1_FAZA12
D
8
0
4
SORT_1
N
5
0
30
T2_FAZA12
D
8
0
5
SORT_2
N
5
0
31
T1_FAZA13
D
8
0
6
SORT_3
N
5
0
32
T2_FAZA13
D
8
0
7
T1_FAZA1
D
8
0
33
T_VOZD_SR
N
8
1
8
T2_FAZA1
D
8
0
34
T_VOZD_MAX
N
8
1
9
T1_FAZA2
D
8
0
35
T_VOZD_MIN
N
7
1
10
T2_FAZA2
D
8
0
36
T_POCH_SR
N
8
1
11
T1_FAZA3
D
8
0
37
T_POCH_MAX
N
5
1
12
T2_FAZA3
D
8
0
38
T_POCH_MIN
N
6
1
13
T1_FAZA4
D
8
0
39
VL_OTN_SR
N
9
1
14
T2_FAZA4
D
8
0
40
VL_OTN_MIN
N
5
1
15
T1_FAZA5
D
8
0
41
VL_ABS
N
5
1
16
T2_FAZA5
D
8
0
42
OSAD_DAY
N
5
1
17
T1_FAZA6
D
8
0
43
OSAD_NIGHT
N
5
1
18
T2_FAZA6
D
8
0
44
OSAD_SUTKI
N
7
1
19
T1_FAZA7
D
8
0
45
DAVL_STAN
N
9
1
20
T2_FAZA7
D
8
0
46
DAVL_SEA
N
11
1
21
T1_FAZA8
D
8
0
47
OBL_VSEGO
N
6
1
22
T2_FAZA8
D
8
0
48
OBL_DOWN
N
6
1
23
T1_FAZA9
D
8
0
49
VETER_AZIM
N
6
1
24
T2_FAZA9
D
8
0
50
VETER_SKOR
N
5
1
25
T1_FAZA10
D
8
0
51
ATM_YVLEN
N
5
1
26
T2_FAZA10
D
8
0
Для выполнения этапов 2 и 3 применен специально разработанный программный интерфейс, вошедший в состав стандартного инструментария СК-анализа, обеспечивающий преобразование таблицы исходных данных (таблица 25) в стандарт внешней базы данных системы "Эйдос".
Экранная форма программного интерфейса имеет вид (рисунок 33).
Рисунок 33. Экранная форма программного интерфейса
первого уровня с системой "Эйдос"
Программный интерфейс реализован на языке программирования xBASE++, что связано с необходимостью обеспечения полной совместимости по стандарту используемых баз данных с системой "Эйдос", которая написана на этом языке программирования.
Алгоритм программного интерфейса приведен на рисунке 34.
На этапе 2 рассчитываются все метеопоказатели по каждой фенофазе каждого сорта в каждом году на основе их значений за каждый день с учетом периодов фенофаз. Результаты расчета записываются в базе данных INP_FAZA.DBF (таблица 27).
Рисунок 34. Алгоритм программного интерфейса первого уровня
с системой "Эйдос"
Таблица 27 – ТАБЛИЦА ФАКТИЧЕСКИХ ПЕРИОДОВ ФЕНОФАЗ ПО 5 СОРТАМ ЯБЛОК ЗА 1993 – 2002 ГОДЫ (ФРАГМЕНТ)
Год
Сорт
Фенофаза
Окончательные результаты расчета приведены в базе данных INP12.DBF (таблица 28), являющейся входной для системы "Эйдос".
Таблица 28 – СТРУКТУРА БАЗЫ INP12.DBF С ИСХОДНЫМИ
ДАННЫМИ ПО РЕЗУЛЬТАТАМ ВЫРАЩИВАНИЯ
И МЕТЕОПАРАМЕТРАМИ ПО ФЕНОФАЗАМ
(5 СОРТОВ ЯБЛОК ЗА 1993 – 2002 ГОДЫ – ФРАГМЕНТ)
№
Имя поля
Тип поля
Длина поля
Дес.разр.
№
Имя поля
Тип поля
Длина поля
Дес.разр.
№
Имя поля
Тип поля
Длина поля
Дес.разр.
1
NUM_GOD
C
12
0
2
NAME_UR_VS
C
65
0
3
NAME_UR_S1
C
65
0
4
NAME_UR_S2
C
65
0
5
NAME_UR_S3
C
65
0
6
01TVOZDSR
N
13
2
49
02TVOZDSR
N
13
2
92
03TVOZDSR
N
13
2
7
01TVOZDMAX
N
13
2
50
02TVOZDMAX
N
13
2
93
03TVOZDMAX
N
13
2
8
01TVOZDMIN
N
13
2
51
02TVOZDMIN
N
13
2
94
03TVOZDMIN
N
13
2
9
01TPOCHSR
N
13
2
52
02TPOCHSR
N
13
2
95
03TPOCHSR
N
13
2
10
01TPOCHMAX
N
13
2
53
02TPOCHMAX
N
13
2
96
03TPOCHMAX
N
13
2
11
01TPOCHMIN
N
13
2
54
02TPOCHMIN
N
13
2
97
03TPOCHMIN
N
13
2
12
01VLOTNSR
N
13
2
55
02VLOTNSR
N
13
2
98
03VLOTNSR
N
13
2
13
01VLOTNMIN
N
13
2
56
02VLOTNMIN
N
13
2
99
03VLOTNMIN
N
13
2
14
01VLABS
N
13
2
57
02VLABS
N
13
2
100
03VLABS
N
13
2
15
01OSAD_DAY
N
13
2
58
02OSAD_DAY
N
13
2
101
03OSAD_DAY
N
13
2
16
01OSAD_NIG
N
13
2
59
02OSAD_NIG
N
13
2
102
03OSAD_NIG
N
13
2
17
01OSAD_SUT
N
13
2
60
02OSAD_SUT
N
13
2
103
03OSAD_SUT
N
13
2
18
01DAVL_STA
N
13
2
61
02DAVL_STA
N
13
2
104
03DAVL_STA
N
13
2
19
01DAVL_SEA
N
13
2
62
02DAVL_SEA
N
13
2
105
03DAVL_SEA
N
13
2
20
01OBL_VSEG
N
13
2
63
02OBL_VSEG
N
13
2
106
03OBL_VSEG
N
13
2
21
01OBL_DOWN
N
13
2
64
02OBL_DOWN
N
13
2
107
03OBL_DOWN
N
13
2
22
01VETER_AZ
N
13
2
65
02VETER_AZ
N
13
2
108
03VETER_AZ
N
13
2
23
01VETER_SK
N
13
2
66
02VETER_SK
N
13
2
109
03VETER_SK
N
13
2
№
Имя поля
Тип поля
Длина поля
Дес.разр.
№
Имя поля
Тип поля
Длина поля
Дес.разр.
№
Имя поля
Тип поля
Длина поля
Дес.разр.
24
01ATM_00
N
13
2
67
02ATM_00
N
13
2
110
03ATM_00
N
13
2
25
01ATM_01
N
13
2
68
02ATM_01
N
13
2
111
03ATM_01
N
13
2
26
01ATM_02
N
13
2
69
02ATM_02
N
13
2
112
03ATM_02
N
13
2
27
01ATM_03
N
13
2
70
02ATM_03
N
13
2
113
03ATM_03
N
13
2
28
01ATM_04
N
13
2
71
02ATM_04
N
13
2
114
03ATM_04
N
13
2
29
01ATM_05
N
13
2
72
02ATM_05
N
13
2
115
03ATM_05
N
13
2
30
01ATM_06
N
13
2
73
02ATM_06
N
13
2
116
03ATM_06
N
13
2
31
01ATM_07
N
13
2
74
02ATM_07
N
13
2
117
03ATM_07
N
13
2
32
01ATM_08
N
13
2
75
02ATM_08
N
13
2
118
03ATM_08
N
13
2
33
01ATM_09
N
13
2
76
02ATM_09
N
13
2
119
03ATM_09
N
13
2
34
01ATM_10
N
13
2
77
02ATM_10
N
13
2
120
03ATM_10
N
13
2
35
01ATM_11
N
13
2
78
02ATM_11
N
13
2
121
03ATM_11
N
13
2
36
01ATM_12
N
13
2
79
02ATM_12
N
13
2
122
03ATM_12
N
13
2
37
01ATM_13
N
13
2
80
02ATM_13
N
13
2
123
03ATM_13
N
13
2
38
01ATM_14
N
13
2
81
02ATM_14
N
13
2
124
03ATM_14
N
13
2
39
01ATM_15
N
13
2
82
02ATM_15
N
13
2
125
03ATM_15
N
13
2
40
01ATM_16
N
13
2
83
02ATM_16
N
13
2
126
03ATM_16
N
13
2
41
01ATM_17
N
13
2
84
02ATM_17
N
13
2
127
03ATM_17
N
13
2
42
01ATM_18
N
13
2
85
02ATM_18
N
13
2
128
03ATM_18
N
13
2
43
01ATM_19
N
13
2
86
02ATM_19
N
13
2
129
03ATM_19
N
13
2
44
01ATM_20
N
13
2
87
02ATM_20
N
13
2
130
03ATM_20
N
13
2
45
01ATM_21
N
13
2
88
02ATM_21
N
13
2
131
03ATM_21
N
13
2
46
01ATM_22
N
13
2
89
02ATM_22
N
13
2
132
03ATM_22
N
13
2
47
01ATM_23
N
13
2
90
02ATM_23
N
13
2
133
03ATM_23
N
13
2
48
01ATM_24
N
13
2
91
02ATM_24
N
13
2
134
03ATM_24
N
13
2
В таблице 28 приведены наименования полей для 3 фенофаз, а в структуре базы данных INP12.DBF они есть для всех 13 фенофаз.
Расшифровка смысла полей, соответствующих классам и признакам (на примере 1-й фазы) приведена в таблице 29.
Таблица 29 – РАСШИФРОВКА СМЫСЛА ПОЛЕЙ,
СООТВЕТСТВУЮЩИХ КЛАССАМ И ПРИЗНАКАМ
(НА ПРИМЕРЕ 1-Й ФАЗЫ)
№
Имя поля
Смысл информации, содержащейся в поле
1
NUM_GOD
Номер примера выращивания и год, за который пример
2
NAME_UR_VS
Наименование сорта и урожайность (всего)
3
NAME_UR_S1
Наименование сорта и урожайность (по 1-му сорту)
4
NAME_UR_S2
Наименование сорта и урожайность (по 2-му сорту)
5
NAME_UR_S3
Наименование сорта и урожайность (по 3-му сорту)
6
01TVOZDSR
Температура воздуха средняя (°С)
7
01TVOZDMAX
Температура воздуха максимальная (°С)
8
01TVOZDMIN
Температура воздуха минимальная (°С)
9
01TPOCHSR
Температура почвы средняя (°С)
10
01TPOCHMAX
Температура почвы максимальная (°С)
11
01TPOCHMIN
Температура почвы минимальная (°С)
12
01VLOTNSR
Влажность относительная средняя
13
01VLOTNMIN
Влажность относительная минимальная
14
01VLABS
Влажность абсолютная
15
01OSAD_DAY
Количество осадков днем
16
01OSAD_NIG
Количество осадков за ночь
17
01OSAD_SUT
Количество осадков за сутки
№
Имя поля
Смысл информации, содержащейся в поле
18
01DAVL_STA
Атмосферное давление на уровне метеостанции
19
01DAVL_SEA
Атмосферное давление на уровне моря
20
01OBL_VSEG
Облачность всего
21
01OBL_DOWN
Облачность низкая
22
01VETER_AZ
Ветер азимут (способ кодирования в таблица 21)
23
01VETER_SK
Ветер скорость
24
01ATM_00
Штиль
25
01ATM_01
Дождь
26
01ATM_02
Ливневый дождь
27
01ATM_03
Морось
28
01ATM_04
Снег
29
01ATM_05
Ливневый снег
30
01ATM_06
Снежная крупа
31
01ATM_07
Снежные зерна
32
01ATM_08
Ледяная крупа
33
01ATM_09
Ледяной дождь
34
01ATM_10
Град
35
01ATM_11
Мокрый снег
36
01ATM_12
Ливневый мокрый снег
37
01ATM_13
Роса
38
01ATM_14
Иней
39
01ATM_15
Гололед
40
01ATM_16
Зернистая изморось
41
01ATM_17
Кристаллическая изморось
42
01ATM_18
Гололедица
43
01ATM_19
Туман
44
01ATM_20
Просвечивающийся туман
45
01ATM_21
Дымка
46
01ATM_22
Гроза
47
01ATM_23
Зарница
48
01ATM_24
Шквал
4.2.2.7. Импорт исходных данных из стандартной формы по фенофазам в базы данных системы "Эйдос"
Для этой цели использовался встроенный в систему "Эйдос" стандартный программный интерфейс с внешней базой данных (рисунки 35, 36) INP12.DBF. Структура этой базы данных приведена в таблице 28.
Рисунок 35. Выход на режим импорта данных из внешней
базы данных стандарта профессора А.Н.Лебедева
Рисунок 36. Экранная форма интерфейса импорта данных из внешней базы данных стандарта профессора А.Н.Лебедева
При этом автоматически формируются и вводятся в соответствующие базы данных системы "Эйдос" классификационные и описательные шкалы и градации, а также обучающая выборка, приведенные в таблицах 22 – 29.
4.2.3. Синтез семантической информационной модели, ее оптимизация и проверка на адекватность
4.2.3.1. Синтез семантической информационной модели (СИМ)
Синтез семантической информационной модели (СИМ) осуществляется в 5-м режиме 2-й подсистемы системы "Эйдос" (рисунок 37).
Рисунок 37. Синтез семантической информационной модели
4.2.3.2. Оптимизация СИМ
Оптимизация семантической информационной модели состоит в исключении из нее факторов, не оказывающих существенного влияния на получение тех или иных результатов выращивания исследуемых сельхозкультур. Рассмотрим график, приведенный на рисунке 38.
Рисунок 38. № Паретто-кривая "Сила влияния градаций факторов
на получение различных результатов выращивания"
Видно, что примерно половина всех градаций факторов (1400 из 2795) суммарно оказывает около 95% влияния, а другая половина – не более 5% влияния, т.е. практически никакого влияния не оказывает. Это значит, что градации факторов, входящие в эту вторую половину, могут быть без какого-либо ущерба для адекватности модели быть исключены из нее. В этом и состоит оптимизация модели в данном случае.
В результате оптимизации модели резко сокращается ее размерность и резко сокращается время решения задач и объем используемой для баз данных и индексных массивов внешней памяти.
4.2.3.3. Измерение адекватности СИМ
Измерение адекватности СИМ состоит в измерении внутренней и внешней, дифференциальной и интегральной валидности.
4.2.3.3.1. Внутренняя дифференциальная и интегральная валидность
Под внутренней валидностью понимается способность модели верно идентифицировать объекты, входящие в обучающую выборку.
Для измерения адекватности модели необходимо выполнить следующие действия:
1. Скопировать обучающую выборку в распознаваемую (во 1-м режиме 2-й подсистемы нажав клавишу F5).
2. Выполнить пакетное распознавание (во 2-м режиме 4-й подсистемы, задав 1-й критерий сходства) (рисунок 39).
3. Измерить адекватность модели (во 2-м режиме 6-й подсистемы) (рисунки 40 и 41).
Рисунок 39. Выход на режим пакетного распознавания
Рисунок 40. Выход на режим измерения адекватности
семантической информационной модели системы "Эйдос"
Рисунок 41. Экранная форма управления измерением адекватности модели и отображения результатов
Эта форма может прокучиваться вниз-вверх и вправо-влево. В верхней части формы приведены показатели интегральной валидности (средневзвешенные по всей обучающей выборке), а в самой таблице – дифференциальной валидности, т.е. в разрезе по классам.
Кроме того, результаты измерения адекватности модели выводятся в форме файлов с именами ValidSys.txt (таблица 30) и ValAnkSt.txt (рисунок 42) стандарта "TXT-текст DOS" в поддиректории TXT.
19-05-04 23:58:24 г.Краснодар
Код
класса
Наименование класса
Всего
логич
анкет
Идентифи-
цировано
Неиденти-
фицировано
Идентифи-
цировано
Неиденти-
фицировано
Рисунок 42. Фрагмент выходной формы ValAnkSt.txt с результатами измерения адекватности модели и отображения результатов
В данной форме приведены коды анкет обучающей выборки, которые были учтены в каждой графе предыдущей формы по каждому классу.
Форма, приведенная в таблице 30, рассчитывается как средневзвешенная на основе карточек прогнозирования, представленных на рисунке 43.
Рисунок 43. Пример карточки прогнозирования количественных
и качественных результатов выращивания всех сортов яблок
для заданного года (1993)
При этом результаты измерения валидности СИМ зависят от количества классов из карточек распознавания, засчитываемых как верно идентифицированные. График эмпирической зависимости валидности СИМ от этого параметра приведен на рисунке 44.
Рисунок 44. Эмпирическая зависимость валидности СИМ
от количества классов из карточек распознавания,
засчитываемых как верно идентифицированные
"Факторные портреты" тех лет, в которые был получен данный конкретный количественный и качественный результат выращивания данного сорта (рисунок 45), обобщены системой, в результате чего сформирован обобщенный информационный портрет системы факторов, действие которых приводит к данному результату (рисунок 46). Эта задача иногда называется задачей "Типизации лет".
Рисунок 45. Пример карточки прогнозирования конкретного
результата выращивания данного сорта яблок
за 10 лет (с 1993 по 2003)
Рисунок 46. Фрагмент информационного портрета класса
(конкретного результат выращивания заданного сорта)
Если задача типизации лет решена, то на основе нее может решаться задача оценки эффективности выращивания определенного заданного сорта в заданной конкретной зоне и микрозоне выращивания. На основе этого для каждой микрозоны может быть определен оптимальный сорт, и для каждого сорта - оптимальные микрозоны.
Рассмотрим, что означают графы выходной формы, представленной в таблице 30.
"Всего логических анкет" – это количество анкет (примеров текстов) в обучающей выборке, на основе которых формировался образ данного класса.
"Идентифицировано верно" – это количество анкет обучающей выборки, которые идентифицированы как классы, к которым они действительно относятся.
"Идентифицировано ошибочно" – это количество анкет обучающей выборки, которые идентифицированы как классы, к которым они в действительности не относятся (ошибка идентификации).
"Неидентифицировано верно" – это количество анкет обучающей выборки, которые неидентифицированы как классы, к которым они действительно не относятся.
"Неидентифицировано ошибочно" – это количество анкет обучающей выборки, которые неидентифицированы как классы, к которым они в действительности относятся (ошибка неидентфикации).
В правой части формы приведены те же показатели, но в процентом выражении:
– для анкет, идентифицированных верно и неидентифицированных ошибочно за 100% принимается количество логических анкет обучающей выборки по данному классу;
– для анкет, идентифицированных ошибочно и неидентифицированных верно за 100% принимается суммарное количество логических анкет обучающей выборки за вычетом логических анкет по данному классу.
4.2.3.3.2. Внешняя дифференциальная и интегральная валидность
Под внешней валидностью понимается способность модели верно идентифицировать объекты, не входящие в обучающую выборку, но относящиеся к генеральной совокупности, по отношению к которой она репрезентативна.
Для измерения внешней валидности необходимо выполнить следующие действия:
1. В режиме измерения адекватности модели запустить режим измерения внешней валидности (нажав F8 Измерение внешней валидности) (рисунок 41).
2. Выбрать один из режимов удаления объектов обучающей выборки, приведенный на экранной форме (рисунок 47) (бутстрепный метод).
Внешняя валидность модели не измерялась, т.к. по каждому результату выращивания по данным обучающей выборки было представлено, как правило, всего несколько примеров (рисунок 48 и таблица 31).
Рисунок 47. Режим переноса анкет обучающей выборки
в распознаваемую для измерения внешней валидности
Рисунок 48. Частотное распределение объектов обучающей выборки по классам (количественным и качественным результатам выращивания различных сортов яблок)
Например, из этого распределения видно, что лишь по 18 классам представлено более 2 примеров. Следовательно, для повышения надежности выводов необходимо либо увеличить объем обучающей выборки, либо укрупнить классы.
4.2.4. Выводы
Измерение валидности семантической информационной модели объекта исследования показало ее высокую степень адекватности. Это означает, что вполне корректно считать исследование модели объекта изучением самого объекта.
4.3. Исследование семантический
информационной модели
4.3.1. Прогнозирование результатов выращивания
заданной культуры в заданной точке
Сформулируем задачи, которые должны быть решены перед прогнозированием результатов выращивания плодовых культур:
– определение периодов фенофаз данной культуры в заданной точке;
– определение метеопараметров в заданной точке.
Сразу отметим, что решение этих задач не входит в тематику данной работы и мы будем считать, что они решены.
4.3.1.1. Задача определения периодов фенофаз для заданного сорта в данной зоне и микрозоне выращивания
В соответствии с созданной семантической информационной моделью прогнозирование результатов выращивания осуществляется на основе информации о прошлых или прогнозируемых значениях ряда метеопараметров в периоды фенофаз различных сортов.
Однако метеослужбы располагают информацией не по периодам фенофаз, а по дням. Следовательно, для решения задачи прогнозирования необходимо предварительно решить задачу определения наиболее вероятных периодов наступления и окончания фенофаз для заданной культуры и сорта по известным метеопараметрам в течение ряда лет.
4.3.1.2. Задача определения значений метеопараметров в заданной точке по их значениям в трех ближайших метеостанциях
Метеопараметры измеряются метеостанциями не в потенциальных точках выращивания, а в местах нахождения метеостанций. Поэтому перед тем, как определять периоды фенофаз для того или иного сорта в некоторой заданной потенциальной точке выращивания необходимо предварительно решить задачу определения значений метеопараметров в данной точке путем пространственной интерполяции их значений в трех ближайших к данной точке метеостанциях.
4.3.1.3. Прогнозирование результатов выращивания заданной культуры в заданной точке
Рассмотрим прогнозирование результата выращивания сорта Старкрымсон (2-й сорт), урожайность 1.00, который имеет наиболее высокую дифференциальную валидность (75% при 2 засчитываемых классах) (рисунок 49).
Рисунок 49. Дифференциальная валидность результатов
выращивания (сортировка в порядке убывания)
Для выполнения прогнозирования заполним карточку прогнозирования кодами метеофакторов в соответствии с справочником описательных шкал и градаций. При этом получим карточку вида, представленную в таблице 32, а затем вводим ее в систему и запускаем режим прогнозирования.
В нашем примере эти карточки распознавания совпадают с использованными в обучающей выборке (обучающая выборка была скопирована в распознаваемую для измерения внутренней валидности модели). Поэтому мы эту карточку не заполняли, а нашли в распознаваемой выборке. Для этого в форме ValAnkSе.txt находим фрагмент, посвященный прогнозированию интересующего нас результата выращивания по заданному сорту (таблица 33):
Таблица 33 – А Н К Е Т Ы распознаваемой выборки
Класс распознавания: 87 - СТАРКРЫМСОН (2-Й СОРТ) - УРОЖАЙ: 1.00
Результат идентификации: Верная идентификация
Минимальный уровень сходства: 0.0 Максимальное кол-во классов: 2
22-05-04 14:00:30 г.Краснодар
=================================================================================
¦ К о д ы а н к е т р а с п о з н а в а е м о й в ы б о р к и ¦
¦-------------------------------------------------------------------------------¦
¦ 10 15 20 25 45 50 ¦
=================================================================================
Универсальная когнитивная аналитическая система НПП *ЭЙДОС*
Затем выводим результаты прогнозирования используя соответствующий режим системы "Эйдос" (рисунок 50), получаем карточку в выходной форме (рисунок 51) и в таблице 34.
4.3.2. Поддержка принятия решений по рациональному выбору зон и микрозон выращивания данной культуры и сорта
В результате решения двух задач, сформулированных выше, создаются все условия для решения задачи прогнозирования количественных и качественных результатов выращивания заданного сорта в данной точке.
Эта задача решается для заданного сорта для всех потенциальных точек выращивания, в общем случае – для всех точек, находящихся в узлах некоторой регулярной (с одинаковым шагом) решетки на карте.
Результаты оценки пригодности различных географических точек для выращивания заданного сорта могут быть визуализированы в форме карт с использованием геоинформационных технологий. Для ряда косточковых плодовых культур эта работа выполнена под руководством профессора И.А. Драгавцевой [6], но для семечковых, в частности яблок, насколько нам известно, конкретные предпосылки для решения этих задач впервые создаются именно данной работой.
4.3.3. Поддержка принятия решений по рациональному выбору культур для выращивания в данной зоне
и микрозоне
Предпосылки для решения задачи выбору культур для выращивания в данной зоне и микрозоне, также как и предыдущей задачи, создаются в результате решения двух задач, сформулированных выше в данной работе.
Эта задача может быть решена для заданной точки выращивания для всех потенциальных сортов с использованием моделей и технологии, описанных в данной работе.
4.3.4. Кластерно-конструктивный
и системно-когнитивный
анализ результатов выращивания и факторов
Эти возможности обеспечиваются режимами 5-й подсистемы "Типология" (рисунок 52).
Рисунок 52. Режимы подсистемы типологического
анализа классов и факторов
Кластерный анализ классов показывает, какие качественные и количественные результаты выращивания различных сортов детерминируются (вызываются) сходными системами факторов, и могут быть получены одновременно, а какие противоположными, несовместимыми и одновременно недостижимыми. Результаты кластерного анализа классов и факторов выводятся в форме таблиц (таблицы 35 и 36) и в форме семантических сетей (рисунок 53).
Рисунок 54. Сравнение влияния двух факторов на количественные
и качественные результаты выращивания яблок
4.3.5. Выводы
Таким образом, можно сделать вывод о том, что предложенная семантическая модель и технология СК-анализа обеспечили решение следующих задач: прогнозирование результатов выращивания заданной культуры в заданной точке; поддержка принятия решений по рациональному выбору зон и микрозон выращивания данной культуры и сорта; поддержка принятия решений по рациональному выбору культур для выращивания в данной зоне и микрозоне; кластерно-конструктивный и системно-когнитивный анализ результатов выращивания и факторов.
4.4. Эффективность применения полученного решения, его ограничения и перспективы развития
4.4.1. Применение в проектных организациях
На сегодняшний день в Краснодарском крае нет ни одного сортоучастка, где абрикос давал бы более 4-х урожаев за 10 лет [6]. Госсортосеть рекомендует к закладке садов сорта по данным эмпирических испытаний, без учета и анализа их адаптивного потенциала и природно-ресурсного потенциала конкретного пункта. Эти рекомендации с аналогичными данными НИИ используются при разработке проектов закладки садов проектными организациями, например, по Краснодарскому краю ОАО "Краснодарагроспецпроект". Применение проектными организациями технологий, подобных описанных в данной работе, позволило бы снизить затраты на разработку проектов садов и повысить качество проектов, что дало бы соответствующий экономический эффект как текущий, так и в долгосрочной перспективе за счет повышения эффективности садов.
4.4.2. Применение в производственных организациях
Применение предложенной технологии в производственных организациях, например, в самой ЗАО Агрофирме "Сад Гигант", по нашему мнению позволит разрабатывать более точные прогнозы результатов деятельности, что повысит адекватность решений по способу использования произведенной продукции позволит заблаговременно подготовить для этого ресурсы и другие условия. Это касается и условий хранения и переработки продукции, и заключения фьючерсных сделок на ее реализацию.
4.4.3. Применение в образовательных учреждениях
В образовательных учреждениях, прежде всего в Кубанском государственном аграрном университете, проведенная работа может стать основой лекционного занятия и полноценной лабораторной работы по дисциплине: "Интеллектуальные информационные системы", читаемой на 5-м курсе специальности: 351400 – Прикладная информатика.
4.4.4. Ограничения разработанной технологии
и перспективы ее развития
Для адекватного описания объектов управления в АПК необходимо использовать тысячи факторов различной природы (многофакторность), но на практике это сделать очень сложно.
Поэтому, в одних исследованиях учитывается влияние климатических факторов на количественные и качественные результаты выращивания сельскохозяйственных культур (агрометеорология), в других влияние агротехнологий, в третьих влияние почв, предшественников (севооборот), структуры и организации машинно-тракторного парка, финансовых и материальных потоков (логистика) и т.д., и т.д. Сами агротехнологии также включают массу различных факторов: способы вспашки; количество, виды и способы внесения удобрений; нормы высева, полива и т.д. Однако ни одна из этих групп факторов не является определяющей в получении хозяйственного результата (слабодетерминированность). Дело усложняется тем, что исследования каждой группы факторов проводятся обычно разрозненными группами ученых, на разных кафедрах, в различных научно-исследовательских институтах. Так ученые, изучающие влияние лимитирующих климатических факторов с учетом генетического потенциала и пофазного развития сортов и культур не имеют исходной информации для изучения влияния агротехнологий, и наоборот, специалисты по агротехнологиям не имеют климатических баз данных, геоинформационных технологий, и соответственно, возможности учета климатических факторов. И у первых, и у вторых возникают проблемы, связанные с нелинейным системным взаимодействием факторов, а также огромными размерностями математических моделей.
Поэтому мы перспективу развития направления, представленного данной работой, мы видим в разработке моделей, учитывающей кроме климатических факторов, также технологические факторы и неклиматические факторы внешней среды, например, такие как: виды и состояние почв, экологические факторы и др., а также в создании условий для применения этих моделей для решения рассмотренных задач в практике деятельности проектных и производственных организаций.
4.4.5. Выводы
Таким образом, на основании вышеизложенного можно сделать вывод об эффективности предложенной технологии и целесообразности ее применения и дальнейшего развития.
4.5. Выводы
Данный раздел монографии посвящен решению актуальных задач прогнозирования количественных и качественных результатов выращивания семечковых плодовых культур (на примере яблок), на основе выявления причинно-следственных зависимостей между метеофакторами и этими результатами.
1. В связи с высокой размерностью задачи и разнородностью исходных данных показана целесообразность применения для решения поставленных задач нового метода: системно-когнитивного анализа, обоснованного теоретически и имеющего свой программный инструментарий.
2. Показано, что сформированная с помощью СК-анализа семантическая информационная модель имеет достаточно высокую адекватность для того, чтобы ее исследование считать изучением самого объекта.
3. В работе решены следующие задачи, имеющие научное и практическое значение:
– прогнозирование результатов выращивания заданной культуры в заданной точке;
– поддержка принятия решений по рациональному выбору зон и микрозон выращивания данной культуры и сорта;
– поддержка принятия решений по рациональному выбору культур для выращивания в данной зоне и микрозоне;
– кластерно-конструктивный и системно-когнитивный анализ результатов выращивания и факторов.
4. Таким образом, предложенный подход позволяет успешно решить поставленные задачи и достичь цели работы.
5. Предложенная технология эффективна и целесообразно ее применения и дальнейшее развитие.
6. Научная новизна проведенного исследования состоит в том, что впервые методология, технология и инструментарий системно-когнитивного анализа применены для решения задач прогнозирования количественных и качественных результатов выращивания семечковых плодовых культур в Краснодарском крае.
7. Практическая значимость исследования состоит в возможности и целесообразности применения полученных результатов и технологий в практике работы проектных и производственных организаций, а также в учебном процессе на факультете прикладной информатики в Кубанском государственном аграрном университете.
ГЛАВА-5. СОВЕРШЕНСТВОВАНИЕ МЕТОДОВ КОМПЬЮТЕРНОЙ СЕЛЕКЦИИ ПОДСОЛНЕЧНИКА
Исследование посвящено решению актуальных задач прогнозирования и поддержки принятия решений при выборе растений для селекции методом отбора, на основе выявления и использования знания причинно-следственных зависимостей между непосредственно наблюдаемыми фенотипическими признаками растений и их хозяйственными свойствами, являющимися целями селекции.
В разделе 1: "Постановка задачи и выбор метода ее решения" обоснованы актуальность, объект и предмет, цель и задачи исследования, приведены источники исходных данных, дана характеристика исходных данных и обоснованы требования к методу решения поставленных задач, кратко описаны традиционные методы решения, и сделан основной вывод о недостаточности традиционных подходов и целесообразности применения новых методов, а именно методов "компьютерной селекции", для решения поставленных задач.
В разделе 2: "Когнитивная структуризация, формальная постановка задач и синтез модели" обоснованы выбор метода и концепция решения задач, дано краткое описание метода системно-когнитивного анализа (СК-анализ) с учетом его применения для решения поставленных задач, раскрыты его теоретические предпосылки, описаны математическая модель, методика численных расчетов, специальный программный инструментарий (система "Эйдос"), проведены когнитивная структуризация предметной области, формальная постановка задачи и формирование обучающей выборки. В частности, разработаны классификационные и описательные шкалы и градации, а также Excel-форма для представления исходных данных; применен программный интерфейс СК-анализа для преобразования исходных данных из этой формы в базы данных системы "Эйдос"; а затем и осуществлен синтез семантической информационной модели, ее оптимизация и проверка на адекватность. По результатам второй главы сделан главный вывод о том, что сформированная модель имеет достаточно высокую адекватность для того, чтобы ее исследование считать исследованием самого объекта. Это значит, что ей корректно пользоваться для решения поставленных задач.
В разделе 3: "Исследование семантический информационной модели" решены следующие задачи: выявлены причинно-следственные зависимости между фенотипическими признаками подсолнечника и его хозяйственными свойствами; разработана методика прогнозирования хозяйственных свойств растений подсолнечника на основе анализа их фенотипических признаков; разработана методика поддержки принятия решений по отбору растений для селекции не по их хозяйственным свойствам, а на основе анализа фенотипических признаков. В третьей главе сделан вывод о том, что предложенный подход позволяет успешно решить поставленные задачи и достичь цели работы.
В разделе 4: "Эффективность применения полученного решения, его ограничения и перспективы развития" кратко описаны возможности применения предложенной технологии в научно-селекционных и образовательных организациях. Показаны ограничения разработанной технологии и перспективы ее развития. Сделан вывод об эффективности предложенной технологии и целесообразности ее применения и дальнейшего развития.
В выводах кратко перечислены полученные результаты, констатировано достижение цели работы, сформулирована научная новизна и практическая значимость проведенного исследования.
5.1. Постановка задачи и выбор метода ее решения
5.1.1. Проблема, решаемая в работе, традиционные
пути ее решения и их недостатки
При селекции методом отбора для следующих поколений отбираются лучшие по генотипу растения. Лучшим считается генотип, детерминирующий наилучшие по заданным критериям хозяйственные свойства растений.
Однако исследования на уровне генома, дающие информацию о том, какие конкретно гены и их сочетания детерминируют заданные целевые хозяйственные свойства, весьма дороги, трудоемки, требуют очень высокого уровня квалификации исследователей, значительного времени и первоклассного оборудования. Все это делает весьма проблематичным и даже практически невозможным отбор конкретных растений для следующих селекционных поколений путем анализа их генома и сравнения его с оптимальным.
Поэтому традиционным является отбор растений по их целевым хозяйственным свойствам. В случае подсолнечника, это его морозостойкость, вес семян с одного растения и с гектара, выход масла с единицы веса семян и с гектара посевов подсолнечника. Однако и количественная оценка хозяйственных свойств конкретных растений требует специальных инструментальных измерений, например веса и выхода масла, которые сложно провести в полевых условиях.
Таким образом, проблема, решаемая в работе, состоит в разработке полевой неинструментальной экспресс-методики, обеспечивающей оценку того, обладает ли генотип данного конкретного растения заданными целевыми свойствами. При этом не должно осуществляться непосредственного исследования генотипа и не должны использоваться какие-либо специальные инструментальные измерения хозяйственных характеристик растений.
5.1.2. Идея решения проблемы
Идея решения проблемы состоит в следующем.
Генотип растения детерминирует не только его хозяйственные свойства, но и фенотипические признаки. Поэтому по фенотипическим признакам растения можно судить не только о его генотипе, но и его хозяйственных свойствах. Фенотипические же признаки устанавливаются непосредственно визуально или их оценка может потребовать простых измерений с помощью рулетки или мерного шеста.
Поэтому предлагается следующая идея: если выявить зависимости хозяйственных свойств растений от их фенотипических признаков, то можно косвенно оценивать, т.е. по сути измерять, эти хозяйственные свойства по фенотипическим признакам, естественно, с определенной степенью надежности, которую необходимо контролировать.
Правда необходимо отметить, что на фенотипические признаки, кроме генотипа растения, оказывают влияние также и внешние для растения факторы. Эти внешние факторы можно разделить на две основные группы по степени их зависимости от воли человека:
1. Факторы окружающей среды (прежде всего виды почв и метеорологические факторы) практически не зависят от человека.
2. Технологические факторы, т.е. связанные с использованием различных агротехнологий (вспашка, нормы высева, способы удобрения и защиты растений, полив, освещение, севооборот, и т.д.) во многом зависят от человека.
Исследование влияния почв и метеорологических факторов на количественные и качественные результаты выращивания плодовых культур проводились И.А.Драгавцевой, Е.В.Луценко и Л.М.Лопатиной исследования [5-12, 15, 23, 68-75, 78, 84, 87]. По семечковым, в частности яблокам, подобная работа, насколько известно по литературным данным, по-видимому, впервые проведена А.М.Максимовым под научным руководством Е.В. Луценко. Влияние технологических факторов на количественные и качественные результаты выращивания зерновых колосовых изучалось О.А.Засухиной и Е.В.Луценко [27].
Способ учета влияния всех этих внешних факторов один и тот же и не отличается от способа выявления зависимостей между фенотипом и хозяйственными свойствами растений. Это означает, что технически мы могли бы исследовать все эти группы факторов в комплексе. Однако в данном исследовании учитывать мы этого делать не будем по двум основным причинам:
– первое: в процессах многолетней селекции подсолнечника морозоустойчивого сорта "Победа" в агрономических журналах не фиксировались внешние факторы;
– второе: внешние факторы выращивания не менялись в процессе селекции, т.е. выращивание осуществлялось в одной микрозоне с постоянными метеоусловиями и по одной технологии. Поэтому даже если бы эти факторы и учитывались в журналах, их влияние на хозяйственные свойства изучить не представлялось бы возможным из-за практически полного отсутствия вариабельности по этим факторам.
Поэтому в данном исследовании внешними факторами вполне корректно можно пренебречь.
5.1.3. Актуальность, объект и предмет,
цель и задачи исследования
Актуальность для науки данной работы определяется также ее научной новизной. Как уже упоминалось выше, в какой-то мере сходные исследования и разработки проводились И.А. Драгавцевой, Л.М.Лопатиной, Е.В.Луценко исследования [5-12, 15, 23, 68-75, 78, 84, 87], А.М.Максимовым, Е.В.Луценко и О.А.Засухиной, Е.В.Луценко [27]. Однако исследование взаимосвязи фенотипа и хозяйственных свойств подсолнечника, в частности для морозоустойчивого сорта "Победа", с целями совершенствования методов его компьютерной селекции, по всей видимости проведено впервые, в этом и состоит научная новизна данной работы [18, 64-67].
Актуальность для практики темы работы определяется возможностью применения ее результатов в практике работы научно-селекционных и образовательных организаций.
В научно-селекционных организациях разработанные методы компьютерной селекции позволяют существенно снизить затраты различных видов ресурсов, прежде всего времени и финансовых средств, на проведение селекционной работы методом отбора лучших по генотипу растений и использования их для формирования следующего селекционного поколения.
В учебном процессе методика разработки и решения перечисленных выше задач может быть использована для разработки полноценной лабораторной работы по дисциплине: "Интеллектуальные информационные системы", изучаемой на 5-м курсе специальности 351400 – Прикладная информатика.
Таким образом, объектом исследования является изучение взаимосвязи фенотипа и хозяйственных свойств культурных растений.
Предмет исследования состоит в изучении взаимосвязи фенотипа и хозяйственных свойств подсолнечника.
Цель исследования: выявление причинно-следственных зависимостей между фенотипом и хозяйственными свойствами подсолнечника сорта "Победа", и, на основе этого, разработка неинструментальной полевой методики прогнозирования хозяйственных свойств и поддержки принятия решений по отбору растений для следующего селекционного поколения.
5.1.4. Характеристика исходных данных и обоснование требований к методу решения поставленных задач
5.1.4.1. Источники исходных данных
Основой для выполнения данной работы являются данные, предоставленные научно-селекционной агрофирмой ООО "Эверест-Олвик", специализирующейся на селекции морозоустойчивых высокотехнологичных сортов подсолнечника, прежде всего совершенствовании сорта "Победа".
Агрофирму ООО "Эверест-Олвик" создал и уже более 13 лет бессменно возглавляет известный ученый, продолжатель дела академика В.С.Пустовойта, ученик академика И.А. Рапопорта, заслуженный деятель науки Кубани, профессор, доктор сельскохозяйственных наук Ашот Андраникович Калайджян – автор 225 научных работ, 3-х монографий и двух новых сортов подсолнечника Салют и Победа. Сегодня возглавляемая им агрофирма – одно из ведущих хозяйств России по выведению новых сортов подсолнечника.
5.1.4.2. Характеристика исходных данных
Первичная форма существования исходных данных – это полевые журналы агрономов-селекционеров, в которых они на протяжении 25 лет проведения селекционной работы по сорту "Победа" фиксировали регенеративные (хозяйственные) и вегетативные (фенотипические) характеристики растений на различных делянках. Для исследования в данной работе выбраны данные за 10 лет: с 1994 по 2003 годы, по 100 делянок на каждый год. Анализ этих данных показывает, что они отражают не все возможные сочетания значений признаков.
5.1.5. Выводы
Традиционные методы обработки имеющихся исходных данных не обеспечивают решение поставленных задач и необходимо использование нового подхода, обеспечивающего выявление зависимостей между хозяйственными свойствами растений подсолнечника и их фенотипическими признаками при неполных (фрагментированных) данных.
5.2. Когнитивная структуризация, формальная
постановка задачи и синтез модели
5.2.1. Обоснование выбора метода
и концепция решения задачи
5.2.1.1. Традиционные методы решения и их недостатки
Традиционные статистические модели требуют информации о результатах действия всех сочетаний исследуемых факторов ("повторности"). В исследуемой предметной области это требование на практике сложно достижимо.
Необходимо особо подчеркнуть, что восполнить отсутствующие данные из опыта не представляется возможным, т.к. объект исследования принципиально не допускает повторение условий прошедших периодов с заданными сочетаниями факторов, которые не зависят от воли человека. Восполнение данных путем интерполяции также некорректно, т.к. в каждой строке и столбце корреляционной матрицы имеется более одного пропуска.
Кроме того, статистические модели очень сложно содержательно интерпретировать, для чего требуются большой труд квалифицированных аналитиков.
Таким образом, можно сделать вывод, что для моделирования такого сложного и малоисследованного объекта, каким является подсолнечник в процессе селекции, применение традиционных математических моделей является проблематичным.
5.2.1.2. Выбор метода системно-когнитивного анализа
По-видимому, решение поставленных задач может быть получено путем применения системно-когнитивного анализа (СК-анализ) [27], – нового перспективного математического метода системного анализа, основанного на теории информации, системном анализе и когнитивном моделировании.
Метод является непараметрическим, позволяет сопоставимо обрабатывать тысячи градаций факторов и будущих состояний объекта управления при неполных (фрагментированных), зашумленных данных различной природы.
Для метода СК-анализа разработаны и методика численных расчетов, и соответствующий программный инструментарий, а также технология и методика их применения. Они прошли успешную апробацию при решении ряда задач в различных предметных областях [27].
Наличие инструментария СК-анализа позволяет не только осуществить синтез семантической информационной модели (СИМ), но и периодически поводить адаптацию и синтез ее новых версий, обеспечивая тем самым отслеживание динамики предметной области и сохраняя высокую адекватность модели в изменяющихся условиях.
В работах [27, 35, 36] приведен перечень этапов системно-когнитивного анализа, которые необходимо выполнить, чтобы осуществить синтез модели и исследование модели объекта управления:
1. Когнитивная структуризация, а затем и формализация предметной области.
2. Ввод данных мониторинга в базу прецедентов за период, в течение которого имеется необходимая информация в электронной форме.
3. Синтез семантической информационной модели (СИМ).
4. Оптимизация СИМ.
5. Проверка адекватности СИМ (измерение внутренней и внешней, дифференциальной и интегральной валидности).
6. Анализ СИМ.
7. Решение задач идентификации состояний объекта управления, прогнозирование и поддержка принятия управленческих решений по управлению с применением СИМ.
Важной особенностью СК-анализе является возможность единообразной числовой обработки разнотипных числовых и нечисловых данных. Это обеспечивается тем, что нечисловым величинам тем же методом, что и числовым, приписываются сопоставимые в пространстве и времени, а также между собой, количественные значения, позволяющие обрабатывать их как числовые:
– на первых двух этапах СК-анализа числовые величины сводятся к интервальным оценкам, как и информация об объектах нечисловой природы (фактах, событиях) (этот этап реализуется и в методах интервальной статистики);
– на третьем этапе СК-анализа всем этим величинам по единой методике, основанной на системном обобщении семантической теории информации А.Харкевича, сопоставляются количественные величины, с которыми в дальнейшем и производятся все операции моделирования (этот этап является уникальным для СК-анализа).
Учитывая эти этапы СК-анализа выполним декомпозицию цели работы в ряд задач, решение которых обеспечит ее поэтапное достижение:
1. Когнитивная структуризация предметной области и формальная постановка задачи, проектирование структуры и состава исходных данных.
2. Получение исходных данных запланированного состава в той форме, в которой они накапливаются в поставляющей их организации (журналы).
3. Разработка Excel-формы для представления исходных данных.
4. Преобразование исходных данных в Excel-форму.
5. Контроль достоверности исходных данных и исправление ошибок.
6. Использование программного интерфейса для преобразования исходных данных из стандартной формы по фенофазам в базы данных, используемые в инструментарии системно-когнитивного анализа (СК-анализ) – когнитивной аналитической системе "Эйдос" (система "Эйдос").
7. Синтез семантической информационной модели (СИМ).
8. Оптимизация СИМ.
9. Измерение адекватности СИМ.
10. Задача 1: выявление причинно-следственных зависимостей между фенотипическими признаками подсолнечника и его хозяйственными свойствами;
11. Задача 2: разработка методики прогнозирования хозяйственных свойств растений подсолнечника на основе анализа их фенотипических признаков;
12. Задача 3: разработка методики поддержки принятия решений по отбору растений для селекции не по их хозяйственным свойствам, а на основе анализа фенотипических признаков.
13. Разработка принципов оценки экономической эффективности разработанных технологий при их применении:
– в научно-селекционных организациях;
– в образовательных учреждениях.
14. Исследование ограничений разработанной технологии и перспектив ее развития.
5.2.2. Когнитивная структуризация предметной области,
формальная постановка задачи
и формирование обучающей выборки
Рассмотрим подробнее пути реализации первого этапа СК-анализа. На этом этапе:
– конкретно определяются факторы и будущие состояния объекта управления;
– измеряется область изменения числовых значений факторов и интервалы (диапазоны), а также макропараметров, определяющих состояния объекта управления;
– конструируются классификационные и описательные шкалы и градации и их кодирование;
– исходные данные кодируются в системе классификационных и описательных шкал и градаций, и формируется обучающая выборка (база прецедентов, содержащая в формализованный опыт управления перерабатывающим комплексом региона за ряд лет).
5.2.2.1. Когнитивная структуризация предметной области и формальная постановка задачи, проектирование структуры и состава исходных данных
5.2.2.1.1. Когнитивная структуризация предметной области
Под когнитивной структуризацией в общем случае понимается определение будущих, как желательных (целевых), так и нежелательных состояний объекта исследования и управления, а также системы факторов, детерминирующих эти состояния. В общем случае, как факторы могут рассматриваться и факторы окружающей среды, и технологические факторы, и параметры объекта исследования на низких уровнях ее иерархической структурно-функциональной организации.
В данном исследовании как будущие состояния объекта рассматриваются хозяйственные свойства, а как факторы – фенотипические признаки. Поэтому под когнитивной структуризацией в данной работе понимается определение хозяйственных свойств, как желательных (целевых), так и нежелательных, а также системы фенотипических признаков, связанных с этими хозяйственными свойствами.
Предлагаем для исследования в модели следующие состояния объекта исследования (классы) (таблица 39) и детерминирующие их факторы (признаки) (таблица 40).
Таблица 39 – КЛАССИФИКАЦИОННЫЕ ШКАЛЫ
Код
Наименование класса
1
Год
2
Урожайность (г.)
3
Сборы масла (г.)
4
Средняя масличность (%)
5
Натура (г/л)
Таблица 40 – ОПИСАТЕЛЬНЫЕ ШКАЛЫ (ФАКТОРЫ)
Код
Наименование класса
1
Вес семян с 1 корзины (г.)
2
Время посева
3
Высота растения (см.)
4
Облиственность (шт.)
5
Диаметр корзины (см.)
5.2.2.1.2. Формализация предметной области
Формализация предметной области осуществляется на основеее когнитивной структуризации, проведенной в предыдущем разделе.
Формализация предметной области – это конструирование классификационных (таблица 41) и описательных шкал и градаций (таблицы 42), как правило, порядкового типа с использованием интервальных оценок, в системе которых предметная область описывается в форме, пригодной для обработки на компьютере с использованием математических моделей, т.е. шкалы и градации представляются в закодированной форме. [27].
Таблица 41 – КЛАССИФИКАЦИОННЫЕ ШКАЛЫ
И ГРАДАЦИИ (КЛАССЫ)
Код
Наименование класса
Код
Наименование класса
1
Год
3
Сборы масла (г.)
1
1994
17
менее 200
2
1995
18
[ 200, 250)
3
1996
19
[ 250, 300)
4
1997
20
[300, 350)
5
1998
21
[350, 400)
6
1999
22
400 и более
7
2000
4
Средняя масличность(%)
8
2001
23
менее 50
9
2002
24
[ 50, 51)
10
2003
25
51, 52
2
Урожайность (г.)
26
52, 53
11
менее 400
27
53, 54
12
[400, 500)
28
54 и более
13
[500, 600)
5
Натура (г/л)
14
[600, 700)
29
менее 420
15
[700, 800)
30
420, 430
16
800 и более
31
430, 440
32
440, 450
33
450, 460
34
460, 470
35
470 и более
Таблица 42 – ОПИСАТЕЛЬНЫЕ ШКАЛЫ И ГРАДАЦИИ (ФАКТОРЫ)
==================================================
| Код | Н а и м е н о в а н и я |
| призн| шкал и градаций признаков |
|================================================|
|[ 1]| ВЕС СЕМЯН С 1 КОРЗИНЫ (Г) |
| 1 | менее 60 |
| 2 | [60, 70) |
| 3 | [70, 80) |
| 4 | [80, 90) |
| 5 | [90, 100) |
| 6 | 100 и более |
|~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~|
|[ 2]| ВРЕМЯ ПОСЕВА |
| 7 | ПОЗДНЕЗИМНИЙ (ДЕКАБРЬ) |
| 8 | РАННЕВЕСЕННИЙ(ФЕВРАЛЬ) |
| 9 | ОПТИМАЛЬНЫЙ |
|~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~|
|[ 3]| ВЫСОТА РАСТЕНИЯ (см.) |
| 10 | менее 50 |
| 11 | [50, 80) |
| 12 | [80, 110) |
| 13 | [110, 140) |
| 14 | [140, 170) |
| 15 | [170, 200) |
| 16 | 200 и более |
|~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~|
|[ 4]| ОБЛИСТВЕННОСТЬ (шт.) |
| 17 | менее 30 |
| 18 | 30 |
| 19 | 31 |
| 20 | 32 |
| 21 | 33 |
| 22 | 34 |
| 23 | 35 |
| 24 | 35 и более |
|~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~|
|[ 5]| ДИАМЕТР КОРЗИНЫ (см.) |
| 25 | менее 19 |
| 26 | 19 |
| 27 | 20 |
| 28 | 21 |
| 29 | 22 |
| 30 | 23 |
| 31 | 24 |
| 32 | 24 и более |
==================================================
В соответствии с методом СК-анализа каждый числовой фактор, независимо от его смысла и единиц измерения, рассматривается как переменная числовая величина, принимающая определенное множество значений. Подобные величины формализуются путем сведения к интервальным значениям, т.е. путем введения некоторого количества диапазонов, охватывающих все множество значений фактора, и установления фактов попадания конкретного значения величины в определенный диапазон.
Для каждого фактора устанавливаются свои границы диапазонов, исходя из их количества и множества значений величины фактора.
Количество диапазонов может быть различным для разных факторов, но на практике удобнее выбирать их одинаковым. Каковы же соображения, из которых исходят при выборе количества диапазонов? Чем больше диапазонов, тем точнее интервальные оценки. Однако это так только тогда, когда, по крайней мере, для большинства диапазонов наблюдаются факты попадания значений факторов в них. Очевидно, для этого необходимо достаточно большое количество данных. Если же их нет, то многие диапазоны могут оказаться пустыми и модель приближается к детерминистскому типу. Тогда имеет смысл уменьшить их количество и тем самым укрупнить их.
Из этих рассуждений следует вывод о том, что при большом количестве данных оправданно увеличивать количество диапазонов и имеется возможность повысить точность исследования. Когда же данных недостаточно, приходится укрупнять диапазоны, что приводит к некоторой потере точности выводов, но делает их более обоснованными статистически. По-видимому, это утверждение можно считать одной из форм теоремы Котельникова об отсчетах.
СК-анализ предусматривает также возможность использования вторичных показателей, являющихся различными функциями первичных показателей. Но этот подход требует данных большего объема и за больший период времени и, поэтому, в данном исследовании применяться не будет.
Основываясь на этих соображениях нами, прежде всего, было определено количество диапазонов значений для каждого фактора.
Затем были определены границы каждого диапазона. Для этого:
– для каждого фактора были определены минимальное и максимальное значения;
– весь интервал значений был разделен на несколько равных частей, в общем случае разное для различных факторов. Равенство интервалов в каждой из шкал означает, что фактически эти шкалы являются не порядковыми, как выглядит на первый взгляд, а шкалами отношений.
5.2.2.2. Получение исходных данных запланированного состава в той форме, в которой они накапливаются в поставляющей их организации (журналы)
В научно-селекционной агрофирмой ООО "Эверест-Олвик" организован и ведется систематический сбор и учет данных, необходимых для селекции подсолнечника. Основной объем этой информации составляли журналы агрономов. Эта информация по выбранным для обработки показателям была любезно предоставлена для выполнения данной работы.
5.2.2.3. Разработка электронной формы для представления исходных данных
Для ввода исходных данных непосредственно из журналов агрономов была разработана Excel-таблица, фрагмент которой приводится ниже (таблица 43).
Каждая строка таблицы содержит закодированные данные по одной делянке за определенный год: 1-й столбец – порядковый номер, 2-й – год и номер делянки, столбцы с 3-го по 7-й – коды классов согласно таблице 43, а столбцы с 8-го по 12-й – коды значений факторов, всего 1000 строк за период с 1994 по 2003 годы, по 100 делянок за год. Полностью таблица с обучающей выборкой в данной работе не приводится из-за ее большого объема.
5.2.2.4. Преобразование исходных данных в электронную форму
Этот этап работ представляет собой кодирование с использованием таблиц 41, 42 и ввод исходных данных из бумажных журналов агрономов в электронную Excel-таблицу (таблица 43) и осуществлялся на компьютере вручную.
5.2.2.5. Контроль достоверности исходных данных и исправление ошибок
После ввода исходных данных в Excel-таблицу, который осуществлялся вручную, была осуществлена выборочная проверка, которая показала правильность кодирования и ввода исходной информации.
5.2.2.6. Импорт исходных данных из входной электронной формы в базы данных системы "Эйдос"
Для этой цели использовалась специально разработанная программа, исходный текст и алгоритм которой приведены ниже (рисунок 55).
ИСХОДНЫЙ ТЕКСТ ПРОГРАММНОГО ИНТЕРФЕЙСА
* ВВОД ОБУЧАЮЩЕЙ ВЫБОРКИ В СИСТЕМУ "ЭЙДОС" ИЗ ФАЙЛА INP_12.DBF
scr23 = SAVESCREEN(0,0,24,79)
SET CURSOR OFF
SET DATE ITALIAN
SET DECIMALS TO 15
SET ESCAPE On
FOR J=0 TO 24
@J,0 SAY REPLICATE(" ",80) COLOR "rg+/N"
NEXT
SHOWTIME(0,60,.F.,"rg+/n",.F.,.F.)
Mess3 = " === ГЕНЕРАЦИЯ СЛУЧАЙНОЙ ОБУЧАЮЩЕЙ ВЫБОРКИ === "
@6,40-LEN(Mess3)/2 SAY Mess3 COLOR "rg+/rb"
USE Inp_12 EXCLUSIVE NEW
USE ObInfZag EXCLUSIVE NEW;ZAP
USE ObInfKpr EXCLUSIVE NEW;ZAP
SELECT Inp_12
N_Rec = RECCOUNT()
x = 0
DBGOTOP()
@24,0 SAY REPLICATE("█",80) COLOR "rb/n"
DO WHILE .NOT. EOF()
****** Генерация массива кодов классов и признаков БД Inp_12.dbf
SELECT Inp_12
Ak := {}
FOR j=1 TO 12
AADD(Ak,FIELDGET(j))
NEXT
****** Запись массива кодов признаков в БД ObInfZag
SELECT ObInfZag
APPEND BLANK
FOR j=1 TO 7
FIELDPUT(j,Ak[j])
NEXT
****** Запись массива кодов признаков в БД ObInfKpr
SELECT ObInfKpr
APPEND BLANK
FIELDPUT(1,Ak[1])
FOR j=8 TO 12
FIELDPUT(j-6,Ak[j])
NEXT
p=++x/N_Rec*100;p=IF(p<=100,p,100)
@24,0 SAY STR(p,3)+"%" COLOR "w+/r+"
@24,4 SAY REPLICATE("█",0.76*p) COLOR "rb+/n"
SELECT Inp_12
DBSKIP(1)
ENDDO
Mess4 = " === ПЕРЕИНДЕКСАЦИЯ === "
@8,40-LEN(Mess4)/2 SAY Mess4 COLOR "rg+/rb"
CLOSE ALL
USE ObInfZag EXCLUSIVE NEW
INDEX ON STR(Kod_Ist,5) TO Oiza_ist
INDEX ON Name_ist TO Oiza_nis
INDEX ON STR(Obj_1,4) TO Oiza_obj
INDEX ON DTOS(Date_ank) TO Oiza_dat
INDEX ON Time_edit TO Oiza_tim
INDEX ON STR(Kod_Old,5) TO Oiza_old
CLOSE ALL
USE ObInfKpr EXCLUSIVE NEW
INDEX ON STR(Kod_Ist,5) TO OIkpr_is
CLOSE ALL
Mess = " ПРОЦЕСС ГЕНЕРАЦИИ ЗАВЕРШЕН УСПЕШНО !!! "
@14,40-LEN(Mess)/2 SAY Mess COLOR "rg+/rb"
INKEY(0)
RESTSCREEN(0,0,24,79,scr23)
CLOSE ALL
QUIT
Рисунок 55. Алгоритм программного интерфейса импорта исходных данных из входной Excel-формы в базы данных системы "Эйдос"
Приведенный программный интерфейс обеспечивает автоматический ввод обучающей выборки из Excel-файла с входной информацией в соответствующие базы данных системы "Эйдос".
5.2.3. Синтез семантической информационной модели, ее оптимизация и проверка на адекватность
5.2.3.1. Синтез семантической информационной модели (СИМ)
Синтез семантической информационной модели (СИМ) осуществляется в 5-м режиме 2-й подсистемы системы "Эйдос" (рисунок 56).
Рисунок 56. Синтез семантической информационной модели
5.2.3.2. Оптимизация СИМ
Оптимизация семантической информационной модели состоит в исключении из нее факторов, не оказывающих существенного влияния на получение тех или иных результатов выращивания исследуемых сельхозкультур. Рассмотрим график, приведенный на рисунке 57.
Рисунок 57. Паретто-кривая "Сила влияния различных градаций факторов на получение различных результатов выращивания "нарастающим итогом"
Из рисунка 57 видно, что в созданной модели практически нет несущественных факторов, поэтому в данном случае оптимизации модели не требуется. В общем случае в результате оптимизации модели резко сокращается ее размерность и резко сокращается время решения задач и объем используемой для баз данных и индексных массивов внешней памяти.
5.2.3.3. Измерение адекватности СИМ
Измерение адекватности СИМ состоит в измерении внутренней и внешней, дифференциальной и интегральной валидности.
5.2.3.3.1. Внутренняя дифференциальная и интегральная валидность
Под внутренней валидностью понимается способность модели верно идентифицировать объекты, входящие в обучающую выборку.
Для измерения адекватности модели необходимо выполнить следующие действия:
1. Скопировать обучающую выборку в распознаваемую (во 1-м режиме 2-й подсистемы нажав клавишу F5).
2. Выполнить пакетное распознавание (во 2-м режиме 4-й подсистемы, задав 1-й критерий сходства) (рисунок 58).
3. Измерить адекватность модели (во 2-м режиме 6-й подсистемы) (рисунки 59 и 60).
Рисунок 58. Выход на режим пакетного распознавания
Рисунок 59. Выход на режим измерения адекватности модели
системы "Эйдос"
Рисунок 60. Экранная форма управления измерением адекватности модели и отображения результатов
Эта форма может прокучиваться вниз-вверх и вправо-влево. В верхней части формы приведены показатели интегральной валидности (средневзвешенные по всей обучающей выборке), а в самой таблице – дифференциальной валидности, т.е. в разрезе по классам.
Кроме того, результаты измерения адекватности модели выводятся в форме файлов с именами ValidSys.txt (таблица 44) и ValAnkSt.txt (рисунок 61) стандарта "TXT-текст DOS" в поддиректории TXT.
Таблица 44 – ИЗМЕРЕНИЕ АДЕКВАТНОСТИ
СЕМАНТИЧЕСКОЙ ИНФОРМАЦИОННОЙ МОДЕЛИ
Рисунок 61. Фрагмент выходной формы ValAnkSt.txt с результатами измерения адекватности модели и отображения результатов
В данной форме приведены коды анкет распознаваемой выборки, которые были верно отнесены моделью к классу 14.
Форма, приведенная в таблице 44, рассчитывается как средневзвешенная на основе карточек прогнозирования, представленных на рисунке 62.
Рисунок 62. Пример карточки прогнозирования хозяйственных свойств подсолнечника с делянки 1310.1 в 1994 году
При этом результаты измерения валидности СИМ зависят от количества классов из карточек распознавания, засчитываемых как верно идентифицированные. График эмпирической зависимости валидности СИМ от этого параметра приведен на рисунке 63.
Рисунок 63. Эмпирическая зависимость валидности СИМ
от количества классов из карточек распознавания,
засчитываемых как верно идентифицированные
"Факторные портреты" тех лет, в которые был получен данный конкретный количественный и качественный результат выращивания данного сорта (рисунок 64), обобщены системой, в результате чего сформирован обобщенный информационный портрет системы факторов, действие которых приводит к данному результату (рисунок 65). Это позволяет решать задачи, связанные с типизацией лет.
Рисунок 64. Пример карточки прогнозирования конкретного
результата выращивания (урожайность 800 и более) подсолнечника
за 10 лет (с 1993 по 2003)
Рисунок 65. Фрагмент информационного портрета класса 16
(конкретного результата выращивания)
5.2.3.3.2. Внешняя дифференциальная и интегральная валидность
Под внешней валидностью понимается способность модели верно идентифицировать объекты, не входящие в обучающую выборку, но относящиеся к генеральной совокупности, по отношению к которой она репрезентативна.
Для измерения внешней валидности необходимо выполнить следующие действия:
1. В режиме измерения адекватности модели запустить режим измерения внешней валидности (нажав F8 Измерение внешней валидности) (рисунок 60).
2. Выбрать один из режимов удаления объектов обучающей выборки, приведенный на экранной форме (рисунок 66).
Рисунок 66. Режим переноса анкет обучающей выборки
в распознаваемую для измерения внешней валидности
Частотное распределение объектов обучающей выборки по классам приведено на рисунке 67 и в таблице 45. Видно, что оно довольно равномерное, т.е. все классы достаточно хорошо представлены. Это значит, что имеет смысл измерение внешней валидности.
Рисунок 67. Частотное распределение
объектов обучающей выборки по классам
Таблица 45 – ЧАСТОТНОЕ РАСПРЕДЕЛЕНИЕ
ОБЪЕКТОВ ОБУЧАЮЩЕЙ ВЫБОРКИ ПО КЛАССАМ
Код
Наименование
Кол-во
Кол-во %
Инф-ть
1
ГОД - 1994
100
10,000
0,21709
2
ГОД - 1995
100
10,000
0,15611
3
ГОД - 1996
100
10,000
0,11928
4
ГОД - 1997
100
10,000
0,12336
5
ГОД - 1998
100
10,000
0,15446
6
ГОД - 1999
100
10,000
0,11498
7
ГОД - 2000
100
10,000
0,14163
8
ГОД - 2001
100
10,000
0,11471
9
ГОД - 2002
100
10,000
0,12852
10
ГОД - 2003
100
10,000
0,09828
11
УРОЖАЙНОСТЬ - менее 400
144
14,400
0,10584
12
УРОЖАЙНОСТЬ - [400, 500)
165
16,500
0,09277
13
УРОЖАЙНОСТЬ - [500, 600)
164
16,400
0,08142
14
УРОЖАЙНОСТЬ - [600, 700)
195
19,500
0,07623
15
УРОЖАЙНОСТЬ - [700, 800)
173
17,300
0,09256
16
УРОЖАЙНОСТЬ - 800 и более
159
15,900
0,09289
17
СБОРЫ МАСЛА - менее 200
168
16,800
0,09061
18
СБОРЫ МАСЛА - [200, 250)
171
17,100
0,07981
19
СБОРЫ МАСЛА - [250, 300)
158
15,800
0,08938
20
СБОРЫ МАСЛА - [300, 350)
191
19,100
0,08988
21
СБОРЫ МАСЛА - [350, 400)
154
15,400
0,08020
22
СБОРЫ МАСЛА - 400 и более
158
15,800
0,09388
23
СРЕДНЯЯ МАСЛИЧНОСТЬ - менее 50
173
17,300
0,08743
24
СРЕДНЯЯ МАСЛИЧНОСТЬ - [50, 51)
168
16,800
0,07098
Код
Наименование
Кол-во
Кол-во %
Инф-ть
25
СРЕДНЯЯ МАСЛИЧНОСТЬ - [51, 52)
163
16,300
0,09256
26
СРЕДНЯЯ МАСЛИЧНОСТЬ - [52, 53)
146
14,600
0,07171
27
СРЕДНЯЯ МАСЛИЧНОСТЬ - [53, 54)
166
16,600
0,10816
28
СРЕДНЯЯ МАСЛИЧНОСТЬ - 54 и более
184
18,400
0,07438
29
НАТУРА - менее 420
150
15,000
0,06586
30
НАТУРА - [420, 430)
136
13,600
0,09865
31
НАТУРА - [430, 440)
159
15,900
0,10580
32
НАТУРА - [440, 450)
132
13,200
0,10289
33
НАТУРА - [450, 460)
152
15,200
0,10755
34
НАТУРА - [460, 470)
135
13,500
0,06422
35
НАТУРА - 470 и более
136
13,600
0,07615
Результаты измерения внешней валидности приведены в таблице 46. При этом в качестве обучающей выборки использовались нечетные анкеты, а в качестве распознаваемой – четные (один из вариантов бутстрепного метода).
Таблица 46 – РЕЗУЛЬТАТЫ ИЗМЕРЕНИЯ ВНЕШНЕЙ ВАЛИДНОСТИ
Из таблицы 46 видно, что вероятность верной идентификации объектов, отсутствующих в обучающей выборке, с использованием созданной модели, составляет около 51%, тогда как вероятность их случайной верной идентификации не превышает 3% (при условии примерно равномерного распределения объектов по классам, что, как мы видели выше в рисунке 67 и таблице 45, недалеко от истины). Это означает, что использование семантической информационной модели в среднем примерно в 18 раз повышает достоверность прогнозирования хозяйственных свойств подсолнечника по сравнению со случайным угадыванием. Этим и обосновывается целесообразность применения данного подхода.
5.2.4. Выводы
Измерение как внутренней, так и внешней валидности семантической информационной модели объекта исследования показало ее высокую степень адекватности. Это означает, что вполне корректно считать исследование модели объекта изучением самого объекта.
5.3. Исследование семантический
информационной модели
Исследование семантической информационной модели включает решение поставленных в работе задач, а также кластерно-конструктивный и системно-когнитивный анализ модели.
5.3.1. Задача 1: выявление причинно-следственных зависимостей между фенотипическими признаками подсолнечника и его хозяйственными свойствами
Решению 1-й задачи посвящена 2-я глава данной работы. Поэтому в данном разделе ограничимся тем, что отобразим результаты выявления этих причинно-следственных зависимостей между градациями описательных и классификационных шкал. Мерой причинно-следственных зависимостей является количество информации, которое содержится в факте действия определенного значения фактора о том, что растение подсолнечника будет иметь определенное потребительское свойство. Значение информативности может быть по модулю различной величины и положительным и отрицательным по знаку, что означает, соответственно, величину и направление влияния данного значения фактора на данное потребительское свойство.
В полном виде все зависимости содержаться в матрице информативностей, приведенной в таблице 47. Вертикальная шапка таблицы 47 содержит градации описательных шкал (таблица 42), а горизонтальная шапка – градации классификационных шкал (таблица 41).
Таблица 47 – КОЛИЧЕСТВЕННАЯ ОЦЕНКА СИЛЫ И НАПРАВЛЕНИЯ ПРИЧИННО-СЛЕДСТВЕННЫХ СВЯЗЕЙ МЕЖДУ ФЕНОТИПИЧЕСКИМИ И ХОЗЯЙСТВЕННЫМИ СВОЙСТВАМИ ПОДСОЛНЕЧНИКА (Бит 100)
5.3.2. Задача 2: разработка методики прогнозирования хозяйственных свойств растений подсолнечника на основе анализа их фенотипических признаков
Данная задача решается на основе задачи 1. Суть методики прогнозирования состоит в следующем. Из таблицы 47 известно, какое количество информации содержится в определенном фенотипическом признаке конкретного растения подсолнечника о том, что данное растение будет обладать каждым из исследованных в модели хозяйственных свойств. Если о растении известно, что оно обладает определенным набором фенотипических признаков, то естественно считать, что оно будет обладать теми хозяйственными свойствами, о которых в данном наборе содержится наибольшее количество информации. Данный интегральный критерий предложен и обоснован в [76].
Исходные данные для прогнозирования вводятся в 1-м режиме 4-й подсистемы системы "Эйдос" в форме распознаваемой выборки, само прогнозирование осуществляется во 2-м режиме этой же подсистемы, а результаты в выводятся в 3-м режиме в двух разрезах:
– один объект – много классов;
– один класс – много объектов.
Результаты прогнозирования выводятся системой в обобщенной форме, каждая строка которой соответствует классу, с которым данный объект имеет наиболее сходство, и в детализированной форме карточек прогнозирования (распознавания). Примеры этих карточек приведены на рисунке 68.
Карточка разделена на две части. В верхней части приведены классы, с которыми данный объект имеет наивысшее сходство в порядке его убывания, а в нижней – классы, от которых данный объект максимально отличается. Задача идентификации может решаться в поле с использованием ноутбука, на котором установлена система "Эйдос".
5.3.3. Задача 3: разработка методики поддержки принятия решений по отбору растений для селекции не по их хозяйственным свойствам, а на основе анализа фенотипических признаков
Задача принятия решений является обратной по отношению к задаче прогнозирования. Если при прогнозировании мы по фенотипическим признакам определяем возможные хозяйственные свойства, то при принятии решений наоборот, по заданным хозяйственным свойствам определяем какими фенотипическим признаками должны обладать растения, имеющие эти свойства. В системе "Эйдос" эта задача решается в 1-м режиме 5-й подсистемы, который позволяет генерировать и отображать так называемые "Информационные портреты классов". Эти информационные портреты показывают систему детерминации будущих состояний объекта управления, в нашем случае – хозяйственных свойств подсолнечника. В таблицах 48-51 приведены информационные портреты наиболее желательных (целевых) хозяйственных свойств.
Таблица 48 – СИСТЕМА ДЕТЕРМИНАЦИИ
ПОТРЕБИТЕЛЬСКОГО СВОЙСТВА:
Код: 16 Наименование: УРОЖАЙНОСТЬ (г.) - 800 и более
14-01-05 02:13:22 Фильтр: All, Positive г.Краснодар
№
Код
Наименование значения фактора
Инф-ть
бит
Инф-ть
%
1
3
ВЫСОТА РАСТЕНИЯ (см.)
15
[170, 200)
0,13
2,58
2
4
ОБЛИСТВЕННОСТЬ (шт.)
23
35
0,12
2,26
3
5
ДИАМЕТР КОРЗИНЫ (см.)
30
23
0,11
2,18
4
4
ОБЛИСТВЕННОСТЬ (шт.)
22
34
0,10
1,93
5
4
ОБЛИСТВЕННОСТЬ (шт.)
21
33
0,10
1,89
6
1
ВЕС СЕМЯН С ОДНОЙ КОРЗИНЫ (г.)
1
менее 60
0,08
1,64
7
5
ДИАМЕТР КОРЗИНЫ (см.)
25
менее 19
0,08
1,55
8
1
ВЕС СЕМЯН С ОДНОЙ КОРЗИНЫ (г.)
3
[70, 80)
0,07
1,38
9
3
ВЫСОТА РАСТЕНИЯ (см.)
13
[110, 140)
0,06
1,09
№
Код
Наименование значения фактора
Инф-ть
бит
Инф-ть
%
10
5
ДИАМЕТР КОРЗИНЫ (см.)
29
22
0,03
0,55
11
5
ДИАМЕТР КОРЗИНЫ (см.)
28
21
0,03
0,53
12
2
ВРЕМЯ ПОСЕВА
8
ранневесенний (февраль)
0,03
0,49
13
2
ВРЕМЯ ПОСЕВА
29
22
-0,05
-1,00
№
Код
Наименование значения фактора
Инф-ть
бит
Инф-ть
%
24
3
ВЫСОТА РАСТЕНИЯ (см.)
16
200 и более
-0,06
-1,23
25
5
ДИАМЕТР КОРЗИНЫ (см.)
26
19
-0,07
-1,43
26
5
ДИАМЕТР КОРЗИНЫ (см.)
30
23
-0,09
-1,76
27
4
ОБЛИСТВЕННОСТЬ (шт.)
18
30
-0,11
-2,08
28
1
ВЕС СЕМЯН С ОДНОЙ КОРЗИНЫ (г.)
4
[80, 90)
-0,12
-2,25
29
4
ОБЛИСТВЕННОСТЬ (шт.)
23
35
-0,13
-2,58
30
3
ВЫСОТА РАСТЕНИЯ (см.)
10
менее 50
-0,15
-2,88
31
1
ВЕС СЕМЯН С ОДНОЙ КОРЗИНЫ (г.)
3
[70, 80)
-0,19
-3,71
32
5
ДИАМЕТР КОРЗИНЫ (см.)
27
20
-0,21
-4,01
Таблица 50 – СИСТЕМА ДЕТЕРМИНАЦИИ
ПОТРЕБИТЕЛЬСКОГО СВОЙСТВА:
Код: 28 Наименование: СРЕДНЯЯ МАСЛИЧНОСТЬ (%)-54 и более
14-01-05 02:14:07 Фильтр: All, Positive г.Краснодар
№
Код
Наименование значения фактора
Инф-ть
бит
Инф-ть
%
1
1
ВЕС СЕМЯН С ОДНОЙ КОРЗИНЫ (г.)
2
[60, 70)
0,12
2,26
2
4
ОБЛИСТВЕННОСТЬ (шт.)
19
31
0,11
2,10
3
3
ВЫСОТА РАСТЕНИЯ (см.)
13
[110, 140)
0,11
2,08
4
5
ДИАМЕТР КОРЗИНЫ (см.)
27
20
0,09
1,67
5
1
ВЕС СЕМЯН С ОДНОЙ КОРЗИНЫ (г.)
5
[90, 100)
0,07
1,37
6
5
ДИАМЕТР КОРЗИНЫ (см.)
28
21
0,07
1,29
7
4
ОБЛИСТВЕННОСТЬ (шт.)
22
34
0,05
0,90
8
1
ВЕС СЕМЯН С ОДНОЙ КОРЗИНЫ (г.)
32
более 24
-0,06
-1,21
28
5
ДИАМЕТР КОРЗИНЫ (см.)
25
менее 19
-0,06
-1,21
29
1
ВЕС СЕМЯН С ОДНОЙ КОРЗИНЫ (г.)
3
[70, 80)
-0,11
-2,11
30
1
ВЕС СЕМЯН С ОДНОЙ КОРЗИНЫ (г.)
1
менее 60
-0,13
-2,45
31
5
ДИАМЕТР КОРЗИНЫ (см.)
30
23
-0,14
-2,67
32
4
ОБЛИСТВЕННОСТЬ (шт.)
18
30
-0,22
-4,22
Таблица 51 – СИСТЕМА ДЕТЕРМИНАЦИИ
ПОТРЕБИТЕЛЬСКОГО СВОЙСТВА:
Код: 35 Наименование: НАТУРА (г/л) - 470 и более
14-01-05 02:14:20 Фильтр: All, Positive г.Краснодар
№
Код
Наименование значения фактора
Инф-ть
бит
Инф-ть
%
1
3
ВЫСОТА РАСТЕНИЯ (см.)
14
[140, 170)
0,13
2,53
2
1
ВЕС СЕМЯН С ОДНОЙ КОРЗИНЫ (г.)
3
[70, 80)
0,10
1,95
3
3
ВЫСОТА РАСТЕНИЯ (см.)
12
[80, 110)
0,09
1,78
4
5
ДИАМЕТР КОРЗИНЫ (см.)
28
21
0,09
1,65
5
4
ОБЛИСТВЕННОСТЬ (шт.)
21
33
0,07
1,32
6
4
ОБЛИСТВЕННОСТЬ (шт.)
17
менее 30
0,07
1,28
7
4
ОБЛИСТВЕННОСТЬ (шт.)
18
30
0,06
1,10
8
2
ВРЕМЯ ПОСЕВА
8
ранневесенний (февраль)
0,05
1,06
9
3
ВЫСОТА РАСТЕНИЯ (см.)
9
Оптимальный
-0,10
-1,89
30
3
ВЫСОТА РАСТЕНИЯ (см.)
10
менее 50
-0,14
-2,81
31
4
ОБЛИСТВЕННОСТЬ (шт.)
20
32
-0,15
-2,87
32
3
ВЫСОТА РАСТЕНИЯ (см.)
16
200 и более
-0,19
-3,75
Эти информационные портреты непосредственно используются при отборе растений подсолнечника для формирования следующего поколения при селекции, например, по следующему алгоритму. Выбираются растения с фенотипическими признаками, указанными в начале указанных информационных портретов и удаляются с признаками, указанными в их конце. Оставшиеся используются для формирования следующего селекционного поколения.
Аппарат СК-анализа позволяет строить функции взаимосвязи между описательными и классификационными шкалами. С учетом целей ресурсосберегающих технологий возделывания подсолнечника [76] для селекции особый интерес представляет взаимосвязь между высотой растения и его хозяйственными свойствами, прежде всего сбором масла с одного растения (рисунок 69).
Рисунок 69. Взаимосвязь между высотой растения
и сбором с него масла
Из этого графика очевидно, что оптимальной высотой растения является 110-140 см, а не 200, как считалось ранее. Объяснение причин этого явления сходно с содержательной интерпретаций взаимосвязи между количеством листьев на растении и масличностью собранных с него семян, представленная на рисунке 70.
Рисунок 70. Взаимосвязь между облиственностью
и масличностью семян
При малом количестве листьев растение не имеет необходимых ресурсов для генерации масла в семенах, при количестве листьев 30-32 наблюдается максимальная масличность, при увеличении количества листьев масличность закономерно падает, что по-видимому можно объяснить тем, что ресурсы растения переориентируются с формирования регенеративных качеств растения на увеличение его вегетативной массы. Этот эффект, наблюдаемый у подсолнечника, полностью аналогичен известному "бройлерному эффекту", известному в птицеводстве и впервые был обнаружен методом СК-анализа эмпирических данных в 1993 году О.А.Засухиной и Е.В.Луценко при исследовании интенсивных технологий возделывания зерновых колосовых [27].
Все функции влияния, отражающие взаимосвязи между всеми описательными и классификационными шкалами и градациями (во всех сочетаниях), не могут быть здесь приведены из-за их большого количества. Однако, необходимо отметить, что их содержательная интерпретация является делом ученого-селекционера и по этой причине в данной работе не рассматривается.
5.3.4. Кластерно-конструктивный
и системно-когнитивный анализ
результатов выращивания и факторов
Эти возможности обеспечиваются режимами 5-й подсистемы "Типология" (рисунок 71).
Рисунок 71. Режимы подсистемы типологического анализа
классов и факторов
Кластерный анализ классов показывает, какие качественные и количественные результаты выращивания различных сортов детерминируются (вызываются) сходными системами факторов, и могут быть получены одновременно, а какие противоположными, несовместимыми и одновременно недостижимыми. Результаты кластерного анализа классов и факторов выводятся в форме таблиц (таблицы 52 и 53) и в форме семантических сетей (рисунок 72).
В графической форме любые заданные фрагменты матрицы сходства признаков (градаций факторов) могут отображаются в виде семантических сетей (рисунки 73 и 74).
Интегральные когнитивные карты, отражающие систему детерминации целевых состояний с кодами 16, 22, 28, 35 высотой и облиственностью растений приведены на рисунках 75 и 76.
Рисунок 73. Семантическая сеть фенотипических признаков:
"Высота растения"
Рисунок 74. Семантическая сеть фенотипических признаков:
"Облиственность" и "Высота растения"
Рисунок 75. Интегральная когнитивная карта, отражающая систему детерминации целевых состояний с кодами 16, 22, 28 и 35
высотой растений
Рисунок 76. Интегральная когнитивная карта, отражающая систему детерминации целевых состояний с кодами 16, 22, 28 и 35 облиственностью растений
5.3.5. Выводы
Таким образом, можно сделать вывод о том, что предложенная семантическая модель и технология СК-анализа обеспечили решение следующих задач:
– задача 1: выявление причинно-следственных зависимостей между фенотипическими признаками подсолнечника и его хозяйственными свойствами;
– задача 2: разработка методики прогнозирования хозяйственных свойств растений подсолнечника на основе анализа их фенотипических признаков;
– задача 3: разработка методики поддержки принятия решений по отбору растений для селекции не по их хозяйственным свойствам, а на основе анализа фенотипических признаков.
Необходимо особо отметить, что "попутно" решается важнешая "задача типизации лет", т.е. разработка обобщенных образов лет сходных по количественным и качественным результатам выращивания данной культуры и сорта в данной микрозоне выращивания. На основе этой зааче может научно-обоснованно решаться задаа районирования сортов.
5.4. Эффективность применения полученного решения, его ограничения и перспективы развития
5.4.1. Применение в научно-селекционных
организациях
Применение научно-селекционными организациями технологий, подобных описанных в данной работе, позволило бы снизить затраты времени ресурсов на селекцию новых сортов подсолнечника и других культур, повысить качество новых сортов. Это дало бы соответствующий экономический эффект как текущий, связанный с сокращением сроков и других затрат на селекцию, так и долгосрочной: за счет повышения эффективности самих сортов, снижения затрат на единицу произведенной продукции.
5.4.2. Применение в образовательных учреждениях
В образовательных учреждениях, прежде всего в Кубанском государственном аграрном университете, проведенная работа может стать основой лекционного занятия и полноценной лабораторной работы по дисциплине: "Интеллектуальные информационные системы", читаемой на 5-м курсе специальности: 351400 – Прикладная информатика.
5.4.3. Ограничения разработанной технологии и перспективы ее развития
Для адекватного описания объектов управления в АПК необходимо использовать тысячи факторов различной природы (многофакторность), но на практике это сделать очень сложно.
Поэтому, в одних исследованиях учитывается влияние климатических факторов на количественные и качественные результаты выращивания сельскохозяйственных культур (агрометеорология), в других влияние агротехнологий, в третьих влияние почв, предшественников (севооборот), структуры и организации машинно-тракторного парка, финансовых и материальных потоков (логистика) и т.д., и т.д. Сами агротехнологии также включают массу различных факторов: способы вспашки; количество, виды и способы внесения удобрений; нормы высева, полива и т.д.
Однако ни одна из этих групп факторов не является определяющей в получении хозяйственного результата (слабодетерминированность). Дело усложняется тем, что исследования каждой группы факторов проводятся обычно разрозненными группами ученых, на разных кафедрах, в различных научно-исследовательских институтах. Так ученые, изучающие влияние лимитирующих климатических факторов с учетом генетического потенциала и пофазного развития сортов и культур обычно не имеют исходной информации для изучения влияния агротехнологий, и наоборот, специалисты по агротехнологиям не имеют климатических баз данных, геоинформационных технологий, и соответственно, возможности учета климатических факторов. И у первых, и у вторых возникают проблемы, связанные с нелинейным системным взаимодействием факторов, а также огромными размерностями математических моделей.
Поэтому перспективу развития направления, представленного данной работой, мы видим в разработке моделей, учитывающих кроме климатических, так же технологические и неклиматические факторы внешней среды. Например, такие как: виды и состояние почв, экологические факторы и др., а также в создании условий для применения этих моделей для решения рассмотренных задач в практике деятельности научных и производственных организаций.
5.4.4. Выводы
Таким образом, на основании вышеизложенного можно сделать вывод об эффективности предложенной технологии и целесообразности ее применения и дальнейшего совершенствования.
5.5. Выводы
Исследование посвящено решению актуальных задач компьютерной селекции подсолнечника, на основе выявления причинно-следственных зависимостей между его фенотипическими признаками и хозяйственными свойствами.
1. В связи с высокой размерностью задачи и разнородностью исходных данных показана целесообразность применения для решения поставленных задач нового метода: системно-когнитивного анализа, обоснованного теоретически и имеющего свой программный инструментарий.
2. Показано, что сформированная с помощью СК-анализа семантическая информационная модель имеет достаточно высокую адекватность для того, чтобы ее исследование считать изучением самого объекта.
3. В работе решены следующие задачи, имеющие научное и практическое значение:
– задача 1: выявление причинно-следственных зависимостей между фенотипическими признаками подсолнечника и его хозяйственными свойствами;
– задача 2: разработка методики прогнозирования хозяйственных свойств растений подсолнечника на основе анализа их фенотипических признаков;
– задача 3: разработка методики поддержки принятия решений по отбору растений для селекции не по их хозяйственным свойствам, а на основе анализа фенотипических признаков.
4. Таким образом, предложенный подход позволяет успешно решить поставленные задачи и достичь цели работы.
5. Предложенная технология эффективна и целесообразно ее применения и дальнейшее развитие.
6. Научная новизна проведенного исследования состоит в том, что впервые методология, технология и инструментарий системно-когнитивного анализа применены для решения задач компьютерной селекции подсолнечника.
7. Практическая значимость исследования состоит в возможности и целесообразности применения полученных результатов и технологий в практике работы научно-селекционных организаций, а также в учебном процессе на факультете прикладной информатики в Кубанском государственном аграрном университете.
ЗАКЛЮЧЕНИЕ
Приведенные примеры постановки и решения задач управления продуктивностью сельхозкультур и качеством продукции позволяют сделать обобщающий вывод об эффективности и целесообразности применения системно-когнитивного анализа для решения подобных задач непосредственно в практике управления в АПК на уровне агротехнологии.
Конечно, рассмотренные в монографии варианты далеко не исчерпывают возможности применения семантических информационных моделей для управления в АПК. Например, в 2004 году были разработаны подходы к созданию АСУ рисовыми оросительными системами [95-98].
Все критические замечания и пожелания по поводу данной монографии будут с благодарностью приняты.
КРАТКИЙ ТОЛКОВЫЙ СЛОВАРЬ ТЕРМИНОВ
ПО СИСТЕМНО-КОГНИТИВНОМУ АНАЛИЗУ
И СИСТЕМАМ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА
В данном небольшом толковом словаре по терминам СИИ мы ни в коей мере не претендуем на его полноту и исчерпывающий характер (да это и вряд ли возможно) и приводим лишь определения тех терминов, которые введены авторами данной монографии, а также тех, у которых авторами изменены или модифицированы формулировки.
Принятие решения есть действие над множеством альтернатив, в результате которого исходное множество альтернатив сужается. Это действие называется "выбор".
Экспертная система (ЭС) – это программа, которая в определенных отношениях заменяет эксперта или группу экспертов в той или иной предметной области.
Клавиатурный почерк – система индивидуальных особенностей начертаний и динамики воспроизведения букв, слов и предложений на клавиатуре.
Система, оснащенная интеллектуальным интерфейсом – это система, способная вести себя по-разному в зависимости от результатов идентификации пользователя, его профессионального уровня и текущего психофизиологического состояния.
Аутентификация – это проверка, действительно ли пользователь является тем, за кого себя выдает. При этом пользователь должен предварительно сообщить о себе идентификационную информацию: свое имя и пароль, соответствующий названному имени.
Идентификация – это установление его личности.
Почерк – это система индивидуальных особенностей начертания и динамики воспроизведения букв, слов и предложений вручную различными людьми или на различных устройствах печати.
Система с биологической обратной связью (БОС) – это система, поведение которой зависит от психофизиологического (биологического) состояния пользователя.
Система с семантическим резонансом – это система, поведение которой зависит от состояния сознания пользователя и его психологической реакции на смысловые стимулы, в т.ч. неосознаваемые.
Виртуальная реальность (ВР) – модельная трехмерная (3D) окружающая среда, создаваемая компьютерными средствами и реалистично реагирующая на взаимодействие с пользователями.
Эффект присутствия – это создаваемая для пользователя иллюзия его присутствия в смоделированной компьютером среде, при этом создается полное впечатление "присутствия" в виртуальной среде, очень сходное с ощущением присутствия в обычном "реальном" мире.
Система виртуальной реальности (ВР) – это система, обеспечивающая:
– генерацию полиперцептивной модели реальности в соответствии с математической моделью этой реальности, реализованной в программной системе;
– погружение пользователя в модель реальности путем подачи на все или основные его перцептивные каналы – органы восприятия, программно-управляемых по величине и содержанию воздействий: зрительного, слухового, тактильного, термического, вкусового и обонятельного и других;
– управление системой путем использования виртуального "образа Я" пользователя и виртуальных органов управления системой (интерфейса), на которые он воздействует, представляющие собой зависящую от пользователя часть модели реальности;
– реалистичную реакцию моделируемой реальности на виртуальное воздействие и управление со стороны пользователя;
– разрыв отождествления пользователя со своим "Образом Я" из обычной реальности (деперсонализация), и отождествление себя с "виртуальным образом Я", генерируемым системой виртуальной реальности (модификация сознания и самосознания пользователя);
– эффект присутствия пользователя в моделируемой реальности в своем "виртуальном образе Я", т.е. эффект личного участия пользователя в наблюдаемых виртуальных событиях;
– положительные результаты применения критериев реальности, т.е. функциональную замкнутость и самодостаточность виртуальной реальности, вследствие чего никакими действиями внутри виртуальной реальности, осуществляемыми над ее объектами, в т.ч. объектами виртуального интерфейса, с помощью своего виртуального тела, невозможно установить, "истинная" эта реальность или виртуальная.
Критерий реальности – это самосогласованность реальности, т.е. получение одной и той же информации качественно различными способами и по различным каналом связи (принцип наблюдаемости):
– согласованность реальности самой с собой во времени;
– согласованность и взаимное подтверждение информации от различных органов восприятия, которые обычно реагируют на различные формы материи и часто являются парными (зрение, слух, обоняние) и расположенными в различных точках пространства.
Принцип эквивалентности виртуальной и истинной реальности: виртуальная система отсчета, локализованная в полнофункциональной виртуальной реальности полностью физически эквивалентна физической системе отсчета, локализованной в "истинной реальности", т.е. никакими действиями внутри виртуальной реальности, осуществляемыми над ее объектами, в т.ч. объектами виртуального интерфейса, с помощью своего виртуального тела, невозможно установить, "истинная" эта реальность или виртуальная (Луценко Е.В., 2004).
Взвешивание данных или ремонт обучающей выборки – это операция, в результате которой частное распределение объектов по классам в обучающей выборке максимально, на сколько это возможно, приближается либо к частотному распределению генеральной совокупности (если оно известно из независимых источников), либо к равномерному.
Обобщение – это операция формирования обобщенных образов классов на основе описаний конкретных объектов, входящих в обучающую выборку.
Распознавание – это операция сравнения и определения степени сходства образа данного конкретного объекта с образами других конкретных объектов или с обобщенными образами классов, в результате которой формируется рейтинг объектов или классов по убыванию сходства с распознаваемым объектом.
Обучение с учителем – это процесс формирования обобщенных образов классов, на основе обучающей выборки, содержащей характеристики конкретных объектов как в описательных, так и в классификационных шкалах и градациях.
Шкала – это способ классификации объектов по наименованиям или степени выраженности некоторого свойства. Понятие шкалы тесно связано с ключевым понятием когнитивной психологии: понятием конструкта, более того, практически является синонимом или формальным аналогом этого понятия.
Градация – это положение на шкале (или интервал, диапазон), соответствующее наименованию или определенной степени выраженности свойства.
Обучение без учителя или самообучение – это процесс формирования обобщенных образов классов, на основе обучающей выборки, содержащей характеристики конкретных объектов, причем только в описательных шкалах и градациях.
Верификация модели – это операция установления степени ее адекватности (валидности) путем сравнения результатов идентификации конкретных объектов с их фактической принадлежностью к обобщенным образам классов.
Адаптация модели – это количественное уточнение модели, не требующее изменения классификационных и описательных шкал и градаций, а лишь объема обучающей выборки.
Синтез (или повторный синтез – пересинтез) модели – качественное уточнение модели, путем учета в модели объектов и факторов, ранее не входящих ни в обучающую выборку, ни в генеральную совокупность, по отношению к которой данная обучающая выборка репрезентативна.
Кластеризация – это операция автоматической классификации, в ходе которой объекты объединяются в группы (кластеры) таким образом, что внутри групп различия между объектами минимальны, а между группами – максимальны. При этом в ходе кластеризации не только определяется состав кластеров, но и сам их набор и границы.
Системный анализ – современный метод теоретического познания и программно-целевого управления, в котором объект управления рассматривается как система.
Система – представляет собой совокупность элементов различных уровней иерархии (подсистемы), связанных между собой каналами взаимодействия, объединенных в единое структурно-функциональное целое, обеспечивающее им преимущества в достижении общей цели системы и целей подсистем за счет системного эффекта.
Системный (эмерджентный) эффект – наличие у системы качественно новых, эмерджентных свойств, которые не сводятся к сумме свойств ее частей.
Эмерджентность свойств – так как все свойства есть свойства тех или иных систем, то можно предположить, что все свойства без исключения имеют эмерджентную природу, т.е. любое свойство основано на уровне Реальности этим свойством не обладающим. Например, свойство "быть соленым " основано на свойствах Na и Cl, по отдельности этим свойством ни в коей мере не обладающими.
Уровень системности – степень отличия свойств системы от суммы свойств ее частей.
Диалектика: структура-свойство-отношение – подсистемы различных уровней иерархии могут рассматриваться с внешней точки зрения как неделимое целое, не имеющее частей, т.е. элемент, обладающий свойством вступать во взаимодействие с другими элементами, а с внутренней точки зрения – как имеющие структуру, состоящую из элементов более низкого уровня иерархии, объединенных определенными видами взаимосвязей. Сам канал взаимодействия может рассматриваться как отношение элементов, которые с помощью него взаимодействуют, или как система, обладающая определенной структурой, включающая среду передачи и объекты, перемещающиеся в этой среде и переносящие субстанцию взаимодействия, например: вещество, стоимость, энергию или информацию.
Системно-когнитивный анализ (СК-анализ) – системный анализ, структурированный по базовым когнитивным операциям.
Автоматизированный системно-когнитивный анализ (АСК-анализ) – автоматизированный СК-анализ, т.е. системный анализ, автоматизированный путем структурирования по базовым когнитивным операциям системного анализа (БКОСА) и включающий: формализуемую когнитивную концепцию, математическую модель, методику численных расчетов и реализующий их программный инструментарий, в качестве которого в настоящее время выступает универсальная когнитивная аналитическая система "Эйдос". АСК-анализ предложен в 2002 году Е.В.Луценко.
Компоненты АСК-анализа:
– формализуемая когнитивная концепция и следующий из нее когнитивный конфигуратор;
– теоретические основы, методология, технология и методика СК-анализа;
– математическая модель СК-анализа, основанная на системном обобщении семантической меры целесообразности информации А. Харкевича;
– методика численных расчетов, в универсальной форме реализующая математическую модель СК-анализа, включающая иерархическую структуру данных и 24 детальных алгоритма 10 БКОСА;
– специальное инструментальное программное обеспечение, реализующее математическую модель и численный метод СК-анализа – Универсальная когнитивная аналитическая система "Эйдос";
– методика, технология и результаты синтеза рефлексивных АСУ активными объектами на основе АСК-анализа.
Этапы АСК-анализа:
1) когнитивная структуризация предметной области;
2) формализация предметной области (конструирование классификационных и описательных шкал и градаций);
3) подготовка обучающей выборки (ввод данных мониторинга в базу прецедентов);
4) синтез семантической информационной модели (СИМ);
5) оптимизация СИМ;
6) проверка адекватности СИМ (измерение внутренней и внешней, дифференциальной и интегральной валидности);
7) системно-когнитивный анализ СИМ, исследование моделируемого объекта путем исследования его модели:
– решение задач идентификации и прогнозирования;
– генерация информационных портретов классов и факторов, т.е. решение обратной задачи прогнозирования, поддержка принятия решений по управлению (результаты отображаются в графической форме двухмерных и трехмерных профилей классов и факторов);
– кластерно-конструктивный анализ классов и факторов (результаты отображаются в форме семантических сетей классов и факторов);
– содержательное сравнение классов и факторов (результаты отображаются в форме когнитивных диаграмм классов и факторов);
– изучение системы детерминации состояний моделируемого объекта, нелокальные нейроны и интерпретируемые нейронные сети;
– построение классических когнитивных моделей (когнитивных карт).
– построение интегральных когнитивных моделей (интегральных когнитивных карт).
Математическая модель АСК-анализа основана на системной теории информации (СТИ).
Системная теория информации (СТИ) – Отличия СТИ от классической теории информации Больцмана-Найквиста-Хартли-Шеннона обусловлены отличиями понятия "система" от понятия "множество". СТИ рассматривает в качестве элементов не только первичные элементы множества, но и элементы, представляющие собой подсистемы различных уровней иерархии, образующиеся за счет взаимодействия первичных элементов, а также учитывает понятие цели. В рамках СТИ предложено системное обобщение семантической меры информации Харкевича, которое удовлетворяет принципу соответствия с мерой Хартли в детерминистском случае, как и мера Шеннона в случае равновероятных событий, чем преодолена несогласованность семантической теории информации и классической теории информации Шеннона. Так как данная мера учитывает понятие цели, то она является количественной мерой знаний. В рамках СТИ предложены гипотезы "О возрастании эмерджентности", следующие из нее: "О природе сложности системы", и "О видах системной информации".
Гипотеза "О возрастания эмерджености": "Чем больше элементов в системе, тем большую долю содержащейся в ней информации составляет информация, содержащаяся во взаимосвязях ее элементов".
Гипотеза "О природе сложности системы": сложность системы определяется количеством содержащейся в ней информации.
Гипотеза "О видах системной информации": системная информация включает две составляющие:
– зависящую от количества элементов системы;
– зависящую как от количества элементов системы, так и от сложности взаимосвязей между ними.
Методика численных расчетов АСК-анализа включает: структуры входных данных (формализация предметной области), промежуточных и выходных данных, а также алгоритмы БКОСА.
Программный инструментарий АСК-анализа – универсальная когнитивная аналитическая система "Эйдос".
Базовые когнитивные операции системного анализа (БКОСА) – когнитивные операции, образующие когнитивный конфигуратор.
Когнитивный конфигуратор – минимальный полный набор познавательных (когнитивных от: "cognition" – "познание", англ.) операций, к которым сводятся различные процессы познания, в т.ч. системный анализ, как метод познания. В формализуемой когнитивной концепции выявлено 10 таких операций, каждая из которых достаточно элементарна для формализации и программной реализации: 1) присвоение имен; 2) восприятие; 3) обобщение (синтез, индукция); 4) абстрагирование; 5) оценка адекватности модели; 6) сравнение, идентификация и прогнозирование; 7) дедукция и абдукция; 8) классификация и генерация конструктов; 9) содержательное сравнение; 10) планирование и принятие решений об управлении.
Формализуемая когнитивная концепция – когнитивная концепция, предложенная с целью разработки СК-анализа. Из данной концепции выводятся структура когнитивного конфигуратора, система базовых когнитивных операций и обобщенная схема системного анализа, структурированного до уровня базовых когнитивных операций (СК-анализ).
Рассматривает процесс познания, как многоуровневую иерархическую систему обработки информации в которой когнитивные структуры каждого уровня являются результатом интеграции структур предыдущего уровня. На 1-м уровне этой системы находятся дискретные элементы потока чувственного восприятия, которые на 2-м уровне интегрируются в чувственный образ конкретного объекта. Те, в свою очередь, на 3-м уровне интегрируются в обобщенные образы классов и факторов, образующие на 4-м уровне кластеры, а на 5-м конструкты. Система конструктов на 6-м уровне образуют текущую парадигму реальности (т.е. человек познает мир путем синтеза и применения конструктов). На 7-м же уровне обнаруживается, что текущая парадигма не единственно-возможная.
Ключевым для когнитивной концепции является понятие факта, под которым понимается соответствие дискретного и интегрального элементов познания (т.е. элементов разных уровней интеграции-иерархии), обнаруженное на опыте. Факт рассматривается как квант смысла, что является основой для его формализации. Таким образом, происхождение смысла связывается со своего рода "разностью потенциалов", существующей между смежными уровнями интеграции-иерархии обработки информации в процессах познания. Между когнитивными структурами разных уровней иерархии существует отношение "дискретное – интегральное". Именно это служит основой формализации смысла.
АСК-анализ в экономике – новый математический и инструментальный метод экономики, характеризующийся универсальной непараметрической математической моделью, основанной на системной теории информации, наличием методики численных расчетов и программного инструментария (система "Эйдос").
Адекватность модели – это ее способность правильно идентифицировать объекты. Понятие адекватности имеет свою структуру, включающую понятия внутренней и внешней, дифференциальной и интегральной валидности ("валидность" и переводится как "правильность").
Внутренняя валидность – способность модели правильно идентифицировать объекты, входящие в обучающую выборку.
Внешняя валидность – способность модели верно идентифицировать объекты, не входящие в обучающую выборку, но относящиеся к генеральной совокупности, по отношению к которой она репрезентативна.
Интегральная валидность – это валидность, средневзвешенная по всей обучающей выборке.
Дифференциальная валидность – это способность правильно идентифицировать отдельные классы.
Инструментарий СК-анализа – универсальная когнитивная аналитическая система "Эйдос".
Показатели валидности:
– идентифицировано верно – это количество объектов обучающей выборки, которые идентифицированы как классы, к которым они действительно относятся;
– идентифицировано ошибочно – это количество объектов обучающей выборки, которые идентифицированы как классы, к которым они в действительности не относятся (ошибка идентификации);
– неидентифицировано верно – это количество объектов обучающей выборки, которые неидентифицированы как классы, к которым они действительно не относятся;
– неидентифицировано ошибочно – это количество объектов обучающей выборки, которые неидентифицированы как классы, к которым они в действительности относятся (ошибка неидентфикации).
Идентификация – количественная оценка степени сходства конкретного объекта или его состояния с классом по признакам, которые относятся к тому же моменту времени, что и состояние.
Прогнозирование – количественная оценка степени сходства конкретного объекта или его состояния с классом по признакам, причем признаки относятся к более раннему времени, чем состояние.
Информационный портрет класса – это список факторов, ранжированных в порядке убывания силы их влияния на переход объекта управления в состояние, соответствующее данному классу. Информационный портрет класса отражает систему его детерминации. Генерация информационного портрета класса представляет собой решение обратной задачи прогнозирования, т.к. при прогнозировании по системе факторов определяется спектр наиболее вероятных будущих состояний объекта управления, в которые он может перейти под влиянием данной системы факторов, а в информационном портрете мы наоборот, по заданному будущему состоянию объекта управления определяем систему факторов, детерминирующих это состояние, т.е. вызывающих переход объекта управления в это состояние. В начале информационного портрета класса идут факторы, оказывающие положительное влияние на переход объекта управления в заданное состояние, затем факторы, не оказывающие на это существенного влияния, и далее – факторы, препятствующие переходу объектауправления в это состояние (в порядке возрастания силы препятствования). Информационные портреты классов могут быть от отфильтрованы по диапазону факторов, т.е. мы можем отобразить влияние на переход объекта управления в данное состояние не всех отраженных в модели факторов, а только тех, коды которых попадают в определенный диапазон, например, относящиеся к определенным описательным шкалам.
Информационный (семантический) портрет фактора – это список классов, ранжированный в порядке убывания силы влияния данного фактора на переход объекта управления в состояния, соответствующие данным классам. Информационный портрет фактора называется также его семантическим портретом, т.к. в соответствии с концепцией смысла системно-когнитивного анализа, являющейся обобщением концепции смысла Шенка-Абельсона, смысл фактора состоит в том, какие будущие состояния объекта управления он детерминирует. Сначала в этом списке идут состояния объекта управления, на переход в которые данный фактор оказывает наибольшее влияние, затем состояния, на которые данный фактор не оказывает существенного влияния, и далее состояния – переходу в которые данный фактор препятствует. Информационные портреты факторов могут быть от отфильтрованы по диапазону классов, т.е. мы можем отобразить влияние данного фактора на переход объекта управления не во все возможные будущие состояния, а только в состояния, коды которых попадают в определенный диапазон, например, относящиеся к определенным классификационным шкалам.
Функция влияния представляет собой график зависимости вероятностей перехода объекта управления в будущие состояния под влиянием различных значений некоторого фактора. Если взять несколько информационных портретов факторов, соответствующих градациям одной описательной шкалы, отфильтровать их по диапазону градаций некоторой классификационной шкалы и взять из каждого информационного портрета по одному состоянию, на переход в которое объекта управления данная градация фактора оказывает наибольшее влияние, то мы и получим зависимость, отражающую вероятность перехода объекта управления в будущие состояния под влиянием различных значений некоторого фактора, т.е. функцию влияния. Функции влияния являются наиболее развитым средством изучения причинно-следственных зависимостей в моделируемой предметной области, предоставляемым системой "Эйдос". Необходимо отметить, что на вид функций влияния математической моделью СК-анализа не накладывается никаких ограничений, в частности, они могут быть и нелинейные.
Двухмерные и трехмерные профили классов и факторов – это графические диаграммы, отображающие силу и направление влияния различных факторов на переход объекта управления в различные состояния. Профилем класса называется графическое отображение столбца матрицы информативностей, соответствующего данному классу. Профилем признака (фактора) называется графическое отображение строки матрицы информативностей, соответствующего данному признаку. Информативности факторов означают силу и направление влияния данного фактора на переход системы в состояние, соответствующее данному классу.
Кластерно-конструктивный анализ – это математический метод анализа данных, обеспечивающий:
– выявление классов, наиболее сходных по системе их детерминации и объединение их в кластеры;
– выявление кластеров классов, наиболее сильно отличающиеся по системе их детерминации и построение из них полюсов конструктов классов, при этом остальные кластеры включаются в конструкты в качестве промежуточных между полюсами;
– выявление факторов, наиболее сходных по детерминируемым ими классам и объединение их в кластеры;
– выявление кластеров факторов, наиболее сильно отличающиеся по детерминируемым ими классам и построение из них полюсов конструктов факторов, при этом остальные кластеры включаются в конструкты в качестве промежуточных между полюсами.
Состояния объекта управления, соответствующие классам, включенным в один кластер, могут быть достигнуты одновременно, т.е. являются совместимыми (коалиционными) по детерминирующим их факторам. Состояния объекта управления, соответствующие классам, образующим полюса конструкта, не могут быть достигнуты одновременно, т.е. являются противоположными по детерминирующим их факторам (антагонистическими).
Факторы, включенные в один кластер, оказывают сходное влияние на поведение объекта управления и могут, при необходимости, быть использованы для замены друг друга. Факторы, образующие полюса конструкта, оказывают противоположное влияние на поведение объекта управления.
Кластерно-конструктивный анализ классов позволяет сравнить их по сходству системы детерминации и отобразить эту информацию в наглядной графической форме семантической сети классов.
Кластерно-конструктивный анализ факторов позволяет сравнить факторы по сходству их влияния на переход объекта в будущие состояния и отобразить эту информацию в наглядной графической форме семантической сети факторов.
Когнитивные диаграммы классов (факторов) – это графические диаграммы, позволяющие отобразить в чем конкретно состоит сходство и различие любых двух классов (или любых двух факторов), т.е. детально увидеть структуру каждой линии связи в семантической сети. Когнитивные диаграммы представляет собой графическое изображение обобщенного коэффициента корреляции профилей классов (или факторов), при этом каждая линия, вносящая вклад в сходство или различие соответствует одному слагаемому, ее цвет – знаку, а толщина – модулю этого слагаемого.
Нелокальные нейроны и интерпретируемые нейронные сети позволяют в наглядной форме отобразить систему детерминации будущих состояний. Нелокальный нейрон представляет собой будущее состояние объекта управления с изображением наиболее сильно влияющих на него факторов с указанием силы и направления (способствует-препятствует) их влияния. Нейронная сеть представляет собой совокупность взаимосвязанных нейронов. В классических нейронных сетях связь между нейронами осуществляется по входным и выходным сигналам, а в нелокальных нейронных сетях – на основе общего информационного поля, реализуемого семантической информационной моделью. Система "Эйдос" обеспечивает построение любого подмножества многослойной нейронной сети с заданными или выбираемыми по заданным критериям рецепторами и нейронами, связанными друг с другом связями любого уровня опосредованности.
Классические когнитивные карты являются графической формой представления фрагментов СИМ, объединяющей достоинства таких форм, как нейроны и семантические сети факторов. Классическая когнитивная карта представляет собой нейрон, соответствующий некоторому состоянию объекта управления с рецепторами, каждый из которых соответствует фактору в определенной степени способствующему или препятствующему переходу объекта в это состояние. Рецепторы соединены связями как с нейроном, так и друг с другом. Связи рецепторов с нейроном отражают силу и направление влияния факторов, а связи рецепторов друг с другом, отображаемые в форме семантической сети факторов, – сходство и различие между рецепторами по характеру их влияния на объект управления. Таким образом, классическая когнитивная карта представляет собой нейрон с семантической сетью факторов, изображенные на одной диаграмме.
Обобщенные когнитивные карты позволяют объединить в одной графической форме семантические сети классов и факторов, объединенных нейронной сетью. Если объединить несколько классических когнитивных карт на одной диаграмме и изобразить на ней также связи между нейронами в форме семантической сети классов, то получим обобщенную (интегральную) когнитивную карту. Система "Эйдос" обеспечивает построение любого подмножества многоуровневой семантической информационной модели с заданными или выбираемыми по заданным критериям рецепторами и нейронами, связанными друг с другом связями любого уровня опосредованности в форме классических и обобщенных когнитивных карт. В частности, в системе полуавтоматически формируется задание на генерацию подмножеств обобщенной когнитивной карты.
ЛИТЕРАТУРА
ОСНОВНАЯ ЛИТЕРАТУРА
1. Луценко Е.В., Лойко В.И., Семантические информационные модели управления агропромышленным комплексом. Монография (научное издание). – Краснодар: КубГАУ. 2005. – 480 с.
2. Луценко Е.В. Автоматизированный системно-когнитив-ный анализ в управлении активными объектами (системная теория информации и ее применение в исследовании экономических, социально-психологических, технологических и организационно-технических систем): Монография (научное издание). – Краснодар: КубГАУ. 2002. – 605 с.
3. Луценко Е.В. Интеллектуальные информационные системы: Учебное пособие для студентов специальности "Прикладная информатика (по областям)" и другим экономическим специальностям. 2-е изд., перераб. и доп.– Краснодар: КубГАУ, 2006. – 615 с.
4. Луценко Е.В. Интеллектуальные информационные системы: Учебное пособие для студентов специальности: 351400 "Прикладная информатика (по отраслям)". – Краснодар: КубГАУ. 2004. – 633 с.
5. Луценко Е.В. Теоретические основы и технология адаптивного семантического анализа в поддержке принятия решений (на примере универсальной автоматизированной системы распознавания образов "ЭЙДОС-5.1"). Монография (научное издание). – Краснодар: КЮИ МВД РФ, 1996. - 280с.
6. Луценко Е.В. Универсальная автоматизированная система распознавания образов "Эйдос" (версия 4.1).-Краснодар: КЮИ МВД РФ, 1995.- 76с.
7. Симанков В.С., Луценко Е.В. Адаптивное управление сложными системами на основе теории распознавания образов. Монография (научное издание). – Краснодар: ТУ КубГТУ, 1999. - 318с.
8. Симанков В.С., Луценко Е.В., Лаптев В.Н. Системный анализ в адаптивном управлении: Монография (научное издание). /Под науч. ред. В.С.Симанкова. – Краснодар: ИСТЭК КубГТУ, 2001. – 258с.
ДОПОЛНИТЕЛЬНАЯ ЛИТЕРАТУРА
1. Lutsenko E.V. Conceptual principles of the system (emergent) information theory & its application for the cognitive modelling of the active objects (entities). 2002 IEEE International Conference on Artificial Intelligence System (ICAIS 2002). –Computer society, IEEE, Los Alamos, California, Washington-Brussels-Tokyo, p. 268-269. http://csdl2.computer.org/comp/proceedings/icais/2002/1733/00/17330268.pdf.
2. Васильев Л.Г. Три парадигмы понимания: анализ литературы вопроса. http://newasp.omskreg.ru/intellect/f54.htm.
3. Вяткин В.Б. Синергетическая теория информации: общая характеристика и примеры использования. [Электронный ресурс]. – Режимы доступа: http://vbvvbv.narod.ru/ http://inftech.webservis.ru/it/information/Vyatkin/ar_02/index.html.
4. Денисов А.А.. Информационное поле. - СПб.: Изд-во "Омега", 1998. - 3,9 п.л.
5. Драгавцев В.А., Драгавцева И.А., Лопатина Л.М. Управление продуктивностью сельскохозяйственных культур на основе закономерностей их генетических и фенотипических изменений при смене лимитов внешней среды. – Краснодар. СКЗНИИСиВ, 2004. – 208 с.
6. Драгавцева И.А. и др. Персик на Юге России и Украины. –Краснодар: СКзНИИСиВ, 2001. –120с.
7. Драгавцева И.А. Экологические основы оптимального размещения абрикоса на Северном Кавказе. Дисс…д.с./х.н. (06.01.07 – Плодоводство) – Краснодар: КубГАУ, 1981. – 328 с.
8. Драгавцева И.А. Экологические ресурсы продуктивности абрикоса на юге России. –Краснодар: 1999. –94с.
9. Драгавцева И.А., Лопатина Л.М. , Луценко Е.В. Автоматизация системного анализа продуктивности плодовых культур Юга России, Научные труды Российской академии сельскохозяйственных наук. – 2005. – №4. – С. 11-14.
10. Драгавцева И.А., Луценко Е.В., Запорожец Н.М., Луценко Н.Е. Новые подходы к районированию плодовых культур на Юге России с применением компьютерного моделирования, Организационно-экономический механизм инновационного процесса и приоритетные проблемы научного обеспечения развития отрасли (Материалы Всероссийской научно-практической конференции 3-4 февраля 2003 г. СКЗНИИСиВ, Краснодар). – Краснодар. – 2003. – С. 74-76.
11. Драгавцева И.А., Луценко Е.В., Лопатина Л.М., Луценко Н.Е. Применение системного анализа для прогнозирования успешности выращивания сельскохозяйственных культур (на примере плодовых), В сб.: "Формы и методы повышения эффективности координации исследований для ускорения процесса передачи реальному сектору экономики завершенных разработок". – Краснодар: СКЗНИИСиВ, 2002. – С. 62-67.
12. Драгавцева И.А., Луценко Е.В., Луценко Н.Е., Лопатина Л.М. Применение автоматизированного системного анализа для прогноза продуктивности плодовых культур на Юге страны, Материалы Всероссийской научно-практической конференции. – Краснодар: СКЗНИИСВ, 2002. – С. 8-11.
13. Дюк В.А. Компьютерная психодиагностика. - СПб: Братство, 1994. - 365с.
14. Дюк В.А. Обработка данных на ПК в примерах. – СПб: Питер, 1997. – 240с.
15. Егоров Е.А., Драгавцева И.А., Лопатина Л.М., Луценко Е.В. и др. Интенсивные технологии возделывания плодовых культур, Монография (научное издание): СКЗНИИСиВ. – Краснодар. – 2004. –394 с.
16. Заде Л.. Понятие о лингвистической переменной и его применение к принятию решений. - М.: Мир, 1976.
17. Калман, Р. Очерки по математической теории систем / Р. Калман, П. Фалб, М. Арбиб; . Перев. с англ. – М.: Мир, 1971. – 400 с.
18. Калустов А.А., Луценко Е.В. Применение автоматизированного системно-когнитивного анализа для совершенствования методов компьютерной селекции подсолнечника, Научный журнал КубГАУ [Электронный ресурс]. – Краснодар: КубГАУ, 2005. – №02(10). – Режим доступа: http://ej.kubagro.ru/2005/02/10/p10.asp
19. Кива В. Данные, информация, знания. http://vlak.webzone.ru/rus/it/knowledge.html.
20. Клыков Ю.И. Луценко Е.В., и др. Разработка и управление реализацией городских целевых комплексных программ. ГСГ 00.004-85 (Стандарт) Городской стандарт. – Краснодар: КФ ПНИИПОУ, 1985. – 107 с.
21. Лачинов, В.М. Информодинамика или путь к Открытому миру / В.М. Лачинов, А.О. Поляков А.О. – СПб.: Изд-во СПбГТУ, 1999. – 432 с. – Режим доступа: http://www.polyakov.com/informodynamics/index.html.
22. Лийв Э. Х. Инфодинамика. Обобщённая энтропия и негэнтропия. - Таллинн, 1998. - 200 с.
23. Лопатина Л.М., Драгавцева И.А., Луценко Е.В. Концептуальная постановка задачи: "Прогнозирование количественных и качественных результатов выращивания заданной культуры в заданной точке", Научный журнал КубГАУ [Электронный ресурс]. – Краснодар: КубГАУ, 2004. – №05(7). – Режим доступа: http://ej.kubagro.ru/2004/05/08/p08.asp
24. Луценко Е.В. Автоматизация когнитивных операций системного анализа, В сб.: "Проблемы совершенствования систем защиты информации, энергоснабжения военных объектов и образовательных технологий подготовки специалистов". Материалы II межвузовской научно-технической конференции. – Краснодар: КВИ, 2001. – С. 131-133.
25. Луценко Е.В. Автоматизированная система распознавания образов, математическая модель и опыт применения, В сб.: "В.И.Вернадский и современность (к 130-летию со дня рождения)". Тезисы научно-практической конференции. – Краснодар: КНА, 1993. – С. 37-42.
26. Луценко Е.В. Автоматизированный когнитивный системный анализ фондового рынка // Проблемы экономического и социального развития России: Материалы Всероссийской научно-практической конференции. – Пенза: ПГУ, 2001. – С. 206–209.
27. Луценко Е.В. Автоматизированный системно-когнитивный анализ в управлении активными объектами (системная теория информации и ее применение в исследовании экономических, социально-психологических, технологических и организационно-технических систем):, Монография (научное издание). – Краснодар: КубГАУ, 2002. – 605 с.
28. Луценко Е.В. Автоматизированный системно-когнитивный анализ в экономике, Изв. вузов. Северо-Кавказский регион. Технические науки. – 2003. – №1. – С. 189-194.
29. Луценко Е.В. АСК-анализ как метод выявления когнитивных функциональных зависимостей в многомерных зашумленных фрагментированных данных, Научный журнал КубГАУ [Электронный ресурс]. – Краснодар: КубГАУ, 2005. – №03(11). – Режим доступа: http://ej.kubagro.ru/2005/03/19/p19.asp
30. Луценко Е.В. Атрибуция анонимных и псевдонимных текстов в системно-когнитивном анализе // Научный журнал КубГАУ [Электронный ресурс]. – Краснодар: КубГАУ, 2004. – №03(5). – Режим доступа: http://ej.kubagro.ru/2004/03/03/p03.asp.
31. Луценко Е.В. Взаимосвязь эластичности и системной меры целесообразности информации, Научный журнал КубГАУ [Электронный ресурс]. – Краснодар: КубГАУ, 2003. – №01(1). – Режим доступа: http://ej.kubagro.ru/2003/01/05/p05.asp
32. Луценко Е.В. Виртуализация общества и повышение качества его базиса. Ж-л Финансы и статистика. 2005, №35(203),. – С.30-43.
33. Луценко Е.В. Виртуализация общества как основной информационный аспект глобализации (основы информационно-функциональной теории развития техники и информационной теории стоимости), Научный журнал КубГАУ [Электронный ресурс]. – Краснодар: КубГАУ, 2005. – №01(9). – Режим доступа: http://ej.kubagro.ru/2005/01/02/p02.asp
34. Луценко Е.В. Идентификация слов по входящим в них буквам с применением системно-когнитивного анализа, Научный журнал КубГАУ [Электронный ресурс]. – Краснодар: КубГАУ, 2004. – №02(4). – Режим доступа: http://ej.kubagro.ru/2004/02/12/p12.asp
35. Луценко Е.В. Интеллектуальные информационные системы: Учебное пособие для студентов специальности: 351400 "Прикладная информатика (по отраслям)". – Краснодар: КубГАУ. 2004. – 633 с.
36. Луценко Е.В. Интеллектуальные информационные системы: Учебное пособие для студентов специальности "Прикладная информатика (по областям)" и другим экономическим специальностям. 2-е изд., перераб. и доп.– Краснодар: КубГАУ, 2006. – 615 с.
37. Луценко Е.В. Интерференция последствия выбора в результате одновременного осуществления альтернатив и необходимость разработки системной (эмерджентной) теории информации, Проблемы совершенствования систем защиты информации, образовательного процесса и электроснабжения военных объектов: Межвузовский сборник научных работ. – 2002. – №3. – С.72-74.
38. Луценко Е.В. Информационно-функциональная теория развития техники, закон повышения качества базиса и детерминация формы сознания человека функциональным уровнем технологической среды. Труды Кубанского государственного аграрного университета. – Выпуск № 420 (448), – КубГАУ, Краснодар, 2005. – С.218-236.
39. Луценко Е.В. Исследование адекватности, сходимости и семантической устойчивости системно-когнитивной модели активных объектов, Проблемы совершенствования систем защиты информации, образовательного процесса и электроснабжения военных объектов: Межвузовский сборник научных работ. – 2002. – №3. – С. 64-70.
40. Луценко Е.В. Когнитивная аналитическая система "ЭЙДОС-6.0" и система "ЭЙДОС-" – адекватный инструментарий для психологических служб МВД, В сб.: "Актуальные проблемы социально-правовой подготовки специалистов и перспективы совершенствования системы комплектования ОВД". Материалы межвузовской научно-практической конференции (16-18.05.1997). Часть 1. –Краснодар: КЮИ МВД РФ, 1997. – С. 65-69.
41. Луценко Е.В. Количественные меры возрастания эмерджентности в процессе эволюции систем (в рамках системной теории информации) // Научный журнал КубГАУ [Электронный ресурс]. – Краснодар: КубГАУ, 2006. – №05(21). – Режим доступа: http://ej.kubagro.ru/2006/05/pdf/31.pdf.
42. Луценко Е.В. Концептуальные основы системной (эмерджентной) теории информации и ее применение для когнитивного моделирования активных объектов // Перспективные информационные технологии и интеллектуальные системы. – Таганрог: ТГРТУ, 2003. – № 1. – С. 23–27. – Режим доступа: http://pitis.tsure.ru/files13/5.pdf.
43. Луценко Е.В. Критерии реальности и принцип эквивалентности виртуальной и "истинной" реальности, Научный журнал КубГАУ [Электронный ресурс]. – Краснодар: КубГАУ, 2004. – №06(8). – Режим доступа: http://ej.kubagro.ru/2004/06/10/p10.asp.
44. Луценко Е.В. Математическая модель автоматизированной системы распознавания образов (Тезисы) В сб.: "Тезисы докладов VIII Всесоюзного съезда психологов". – М.: Наука, 1989. – С.35.
45. Луценко Е.В. Математический метод СК-анализа в свете идей интервальной бутстрепной робастной статистики объектов нечисловой природы, Научный журнал КубГАУ [Электронный ресурс]. – Краснодар: КубГАУ, 2004. – №01(3). – Режим доступа: http://ej.kubagro.ru/2004/01/13/p13.asp
46. Луценко Е.В. Методика использования репозитария UCI для оценки качества математических моделей систем искусственного интеллекта, Научный журнал КубГАУ [Электронный ресурс]. – Краснодар: КубГАУ, 2003. – №02(2). – Режим доступа: http://ej.kubagro.ru/2003/02/12/p12.asp
47. Луценко Е.В. Нелокальные интерпретируемые нейронные сети прямого счета, как инструмент системно-когнитивного анализа, Изв. вузов. Северо-Кавказский регион. Технические науки. Приложение №3. – 2003. – С. 3-12.
48. Луценко Е.В. Неформальная постановка и обсуждение задач, возникающих при системном обобщении теории множеств на основе системной теории информации (Часть 1-я: задачи 1–3) // Научный журнал КубГАУ [Электронный ресурс]. – Краснодар: КубГАУ, 2008. – №3(37). – Режим доступа: http://ej.kubagro.ru/2008/03/pdf/12.pdf.
49. Луценко Е.В. Неформальная постановка и обсуждение задач, возникающих при системном обобщении теории множеств на основе системной теории информации (Часть 2-я: задачи 4–9) // Научный журнал КубГАУ [Электронный ресурс]. – Краснодар: КубГАУ, 2008. – №4(38). – Режим доступа: http://ej.kubagro.ru/2008/04/pdf/01.pdf.
50. Луценко Е.В. Программная идея системного обобщения математики и ее применение для создания системной теории информации // Научный журнал КубГАУ [Электронный ресурс]. – Краснодар: КубГАУ, 2008. – №2(36). – Режим доступа: http://ej.kubagro.ru/2008/02/pdf/11.pdf.
51. Луценко Е.В. Расчет эластичности объектов информационной безопасности на основе системной теории информации, Ж-л "Безопасность информационных технологий". – М.: МИФИ, 2003. – №2. – С. 82-90.
52. Луценко Е.В. Семантическая информационная модель СК-анализа // Научный журнал КубГАУ [Электронный ресурс]. – Краснодар: КубГАУ, 2008. – №2(36). – Режим доступа: http://ej.kubagro.ru/2008/02/pdf/12.pdf.
53. Луценко Е.В. Системная теория информации и нелокальные интерпретируемые нейронные сети прямого счета, Научный журнал КубГАУ [Электронный ресурс]. – Краснодар: КубГАУ, 2003. – №01(1). – Режим доступа: http://ej.kubagro.ru/2003/01/11/p11.asp
54. Луценко Е.В. Системно-когнитивный анализ в управлении АПК (Докторская диссертация) Диссертация на соискание ученой степени д. э. н. (08.00.13). –Краснодар: КубГАУ, 2003. – 467 с.
55. Луценко Е.В. Системно-когнитивный анализ детерминистско-бифуркационной динамики активных систем, Проблемы совершенствования систем защиты информации, образовательного процесса и электроснабжения военных объектов: Межвузовский сборник научных работ. – 2002. – №3. – С. 50-53.
56. Луценко Е.В. Системно-когнитивный анализ как развитие концепции смысла Шенка-Абельсона, Научный журнал КубГАУ [Электронный ресурс]. – Краснодар: КубГАУ, 2004. – №03(5). – Режим доступа: http://ej.kubagro.ru/2004/03/04/p04.asp
57. Луценко Е.В. Существование, несуществование и изменение как эмерджентные свойства систем // Квантовая Магия. – 2008. – Т. 5. – Вып. 1. – С. 1215–1239 [Электронный ресурс]. – Режим доступа: http://quantmagic.narod.ru/volumes/VOL512008/p1215.html.
58. Луценко Е.В. Теоретические основы и технология адаптивного семантического анализа в поддержке принятия решений (на примере универсальной автоматизированной системы распознавания образов "ЭЙДОС-5.1"). Монография (научное издание). – Краснодар: КЮИ МВД РФ, 1996. - 280с.
59. Луценко Е.В. Теоретические основы системной (эмерджентной) теории информации, Проблемы совершенствования систем защиты информации, образовательного процесса и электроснабжения военных объектов: Межвузовский сборник научных работ. – 2002. – №3. – С. 84-93.
60. Луценко Е.В. Типовая методика и инструментарий когнитивной структуризации и формализации задач в СК-анализе, // Научный журнал КубГАУ [Электронный ресурс]. – Краснодар: КубГАУ, 2004. – №01(3). – Режим доступа: http://ej.kubagro.ru/2004/01/16/p16.asp
61. Луценко Е.В. Универсальная автоматизированная система распознавания образов "ЭЙДОС-4", ИЛ №438-93. –Краснодар: КЦНТИ, 1993. – 4с.
62. Луценко Е.В. Универсальная автоматизированная система распознавания образов "ЭЙДОС": опыт и перспективы применения, В сб.: "Состояние и связи криминалистики и теории оперативно-розыскной деятельности ОВД". Материалы всероссийской научно-практической конференции (14-16.06.1995). – Краснодар: КЮИ МВД РФ, 1995. – С. 168-177 (ДСП).
63. Луценко Е.В. Универсальная автоматизированная система распознавания образов "ЭЙДОС" (версия 4.1), Краснодар: КЮИ МВД РФ, 1995. – 76 с.
64. Луценко Е.В., Головин В.П., Калайджян А.А., Калустов А.А. Кластерно-конструктивный и системно-когнитивный анализ результатов выращивания подсолнечника и факторов. Материалы XIV международного симпозиума "Нетрадиционное растениеводство. Эниология. Экология и здоровье" – 2-й съезд селекционеров. 3-11 сентября 2005 г., г. Алушта. – Симферополь, 2005. С. 476-478.
65. Луценко Е.В., Головин В.П., Калайджян А.А., Калустов А.А. Поддержка принятия решений по отбору растений для селекции на основе анализа их фенотипических признаков методом АСК-анализа. Материалы XIV международного симпозиума "Нетрадиционное растениеводство. Эниология. Экология и здоровье" – 2-й съезд селекционеров. 3-11 сентября 2005 г., г. Алушта. – Симферополь, 2005. С. 492-496.
66. Луценко Е.В., Головин В.П., Калайджян А.А., Калустов А.А. Прогнозирование селекционных свойств растений подсолнечника на основе их фенотипических признаков путем применения АСК-анализа. Материалы XIV международного симпозиума "Нетрадиционное растениеводство. Эниология. Экология и здоровье" – 2-й съезд селекционеров. 3-11 сентября 2005 г., г. Алушта. – Симферополь, 2005. С. 463-464.
67. Луценко Е.В., Головин В.П., Калайджян А.А., Калустов А.А. Совершенствование методов компьютерной селекции подсолнечника путем применения АСК-анализа. Материалы XIV международного симпозиума "Нетрадиционное растениеводство. Эниология. Экология и здоровье" – 2-й съезд селекционеров. 3-11 сентября 2005 г., г. Алушта. – Симферополь, 2005. С. 397-411.
68. Луценко Е.В., Драгавцева И. А., Лопатина Л.М., Немоляев А.Н. Подсистема агрометеорологической типизации лет по успешности выращивания плодовых и оценки соответствия условий микрозон выращивания ("АГРО-МЕТЕО-ТИПИЗАЦИЯ"). Пат. № 2006613271 РФ. Заяв. № 2006612452 РФ. Опубл. от 15.09.2006.
69. Луценко Е.В., Драгавцева И.А., Лопатина Л.М. Автоматизация системного анализа продуктивности плодовых культур Юга России. Научные труды Российской академии сельскохозяйственных наук. – 2005. – №4. – С. 11-14.
70. Луценко Е.В., Драгавцева И.А., Лопатина Л.М. Автоматизированная система мониторинга, анализа и прогнозирования развития сельхозкультур "ПРОГНОЗ-АГРО". Пат. № 2003610433 РФ. Заяв. № 2002611927 РФ. Опубл. от 18.02.2003.
71. Луценко Е.В., Драгавцева И.А., Лопатина Л.М. База данных автоматизированной системы мониторинга, анализа и прогнозирования развития сельхозкультур "ПРОГНОЗ-АГРО". Пат. № 2003620035 РФ. Заяв. № 2002620178 РФ. Опубл. от 20.02.03.
72. Луценко Е.В., Драгавцева И.А., Лопатина Л.М., Концептуальная постановка задачи: "Прогнозирование количественных и качественных результатов выращивания заданной культуры в заданной точке". Научный журнал КубГАУ [Электронный ресурс]. – Краснодар: КубГАУ, 2004. – №05(7). – Режим доступа: http://ej.kubagro.ru/2004/05/08/p08.asp
73. Луценко Е.В., Драгавцева И.А., Лопатина Л.М., Луценко Н.Е. Применение системного анализа для прогнозирования успешности выращивания сельскохозяйственных культур (на примере плодовых). В сб.: "Формы и методы повышения эффективности координации исследований для ускорения процесса передачи реальному сектору экономики завершенных разработок". – Краснодар: СКЗНИИСиВ, 2002. – С. 62-67.
74. Луценко Е.В., Драгавцева И.А., Луценко Н.Е., Лопатина Л.М. Применение автоматизированного системного анализа для прогноза продуктивности плодовых культур на Юге страны. Материалы Всероссийской научно-практической конференции. – Краснодар: СКЗНИИСВ, 2002. – С. 8-11.
75. Луценко Е.В., Егоров Е.А., Драгавцева И.А., Лопатина Л.М. и др. Интенсивные технологии возделывания плодовых культур. Монография (научное издание): СКЗНИИСиВ. – Краснодар. – 2004. –394 с.
76. Луценко Е.В., Калустов А.А. Применение автоматизированного системно-когнитивного анализа для совершенствования методов компьютерной селекции подсолнечника. Научный журнал КубГАУ [Электронный ресурс]. – Краснодар: КубГАУ, 2005. – №02(10). – Режим доступа: http://ej.kubagro.ru/2005/02/10/p10.asp
77. Луценко Е.В., Лойко В.И., Семантические информационные модели управления агропромышленным комплексом. Монография (научное издание). – Краснодар: КубГАУ. 2005. – 480 с.
78. Луценко Е.В., Лопатина Л.М. Создание автоматизированной системы мониторинга, анализа, прогноза и управления продуктивностью сельскохозяйственных культур, Научный журнал КубГАУ [Электронный ресурс]. – Краснодар: КубГАУ, 2003. – №02(2). – Режим доступа: http://ej.kubagro.ru/2003/02/07/p07.asp
79. Луценко Е.В. Системно-когнитивный анализ как развитие концепции смысла Шенка – Абельсона / Е.В. Луценко // Научный журнал КубГАУ [Электронный ресурс]. – Краснодар: КубГАУ, 2004. – №03(5). – Режим доступа: http://ej.kubagro.ru/2004/03/pdf/04.pdf
80. Луценко Е.В. Типовая методика и инструментарий когнитивной структуризации и формализации задач в СК-анализе / Е.В. Луценко // Научный журнал КубГАУ [Электронный ресурс]. – Краснодар: КубГАУ, 2004. – №01(3). – Режим доступа: http://ej.kubagro.ru/2004/01/pdf/16.pdf
81. Луценко Е.В., Лойко В.И., Великанова Л.О. Постановка задачи, синтез и оценка адекватности семантической информационной модели прогнозирования урожайности зерновых колосовых и поддержки принятия решений по рациональному выбору агротехнологий. // Научный журнал КубГАУ [Электронный ресурс]. – Краснодар: КубГАУ, 2008. – №04(38). – Режим доступа: http://ej.kubagro.ru/2008/04/pdf/06.pdf
82. Луценко Е.В., Лойко В.И., Великанова Л.О. Прогнозирование урожайности зерновых колосовых и поддержка принятия решений по рациональному выбору агротехнологий с применением СК-анализа. // Научный журнал КубГАУ [Электронный ресурс]. – Краснодар: КубГАУ, 2008. – №04(38). – Режим доступа: http://ej.kubagro.ru/2008/04/pdf/07.pdf
83. Пат. № 2000610164. РФ. Адаптивная система анализа и прогнозирования состояний сложных систем "ДЕЛЬТА". /В.С.Симанков (Россия), Е.В.Луценко (Россия); Заяв. № 2000610164. Опубл. 03.03.2000. - 50с.
84. Пат. № 2003610433 РФ. Автоматизированная система мониторинга, анализа и прогнозирования развития сельхозкультур "ПРОГНОЗ-АГРО". / И. А. Драгавцева (Россия), Е.В.Луценко (Россия), Л.М.Лопатина (Россия); Заяв. № 2002611927 РФ. Опубл. от 18.02.2003. – 50с.
85. Пат. № 2003610986 РФ. Универсальная когнитивная аналитическая система "ЭЙДОС" / Е.В.Луценко (Россия); Заяв. № 2003610510 РФ. Опубл. от 22.04.2003. – 50с.
86. Пат. № 2003610987 РФ. Автоматизированная система комплексной обработки данных психологического тестирования "ЭЙДОС-" / Е.В.Луценко (Россия), С.Д.Некрасов (Россия); Заяв. № 2003610511 РФ. Опубл. от 22.04.2003. – 50с.
87. Пат. № 2003620035 РФ. База данных автоматизированной системы мониторинга, анализа и прогнозирования развития сельхозкультур "ПРОГНОЗ-АГРО". / И. А. Драгавцева (Россия), Е.В.Луценко (Россия), Л.М.Лопатина (Россия); Заяв. № 2002620178 РФ. Опубл. от 20.02.2003. – 50с.
88. Пат. № 940217. РФ. Универсальная автоматизированная система распознавания образов "ЭЙДОС". /Е.В.Луценко (Россия); Заяв. № 940103. Опубл. 11.05.94. – 50с.
89. Пат. № 940328 РФ. Универсальная автоматизированная система анализа, мониторинга и прогнозирования состояний многопараметрических динамических систем "ЭЙДОС-Т". /Е.В.Луценко (Россия); Заяв. № 940324. Опубл. 18.08.94. – 50с.
90. Пат. № 940334. РФ. Универсальная автоматизированная система анализа и прогнозирования ситуаций на фондовом рынке "ЭЙДОС-фонд" /Е.В.Луценко (Россия), Б.Х.Шульман (США); Заяв. № 940336. Опубл. 23.08.94. – 50с.
91. Перегудов Ф.И., Тарасенко Ф.П. Введение в системный анализ: Учебное пособие. – М.: Высшая школа, 1997. – 389с.
92. Перегудов Ф.И., Тарасенко Ф.П. Введение в системный анализ: Учебное пособие. – М.: Высшая школа, 1997. – 389с.
93. Петрик А.А., Лобанов В.Г., Симанков В.С., Луценко Е.В. Адаптивная система управления университетом. В сб.: "Информационные технологии и телекоммуникации в образовании". Тезисы докладов 2-й Международной выставки-конференции. – М.: ВВЦ, 2000. – С. 30-31.
94. Сайт: ИПУ РАН, Сектор-51 "Когнитивный анализ и моделирование ситуаций": http://www.ipu.ru/labs/lab51/projects.htm.
95. Сафронова Т.И., Луценко Е.В. Исследование семантической информационной модели управления качеством грунтовых вод на рисовых оросительных системах, Научный журнал КубГАУ [Электронный ресурс]. – Краснодар: КубГАУ, 2004. – №05(7). – Режим доступа: http://ej.kubagro.ru/2004/05/14/p14.asp
96. Сафронова Т.И., Луценко Е.В. Когнитивная структуризация и формализация задачи управления качеством грунтовых вод на рисовых оросительных системах, Научный журнал КубГАУ [Электронный ресурс]. – Краснодар: КубГАУ, 2004. – №05(7). – Режим доступа: http://ej.kubagro.ru/2004/05/13/p13.asp
97. Сафронова Т.И., Луценко Е.В. Проблема управления качеством грунтовых вод на рисовых оросительных системах и концепция ее решения, Научный журнал КубГАУ [Электронный ресурс]. – Краснодар: КубГАУ, 2004. – №05(7). – Режим доступа: http://ej.kubagro.ru/2004/05/11/p11.asp
98. Сафронова Т.И., Луценко Е.В. Синтез, оптимизация и верификация семантической информационной модели управления качеством грунтовых вод на рисовых оросительных системах, Научный журнал КубГАУ [Электронный ресурс]. – Краснодар: КубГАУ, 2004. – №05(7). – Режим доступа: http://ej.kubagro.ru/2004/05/12/p12.asp
99. Симанков В.С., Луценко Е.В., Лаптев В.Н. Системный анализ в адаптивном управлении: Монография (научное издание). /Под науч. ред. В.С.Симанкова. – Краснодар: ИСТЭК КубГТУ, 2001. – 258с.
100. Сотник С.Л. Конспект лекций по курсу "Основы проектирования систем искусственного интеллекта": (1997-1998), http://neuroschool.narod.ru/books/sotnik.html.
101. Тактаев С. Теория пространства понятий. [Электронный ресурс]. – Режим доступа: http://www.taktaev.com/russian/cnp.
102. Тельнов Ю.Ф. Интеллектуальные информационные системы в экономике. (Учебное пособие) - М., 2002.
103. Тельнов Ю.Ф. Интеллектуальные информационные системы. (Учебное пособие) - М., 2000.
104. Темников Ф.Е., Афонин В.А., Дмитриев В.И. Теоретические основы информационной техники. – М.: Энергия, 1979. – 511с.
105. Терехов С.А. Лекции по теории и приложениям искусственных нейронных сетей. Лаборатория Искусственных Нейронных Сетей НТО-2, ВНИИТФ, Снежинск (http://alife.narod.ru/lectures/neural/Neu_index.htm).
106. Ткачев А.Н., Луценко Е.В. Гуманистическая экономика, качество жизни и цели региональной администрации, Научный журнал КубГАУ [Электронный ресурс]. – Краснодар: КубГАУ, 2004. – №04(6). – Режим доступа: http://ej.kubagro.ru/2004/04/18/p18.asp
107. Ткачев А.Н., Луценко Е.В. Исследование многоуровневой семантической информационной модели влияния инвестиций на уровень качества жизни населения региона, Научный журнал КубГАУ [Электронный ресурс]. – Краснодар: КубГАУ, 2004. – №04(6). – Режим доступа: http://ej.kubagro.ru/2004/04/19/p19.asp
108. Ткачев А.Н., Луценко Е.В. Качество жизни населения, как интегральный критерий оценки эффективности деятельности региональной администрации, Научный журнал КубГАУ [Электронный ресурс]. – Краснодар: КубГАУ, 2004. – №02(4). – Режим доступа: http://ej.kubagro.ru/2004/02/14/p14.asp
109. Ткачев А.Н., Луценко Е.В. Постановка задачи и синтез многоуровневой модели влияния инвестиций на качество жизни, Труды Кубанского государственного аграрного университета. 2002. Вып. 401 (429), юбилейный. – С. 314-326.
110. Ткачев А.Н., Луценко Е.В. Формальная постановка задачи и синтез многоуровневой семантической информационной модели влияния инвестиций на уровень качества жизни населения региона, Научный журнал КубГАУ [Электронный ресурс]. – Краснодар: КубГАУ, 2004. – №04(6). – Режим доступа: http://ej.kubagro.ru/2004/04/17/p17.asp
111. Хагуров А.А., Луценко Е.В., Бакурадзе Л.А. Системный подход к социальному планированию развития города, Проблемы управления развитием городов: сборник докладов научно-практической конференции. – Краснодар: Краснодарский горисполком, 1985. – С. 53-61 (ДСП).
112. Шилейко, А.В. Введение в информационную теорию систем / А.В. Шилейко, В.Ф. Кочнев, Ф.Ф. Химушин. – М.: Радио и связь. 1985. – 280 с.
INTERNET-САЙТЫ
Сайт одного из авторов данной монографии: http://Lc.Kubagro.ru, выход на страничку о системе "Эйдос": http://Lc.kubagro.ru/aidos/eidos.htm.
http://ej.kubagro.ru, работы авторов в электронном Научном журнале КубГАУ:
http://ej.kubagro.ru/a/viewaut.asp?id=11
http://ej.kubagro.ru/a/viewaut.asp?id=10
http://ej.kubagro.ru/a/viewaut.asp?id=162
Базы данных репозитория UCI:
http://www.ics.uci.edu/~mlearn/MLRepository.html
http://datadiver.nw.ru/
http://www.dialog-21.ru
http://alephegg.narod.ru/Refs/Diagonal.htm
http://www.orc.ru/~stasson/neurox.html
http://www.statsoft.ru/home/textbook/modules/stneunet.html
http://www.finbridge.ru/net.shtml
http://alife.narod.ru/
http://www.businesstest.ru/default.asp?topic_id=3
http://www.stu.ru/inform/gl16x.htm
http://www.stu.ru/inform/gl17x.htm
А также сайты, обнаруживаемые в поисковых системах Yandex.ru, Aport.ru и Rambler.ru по запросам:
– "Интеллектуальная обработка данных (data mining)";
– "Распознавание образов";
– "Поддержка принятия решений";
– "Экспертные системы".
– "Когнитивное моделирование";
– "Нейронные сети";
– "Генетические алгоритмы";
– "Моделирование эволюции (машинная эволюция)";
– "Клавиатурный почерк";
– "Биометрическая идентификация пользователя";
– "Биологическая обратная связь";
– "Семантический резонанс".
Луценко Евгений Вениаминович
профессор, доктор экономических наук, кандидат технических наук,
профессор кафедры компьютерных технологий и систем
Кубанского государственного аграрного университета
Лойко Валерий Иванович
профессор, доктор технических наук,
заведующий кафедрой компьютерных технологий и систем
Кубанского государственного аграрного университета
Великанова Лариса Олеговна
доцент, кандидат экономических наук,
доцент кафедры информационных систем
Кубанского государственного аграрного университета
Научное издание
ПРОГНОЗИРОВАНИЕ И ПРИНЯТИЕ РЕШЕНИЙ
В РАСТЕНИЕВОДСТВЕ С ПРИМЕНЕНИЕМ
ТЕХНОЛОГИЙ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА
Монография
Литературный редактор
Е. В. Луценко
Оригинал-макет:
Е. В. Луценко
Лицензия ИД № 02334 от 14 июля 2000 г.
Подписано в печать "29" апреля 2008. Формат 6084. Бумага типографская.
Печ. л.: – 16,06. Заказ № __________ Тираж 500 экз.
Отпечатано в типографии Кубанского государственного аграрного университета
350044, г. Краснодар, ул. Калинина, 13
Последние комментарии
5 часов 19 минут назад
21 часов 23 минут назад
1 день 6 часов назад
1 день 6 часов назад
3 дней 12 часов назад
3 дней 17 часов назад