Меню сайта
Главная » 2014 » Август » 29 » Скачать Автоматическое районирование многомерных данных в векторных ГИС. Заварзин, Андрей Владимирович бесплатно
10:37 PM
Скачать Автоматическое районирование многомерных данных в векторных ГИС. Заварзин, Андрей Владимирович бесплатно
Автоматическое районирование многомерных данных в векторных ГИС

Диссертация

Автор: Заварзин, Андрей Владимирович

Название: Автоматическое районирование многомерных данных в векторных ГИС

Справка: Заварзин, Андрей Владимирович. Автоматическое районирование многомерных данных в векторных ГИС : диссертация кандидата технических наук : 05.13.17 Москва, 2003 159 c. : 61 04-5/418-8

Объем: 159 стр.

Информация: Москва, 2003


Содержание:

Введение
Глава 1 Теоретические основы автоматической классификации многомерных данных в векторных ГИС
11 Обзор классических методов классификации многомерных данных
111 Постановка задачи классификации многомерных данных
112 Классификация задач разбиения множества многомерных объектов на однородные группы
113 Модель смеси распределений
114 Методы классификации без обучения
12 Обзор методов автоматической классификации и районирования, применяемых в геоинформатике
121 Направления исследований авторов
122 Оценочные и типологические классификации многомерных данных
123 Алгоритмы классификации многомерных данных, применяемые в геоинформатике
124 Учет при классификации многомерных данных географического пространства
13 Реализация методов автоматической классификации и районирования в современных векторных ГИС
131 Реализация в векторных ГИС методов классификации по единственному признаку
132 Реализация в векторных ГИС методов классификации по многим признакам
14 Выводы по главе 1
Глава 2 Формирование системы методов автоматического районирования
21 Система методов автоматического районирования
211 Обобщение постановки задачи районирования
212 Классификация методов районирования
22 Ядерные методы автоматического районирования
221 Общая схема ядерного алгоритма районирования
222 Алгоритм районирования на основе метода классификации к-медоидов
223 Изоморфизм постановок задач классификации многомерных данных при наличии ограничений
23 Иерархические методы автоматического районирования
231 Агломеративные иерархические алгоритмы районирования
232 Дивизимные иерархические алгоритмы районирования на основе классических дивизимных методов классификации
233 Дивизимный иерархический алгоритм районирования барьеров максимальных различий
24 Выводы по главе 2
Глава 3 Разработка технологии автоматического районирования-
31 Общая схема процессов автоматической классификации и районирования
311 Этапы автоматической классификации многомерных данных в векторных ГИС
312 Функции ГИС, необходимые для реализации системы автоматического районирования
32 Модели идентификации объектов
321 Постановка задачи идентификации объектов
322 Формализация задачи идентификации объектов
323 Базовая и расширенная модели идентификации объектов
324 Исследование разработанных моделей
33 Получение, хранение и использование матрицы смежности
331 Трудности реализации системы автоматического районирования, связанные с матрицей смежности
332 Вычисление матрицы смежности для одинакового количества объектов
333 Зависимость времени вычисления матрицы смежности от частоты процессора
334 Зависимость времени вычисления матрицы смежности от количества объектов
335 Организация хранения матрицы смежности
336 Дополнительные сложности программной реализации модуля расчета матрицы смежности
34 Реализация и исследование агломеративных иерархических алгоритмов районирования
341 Проблема расчета межрайонных расстояний для агломеративных методов районирования
342 Комбинированный алгоритм расчета межрайонных расстояний
343 Оценка временной сложности агломеративных алгоритмов районирования
344 Пространственные свойства образуемых районов для различных агломеративных алгоритмов районирования
35 Модель визуализации хода и результатов анализа
351 Классические средства визуализации
352 Картографические средства визуализации
353 ER-модель визуализации
354 Пример визуализации автоматического районирования
36 Выводы по главе 3

Введение:

В современном мире практически невозможно отыскать область деятельности человека, в которой бы не использовались достижения информатики. Объем накапливаемой информации продолжает экспоненциально расти, заставляя исследовать и предлагать новые способы ее обработки, а также программные средства автоматизации.
Одним из важнейших подразделов информатики является геоинформатика, под которой понимается совокупность средств и методов обращения с пространственной информацией. Пространственной1 считается любая информация, имеющая компонент местоположения, а класс автоматизированных информационных систем, предназначенных для эффективной работы с ней, носит название геоинформационных систем (ГИС).
А, Эмпирически подсчитано, что доля пространственной информации составляет л около семидесяти пяти процентов от всей накапливаемой человечеством. Действительно, трудно с ходу привести пример информации, которая не привязана к некоторой системе координат. Именно поэтому спектр применения ГИС очень широк и выходит далеко за рамки систем для географии. Особенностью пространственной информации является возможность ее наглядной визуализации в виде карты - естественной модели окружающего нас мира. Карта позволяет единым образом передать сведения о состоянии десятков и сотен объектов, в то время как при обычном представлении человек способен умозрительно манипулировать только пятью-семью объектами.
Одними из передовых методов обработки информации любой природы являются так называемые методы анализа данных. Методы анализа данных Всюду далее термин «пространственные» указывает на наличие в данных компонента местоположения позволяют выявлять в информационных массивах скрытые закономерности и извлекать новые знания, которые недоступны при умозрительном анализе.
Настоящее исследование проведено в - области пересечения методов анализа данных и геоинформатики. Рассматриваемые в работе методы анализа данных ограничены алгоритмами автоматической классификации, которые, впрочем, составляют значительную часть математического аппарата теории распознавания образов.
Исходной информацией для методов классификации являются многомерные данные, т.е. множество объектов, «погруженных» в атрибутивное многопризнаковое пространство. В геоинформатике же всегда оперируют пространственными данными, т.е. такими данными, которые имеют компонент местоположения. Для обозначения объектов, характеризуемых одновременно и атрибутивными признаковыми, и пространственными составляющими, будем использовать термин многомерные пространственные данные. Многомерность # векторных данных возникает при учете набора атрибутов пространственных объектов (например, процентов населения, занятых в различных отраслях производства для карты административно-территориального деления). Многомерность растровых данных чаще всего возникает при получении (например, с помощью космического спутника) серии снимков одного и того же участка земной поверхности, выполненных в разных спектрах (так называемые мультиспектральные снимки). В качестве синонима термина методов анализа данных «объект» в геоинформатике часто выступает термин «операционно-территориальная единица» (ОТЕ).
При классификации многомерных пространственных данных нельзя не учитывать пространственные аспекты анализируемых явлений. Одним из основных подразделов пространственной классификации является районирование. Под районированием понимается деление территории на множество непересекающихся целостных районов, представляющих собой компактные сгущения ОТЕ как в географическом, так и в признаковом
• пространстве (Блануца, 1993, с.З). Подчеркнем, что при подобной постановке задачи методы районирования являются неотъемлемой частью методов анализа данных, распознавания образов, и предназначены для обработки специфических (имеющих пространственную привязку) объектов.
Методы анализа данных бурно развивались в последние десятилетия параллельно с классификационным течением в геоинформатике. В этой связи существующие методы классификации в общем и районирования в частности, применяющиеся в геоинформатике, не всегда учитывают последние тенденции своего «старшего брата» - раздела классификации методов анализа данных. С позиций данного тезиса актуальной проблемой является формирование системы методов районирования, являющихся проекцией стандартных методов анализа данных на географическое поле исследования. Являются не решенными, в частности, задачи сравнения методов районирования между собой, а также оценки вариантов их эффективной компьютерной реализации.
Компьютерная реализация методов пространственной классификации немыслима без привлечения геоинформационных технологий. Геоинформационные технологии - это технологии компьютерного обращения с пространственной информацией. Проблема, с которой сталкивается большинство исследователей при проведении экспериментов по классификации многомерных пространственных данных, заключается в отсутствии в современных промышленных векторных ГИС инструмента многомерной классификации. При этом возможность классификации ОТЕ по единственному признаку присутствует во всех ГИС, поскольку такая функция необходима для тематического картографирования.
Нераскрытой остается и возможность использования мощных средств картографической визуализации современных ГИС для поддержки процесса классификации многомерных пространственных данных. Карта является уникальным средством представления информации. В этой связи важно исследование принципов использования картографической визуализации совместно с классическими средствами визуализации при создании средств автоматизации районирования.
Актуальность диссертационной работы. Суммируя сказанное, актуальность выбранной темы обуславливается потребностью практики в инструменте классификации многомерных данных, имеющих пространственную компоненту. Такой инструмент не является чем-то узко специфическим, поскольку процент пространственной информации очень высок. В настоящее время отсутствуют программные комплексы, совмещающие процесс анализа и визуализации в единой методике и реализующие алгоритмы классификации, ориентированные на работу с многомерными пространственными данными. Это объясняется бурным развитием методов анализа данных, новизной геоинформационных технологий и специфичностью пространственных атрибутов объектов, учесть которые в стандартных алгоритмах анализа данных напрямую невозможно.
Целью диссертационной работы является разработка технологии автоматического районирования многомерных пространственных данных в векторных ГИС.
Объектом исследования является процесс автоматической классификации многомерных данных.
Предметом исследования является процесс автоматического районирования многомерных пространственных данных и его компьютерная реализация в векторных ГИС.
Разработка технологии автоматического районирования многомерных пространственных данных в векторных ГИС предполагает решение следующих задач:
1. Систематизация, разработка и исследование моделей и алгоритмов автоматического районирования многомерных пространственных данных.
2. Исследование процессов обработки многомерных пространственных данных в ходе проведения районирования.
3. Разработка принципов создания средств автоматизации районирования многомерных пространственных данных.
Методологическую и теоретическую основу исследования составили научные труды отечественных и зарубежных прикладных математиков и географов. Ведущие работы по прикладной статистике и классификации за рубежом принадлежат M.Jambu, M.Kendall, G.Kramer, J.Kruskal, G.Lance, J.Mac Queen, W.Williams. Методологическим проблемам классификации в прикладной статистике посвящены работы отечественных ученых С.А.Айвазяна, Э.М.Бравермана, В.М.Бухштабера, И.С.Енюкова, Л.Д.Мешалкина, Б.Г.Миркина. Отечественными географами, заложившими и развивающими классификационное движение в геоинформатике, являются И.Г.Александров, Н.Н.Баранский, В.И.Блануца, Н.Н.Колосовский, Г.М.Кржижановский, Т.М.Калашникова, В.А.Рубцов, Ю.Г.Саушкин, В.С.Тикунов, А.М.Трофимов, М.Д.Шарыгин. 0 В работе использовались следующие методы исследования: системный анализ; методы анализа данных; методы экспертного оценивания; эксперимент; измерение; сравнение.
В числе информационных источников диссертации использованы: научные источники в виде данных и сведений из книг, журнальных статей, научных докладов и отчетов, материалов научных конференций и семинаров; статистические источники в виде отечественных статистических материалов. Ф
Научная новизна исследования заключается в:
• определении роли и места районирования в разделе классификации методов анализа данных: постановка задачи районирования является частным случаем постановки задачи «классификации с ограничениями»;
• разработке комбинированного алгоритма расчета межрайонных расстояний для агломеративных методов районирования, использование которого при реализации методов позволяет сократить время обработки данных;
• разработке принципов картографической визуализации хода и результатов районирования многомерных пространственных данных: впервые ход анализа рассмотрен как объект визуализации.
Практическая значимость работы состоит в:
• разработке и исследовании принципов создания программного средства автоматизации районирования многомерных пространственных данных, в том числе методов идентификации ОТЕ и хранения и использования матрицы смежности;
• реализации методов автоматической классификации и районирования в геоинформационной среде, что позволило вывести процесс соответствующей обработки многомерных пространственных данных на качественно новый уровень диалогового визуального анализа.
Апробация результатов исследования.
Основные научные положения, теоретические и практические результаты диссертационного исследования докладывались и обсуждались на четырех научных конференциях, в том числе международных:
• на Межведомственной научно-практической конференции (Москва, ФАПСИ при Президенте РФ, 2002);
• на Международной научной конференции «Интернет — Образование — Наука» (Украина, Винница, 2002);
• на Международной научной конференции «Интернет - среда новых технологий и информационного общества» (Болгария, Велико Търново, 2001);
• на Международной научной конференции «Разработка прикладных систем» (Сучава, Румыния, 2001).
В Международной научной конференции 2002 года в Винницком государственном техническом университете (Украина) автор участвовал в качестве члена оргкомитета.
По теме исследования опубликовано двенадцать печатных работ, в том числе:
глава «Классификации» в учебнике для ВУЗов «Основы геоинформатики» (Заварзин, Тикунов, 2003); учебно-методическое пособие (Заварзин, 2002 а); шесть научных статей в реферируемых журналах (Кретов, Пинчук, Заварзин, 2001; Заварзин, Месюра, 2001; Заварзин, Месюра, 2002; Mesura, Zavarzin, 2002 а; Заварзин, Месюра, 2003; Заварзин, Орешкина, Тикунов, 2003); четыре статьи в сборниках материалов конференций (Заварзин, 2002 а; Заварзин, 2002 б; Заварзин, 2002 в; Mesura, Zavarzin, 2002 b).
Получено три акта о внедрении результатов исследования:
1. Разработанные и реализованные методы районирования внедрены в практическую деятельность группы «Меркатор» Института географии РАН.
2. Результаты диссертационной работы используются в курсе «Геоинформатика», читаемом на географическом факультете МГУ имени М.В.Ломоносова.
3. Разработанное программное обеспечение «GisCluster 2.0» и результаты диссертации, касающиеся свойств алгоритмов районирования многомерных пространственных данных и методики визуализации, внедрены в учебный процесс в/ч 33965.
На защиту выносятся следующие положения: классификация методов районирования, произведенная с позиций методов анализа данных; комбинированный алгоритм расчета межрайонных расстояний для агломеративных методов районирования, позволяющий в зависимости от пространственной и атрибутивной составляющей данных примерно в полтора раза сократить время их обработки.
Структура и объем работы.
Диссертационная работа состоит из введения, трех глав, заключения, списка литературы и десяти приложений.

Скачивание файла!Для скачивания файла вам нужно ввести
E-Mail: 1528
Пароль: 1528
Скачать файл.
Просмотров: 212 | Добавил: Иван44 | Рейтинг: 0.0/0
Форма входа
Календарь
«  Август 2014  »
ПнВтСрЧтПтСбВс
    123
45678910
11121314151617
18192021222324
25262728293031