Московский Государственный Университет им. М.В. Ломоносова
Географический Факультет
КАФЕДРА ФИЗИЧЕСКОЙ ГЕОГРАФИИ И ЛАНДШАФТОВЕДЕНИЯ

Разделы


Студентам

МАТЕРИАЛЫ ПРАКТИЧЕСКИХ И СЕМИНАРСКИХ РАБОТ
Материалы курса
"АНАЛИЗ ДАННЫХ В СРЕДЕ R"
дисциплина по выбору, четвертый курс, осенний семестр

    Задания №1, №2, №3, №4, №5 новое

Экзаменационные вопросы

Программное обеспечение

Литература и справочные материалы


Задание № 1. «Основные приемы работы в R»

Цель: освоить приемы работы в R (типы переменных, вычисления и визуализация данных).

  1. Установить R и RStudio на свой персональный компьютер
  2. Прочитать разделы пособия Наглядная статистика. Используем R! (Шипунов и др, 2014)
       Глава 2. Как обрабатывать данные
          2.3. Из истории S и R  . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
          2.4. Применение, преимущества и недостатки R . . . . . . . . . 25
          2.5. Как скачать и установить R. . . . . . . . . . . . . . . . . . . . . 27
          2.6. Как начать работать в R . . . . . . . . . . . . . . . . . . . . . . . 28
            2.6.1. Запуск  . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
            2.6.2. Первые шаги . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
       Приложение А. Пример работы в R . . . . . . . . . . . . . . . . 196-206
  3. Открыть в RStudio скрипт R_intro_2016.R. Сохранить файл данных MET_points_2014.txt на диск персонального компьютера
  4. Последовательно выполнить команды, критически читая комментарии. В начале раздела 1.2 "Загрузка данных из файла" - исправить путь к рабочей директории setwd("D:/Dropbox/R")

Задание № 2. «Статистический анализ данных в R. Начало»

Цель: провести средствами R статистические тесты, регрессионный и кластерный анализы для учебного набора данных и повторить их для данных индивидуального научного исследования (курсовая работа, НСО и др.).


- инструкция к выполнению задания

- zip-архив с комплектом материалов


Задание № 3. «Статистический анализ данных в R. Землетрясения»

Цель: провести средствами R статистическую проверку Н0: среднемноголетнее число землетрясений с магнитудой больше 7 по месяцам не различается. Источник данных: The Significant Earthquake Database.


- инструкция к выполнению задания

- zip-архив с комплектом материалов


Задание № 4. «AQP - визуализация и анализ почвенных профилей»

Цель: визуализировать профили почв, провести их сравнение и анализ.

  1. посетить тематическую страницу Algorithms for Quantitative Pedology project (AQP), познакомиться в возможностям пакета
  2. построить профили таксонов двух близких типов почв (например, черноземов и лугово-черноземных почв) по Классификации почв СССР (1977) согласно их характеристикам в Едином Государственном Реестре Почвенных Ресурсов России (ЕГРПР) средствами AQP (скрипт R_AQP_SoilProfiles.R)
  3. визуализировать вертикальный профиль гумуса и плотности черноземов Центрально-Черноземного заповедника

- инструкция к выполнению задания

- zip-архив с комплектом материалов


Задание № 5. «Моделирование почвенно-ландшафтных связей»

Упражнение демонстрирует порядок построения модели почвенно-ландшафтных связей (ПЛС) для номинальных категорий почвенной классификации с использованием инструментов статистического анализа и машинного обучения в среде R: линейного дискриминантного анализа (linear discriminant analysis), ансамбля деревьев решений (Random Forest) и метода опорных векторов (supported vector machine).

Последовательно решаются задачи:
  1. загрузить и визуализировать исходные данные почвенно-топографической съемки;
  2. провести предварительный экспертный и количественный анализ положения почв в пространстве факторов (оценить информативность индикационных переменных);
  3. построить модели почвенно-ландшафтных связей по обучающей выборке с использованием трех методов;
  4. на основе модели построить прогнозную карту;
  5. оценить неопределенности разных моделей и сравнить их друг с другом.

- инструкция к выполнению задания

- zip-архив с комплектом материалов


 ЛИТЕРАТУРА и СПРАВОЧНЫЕ МАТЕРИАЛЫ

http://ashipunov.info/shipunov/school/books/rbook.pdf - "Наглядная статистика. Используем R!" - основное учебное пособие к освоению дисциплины. В практических заданиях указываются тематические разделы, обязательные для прочтения.

http://r-analytics.blogspot.ru - примеры анализа и визуализации данных при помощи R, а также переводы документации по этой программе

http://www.statmethods.net/ - сжатое справочное пособие для работы в R.


http://www.r-graph-gallery.com - лучшие примеры визуализации данных средствами R. Выбираем нужный график-карту-схему и смотрим его код.


Тематические сообщеста в Google+ (присоединяйтесь и следите за новостями):

https://plus.google.com/u/0/communities/115516770321395255377 - R Programming for Data Analysis

https://plus.google.com/u/0/communities/117681470673972651781 - Statistics and R


 ПРОГРАММНОЕ ОБЕСПЕЧЕНИЕ
В качестве инструментов пространственного анализа используются компьютерные программы, бесплатные для некоммерческого использования и обладающие необходимой функциональностью при относительной простоте использования.
R - свободная программная среда вычислений для статистической обработки данных, работы с графикой, цифровой картографии и моделирования
RStudio - is an integrated development environment (IDE) for R. It includes a console, syntax-highlighting editor that supports direct code execution, as well as tools for plotting, history, debugging and workspace management.
Quntum GIS (QGIS) - дружественная к пользователю cвободная географическая информационная система с открытым кодом, распространяющаяся под GNU General Public License. QGIS является проектом Open Source Geospatial Foundation (OSGeo). Она работает на Linux, Unix, Mac OSX, Windows и Android, поддерживает множество векторных, растровых форматов, баз данных и обладает широкими возможностями.
System for Automated Geoscientific Analyses (SAGA) - одно из лучших некоммерческих средств анализа пространственно распределенных данных (ГИС-операции, геостатистика, морфометрический анализ ЦМР, тематический анализ аэрокосмической снимков и др.). Программа разрабатывается под руководством Джергена Бохнера (Juergen Böhner) и Олафа Конрада (Olaf Conrad) в Университете Гамбурга (отдел физической географии Института географии и Klimacampus, Германия). Распространяется по GNU Lesser General Public License (LGPL).
Программа Gimp 2 - полнофункциональный графический редактор с русским интерфейсом и возможностями, не уступающими Adobe Photoshop.
Программа ImageJ - графический редактор c возможностями количественного анализа изображений.

[09.12.16]

доцент Д.Н. Козлов

при использовании материалов ссылка обязательна
Copyright © 2006-2017 Кафедра физической географии и ландшафтоведения
Последнее обновление сайта - март 2017 г.
Locations of visitors to this page Группа ЛАНДЫ в контакте GISMETEO: Погода по г.Москва