Совместное использование пакета Microsoft Office Excel 2007 и служб интеллектуального анализа данных SQL Server Analysis Services Афанасьева С.В.

Slides:



Advertisements
Similar presentations
 Overview  Smart Scan  Predicate Filtering  Column Projection  Join Filtering  Storage Indexes  Hybrid Columnar Compression  Flash Cache.
Advertisements

Астрометрические каталоги К.В.Куимов, ГАИШ МГУ. Определение астрометрического каталога Астрометрический каталог – понятие неопределённое. Например, это.
Linguistic tools Лекция 5. ПОИСКОВЫЕ СИСТЕМЫ: предыстория Библейские индексы и конкордансы 1247 – Hugo de St. Caro – было задействовано 500 монахов для.
Схема распределения грантов городам-участникам программы Тасис (TCAS) Экологические гранты для муниципалитетов.
Поиск оптимального набора параметров оптимизаций компилятора Брусенцов Леонид Евгеньевич студент 4 курса ФИТ НГУ Руководители:Илья.
Глава 1 Принципы экономики 4. Кривая производственных возможностей.
Разработка и внедрение объектно-ориентированной библиотеки для автоматизации тестирования Кафедра системного программирования Студент: Олейник А.Л. 544.
Системы отбора. Условные обозначения (1) (2) (3) (4) (5) (6) (7) Математическое моделирование процессов отбора2.
Автоматизированная поддержка пользовательской документации Web-приложений, разрабатываемых в среде WebRatio Студент: Дорохов Вадим, 544 гр. Научный руководитель:
Елена Станиславовна Петрова Учитель-логопед высшей категории ГДОУ детский сад №47 комбинированного вида Фрунзенского района г. Санкт-Петербурга 2011 год.
ООО «Баркод Маркет».  Инвентаризация имущества – программная система, позволяющая организовать учет любого имущества компании.  Уменьшение неконтролируемых.
Санкт-Петербургский Государственный Университет Математико-механический факультет Кафедра системного программирования Научный руководитель: Б.А. Новиков.
Савенко Мария Олеговна, 361 группа Научный руководитель: старший преподаватель В.С.Полозов.
Тел. (495) Москва, а/я 212 Рабочая группа по реформе МВД Москва, 2010 Новикова Асмик, Фонд «Общественный вердикт»
Можно выделить два подхода, на основе которых производится выбор посредника: 1.Аналитический, предполагающий осуществление выбора с использованием формул,
ПРИНЦИПЫ РАЗРАБОТКИ СИСТЕМЫ КЛАССА LEARNING MANAGEMENT SYSTEM И ОПЫТ ЕЕ ИСПОЛЬЗОВАНИЯ НА ФАКУЛЬТЕТЕ МЕНЕДЖМЕНТА Афанасьева С.В. Кафедра бизнес-информатики.
Определение необходимого уровня запасов на складе.
АВДАШЕВА СВЕТЛАНА КАФЕДРА ЭКОНОМИЧЕСКОГО АНАЛИЗА ОРГАНИЗАЦИЙ И РЫНКОВ 2011/2012 УЧЕБНЫЙ ГОД Теория отраслевых рынков (по выбору для 3 курса факультета.
Тема урока: Взаимно обратные числа 6 класс. Цели урока: вввести понятие взаимно обратных чисел; ссформировать умение находить взаимно обратные числа.
Оценка уровня развития базовых способностей обучающихся
Создание сервиса синхронизации разнородных баз данных Допущена к защите зав. кафедрой: д.ф.м.н., профессор Терехов А.Н. Научный руководитель: доцент Графеева.
Блок 3. Семейства белков I. Множественное выравнивание Первый курс, весна 2008, А.Б.Рахманинова.
1 Генерация контекстных ограничений для баз данных Выполнил: Жолудев В. Научный руководитель: Терехов А.Н. Рецензент: Иванов А.Н.
Гибридная технология перевода Юлия Епифанцева PROMT.
Инструменты AdWords Анна Минчук cертифицированный консультант по Google AdWords.
Понятие риска применительно к инвестиционным проектам
ГЕОИНФОРМАЦИОННЫЕ СИСТЕМЫ ДЛЯ МОНИТОРИНГА СОСТОЯНИЯ ЗДОРОВЬЯ НАСЕЛЕНИЯ Лаборатория Геоинформатики, ВНИИгеосистем, Москва Е.Н. Черемисина, М. Г. Суханов,
Сравнение различных методов хранения XML в реляционных базах данных и в разных системах. Нгуен Тхань Хуен- 545 группа Руководитель : Б.А. Новиков Рецензент:
 Нужно много различных протоколов связи  Каждый из них может реализовываться на разных платформах Современные сети Много устройств, компьютеров и сетей.
Сопоставление полигональных объектов на основе независимой фрагментации контуров Выполнил: Ю. М. Плотников Научный руководитель: канд. ф.-м. наук К. В.
PHP как язык программирования. Типы данных логические величины int, integer – целые числа real, double, float – вещественные числа string – строки array.
Создание экспериментального стенда для оценки методов поиска изображений по содержанию Выполнила: Теплых М. А. Научный руководитель: Васильева Н. С. Рецензент:
EDCWiki Electronic Document Circulation using wiki Система электронного документооборота на основе wiki Участники: Кузьмин К.А., Цыцулин В. И. Руководитель:
Анализ сценариев. Имитационное моделирование. 2 Метод сценариев метод, основанный на построении набора сценариев - возможных непротиворечивых комбинаций.
Оптимизация Just – in - time компилятора методом профилирования значений Соколов Андрей Владимирович, ФФ НГУ, 3 курс, Руководитель:
Симулятор квантовых вычислений Выполнил: Гедерцев А.С. Руководитель, д.ф.-м.н., профессор: Граничин О.Н.
Распределение наборов неоднородных по размеру заданий в кластерных системах на основе ClassAd механизма Голубев Александр Юрьевич, 542 группа Научный руководитель:
ВЫЧИСЛЕНИЕ В ЛИСПЕ Функциональное программирование Григорьева И.В.
Учебная презентация. Список упражнений Перед вами небольшой список упражнений по Microsoft Power Point: Для начала потренируйтесь создавать новые слайды,
Деревья и их представление в STL Презентацию подготовила Чиркова Ольга, 2 подгруппа, группа 271ПИ.
Текстовый процессор Word. Возможности программы Word 1. Работа с текстами: ввод текста; редактирование текста; форматирование текста (изменение параметров.
Воспроизведение лучших результатов ad hoc поиска семинара РОМИП Romip-base project Красильников Павел, Механико-математический факультет МГУ им. Ломоносова.
Санкт-Петербургский Государственный Университет Математико-Механический факультет Кафедра системного программирования Применение диаграмм двоичных решений.
Кураева Екатерина Анатольевна, заместитель директора по УВР, учитель математики сш № 29.
Presentation… The Symbolic Dimension of Innovation Process Nicola Cavalli.
Применение генетических алгоритмов к генерации тестов для автоматных программ Законов Андрей Юрьевич Научный руководитель: Степанов Олег Георгиевич, к.т.н.,
Моделирование будущего с помощью Динамического Финансового Анализа
Методы анализа данных. Статистическая проверка гипотез.
BioUML интегрированная расширяемая среда для моделирования биологических систем Biosoft.Ru Лабоработория Биоинформатики КТИ ВТ СО РАН
Применение генетических алгоритмов для генерации тестов к олимпиадным задачам по программированию Буздалов М.В., СПбГУ ИТМО.
Место человека в интеллектуальной техносреде В.В. Бушуев, д.т.н., проф., Генеральный директор Института энергетической стратегии ЦМТ, г.
9 октября 2004 Поиск статических изображений по содержанию: использование текстового запроса Наталья Васильева
Универсальная интеграция технологии построения отчетов в семейство.NET приложений Презентация дипломной работы Порсева Анатолия, 542 гр. Санкт-Петербург.
Транспортная логистика Алгоритм ускоренного планирования автомобильных перевозок.
Анализ и оптимизация плана работ и стоимости проекта.
Проверка эквивалентности срединной и линейной осей многоугольника Дипломная работа студента 545 группы Подколзина Максима Валериевича Санкт-Петербургский.
Московский инженерно-физический институт (государственный университет) НЕЙТРОННО-ФИЗИЧЕСКИЕ ХАРАКТЕРИСТИКИ ТЯЖЕЛОВОДНОГО РЕАКТОРА С РЕГУЛИРУЕМЫМ СПЕКТРОМ.
Классификация, кластеризация и поиск изображений на основе низкоуровневых характеристик Наталья Васильева Руководитель: Новиков Б. А.
XML Схемы XML документов. XML Schema созданая Microsoft позволяет избавиться от DTD блоков. Основа – использование пространств имен и очень точная типизация.
Исследование возможностей сервисной шины SonicMQ Дипломная работа студентки 545 группы Комольцевой Дарьи Владимировны Научный руководитель: Графеева Н.Г.
Microsoft TechDayshttp:// Александр Шаповал Эксперт по стратегическим технологиям
SQL Server 2012 Более 100 новых функций!. Конференция «Лонч SQL Server 2012» в Санкт-Петербурге 10 апреля 2012 Courtyard by Marriott 2-ая линия Васильевского.
ОЦЕНКА РАДИАЦИОННОГО РЕСУРСА КОРПУСОВ РЕАКТОРОВ ВВЭР-440 В УСЛОВИЯХ ВНЕДРЕНИЯ МОДЕРНИЗИРОВАННОГО ЯДЕРНОГО ТОПЛИВА. Адеев В.А., Бурлов С.В., Панов А.Е.
КРУПНЕЙШАЯ ТЕХНИЧЕСКАЯ КОНФЕРЕНЦИЯ MICROSOFT В УКРАИНЕ Metro приложения: работа с данными Краковецкий Александр, MVP/RD/PhD. DevRain Solutions.
Алгебра логики это раздел математики, изучающий высказывания, рассматриваемые со стороны их логических значений (истинности или ложности) и логических.
Pavel Titenkov © SQL. Pavel Titenkov © Общий обзор англ. Structured Query Language — «язык структурированных запросов»англ. Это наиболее часто используемый.
Сергей Копорулин | Эксперт по технологиям | Microsoft
Управление SQL Server c помощью PowerShell
November CTP Андрей Коршиков MCP-клуб, Краснодар Декабрь 2009.
Сортировка, поиск и фильтрация данных в базе данных и выборках
Presentation transcript:

Совместное использование пакета Microsoft Office Excel 2007 и служб интеллектуального анализа данных SQL Server Analysis Services Афанасьева С.В.

Data Mining (Интеллектуальный анализ данных) - это технология выявления скрытых взаимосвязей внутри больших баз данных. Является службой Microsoft SQL Server 2005 (2008) Analysis Services

Службы Microsoft SQL Server 2005 Analysis Services (SSAS) содержат : Алгоритм дерева принятия решений Алгоритм кластеризации Упрощенный алгоритм Байеса Алгоритм взаимосвязей Алгоритм кластеризации последовательностей Алгоритм временных рядов Алгоритм нейронной сети (службы SSAS) Алгоритм логистической регрессии Алгоритм линейной регрессии

Надстройки интеллектуального анализа данных SQL Server 2005 для Office 2007 выявлять закономерности и тренды, существующие в сложных данных, отображать такие закономерности в диаграммах и интерактивных средствах просмотра формировать цветные сводные отчеты для презентаций и бизнес-аналитики. анализировать корреляции и формировать прогнозы для данных, хранящихся в таблицах Microsoft Office Excel, или создавать и изменять модели интеллектуального анализа данных, хранящихся в экземпляре Analysis Services

Надстройки интеллектуального анализа данных в Office 2007 Алгоритм интеллектуального анализа данных представляет собой механизм, создающий модели интеллектуального анализа данных. Средства интеллектуального анализа данных в этой надстройке автоматически анализируют распределение и тип данных и рекомендуют лучший способ обработки данных для получения допустимых результатов.

Обзор средств анализа таблиц для Excel Анализ ключевых факторов влияния Определяет столбцы данных с наибольшим влиянием на выбранное значение или столбец значений. Поиск категорий Определяет строки с похожими свойствами. Заполнение по примеру Поиск отсутствующих значений данных в выбранном столбце и предложение новых значений на основе закономерностей в данных. Прогноз Прогнозирует будущие значения с учетом ряда значений. Выделение исключений Поиск значений в столбце данных, не соответствующих шаблонам, обнаруженным в данных. Анализ сценария: поиск решения Указывает целевое значение и определяет базовые факторы, подлежащие изменению для соответствия цели на основе анализа шаблонов данных. Анализ сценария: гипотетические ситуации Использует значения для определения результата изменения на основе анализа закономерностей в данных

Анализ ключевых факторов влияния При создании отчета, средство выполняет три действия: создает структуру интеллектуального анализа данных, хранящую ключевые сведения о данных; создает модель интеллектуального анализа данных с помощью упрощенного алгоритма Байеса Майкрософт; запускает прогнозирующий запрос для каждой заданной пары атрибутов, чтобы определить факторы, наиболее отличающие эти два целевых атрибута. Это средство автоматически устанавливает параметры после выполнения анализа данных для определения оптимальных параметров. Цвета заливки произвольные и могут повторно использоваться в каждой сравниваемой паре. Длина полосы показывает вероятность влияния фактора на результат и, следовательно, чем она длиннее, тем теснее взаимосвязь.

Сравнение факторов, ведущих к значениям "Skilled Manual" и "Management"

Поиск категорий После завершения работы средства создается отчет со списком найденных категорий вместе с их отличительными характеристиками. Средство Поиск категорий выполняет автоматический поиск в таблице строк с похожими характеристиками. По умолчанию в таблицу данных добавляется новый столбец с предлагаемой категорией. Затем можно просмотреть категории и переименовать их.

Поиск категорий - диаграмма В таблицу данных добавляется новый столбец с предлагаемой категорией

Заполнение по примеру Средство позволяет быстро создать новые столбцы данных, основанные на закономерностях, найденных в таблице, и образцах новых значений, предоставленных пользователем. При использовании средства Заполнение по примеру формируется отчет, в котором содержится развернутая информация об обнаруженных закономерностях. Эти закономерности также используются при экстраполяции новых значений. Отчет о закономерностях раскрывает ключевые факторы, влияющие на каждое прогнозируемое значение. Описание каждого влияющего фактора или правила содержит в себе имя столбца, значение столбца и относительное влияние данного правила на прогноз. Например, в таблице, содержащей данные о покупателях и их закупках в течение года, можно создать новый столбец и ввести несколько образцов значений, таких как «Крупный покупатель», «Мелкий покупатель» и так далее. Это средство заполнит значениями оставшиеся строки данного столбца путем анализа существующих закономерностей в данных и применяя введенные примеры значений. Если результат окажется неудовлетворительным, можно сделать уточнение, введя дополнительные примеры значений.

Прогноз Новые значения рядов времени не добавлены; это позволяет сначала предварительно просмотреть прогнозы. После завершения мастера новые прогнозы добавятся в конец таблицы источника данных, Средство Прогноз позволяет делать прогноз, основанный на данных в таблице Excel или другом источнике данных, и, по желанию, показывает вероятность каждого прогнозируемого значения. Например, если данные содержат столбец даты и столбец, показывающий объем продаж по каждому дню месяца, можно прогнозировать объем продаж на будущие дни. Также можно указать количество выполняемых прогнозов. Например, пять дней или тридцать. Мастер также создает новый лист с именем «Отчет о прогнозе». Этот лист сообщает об успешности создания прогноза мастером. Новый лист также содержит линейную диаграмму, показывающую тренды предыстории. При расширении ряда времени для включения новых прогнозов прогнозируемые значения добавляются в линейную диаграмму. Значения с предысторией отображаются сплошной линией, а прогнозы — точечной.

Выделение исключений На сводной диаграмме показано число ячеек в каждом столбце, значения в которых превышают порог исключений. Средство в исходной таблице выделяет подсветкой ячейки с подозрительными значениями. Темная подсветка означает, что строка требует внимания. Светлая подсветка означает, что значение в этой конкретной ячейке рассматривается как подозрительное. Средство Выделение исключений работает во всем диапазоне данных таблицы Excel или с несколькими выбранными столбцами. Можно также настроить порог, управляющий изменчивостью данных, чтобы обнаруживать больше или меньше исключений. Иногда данные содержат значения, выходящие за пределы ожидаемого диапазона. Например, владельцу дома могут записать возраст 5 лет. Такие значения, которые называют выбросами, часто бывают неправильными из-за ошибок ввода или указания неверных трендов. Как бы то ни было, исключения могут снизить качество анализа. Средство Выделение исключений помогает найти эти значения, просмотреть их и предпринять то или иное действие.

Анализ сценария: поиск решения Сценарий Поиск решения представляет собой дополнение к средству сценария Анализ гипотетических вариантов и указывает на влияющие факторы, которые должны быть изменены При создании сценария поиска решения выполняются следующие действия. Создает структуру интеллектуального анализа данных, в которой хранятся ключевые сведения о содержащихся в таблице данных. На основе существующих данных создает модель интеллектуального анализа с логистической регрессией. Создает прогнозирующий запрос для каждого из указанных значений. Средство Анализ вариантов показывает влияние различных изменений, а средство Поиск решения указывает на влияющие факторы, которые должны быть изменены для достижения желаемого изменения. Алгоритм логистической регрессии может работать как с числовыми, так и с дискретными значениями. В первом добавленном столбце могут быть либо флажки на фоне зеленого круга, указывающие на то, что решение может быть найдено, либо символы «Х» на фоне красного круга, указывающие на то, что решение не может быть найдено ни при каких изменениях значения. Второй столбец содержит рекомендуемое изменение.

Анализ сценария: гипотетические ситуации Сценарий анализирует закономерности существующих данных, а затем позволяет оценить влияние изменений в одном столбце на значение другого столбца. При создании сценария средство выполняет задачи: Создает структуру интеллектуального анализа данных, в которой хранятся ключевые сведения о содержащихся в таблице данных. На основе существующих данных создает модель интеллектуального анализа с логистической регрессией. Создает прогнозирующий запрос для каждого из указанных значений. Средство сценария Анализ гипотетических вариантов анализирует закономерности существующих данных, а затем позволяет оценить влияние изменений в одном столбце на значение другого столбца. Например, можно проанализировать влияние повышения цены товара на объем продаж. Мастер позволяет создавать произвольное количество прогнозов. После завершения первоначального анализа можно спрогнозировать результаты для всех данных таблицы либо ввести контрольные значения по одному. Столбцы, добавляемые к таблице, содержат два типа данных: спрогнозированное значение с учетом данного изменения и его достоверность. Достоверность представляет собой вероятность правильности прогноза.

Спасибо