Базовые методы анализа, реализованные в аналитической платформе Deductor — ВикиПро: Отраслевая энциклопедия. Окна, двери, мебель

ТБМ Маркет Доброе окошко Конкурс

Сейчас в WikiPRO 3514 статей и 31 161 страниц на русском языке.

Для увеличения текста нажмите CTRL+ для уменьшения CTR-
Если Вы нашли ошибку в тексте, выделите её мышкой и нажмите Ctrl+Enter


Базовые методы анализа, реализованные в аналитической платформе Deductor

Мне нравится
0  

Материал из ВикиПро: Отраслевая энциклопедия. Окна, двери, мебеля
Перейти к: навигация, поиск

Online Analytical Processing

Любая система поддержки принятия решений, прежде всего, должна обладать средствами отбора и предоставления пользователю данных в удобной для восприятия и анализа форме. Как правило, наиболее удобными для анализа являются многомерные данные, описывающие предметную область сразу с нескольких точек зрения. Для описания таких наборов данных вводится понятие многомерных кубов (гиперкубов, метакубов). По осям такого куба размещаются параметры, а в ячейках – зависящие от них данные. Вдоль каждой оси представлены различные уровни детализации данных. Использование такой модели данных позволяет повысить эффективность работы с ними: генерировать сложные запросы, создавать отчеты, выделять подмножества данных и т.д. Технология комплексного многомерного анализа данных и предоставления результатов этого анализа в удобной для использования форме получила название OLAP.

OLAP (Online Analytical Processing)

оперативная аналитическая обработка данных. OLAP дает возможность в реальном времени генерировать описательные и сравнительные сводки данных и получать ответы на различные другие аналитические запросы. OLAP-кубы представляют собой проекцию исходного куба данных на куб данных меньшей размерности. При этом значения ячеек агрегируются, то есть объединяются с применением функции агрегации – сумма, среднее, количество, минимум, максимум. Такие проекции или срезы исходного куба представляются на экране в виде кросс-таблицы. Проиллюстрируем идею OLAP-куба на простом примере. Пусть информацию, хранящуюся в базе данных, или подмножество данных, получаемое в результате выполнения запроса, можно представить в виде следующей таблицы.

OLAP kub.jpg


Основываясь на данных из таблицы, можно дать ответы на несколько вопросов, которые могут возникнуть при анализе объемов продаж. Например, каков объем продаж каждого товара по одному из городов? Obem prodag1.jpg

Данную выборку можно интерпретировать как одномерную, поскольку объемы продаж расположены только вдоль одного измерения с наименованием товара. Или: каков объем продаж каждого из товаров по городам?

Obem prodag2.jpg

Данная выборка является двумерной и может быть представлена в виде «плоского куба», в котором третье измерение «отключено». Чтобы представленный куб превратился в трехмерный, необходимо добавить еще одно измерение данных, т.е. привлечь дополнительную информацию по анализируемым параметрам. Например, если в базе данных предусмотрена информация о квартальном объеме продаж каждого товара по всем городам, то номер квартала может стать этим дополнительным измерением.

Obem prodag3.jpg


Kub trehmernii.jpg



Такая модель представления данных позволяет получать нужную информацию, производя соответствующие сечения (срезы) OLAP-куба. Нет необходимости пытаться произвести геометрическую интерпретацию OLAP-куба с размерностью более 3. Действительно, поскольку человеческое сознание «приспособлено» к восприятию трехмерной действительности, все прочие представления сложны для восприятия, тем более, что речь идет не о реальном, а об информационном пространстве. Само понятие «многомерный куб» есть не что иное, как служебный термин, используемый для описания метода. В принципе, используемое число измерений может быть любым. Однако следует отметить, что задача с большим числом измерений, во-первых, является трудоемкой с точки зрения ее выполнения на ПК и, во-вторых, ее осмысление и интерпретация результатов аналитиком могут быть затруднены и даже приводить к ошибочным решениям. Поэтому с методической точки зрения сложные задачи, требующие анализа данных большой размерности, следует по возможности сводить к нескольким более простым. Аналогично, сложные таблицы, которые содержат большое количество полей и записей, являющихся трудными для чтения, восприятия и анализа, можно разбить на несколько более простых таблиц. Это сделает работу с ними намного более удобной.

Вклад участника:

Троцюк В.И.


Отправить на e-mail
ПОДПИСКА НА НОВОСТИ

Мне нравится
0  

Обратная связь
Оставить комментарий
Как разместить статью
Система Orphus
Личные инструменты
Пространства имён
Варианты
Действия
Навигация
Для потребителей
Для производителей
Для развития бизнеса
О проекте
Инструменты