Распространенные классы задачи, на решение которых рассчитан Deductor

Материал из ВикиПро: Отраслевая энциклопедия. Окна, двери, мебеля
Перейти к: навигация, поиск
Мне нравится
0

Система Deductor предназначена для решения широкого спектра задач, связанных с обработкой структурированных и представленных в виде таблиц данных. При этом область приложения системы может быть практически любой – механизмы, реализованные в системе, с успехом применяются на финансовых рынках, в страховании, торговле, телекоммуникациях, промышленности, медицине, в логистических и маркетинговых задачах и множестве других.

Большинство задач анализа можно разделить на классы, внутри которых они решаются схожим образом. Этих классов немного, но для каждого необходимо использовать свои механизмы. Законченное решение может быть составлено из блоков, собранных из унифицированных компонентов для решения прикладной задачи. Именно возможность комбинировать различные механизмы анализа при создании прикладных решений позволяет говорить, что Deductor является аналитической платформой.

Кратко рассмотрим наиболее распространенные классы задачи, на решение которых рассчитан Deductor.

Системы отчетности

В Deductor включено многомерное хранилище данных Deductor Warehouse, позволяющее быстро создавать системы корпоративной отчетности - финансовой, аналитической, маркетинговой и т. д. Оно решает задачи консолидации, обеспечения целостности и непротиворечивости данных. Оно оптимизировано для обработки больших объемов данных, поэтому при работе с системой задержки, связанные с загрузкой и сохранением информации, сведены к минимуму. Кроме этого, Deductor Warehouse имеет развитый семантический слой, обеспечивающий простоту извлечения данных конечными пользователями, которые оперируют при этом привычными бизнес-терминами.

Благодаря наличию большого набора визуализаторов хранящиеся в Deductor Warehouse данные можно просматривать различными способами: в виде OLAP-кубов, таблиц, диаграмм, гистограмм и т. д. Дополнительную ценность системе придает возможность проведения обработки и анализа не "сырых" данных, а соответственным образом подготовленных – сглаженных, очищенных от шумов, пропусков и аномальных значений. Например, очень интересно просматривать данные о продажах после удаления аномалий и сглаживания, таким образом, обработанные данные наиболее точно передают тенденции, отсекая нехарактерные выбросы и шумы.

Data Mining проекты

Data Mining – это процесс извлечения из исходных данных ранее неизвестных, нетривиальных и практически ценных зависимостей (знаний). Сфера применения Data Mining не ограничена одной прикладной областью. Он может использоваться везде, где возникает потребность в глубоком анализе данных, хотя чаще всего речь идет об анализе коммерческой информации. Среди множества задач, решаемых при помощи методов Data Mining, можно выделить такие:

  • Анализ и управление рисками;
  • Оценка кредитоспособности физических и юридических лиц;
  • Определение профилей клиентов, т. е. наиболее характерных особенностей их поведения;
  • Промышленная диагностика, обнаружение источников и причин возникновения дефектов;
  • Идентификация критических ситуаций;
  • Стимулирование продаж;
  • Сегментация клиентов, продуктов, услуг;
  • Оценка факторов, влияющих на лояльность клиентов

и множество других.

Очистка данных

Очистка данных даже без последующей обработки сама по себе представляет значительный интерес. На практике исходные данные чаще всего бывают плохого качества. Это связано с объективными причинами, и избавиться от этого, применяя какие-либо административные или организационные методы, невозможно. Поэтому необходимо использовать методы очистки данных. Очищенные данные содержат наиболее ценную для анализа информацию, из которой исключены противоречивые и дублирующиеся данные, устранены аномальные выбросы и шумы. Во многих случаях достаточно провести только очистку данных, и выводы будут очевидны. Кроме того, очистка данных позволяет получить лучшие результаты при использовании в дальнейшем любых методов построения моделей.

Прогнозирование

Прогнозирование – одна из наиболее востребованных задач анализа. В Deductor включено несколько механизмов построения прогностических моделей, в том числе с использованием самообучающихся алгоритмов. Кроме того, в системе имеются механизмы очистки данных, которые приносят особенно большую пользу при решении задачи прогнозирования. Имеющийся набор позволяет получать качественные прогнозы и обладает большими возможностями по адаптации, т. е. способен подстраиваться под изменяемую ситуацию.

Еще имеются механизмы, позволяющие автоматически строить прогнозы на основе временного ряда на несколько шагов вперед. Достаточно построить модель, прогнозирующую изменение на 1 шаг, и автоматически использовать ее на произвольное количество отсчетов вперед.

Моделирование

Построение моделей - наиболее универсальный способ анализа. В действительности при анализе мы в том или ином виде всегда имеем некую модель исследуемого процесса или объекта. Но не всегда эта модель формализована, т. е. описана таким образом, чтобы ей мог воспользоваться кто-то в режиме "черного ящика": подали данные на вход, а на выходе получили результат.

Например, просматривая отчеты, эксперт может обнаружить некий объект, отличающийся от остальных, и сделать из этого некие выводы, т. е. в голове у эксперта есть представление о том, на что нужно обратить внимание. Но объяснить это в большинстве случаев он не в состоянии, все базируется на опыте, интуиции. Построив же модель, мы можем тиражировать знания эксперта, т. к. модель является неким формальным описанием, которое легко переносится на машинных носителях.

Способов построения моделей существует множество, но в Deductor основной акцент сделан на самообучающиеся методы и машинное обучение. Данные алгоритмы являются универсальными, решающими большой спектр задач и при этом просты в применении. Полученные результаты можно просмотреть в виде таблиц, кубов, карт, деревьев и прочее. В систему встроены механизмы формальной оценки качества полученной модели.

Анализ "Что-если"

При помощи Deductor можно не только строить модели, но и провести анализ по принципу "что-если", т. е. оценить, как может измениться тот или иной показатель при модификации любого влияющего фактора. Для реализации этого простого в использовании и одновременно мощного механизма предназначен специальный визуализатор. При этом не имеет значения, каким способом производилось построение модели, работа со всеми алгоритмами выполняется одинаково. Результаты можно просмотреть как в табличном, так и в графическом виде.

Такого рода механизмы анализа являются готовым инструментом для оптимизации процессов.

Обратная связь Автору