Компьютер-Информ || Архив || Рубрики || Поиск || Подписка || Работа || О "КИ" || Карта

ЗАО "Техно-СПб" Системная интеграция

Microsoft Special Interest Group "NEVA"

Microsoft SQL Server 2000 Analysis Services
как инструмент для интеллектуального бизнес-анализа


Наталия Новакова,

B настоящее время практически все успешно развивающиеся организации активно используют так называемые базы данных обработки транзакций. Продажа товара и выписка счета √ это лишь простейший пример применения базы данных OLTP (Online Transaction Processing). Технологии хранения и обработки данных постоянно совершенствуются √ и это приводит к накоплению огромных запасов данных, которые без продуктивной переработки образуют никому не нужную информационную свалку. Между тем, эти данные вовсе не бесполезны. Например, проанализировав динамику продаж за несколько лет, на основе полученных результатов можно спланировать работу с поставщиками. Руководитель предприятия или аналитик на основе этих данных может сделать прогноз изменений клиентуры, провести анализ риска, выявить группы клиентов для поощрения или проследить динамику продаж товара за несколько лет.

Возникает естественный вопрос: как извлечь необходимый материал из огромных по размерам, разнородных по содержанию и форме представления пластов сырых данных (raw data)? С помощью какого инструмента можно сделать нужный статистический отчет, получить прогноз, выявить закономерности и тенденции? Запросы обобщающего характера (к примеру, суммарное число продаж по какому-то региону или отдельному клиенту) могут, конечно, выполняться в обычных транзакционных базах данных. Но тогда, как правило, не обойтись без многочисленных соединений таблиц и применения агрегатных функций, что может заметно снизить производительность работы сервера. Это не удивительно, потому как транзакционные базы данных не предназначены для проведения серьезного бизнес-анализа. В то же время сегодня уже все производители ведущих серверных СУБД, такие как Oracle, Microsoft, Informix, IBM, Sybase, выпускают серверные средства, предназначенные специально для комплексного многомерного анализа данных, их динамики, тенденций и, в конечном итоге, для принятия решений. Однако соответствующие продукты фирм Oracle, Informix, IBM и Sybase приобретаются отдельно от сервера баз данных и стоят достаточно дорого. Что же касается Microsoft, то, начиная уже с седьмой версии, Microsoft SQL Server содержит в своем составе OLAP-сервер и, таким образом, позволяет создавать относительно недорогие OLAP-решения на базе Microsoft SQL Server. В аналитические службы для Microsoft SQL Server помимо OLAP-сервера входит клиент PivotTable Service и открытые интерфейсы доступа к многомерным данным OLE DB для OLAP и ADO MD. Однако нельзя не заметить, что основу аналитической обработки данных реального времени OLAP (On-Line Analytical Processing) составляет ╚грубый╩ разведочный анализ. На практике зачастую требуется еще более тщательная переработка данных, которую по сложности можно сравнить с обогащением руды. Этот процесс называется извлечением или добычей данных (Data Mining). Термин Data Mining (интеллектуальный анализ данных) означает поиск закономерностей, корреляций и тенденций в данных. В основу современной технологии Data Mining положена концепция шаблонов, отражающих фрагменты многоаспектных отношений в данных. Шаблоны представляют собой закономерности, свойственные подвыборкам данных, которые могут быть компактно выражены в понятной человеку форме. Поиск шаблонов производится методами, не ограниченными рамками априорных предположений о структуре выборки и виде распределений значений анализируемых показателей. Главная особенность таких шаблонов √ их нетривиальность. Найденные шаблоны должны отражать неочевидные, неожиданные регулярности в данных, составляющие так называемые скрытые знания (hidden knowledge).

Analysis Services, входящие в состав редакций Enterprise, Standard и Developer Microsoft SQL Server 2000, представляют собой дальнейшее развитие серверных средств Microsoft SQL Server 7.0 OLAP Extensions. Помимо уже имеющихся средств построения хранилищ данных и OLAP, Analysis Services в SQL Server 2000 включают в себя средства Data Mining.

Итак, существуют три технологии извлечения знаний из данных, отличающиеся друг от друга глубиной извлекаемых знаний и используемыми аналитическими инструментами. Применение языка запросов к базе данных, активно обрабатывающей транзакции, позволяет извлечь лишь поверхностный слой знаний. Использование средств оперативной аналитической обработки дает возможность вскрыть более глубокие пласты представленных в хранилище данных. Наконец, применение ╚раскопки данных╩ средствами Data Mining открывает поистине неисчерпаемые возможности для поиска самых глубинных пластов знаний и выявления скрытых закономерностей. Поиск скрытых закономерностей в бизнес-данных позволит предприятиям оптимизировать свой бизнес за счет обнаружения неявных взаимозависимостей, предсказания важных маркетинговых факторов и прогноза стратегии ведения бизнеса. Извлечение знаний на основе исследования данных играет существенную роль в задачах интеллектуального бизнеса (Business Intelligence), с которыми так или иначе сталкиваются практически все предприятия в процессе своей повседневной деятельности. К ним относятся, например, целевая реклама, перекрестные продажи, управление рисками, ценообразование и т.═д. При грамотной раскопке глубинного пласта знаний, находящегося в сырых данных, могут быть обнаружены настоящие самородки. Microsoft SQL Server 2000 позволяет реализовать все эти технологии, которые, несомненно, могут оказаться полезными в деятельности большинства коммерческих, производственных и научных организаций. Кроме того, Microsoft SQL Server 2000 предоставляет новые средства управления доступом к данным и безопасностью, новые клиентские утилиты для построения и администрирования многомерных хранилищ и анализа данных, а также обеспечивает дополнительные возможности для управления хранилищами, создания распределенных хранилищ данных, определения метаданных (например, размерностей).

OLAP-сервер может работать с данными из реляционных баз SQL Server, а также баз данных Oracle и других внешних источников, к которым можно получить доступ по ODBC или OLE DB. В наполнении хранилищ важную роль играют службы преобразования данных DTS, которые входят в состав SQL Server (см. рис.).

Хранилища данных под управлением OLAP-сервера могут располагаться в самой реляционной базе (ROLAP, relational OLAP), в собственной многомерной структуре OLAP-сервера (MOLAP, multidimensional OLAP). Вычисленные агрегаты можно также хранить в кубе OLAP-сервера, а детальные данные ≈ в реляционной базе по месту их исходного нахождения (HOLAP, hybrid OLAP). С точки зрения клиента, все эти кубы выглядят одинаково. Простейшим клиентом для OLAP служит MS Excel 2000, чьи средства построения сводных таблиц и графиков прекрасно адаптированы для работы с хранилищами как на базе Microsoft OLAP, так и других производителей, поддерживающих интерфейсы OLE DB для OLAP. В состав MS Office 2000 входят Web-компоненты, позволяющие легко строить клиентские приложения для анализа данных. Наконец, клиентские приложения любого уровня сложности могут быть созданы с использованием любого высокоуровневого средства разработки, такого как Visual C++, Visual Basic, Visual InterDev и т.═д. и открытых интерфейсов OLE DB для OLAP и ADO MD.

В условиях сегодняшней жесткой конкуренции на рынке компания, обладающая наилучшими средствами бизнес-анализа (Business Intelligence), имеет очевидное преимущество перед своими соперниками. Все то, что она знает о своих потребителях, продуктах и действиях, позволяет ей ощутимо поднять доходы, снизить себестоимость издержки и увеличить прибыль. Руководители и аналитики, применяющие методы исследования данных (Data Mining) для анализа и фильтрации огромных объемов информации в поисках скрытых закономерностей и тенденций, получают ощутимые преимущества в конкурентной борьбе. Дополнительные возможности Microsoft SQL Server 2000 Analysis Services, связанные с применением технологии Data Mining, превращают метод, ранее известный лишь узкому кругу специалистов в области искусственного интеллекта, в мощный инструмент, грамотное применение которого поможет отыскать свою золотую жилу в огромных залежах информационной руды.

Задачи поиска закономерностей актуальны для предприятий любого масштаба. Тем не менее, до сегодняшнего момента это могли позволить себе только самые крупные из них, поскольку большинство существующих на рынке систем относится к разряду высшего ценового диапазона, требует усиленной аппаратной конфигурации и отличается сложностью в управлении и применении. Еще одним препятствием на пути широкого распространения систем поиска закономерностей являлось отсутствие открытых интерфейсов и слабая интеграция приложений такого рода друг с другом. Microsoft SQL Server 2000 позволит легко преодолеть препятствия на пути к интеллектуальному ведению бизнеса.

Теперь несколько слов о том, как с минимальными затратами времени научиться не только создавать информационно-аналитические системы и системы поддержки принятия решений на основе предлагаемых Microsoft технологий, но и сделать это максимально эффективно. Авторизованный учебный центр компании ЭВРИКА предлагает курсы официальной программы Microsoft по подготовке специалистов в области планирования, создания и обслуживания хранилищ данных, управления аналитическими службами и системами, применяющими многомерный анализ данных. Программа состоит из трех курсов: 2074 ≈ Разработка и реализация OLAP-решений с использованием Microsoft SQL Server 2000 (Designing and Implementing OLAP Solutions Using Microsoft SQL Server 2000), 2092 ≈ Наполнение хранилищ данных с использованием Microsoft SQL Server 2000 Data Transformation Services (Populating a Data Warehouse with Microsoft SQL Server 2000 Data Transformation Services), 2093 ≈ Анализ многомерных данных в Microsoft SQL Server 2000 (Analyzing Multi-Dimensional Data with Microsoft SQL Server 2000). Более детальную информацию о курсах в учебном центре компании ЭВРИКА Вы можете найти на сайте по адресу http://www.eureca.ru/education/.

 


       КОМПЬЮТЕР-ИНФОРМ 
          Главная страница || Статьи ╧ 17'2001 || Новости СПб || Новости России || Новости мира

Анкета || Рубрики || Работа || Услуги || Поиск || Архив || Дни рождения
О "КИ" || График выхода || Карта сайта || Подписка

Главная страница

Сайт газеты "Компьютер-Информ" является зарегистрированным электронным СМИ.
Свидетельство Эл ╧ 77-4461 от 2 апреля 2021 г.
Перепечатка материалов без письменного согласия редакции запрещена.
При использовании материалов газеты в Интернет гиперссылка обязательна.

Телефон редакции (812) 118-6666, 118-6555.
Адрес: 196084, СПб, ул. Коли Томчака, д. 9
e-mail:
Для пресс-релизов и новостей