Крупному бизнесу > Статьи

Бизнес-аналитика становится умнее

Интервью: новая партнерская инициатива — проект REAL, демонстрирует, как Microsoft SQL Server 2005 решает множество практических задач, которые встают перед компаниями в процессе анализа больших массивов данных.

Дополнительная информация

Даллас, Техас, 28 сентября 2005 — Бизнес-аналитика (BI) является тем сверхмощным средством, которое делает неизмеримые объемы корпоративных данных легкими в управлении, значащими и полезными. Превращение данных в знания — это задача любого BI-приложения; в идеале BI дает лицам, принимающим решения, глубоко в режиме реального времени понимать состояние финансов организации, ее потребительского рынка, товарного ряда, каналов сбыта и других критичных аспектов бизнеса.

Грядущий релиз Microsoft SQL Server 2005, запланированный на 7 ноября, содержит расширенный набор BI-возможностей, которые созданы для того, чтобы способствовать повышению производительности и одновременному снижению издержек и тем самым обеспечить пользователям конкурентные преимущества. Хотя не планируется, что SQL Server 2005 станет широко доступным до ноября, Microsoft и несколько его партнеров в области BI месяцами работали над крупномасштабным внедрением на основе существующих пользовательских сценариев, что позволило открыть лучшие способы создания BI-приложений на базе SQL Server 2005.

Проект REAL (Reference implementation, End-to-end, At scale, and Lots of users) — это новаторский способ разработки, развертывания и тестирования систем. Он включает уроки по анализу массивов данных, подходящие многим потребителям, которые ищут действенные BI-инструменты. Уже существует документация по проекту (EN), и он будет продемонстрирован на ряде практических сессий на недельном PASS (Professional Association for SQL Server) Community Summit 2005, крупнейшем событии года, посвященном исключительно обучению работе с SQL Server.

Билл Бейкер, главный менеджер SQL Server Business Intelligence в Microsoft и главный докладчик на PASS Community Summit этого года, дал интервью о проекте REAL и внедрении безнес-анализа в практику.

Корреспондент: Какова цель новой инициативы?

Бейкер: Проект REAL демонстрирует, что приложения для бизнес-анализа на базе SQL Server 2005 готовы к использованию. Потребители могут взять инструменты SQL Server 2005, использовать их, как они есть, и достигнуть успеха в крупных процессах. Мы также предоставляем пошаговый план, который позволяет строить подобные системы. Мы строим систему таким образом, чтобы пользователи могли на ней учиться. Мы собираемся много об этом говорить, публиковать статьи и представлять систему на множестве конференций, начиная с конференции PASS. В целом идея заключается в том, что мы разработали лучшие инструкции и огромное количество вспомогательной информации, так что потребители могут добиться успеха при помощи BI-приложений, работая с такими же масштабами и сложностями, с которыми мы работаем в рамках проекта REAL.

Корреспондент: Что вам подсказало такой подход? Что вам подсказало такой подход?

Бейкер: Мы знали, что в релизе SQL Server 2005 делалось много важных изменений в BI инструментах. Мы хотели их опередить и успеть обновить лучшие инструкции. Чтобы понять, где нужно разработать новые руководства, мы выбрали лучший для нас способ: мы сами прошли через процесс построения крупномасштабной системы и работы с ней. Мы знали, что в релизе SQL Server 2005 делалось много важных изменений в BI инструментах. Мы хотели их опередить и успеть обновить лучшие инструкции. Чтобы понять, где нужно разработать новые руководства, мы выбрали лучший для нас способ: мы сами прошли через процесс построения крупномасштабной системы и работы с ней.

Аббревиатура проекта REAL — Reference implementation (Связанное воплощение), End-to-end (Сквозное), At scale (Масштабное) and Lots of users (Многопользовательское) — совершенно очерчивает ту мысль, что это практическая реализация. Мы взяли хранилище данных Barnes & Noble и буквально перестроили его на SQL Server 2005, используя все новейшие инструменты и техники. И теперь у нас есть практическая, сложная, крупномасштабная реализация, которую мы можем показывать нашим пользователям. Ключевым моментом проекта является то, что мы может показать, что мы сделали и как мы это сделали. Это картина «связанного воплощения».

Корреспондент: Как хранилище данных Barnes & Noble запоминает образы массивов данных пользователей других областей бизнеса?

Бейкер: Это по-настоящему важный вопрос, потому что есть множество способов, с помощью которых Barnes & Noble воспроизводит многие пользовательские сценарии. Один состоит в том, что данные приносятся из множества источников и интегрируются в едином хранилище. Barnes & Noble берет часть данных из системы отслеживания продаж и другие данные из складской системы. Это две разные системы. После извлечения эти данные интегрируются, и создается единая родственная база данных внутри хранилища.

Второе, что также касается Barnes & Noble, так это несравнимая аудитория их информации. Они стремятся поддерживать менеджеров, что называется, с передовой, работающих в магазинах. Они также поддерживают байеров, ответственных за поставку продукции и ее распределение по всей торговой сети. И они поддерживают сидящих в нью-йоркских штаб-квартирах высших менеджеров, которые задают совершенно иные вопросы, чем менеджеры магазинов, работающие на местах. Все эти пользовательские группы поддерживаются с помощью одного и того же хранилища данных. Мы находит, что это самый общий сценарий на сегодня: множество пользовательских сообществ должны поддерживаться из единого хранилища данных.Второе, что также касается Barnes & Noble, так это несравнимая аудитория их информации. Они стремятся поддерживать менеджеров, что называется, с передовой, работающих в магазинах. Они также поддерживают байеров, ответственных за поставку продукции и ее распределение по всей торговой сети. И они поддерживают сидящих в нью-йоркских штаб-квартирах высших менеджеров, которые задают совершенно иные вопросы, чем менеджеры магазинов, работающие на местах. Все эти пользовательские группы поддерживаются с помощью одного и того же хранилища данных. Мы находит, что это самый общий сценарий на сегодня: множество пользовательских сообществ должны поддерживаться из единого хранилища данных.

Третье. По-настоящему важный способ, характерный для Barnes & Noble, имеет отношение к объединению данных о продажах и инвентаризационных данных. Если говорить о традиционных OLAP-системах (и службы анализа — это пример OLAP-системы), то для них характерны настоящие трудности с инвентаризационными данными. Это такой класс данных, который мы называем полуаддитивными мерами.

Корреспондент: А в чем состоит проблема с этим особым видом данных?

Бейкер: Я приведу пример. Противопоставьте инвентаризационные данные и данные о продажах. Если я отправлю пять экземпляров книги в январе и еще пять в феврале, а потом еще пять в марте, то я смогу точно сказать, что в первом квартале я продал 15 экземпляров книги. Потому что это легко сложить и подсчитать.

При инвентаризации это не пройдет. Если бы по описи у меня было пять экземпляров в конце января, пять в конце февраля и пять в конце марта, я бы не мог сказать, что у меня по описи 15 экземпляров. Это не складывается. Существуют точные классы прикладных вопросов, в которых не работает подобное сложение. Инвентаризация — это большой, канонический пример полуаддитивных мер.

Корреспондент: Получается, что это было самой большой проблемой, с который вы столкнулись, забирая все данные Barnes & Noble и приспосабливая BI к новой версии SQL Server 2005? Получается, что это было самой большой проблемой, с который вы столкнулись, забирая все данные Barnes & Noble и приспосабливая BI к новой версии SQL Server 2005?

Бейкер: На самом деле это вообще не было проблемой. Это было безумно интересно. Службы анализа теперь очень просто взаимодействуют с полуаддитивными мерами. Это просто и легко делать. Мы показываем, что работать в проекте REAL очень удобно.

Корреспондент: Вы тесно сотрудничали с большим количеством партнеров по этой инициативе. Почему она зародилась как совместное дело? Вы тесно сотрудничали с большим количеством партнеров по этой инициативе. Почему она зародилась как совместное дело?

Бейкер: Когда мы взялись за это дело чуть больше года назад, одной из наших целей было широко распространить знания, которые будут получены в ходе работы. И мы чувствовали, что лучшим способом это сделать было сотрудничество с несколькими наиболее подходящими партнерами, которые могли бы использовать эту информацию и приспособить ее к собственной деятельности. Мы разыскали таких партнеров в сфере BI, которым действительно хотелось внести свой вклад в это дело. Каждый хорошо поработал над этим проектом. У нас было много времени для работы с этими партнерами: Apollo Data Technologies, EMC, Intellinet, Panorama, Proclarity, Scalability Experts и Unisys. И конечно же очень щедры были Barnes & Noble, предоставившие нам исходный набор данных.

Корреспондент: Какие виды бизнес-сценариев вы реализовываете в этом проекте?

Бейкер: Это полномасштабная попытка использовать наши BI-инструменты в едином хранилище данных. Вот важное замечание — буква «e» в названии проекта REAL означает «end-to-end», то есть «сквозной». Мы от начала до конца охватываем все, с чем пользователю предстоит столкнуться, чтобы построить крупномасштабное хранилище данных. Им нужно извлечь, преобразовать и загрузить данные (технология ETL) из их исходных систем в их новое хранилище данных. Им нужно построить кубы на высоком уровне хранилища. Они хотят создавать отчеты по базе данных. Они хотят развертывать приложения на рабочих компьютерах своих работников, и им нужно уметь развертывать web-приложения и работать с партнерами через Интернет. И слово «сквозной» как часть концепции здесь очень важное. Так что мы затронули все эти компоненты в подборке BI-средств  — в службах интеграции, аналитических службах, службах отчетности и таким же образом в сопоставительном механизме.

Корреспондент: Какие выгоды проект REAL дает пользователям?

Бейкер: Мы ожидаем, что отдача будет в двух основных формах. Во-первых, то, что мы здесь делаем, поможет пользователям в процессе принятия решений. Когда они думают о развертывании хранилища данных, сетевой график, которому бы они следовали, упростит решение о том, чтобы устремиться вперед со своим проектом, и обеспечить крайне важной информацией о том, как создать проект.

Во-вторых, мы даем разработчикам и операторам лучшие инструкции и руководства. Это те люди, которые делают каждодневную работу и заставляют функционировать системы. Они могут узнать о том, как мы проделали всю работу, чему мы научились, и прочесть множество сделанных нами рекомендаций. Что делать и чего не делать. Мы публикуем феноменальный объем информации в документации на нашем web-сайте. Уже вывешено девять документов и скоро появятся новые. К тому же, мы устраиваем web-трансляции и предоставляем несколько возможностей «живого» обучения на конференции PASS и в ноябре на конференции SQL Connections в Лас-Вегасе.

Корреспондент: Каково положение дел в BI?

Бейкер: Бизнес-анализ становится вездесущим, и это происходит несколькими различными способами. Один том, что мы рассматриваем развертывание систем BI отчетности во всех частях компании на всех уровнях. BI сейчас используют не только бизнес-аналитики и руководители. Сейчас эти инструменты влияют на процессы по всей организации.

Положение дел заставляет делать так, чтобы данные могли использоваться всеми отделами организации и чтобы они были актуальными и важными для людей при исполнении ими их ролей. И представлять их так, чтобы они были полезны людям: что подходит бизнес-аналитику, не подойдет оператору на телефоне. И быть способными использовать данные новыми способами, не только анализ OLAP-типа, но также и data mining. И смотреть на все это как на часть каждодневных процессов компании.

Корреспондент: Как Microsoft помогает пользователям этого добиться?

Бейкер: Если вы посмотрите на каждый компонент, который мы здесь загружаем, он будет обращен к отдельному, совершенно отличному аспекту перспективы вездесущности и всепроникновения BI. Службы интеграции касаются вопроса соединения данных из множества источников в значимую периодическую информацию. В службах анализа, обеих — OLAP и data mining, компоненты заняты в мощном анализе данных, так что вы сможете понять информацию так, как никогда и не подумали бы раньше. Службы отчетности заняты извлечением этой информации для каждой части компании и представлением ее в удобном виде для каждой из групп пользователей — в тех формах, которые позволили бы ее использовать в соответствии с их ролями. И конечно, сопоставительный механизм является тем, что стоит за всем этим, — основой всей системы.

Корреспондент: Что вы узнали благодаря тестированию рабочих характеристик, которые были созданы в рамках проекта REAL?

Бейкер: Мы сделали отличную платформу. Во многих отношениях я просто в настоящем восторге от богатства платформы. Что касается моей команды и наших партнеров, вместе с которыми мы работали над построением этой показательной системы, то мы каждый день открывали новые возможности и новые способы их реализации. Я действительно поражаюсь этому продукту. Команда проекта REAL всю неделю будет на конференции PASS. Мы собираемся обсудить этот проект на специальных сессиях вроде «Спроси экспертов» или просто, когда кому-нибудь будет важно переговорить с одним из нас в перерывах между сессиями.

Корреспондент: Со всеми этими потрясающими надстройками в ноябрьском релизе SQL Server 2005, что вы думаете о пользе и ценности этого релиза для пользователей?

Бейкер: Этот релиз изменит мир BI. Каждая часть продукта наделена новой функциональностью. Службы интеграции вобрали в себя ETL-технологию уровня целого предприятия и представляют ее в форме, доступной каждому. Службы анализа несут с собой новые классы анализа, которые не были возможны раньше, например, качественный анализ, полуаддитивные меры и отношения «многие ко многим». Существуют целые новые классы вопросов, которые можно задавать и на которые можно получать ответы, чего нельзя было сделать раньше. И конечно, со всеми новыми алгоритмами data mining и интеграцией data mining в состав служб анализа, служб интеграции и служб отчетности, мы сделаем этого поразительно мощный инструмент доступным аудиториям, которые раньше и не мечтали о том, чтобы иметь нечто подобное. И пока все, что мы закладываем в BI с SQL Server 2005, является чем-то значимым для решения критически важных задач крупного бизнеса, мы видим в этом ценность для каждой организации. Для каждого в SQL Server 2005 есть что-то свое.