Logo bg.artbmxmagazine.com

Складове за данни и информационни системи в microsoft sql server 2008

Съдържание:

Anonim

Информационните системи са разделени на две категории (Casares, 2003):

  • Операционни системи: Те са тези, които имат за цел да отразяват състоянието и работата на компанията, регистрираща ежедневни транзакции или операции, следователно са известни като системи за обработка на онлайн транзакции (OLTP). Системи за подкрепа на решения: Те са тези, чиито цели са да измерват и контролират развитието на важни бизнес променливи, като се стремят да идентифицират, проектират и прогнозират тенденциите от натрупаните данни.

От началото на компютърната ера организациите използват данни от своите операционни системи, за да задоволят техните информационни нужди. Някои предоставят директен достъп до информацията, съдържаща се в оперативните приложения. Други са извлекли данните от техните оперативни бази данни, за да ги комбинират по различни неструктурирани начини, в опит да обслужват потребителите с техните информационни нужди (Casares, 2003).

Бил Инмон беше един от първите автори, писали по темата за хранилищата на данни, той дефинира склад за данни по отношение на характеристиките на хранилището на данни (Inmon, 2007):

Ориентирани по теми: Данните в базата данни са организирани така, че всички елементи от данни, свързани с едно и също събитие или обект от реалния свят, са свързани помежду си.

Вариант във времето: Промените в данните във времето се записват, така че отчетите, които могат да бъдат генерирани, отразяват тези промени.

Нелетлива: Информацията не се променя или изтрива, след като данните се съхраняват, тя става информация само за четене и се съхранява за бъдеща справка.

Интегрирана: Базата данни съдържа данните на всички операционни системи на организацията и посочените данни трябва да са последователни.

Пазарите на данни са подмножества от данни от склад на данни за определени области. От гледна точка на дизайна, всичко, което е приложимо за склад за данни, се прилага на пазара на данни (Inmon, 2007).

Размерният модел е най-използваният в системите за съхранение на данни, това е различно от релационния модел, използван в OLTP системите. Този модел се основава на измерения, които представляват категории информация, атрибути, които представляват едно ниво в едно измерение, може да има йерархии от атрибути, които изразяват връзки между различни атрибути и накрая таблици с факти, които съдържат данни за интерес, които имат ниво на гранулиране. Гранулирността е най-ниското ниво на информация, която ще се съхранява в таблицата с факти. Първата стъпка при създаването на таблица с факти е определянето на детайлност.

Размерни диаграми:

  • Звездна схема: Таблица с факти в центъра, свързана с набор от таблици за измерения. Снежинка схема: Уточнение на предишната, където някои измерения са нормализирани в по-малки таблици. Съзвездие от факти: Множество таблици с факти споделят таблици с размер. те се визуализират като съзвездие от факти.

Административното ръководство признава, че един от начините за повишаване на неговата ефективност е да се използва най-добре информационните ресурси, които вече съществуват в организацията. Понастоящем складът на данни е в центъра на вниманието на големите институции, тъй като осигурява среда за организациите да използват по-добре информацията, която се управлява от различни оперативни приложения (Casares, 2003).

Архитектурата на склад за данни се състои от три нива (Casares, 2003):

  • Източници (производствени и исторически) База данни с обобщени данни, извлечени от производствени бази (склад на данни). Ориентирани към потребителя интерфейси, които извличат информация за вземане на решения. Класическите от тях са: заявки и отчети, многоизмерен анализ и обработка на данни.

Източна база данни: Състои се от производствени бази данни, както и исторически бази данни. Тези бази данни могат да бъдат внедрени в различни видове системи: BD-Relational, BD-географски, BD-текстове, файлове и др. Обща характеристика е, че те съхраняват атомни данни, които са уместни като производствени данни, но може да са твърде фини, за да послужат като основа за вземане на решения. Освен това, понятието за качество на данните в тези бази се основава на последователността на тези записи, независимо от тяхното значение за проблема.

Важен компонент в хранилището на данни е речникът на данните (метаданни), в който са описани запаметените данни, за да се улесни достъпът до тях чрез инструментите за използване на хранилището на данни. Речникът на данните установява съответствие между съхранените данни и концепциите, които те представляват, за да улесни извличането на информация от крайния потребител.

Потребителски ориентирани интерфейси, които извличат информация за вземане на решения:

  • Интерфейси за сложни заявки и отчети: Те позволяват на потребителя да изгражда графики и отчети от информацията, съдържаща се в хранилището на данни и описана чрез речника на данните. Някои типични функционалности на тези инструменти са: динамично групиране и разгрупиране на данни в отчети, промени в реда на полетата на отчета, визуализация на резултата от заявките в графична форма (барове, торта, точки и др.). Тези инструменти генерират изразите на езика на заявката, които извличат исканите данни (обикновено SQL), свързват се с хранилището на данни, извличат резултата и го форматират според дадената спецификация.
  • Продукти за анализ на данни (OLAP): Те позволяват представяне на проблемните данни по отношение на размерите. Например, ако става въпрос за продажби на продукти в различни области, едно измерение на проблема са областите, друго - продуктите и друг път. По този начин веднага се извършват заявки за анализ на данни от едно измерение, основано на другото.
  • Инструменти за извличане на данни: Те ви позволяват да проучите склада на данни в търсене на неизвестни или неочаквани връзки между данните.

Основните мотиви за изграждането на склад за данни са следните (Casares, 2003):

  • Да има информационни системи в подкрепа на решението. Да има бази данни, които позволяват извличане на знания от историческата информация, съхранявана в организацията. Проектирайте база данни, която позволява да се изпълняват неизвестни заявки.

Microsoft SQL Server 2008 предоставя платформа за изграждане и поддържане на хранилища с данни, по-долу са някои от неговите нови функции и най-добрите практики, свързани с тях:

- Компресиране на данни

Компресирането на данни намалява пространството, необходимо за съхраняване на таблици и индекси, като позволява по-ефективно използване на капацитета за съхранение.

Има възможност за компресия на статия или на страница. Компресирането по артикули съхранява всички полета във формат с променлива ширина, компресирането по страница прави същото, но се прави между статии на една и съща страница. Речник на ниво страница се използва за съхранение на общи стойности, плюс общи префикси за стойности на колоните се съхраняват само веднъж на страницата. И двете форми на компресия могат да бъдат приложени към таблици и индекси.

- Прозрачно шифроване на данни

Прозрачното криптиране на данни позволява сигурно съхраняване на данни чрез криптиране на файлове в базата данни. SQL Server извършва криптиране и декриптиране директно, като прави процеса прозрачен за свързаното приложение. Ако едновременно се използват компресия и криптиране на данни, операциите трябва да се извършват в този ред.

- Управител на ресурсите

Управителят на ресурсите позволява на администраторите да контролират и присвояват ресурси като процесори и памет на приложения с най-висок приоритет.

- Горещо добавяне на процесори и памет

64-битовото издание на SQL Server Enterprise позволява горещо добавяне на процесори и памет, без да е необходимо спиране на сървъра или ограничаване на съществуващи връзки.

- MERGE оператор

Новият оператор MERGE опростява процеса на зареждане на склад за данни от своя източник. Този нов оператор разграничава нови и актуализирани статии в изходната база данни и предприема съответните действия в хранилището на данни.

- Нови видове пространствени данни

Новите типове пространствени данни GEOGRAPHY и GEOMETRY позволяват пространствените данни да се съхраняват директно в SQL Server 2008. GEOGRAPHY позволява да се представят геодезически данни в три измерения, които се използват от GPS приложения, а GEOMETRY позволява да се представят точки в двумерни равнини. Има и интеграция с Virtual Earth, която позволява графични изображения на физически места.

Всички тези нови функции правят Microsoft SQL Server 2008 усъвършенстван инструмент за създаване и поддържане на хранилища на данни.

библиография

CASARES, C. (2003) Складиране на данни.

INMON, B. (2007) Фабрика за корпоративна информация. Inmon Consulting Services.

MICROSOFT (2008) Най-добри практики за съхранение на данни с SQL Server 2008.

MICROSOFT (2008) Какво е новото в SQL Server 2008

Складове за данни и информационни системи в microsoft sql server 2008