Verilənlər xəzinəsi
Bu məqalənin sonunda mənbə siyahısı var, lakin mətndaxili mənbələr heç və ya kifayət qədər istifadə edilmədiyi üçün bəzi məlumatların mənbəsi bilinmir. |
Verilənlər xəzinəsi (en. Data Warehouse) – idarəedici qərarların qəbul edilməsi prosesini dəstəkləyən, sahə təmayüllü, zamandan asılı olub, dəyişməyən və istiqamətləndirici verilənlər yığımıdır.
Ümumi məlumat
redaktəİlk dəfə 1988-ci ildə Devlin və Merfi tərəfindən yazılmış məqalədə VX haqqında danışılmışdır. VX konsepsiyasının ilk müəlliflərindən biri B. İnmon 1992-ci ildə VX-ni belə təsvir etmişdir:
Verilənlər xəzinəsi (VX) konsepsiyasının predmetini verilənlər təşkil edir. Verilənlərin emalı sistemlərinin (VES) məhsulu sayılan verilənlər digər istehsalat məhsulları kimi müəyyən xüsusiyyətə və xarakteristikaya malikdirlər: yararlılıq müddətinə, saxlandığı yerə, bazar qiymətinə, ötürülmə qabiliyyətinə, düzəlişi qəbul etmək xüsusiyyətinə və s. Bu cəhətləri nəzərə almaqla demək olar ki, VX konsepsiyası verilənlərin analizi konsepsiyası deyil, verilənlərin analiz üçün hazırlanması konsepsiyasıdır.
VX-nin arxitekturası
redaktəVX-nin arxitekturasını qurarkən informasiya sistemlərinin arxitekturasını təyin edən mövcud sənədlərin öyrənilməsindən başlamaq lazımdır. Bu sənədlərə təşkilatlardakı informasiya texnologiyalarının (İT) inkişafının general planı da daxildir. VX-nin təşkilatın İT-nin infrastrukturuna inteqrasiya olunması vacib olduğundan VX yaradarkən informasiya sistemlərinin və ya İT-nın inkişafının general planına əsaslanmaq lazımdır.
Operativ sistemlərdə (OLTP) verilənləri analiz etmək çox çətindir. Bu da ]]verilənlər]]in müxtəlif formatlı VBİS-lərində, korporativ şəbəkənin müxtəlif hissələrində yerləşmələri ilə izah olunur. VX-nin əsas vəzifəsi verilənləri sadə, anlamlı strukturda analiz üçün təqdim etməkdir. VX-nin strukturu sadə olmalıdır.
VX-nə verilənlər operativ sistemlərdən gətirilir. Operativ sistemlər biznes-proseslərin avtomatlaşdırılması üçün nəzərdə tutulub. Eyni zamanda VX xarici mənbələr hesabına, məsələn, statistik hesabatlar hesabına doldurula bilir. Müxtəlif əməliyyat mənbələrindən yığılmış operativ verilənlər təmizlənir, inteqrasiya olunur və relyasiya verilənlər xəzınəsənə (RVX) yığılır. Verilənlər analiz üçün yararlı hala gətirilir, nəticədə müxtəlif üsullardan istifadə etməklə hesabatlar yaradılır. Analitik emal üçün nəzərdə tutulmuş verilənlər xüsusi OLAP VB-na yığılır və ya RVX-də saxlanılır.
VX-nin relyasiya bazalarından (RVB) fərqi
redaktəVX-nin relyasiya bazalarından fərqi aşağıdakılardır:
- Adi verilənlər bazası istifadəçilərin gündəlik işlərini yerinə yetirmək üçün, VX isə qərarların qəbul edilməsi üçün nəzərdə tutulmuşdur. Məsələn, məhsulun satışı və hesabatın çıxarılması tranzaksiya üçün nəzərdə tutulmuş VB-dan istifadə etməklə, bir neçə il ərzində satış dinamikasının analizi VX-nın köməyilə yerinə yetirilir.
- Adi VB istifadəçilərin iş prosesi zamanı daimi dəyişikliklərə məruz qalır. VX isə nisbətən sabitdir: orada verilənlər təyin olunmuş vaxta görə təzələnirlər (məsələn, saatbasaat, gündəlik və ya həftə üzrə, tələbatdan asılı olaraq). İdeal halda verilənlərin yığılması VX-də yerləşmiş əvvəlki informasiyanı dəyişmədən təyin olunmuş zaman ərzində yeni verilənlərin əlavə edilməsi deməkdir.
Adi VB VX-nə daxil olan verilənlər üçün mənbədir. Digər tərəfdən VX xarici mənbələrin, məsələn statistik hesabatların hesabına doldurula bilər. OLAP sistemlərindən istifadə zamanı verilənlər müxtəlif mənbələrdən gətirilə bilər ki, bu da sistemin qıvraqlığından xəbər verir. Məsələn, RVB-dan, İnternet şəbəkəsindən, müxtəlif hesabatlardan və s. Lakin analiz nəticəsinin düzgün alınması bu mənbələrin xüsusiyyətlərindən çox asılıdır. Bu baxımdan VX OLAP sistemlərində əsas bloklardan birini təşkil edir. VX cədvəldə göstərilmiş tələblərə cavab verən verilənlər yığımından ibarətdir:
Sahə təmayüllü | olunmuşHər-hansı sahə haqqında bütün verilənlər yığılır (müxtəlif mənbələrdən), təmizlənir, razılaşdırılır, əlavələr edilir, aqreqatlaşdırılır və analizdə istifadə üçün rahat formaya gətirilir. |
İnteqrasiya | Müxtəlif sahələr haqqındakı verilənlər qarşılıqlı razılaşdırılır və ümumkorporativ VX-də saxlanılır. |
Dəyişməzliyi | İlkin verilənlər razılaşdırıldıqdan, verifikasiya edildikdən sonra ümumkorporativ VX-nə gətirilir, dəyişdirilməz qalır və yalnız oxunma rejimində istifadə olunur. |
Xronologiyanın dəstəklənməsi | Verilənlər xronoloji olaraq strukturlaşdırılır, analiz və proqnozlaşdırmanın yereinə yetirilməsi üçün kifayət olan tarixi göstərir. |
Mənbə
redaktə- Parsaye K. A Characterization of Data Mining Technologies and Processes // The Journal of Data Warehousing. −1998.-№ 1.
- Parsaye K. OLAP and Data Mining: Bridging the Gap // Database Programming and Design. – 1997. – № 2.
- Ralph Kimball. The Data Warehouse Toolkit: Practical Techniques for Building Dimensional Data Warehouses, John Wiley & Sons, 1996.
- Ralph Kimball. The Data Webhouse Toolkit: Building the Web-Enabled Data Warehouse, John Wiley & Sons, 2000.