ورود

View Full Version : انبار داده



kamran_b
سه شنبه 08 مرداد 1398, 21:28 عصر
http://up.onlinesnic.ir/img/3bgjd5kzjv.png


ساخت انبار داده (http://nazmaran.com/Content.aspx?ObjectName=DW&name=%u0645%u0631%u0627%u062d%u0644+%u0627%u06cc%u 062c%u0627%u062f+%u0627%u0646%u0628%u0627%u0631+%u 062f%u0627%u062f%u0647)ساخت انبار داده در سازمان (http://nazmaran.com/Content.aspx?ObjectName=DW&name=%u0645%u0631%u0627%u062d%u0644+%u0627%u06cc%u 062c%u0627%u062f+%u0627%u0646%u0628%u0627%u0631+%u 062f%u0627%u062f%u0647)
بسیاری از شرکت ها و سازمانها به این باور رسیده اند که گردآوری، سازمان دهی (http://nazmaran.com/Content.aspx?ObjectName=DW&name=%u0645%u0631%u0627%u062d%u0644+%u0627%u06cc%u 062c%u0627%u062f+%u0627%u0646%u0628%u0627%u0631+%u 062f%u0627%u062f%u0647) و یکپارچه سازی داده ها (http://nazmaran.com/Content.aspx?ObjectName=DW&name=%u0645%u0631%u0627%u062d%u0644+%u0627%u06cc%u 062c%u0627%u062f+%u0627%u0646%u0628%u0627%u0631+%u 062f%u0627%u062f%u0647) در یک مخزن داده (http://nazmaran.com/Content.aspx?ObjectName=DW&name=%u0645%u0631%u0627%u062d%u0644+%u0627%u06cc%u 062c%u0627%u062f+%u0627%u0646%u0628%u0627%u0631+%u 062f%u0627%u062f%u0647) برای مدیریت بهینه و اتخاذ تصمیمات کلان (http://nazmaran.com/Content.aspx?ObjectName=DW&name=%u0645%u0631%u0627%u062d%u0644+%u0627%u06cc%u 062c%u0627%u062f+%u0627%u0646%u0628%u0627%u0631+%u 062f%u0627%u062f%u0647) یک ضرورت می باشد.

به طور کلی ساخت یک انبار داده (http://nazmaran.com/Content.aspx?ObjectName=DW&name=%D9%85%D8%B1%D8%A7%D8%AD%D9%84%20%D8%A7%DB%8C %D8%AC%D8%A7%D8%AF%20%D8%A7%D9%86%D8%A8%D8%A7%D8%B 1%20%D8%AF%D8%A7%D8%AF%D9%87)، به شکل یک پروژه شامل مراحل اصلی زیر می باشد:

1- استخراج داده های تراکنشی (http://nazmaran.com/Content.aspx?ObjectName=DW&name=%u0645%u0631%u0627%u062d%u0644+%u0627%u06cc%u 062c%u0627%u062f+%u0627%u0646%u0628%u0627%u0631+%u 062f%u0627%u062f%u0647) از پایگاه های داده (http://nazmaran.com/Content.aspx?ObjectName=DW&name=%u0645%u0631%u0627%u062d%u0644+%u0627%u06cc%u 062c%u0627%u062f+%u0627%u0646%u0628%u0627%u0631+%u 062f%u0627%u062f%u0647) به یک مخزن واحد (http://nazmaran.com/Content.aspx?ObjectName=DW&name=%u0645%u0631%u0627%u062d%u0644+%u0627%u06cc%u 062c%u0627%u062f+%u0627%u0646%u0628%u0627%u0631+%u 062f%u0627%u062f%u0647)
شناخت منابع داده های سازمان و استخراج داده های ارزشمند از آنها یکی از اصلی ترین مراحل ایجاد انبار داده (http://nazmaran.com/Content.aspx?ObjectName=DW&name=%u0645%u0631%u0627%u062d%u0644+%u0627%u06cc%u 062c%u0627%u062f+%u0627%u0646%u0628%u0627%u0631+%u 062f%u0627%u062f%u0647) می باشد.

2- تبدیل داده ها (http://nazmaran.com/Content.aspx?ObjectName=DW&name=%u0645%u0631%u0627%u062d%u0644+%u0627%u06cc%u 062c%u0627%u062f+%u0627%u0646%u0628%u0627%u0631+%u 062f%u0627%u062f%u0647) در انبار داده (http://nazmaran.com/Content.aspx?ObjectName=DW&name=%u0645%u0631%u0627%u062d%u0644+%u0627%u06cc%u 062c%u0627%u062f+%u0627%u0646%u0628%u0627%u0631+%u 062f%u0627%u062f%u0647)
از آنجائیکه سیستمهای اطلاعاتی (http://nazmaran.com/Content.aspx?ObjectName=DW&name=%u0645%u0631%u0627%u062d%u0644+%u0627%u06cc%u 062c%u0627%u062f+%u0627%u0646%u0628%u0627%u0631+%u 062f%u0627%u062f%u0647) و برنامه های کاربردی یک سازمان (http://nazmaran.com/Content.aspx?ObjectName=DW&name=%u0645%u0631%u0627%u062d%u0644+%u0627%u06cc%u 062c%u0627%u062f+%u0627%u0646%u0628%u0627%u0631+%u 062f%u0627%u062f%u0647) غالبا توسط افراد و پروژه های مختلف به مـرور زمان در مواجهـه با نیـازهای جدید سـاخته یا تغییر شـکل داده (http://nazmaran.com/Content.aspx?ObjectName=DW&name=%u0645%u0631%u0627%u062d%u0644+%u0627%u06cc%u 062c%u0627%u062f+%u0627%u0646%u0628%u0627%u0631+%u 062f%u0627%u062f%u0647) می شـوند، یکسـان سـازی آنها امری ضروری می باشد.در بسیاری از موارد نیز سیستمهای اطلاعاتی در بستر های مختلف پایگاه داده (http://nazmaran.com/Content.aspx?ObjectName=DW&name=%u0645%u0631%u0627%u062d%u0644+%u0627%u06cc%u 062c%u0627%u062f+%u0627%u0646%u0628%u0627%u0631+%u 062f%u0627%u062f%u0647) مانند Microsoft SQL Server ،Oracle ، Sybase (http://nazmaran.com/Content.aspx?ObjectName=DW&name=%u0645%u0631%u0627%u062d%u0644+%u0627%u06cc%u 062c%u0627%u062f+%u0627%u0646%u0628%u0627%u0631+%u 062f%u0627%u062f%u0647) ، Microsoft Access و غیره طراحی گردیده اند. بررسی جداول، برقراری ارتباط بین فیلدها و یک شکل سازی داده ها (http://nazmaran.com/Content.aspx?ObjectName=DW&name=%u0645%u0631%u0627%u062d%u0644+%u0627%u06cc%u 062c%u0627%u062f+%u0627%u0646%u0628%u0627%u0631+%u 062f%u0627%u062f%u0647) در این مرحله صورت می پذیرد.

3- بارگذاری داده ها (http://nazmaran.com/Content.aspx?ObjectName=DW&name=%u0645%u0631%u0627%u062d%u0644+%u0627%u06cc%u 062c%u0627%u062f+%u0627%u0646%u0628%u0627%u0631+%u 062f%u0627%u062f%u0647)ی تبدیل شده به یک پایگاه داده چند بعدی (http://nazmaran.com/Content.aspx?ObjectName=DW&name=%u0645%u0631%u0627%u062d%u0644+%u0627%u06cc%u 062c%u0627%u062f+%u0627%u0646%u0628%u0627%u0631+%u 062f%u0627%u062f%u0647) در انبار داده (http://nazmaran.com/Content.aspx?ObjectName=DW&name=%u0645%u0631%u0627%u062d%u0644+%u0627%u06cc%u 062c%u0627%u062f+%u0627%u0646%u0628%u0627%u0631+%u 062f%u0627%u062f%u0647)
بر خلاف پایگاه داده سیستمهای عملیاتی (http://nazmaran.com/Content.aspx?ObjectName=DW&name=%u0645%u0631%u0627%u062d%u0644+%u0627%u06cc%u 062c%u0627%u062f+%u0627%u0646%u0628%u0627%u0631+%u 062f%u0627%u062f%u0647) (OLTP) که دارای معماری رابطه ای (http://nazmaran.com/Content.aspx?ObjectName=DW&name=%u0645%u0631%u0627%u062d%u0644+%u0627%u06cc%u 062c%u0627%u062f+%u0627%u0646%u0628%u0627%u0631+%u 062f%u0627%u062f%u0647) می باشند و از اصول نرمالیزه استفاده می کنند، طراحی انبار داده (http://nazmaran.com/Content.aspx?ObjectName=anbar%20dade) به شکلی ویژه بدون بهره گیری از اصول نرمالیزاسیون می باشد. درانبار داده (http://nazmaran.com/Content.aspx?ObjectName=DW&name=%u0645%u0631%u0627%u062d%u0644+%u0627%u06cc%u 062c%u0627%u062f+%u0627%u0646%u0628%u0627%u0631+%u 062f%u0627%u062f%u0647) فیلدها در جاهای مختلفی تکرار می شوند و روابط بین جداول کمتر به چشم می خورند. علت آن هم افزایش سرعت پردازش اطلاعات (http://nazmaran.com/Content.aspx?ObjectName=DW&name=%u0645%u0631%u0627%u062d%u0644+%u0627%u06cc%u 062c%u0627%u062f+%u0627%u0646%u0628%u0627%u0631+%u 062f%u0627%u062f%u0647) هنگام گزارشات و عملیات آماری می باشد.
4- تولید مقادیر از پیش محاسبه شده جهت افزایش سرعت گزارش گیری در انبار داده (http://nazmaran.com/Content.aspx?ObjectName=DW&name=%u0645%u0631%u0627%u062d%u0644+%u0627%u06cc%u 062c%u0627%u062f+%u0627%u0646%u0628%u0627%u0631+%u 062f%u0627%u062f%u0647)

مـقادیر از پیـش محاسـبه شده را تراکـم نیـز مـی نامـند. ایـن مرحلــه توســط سیستـمهایی نظــیرMicrosoft SQL Server Analysis Services (http://nazmaran.com/Content.aspx?ObjectName=DW&name=%u0645%u0631%u0627%u062d%u0644+%u0627%u06cc%u 062c%u0627%u062f+%u0627%u0646%u0628%u0627%u0631+%u 062f%u0627%u062f%u0647) بسیار ساده تر شده است. ایـن تراکم ها کـه در ابـعاد مختلـف انبار داده (http://nazmaran.com/) سـاخته می شوند، موجب می شوند که سرعت انجام عملیات گزارش گیری (http://nazmaran.com/Content.aspx?ObjectName=DW&name=%u0645%u0631%u0627%u062d%u0644+%u0627%u06cc%u 062c%u0627%u062f+%u0627%u0646%u0628%u0627%u0631+%u 062f%u0627%u062f%u0647) به شکل محسوسی افزایش یابد. بایدتوجه داشت که عملیات ساخت این مقادیر بسیار زمان گیر بوده و نیازمند حافظه زیادی بر روی سروراست.

5- ساخت ( یا خرید ) یک ابزار گزارش گیری (http://nazmaran.com/Content.aspx?ObjectName=DW&name=%u0645%u0631%u0627%u062d%u0644+%u0627%u06cc%u 062c%u0627%u062f+%u0627%u0646%u0628%u0627%u0631+%u 062f%u0627%u062f%u0647) در انبار داده (http://nazmaran.com/Content.aspx?ObjectName=DW&name=%u0645%u0631%u0627%u062d%u0644+%u0627%u06cc%u 062c%u0627%u062f+%u0627%u0646%u0628%u0627%u0631+%u 062f%u0627%u062f%u0647)

پس از انجام مراحل فوق، شـما می توانـید نسبـت به ساخت یا خـرید یـک نرم افزار گزارش گیـری (http://nazmaran.com/Content.aspx?ObjectName=DW&name=%u0645%u0631%u0627%u062d%u0644+%u0627%u06cc%u 062c%u0627%u062f+%u0627%u0646%u0628%u0627%u0631+%u 062f%u0627%u062f%u0647)تصمیم گیری نمایید. به طور معمـول هزینه سـاخت یک نرم افزار گزارش گـیری (http://nazmaran.com/Content.aspx?ObjectName=DW&name=%u0645%u0631%u0627%u062d%u0644+%u0627%u06cc%u 062c%u0627%u062f+%u0627%u0646%u0628%u0627%u0631+%u 062f%u0627%u062f%u0647)، بالاتـر از هزینـه خریـد آن از یک شرکت خارجـی می شود.


ویژگیهای اصلی داده های انبار داده (http://nazmaran.com/Content.aspx?ObjectName=DW&name=%u0645%u0631%u0627%u062d%u0644+%u0627%u06cc%u 062c%u0627%u062f+%u0627%u0646%u0628%u0627%u0631+%u 062f%u0627%u062f%u0647) هاداده‌های موجود در انبار داده ها (http://nazmaran.com/Content.aspx?ObjectName=anbar%20dade) از سیستم‌های عملیاتی متنوع (نظیر سیستم‌های پایگاه داده‌ها (http://nazmaran.com/Content.aspx?ObjectName=DW&name=%u0645%u0631%u0627%u062d%u0644+%u0627%u06cc%u 062c%u0627%u062f+%u0627%u0646%u0628%u0627%u0631+%u 062f%u0627%u062f%u0647)) ومنابع داده‌ای خارجی (http://nazmaran.com/Content.aspx?ObjectName=DW&name=%u0645%u0631%u0627%u062d%u0644+%u0627%u06cc%u 062c%u0627%u062f+%u0627%u0646%u0628%u0627%u0631+%u 062f%u0627%u062f%u0647) (نظیر پایگاه داده‌های آماری (http://nazmaran.com/Content.aspx?ObjectName=DW&name=%u0645%u0631%u0627%u062d%u0644+%u0627%u06cc%u 062c%u0627%u062f+%u0627%u0646%u0628%u0627%u0631+%u 062f%u0627%u062f%u0647) و WWW )یکپارچه می‌شوند. تفاوتهای ساختاری ومعنایی داده‌ها (http://nazmaran.com/Content.aspx?ObjectName=DW&name=%u0645%u0631%u0627%u062d%u0644+%u0627%u06cc%u 062c%u0627%u062f+%u0627%u0646%u0628%u0627%u0631+%u 062f%u0627%u062f%u0647) باید پیش از یکپارچه سازی انسجام یابند. برای مثال داده‌ها باید مطابق با مدل داده‌ای یکپارچه (http://nazmaran.com/Content.aspx?ObjectName=DW&name=%u0645%u0631%u0627%u062d%u0644+%u0627%u06cc%u 062c%u0627%u062f+%u0627%u0646%u0628%u0627%u0631+%u 062f%u0627%u062f%u0647) "همگن" شوند. بعلاوه، مقادیر داده‌ای سیستم‌های عملیاتی باید پاک شوند تا داده‌های صحیحی در انبار داده (http://nazmaran.com/Content.aspx?ObjectName=DW&name=%u0645%u0631%u0627%u062d%u0644+%u0627%u06cc%u 062c%u0627%u062f+%u0627%u0646%u0628%u0627%u0631+%u 062f%u0627%u062f%u0647) ها وارد شوند. نیاز به داده‌های تاریخی یکی از موارد مهم درشیوه انبار داده (http://nazmaran.com/Content.aspx?ObjectName=DW&name=%u0645%u0631%u0627%u062d%u0644+%u0627%u06cc%u 062c%u0627%u062f+%u0627%u0646%u0628%u0627%u0631+%u 062f%u0627%u062f%u0647) هاست. داده‌های تاریخی برای تحلیل روند کسب وکار (http://nazmaran.com/Content.aspx?ObjectName=DW&name=%u0645%u0631%u0627%u062d%u0644+%u0627%u06cc%u 062c%u0627%u062f+%u0627%u0646%u0628%u0627%u0631+%u 062f%u0627%u062f%u0647)ضروری هستند. البته هزینه نگهداری این گونه داده ها نیز باید مورد توجه قرار گیرد. بعلاوه، داده های انبار داده (http://nazmaran.com/Content.aspx?ObjectName=DW&name=%u0645%u0631%u0627%u062d%u0644+%u0627%u06cc%u 062c%u0627%u062f+%u0627%u0646%u0628%u0627%u0631+%u 062f%u0627%u062f%u0647) ها ثابت هستند، برای مثال دسترسی به DWH از نوع خواندنی است. انجام اصلاحات در این داده‌ها فقط هنگامی صورت می‌گیرد که اصلاحات داده‌های منبع در انبار انتشار یابند. DWH داده‌های دیگری به نام داده‌های اشتقاق یافته (derived data) دارد. این داده ها به طور صریح در منابع عملیاتی ذخیره نمی‌شوند، بلکه در حین بعضی از فرایندها از داده های عملیاتی (http://nazmaran.com/Content.aspx?ObjectName=DW&name=%u0645%u0631%u0627%u062d%u0644+%u0627%u06cc%u 062c%u0627%u062f+%u0627%u0646%u0628%u0627%u0631+%u 062f%u0627%u062f%u0647)، اشتقاق می‌یابند. برای مثال داده های فروش را می‌توان در سطوح مختلف (هفتگی، ماهانه، فصلی) در انبار ذخیره نمود.
Data Warehouseسیستم های انبار داده (http://nazmaran.com/Content.aspx?ObjectName=DW&name=%u0645%u0631%u0627%u062d%u0644+%u0627%u06cc%u 062c%u0627%u062f+%u0627%u0646%u0628%u0627%u0631+%u 062f%u0627%u062f%u0647) ها
سیستم انبار داده (http://nazmaran.com/Content.aspx?ObjectName=DW&name=%u0645%u0631%u0627%u062d%u0644+%u0627%u06cc%u 062c%u0627%u062f+%u0627%u0646%u0628%u0627%u0631+%u 062f%u0627%u062f%u0647) ها (DWS) شامل انبار داده ها و همه مولفه هایی است که برای ساخت، دستیابی و نگهداری DWH به کار می‌روند. انبار داده‌ (http://nazmaran.com/Content.aspx?ObjectName=DW&name=%u0645%u0631%u0627%u062d%u0644+%u0627%u06cc%u 062c%u0627%u062f+%u0627%u0646%u0628%u0627%u0631+%u 062f%u0627%u062f%u0647) ها بخش مرکزی سیستم انبار داده (http://nazmaran.com/Content.aspx?ObjectName=DW&name=%u0645%u0631%u0627%u062d%u0644+%u0627%u06cc%u 062c%u0627%u062f+%u0627%u0646%u0628%u0627%u0631+%u 062f%u0627%u062f%u0647) ها را تشکیل می‌دهد. گاهی اوقات انبار داده (http://nazmaran.com/Content.aspx?ObjectName=DW&name=%u0645%u0631%u0627%u062d%u0644+%u0627%u06cc%u 062c%u0627%u062f+%u0627%u0646%u0628%u0627%u0631+%u 062f%u0627%u062f%u0647) ها حجم عظیمی از اطلاعات را در واحدهای منطقی کوچکتر به نام Data Mart نگهداری می‌کند. مولفه آماده سازی، مسوولیت کسب یا دریافت داده ها را بر عهده دارد. این مولفه شامل همه برنامه‌ها و‌برنامه‌های کاربردی ای است که مسوول استخراج داده ها از منابع عملیاتی هستند. مولفه دستیابی شامل برنامه‌های کاربردی مختلف (OLAP یا برنامه‌های کاربردی داده کاوی) است که امکان استفاده از اطلاعات ذخیره شده در انبار داده (http://nazmaran.com/Content.aspx?ObjectName=DW&name=%u0645%u0631%u0627%u062d%u0644+%u0627%u06cc%u 062c%u0627%u062f+%u0627%u0646%u0628%u0627%u0631+%u 062f%u0627%u062f%u0647)ها را فراهم می‌آورند.



مولفه مدیریت Metadata، وظیفه مدیریت، تعریف و دستیبابی به انواع مختلف Metadata را بر عهده دارد. در اصل ،‌Metadata "داده هایی درباره داده‌ها" یا "داده هایی است که مفهوم داده‌ها (http://nazmaran.com/Content.aspx?ObjectName=DW&name=%u0645%u0631%u0627%u062d%u0644+%u0627%u06cc%u 062c%u0627%u062f+%u0627%u0646%u0628%u0627%u0631+%u 062f%u0627%u062f%u0647) را توصیف می‌کنند". انواع مختلف Metadata در انبار داده‌ها (http://nazmaran.com/Content.aspx?ObjectName=DW&name=%u0645%u0631%u0627%u062d%u0644+%u0627%u06cc%u 062c%u0627%u062f+%u0627%u0646%u0628%u0627%u0631+%u 062f%u0627%u062f%u0647) وجود دارند. مثلا اطلاعاتی درباره منابع عملیاتی، ساختار داده‌های DWH و کارهایی که در حین ساخت، نگهداری و دستیبابی به DWH انجام می‌شوند. نیاز به Metadata شناخته شده است. پیاده سازی یک DWS منسجم ،کار پیچیده و دشواری است و شامل دو فاز می باشد. درفاز اول که پیکربندی DWS نام دارد، دیدگاه مفهومی انبار داده‌ها مطابق با نیازمندیهای کاربر مشخص می‌شود. سپس منابع داده‌ای دخیل و روش استخراج و بار گذاری در انبار داده‌ها (http://nazmaran.com/Content.aspx?ObjectName=DW&name=%u0645%u0631%u0627%u062d%u0644+%u0627%u06cc%u 062c%u0627%u062f+%u0627%u0646%u0628%u0627%u0631+%u 062f%u0627%u062f%u0647) تعیین می‌گردد. سرانجام، درباره پایگاه داده ها (http://nazmaran.com/Content.aspx?ObjectName=DW&name=%u0645%u0631%u0627%u062d%u0644+%u0627%u06cc%u 062c%u0627%u062f+%u0627%u0646%u0628%u0627%u0631+%u 062f%u0627%u062f%u0647)ی مورد نظر و روشهای دستیبابی داده‌ها تصمیم گیری خواهد شد. پس از بار گذاری اولیه، در فاز عملیات DWS باید داده‌هایانبار داده ها (http://nazmaran.com/Content.aspx?ObjectName=DW&name=%u0645%u0631%u0627%u062d%u0644+%u0627%u06cc%u 062c%u0627%u062f+%u0627%u0646%u0628%u0627%u0631+%u 062f%u0627%u062f%u0647) به منظور منظم refresh شوند.


طراحی انبار داده ها (http://nazmaran.com/Content.aspx?ObjectName=DW&name=%u0645%u0631%u0627%u062d%u0644+%u0627%u06cc%u 062c%u0627%u062f+%u0627%u0646%u0628%u0627%u0631+%u 062f%u0627%u062f%u0647)
روشهای طراحی انبار داده ها (http://nazmaran.com/Content.aspx?ObjectName=DW&name=%u0645%u0631%u0627%u062d%u0644+%u0627%u06cc%u 062c%u0627%u062f+%u0627%u0646%u0628%u0627%u0631+%u 062f%u0627%u062f%u0647) امکان پردازش کارآمد query را برروی حجم عظیمی از داده ها فراهم می‌آورند. نوع ویژه‌ای از الگوی پایگاه داده ها به نام star برای مدل سازی انبار داده ها (http://nazmaran.com/Content.aspx?ObjectName=DW&name=%u0645%u0631%u0627%u062d%u0644+%u0627%u06cc%u 062c%u0627%u062f+%u0627%u0646%u0628%u0627%u0631+%u 062f%u0627%u062f%u0647) ی چند بعدی به کار می‌رود. در این حالت، پایگاه داده ها از یک جدول مرکزی واقعیت یا fact و جداول چند بعدی تشکیل شده است. جدول واقعیت حاوی tuple هایی است که بیانگر واقعیت های کسب و کار مانند فروش یا عرضه هستند. هر tuple جدول واقعیت به tupleهای جدول چند بعدی اشاره دارد. هرtuple جدول چند بعدی مواردی نظیر محصولات، مشتریان، زمان و فروشنده را نشان می‌دهد.