kamran_b
سه شنبه 08 مرداد 1398, 21:28 عصر
http://up.onlinesnic.ir/img/3bgjd5kzjv.png
ساخت انبار داده (http://nazmaran.com/Content.aspx?ObjectName=DW&name=%u0645%u0631%u0627%u062d%u0644+%u0627%u06cc%u 062c%u0627%u062f+%u0627%u0646%u0628%u0627%u0631+%u 062f%u0627%u062f%u0647)ساخت انبار داده در سازمان (http://nazmaran.com/Content.aspx?ObjectName=DW&name=%u0645%u0631%u0627%u062d%u0644+%u0627%u06cc%u 062c%u0627%u062f+%u0627%u0646%u0628%u0627%u0631+%u 062f%u0627%u062f%u0647)
بسیاری از شرکت ها و سازمانها به این باور رسیده اند که گردآوری، سازمان دهی (http://nazmaran.com/Content.aspx?ObjectName=DW&name=%u0645%u0631%u0627%u062d%u0644+%u0627%u06cc%u 062c%u0627%u062f+%u0627%u0646%u0628%u0627%u0631+%u 062f%u0627%u062f%u0647) و یکپارچه سازی داده ها (http://nazmaran.com/Content.aspx?ObjectName=DW&name=%u0645%u0631%u0627%u062d%u0644+%u0627%u06cc%u 062c%u0627%u062f+%u0627%u0646%u0628%u0627%u0631+%u 062f%u0627%u062f%u0647) در یک مخزن داده (http://nazmaran.com/Content.aspx?ObjectName=DW&name=%u0645%u0631%u0627%u062d%u0644+%u0627%u06cc%u 062c%u0627%u062f+%u0627%u0646%u0628%u0627%u0631+%u 062f%u0627%u062f%u0647) برای مدیریت بهینه و اتخاذ تصمیمات کلان (http://nazmaran.com/Content.aspx?ObjectName=DW&name=%u0645%u0631%u0627%u062d%u0644+%u0627%u06cc%u 062c%u0627%u062f+%u0627%u0646%u0628%u0627%u0631+%u 062f%u0627%u062f%u0647) یک ضرورت می باشد.
به طور کلی ساخت یک انبار داده (http://nazmaran.com/Content.aspx?ObjectName=DW&name=%D9%85%D8%B1%D8%A7%D8%AD%D9%84%20%D8%A7%DB%8C %D8%AC%D8%A7%D8%AF%20%D8%A7%D9%86%D8%A8%D8%A7%D8%B 1%20%D8%AF%D8%A7%D8%AF%D9%87)، به شکل یک پروژه شامل مراحل اصلی زیر می باشد:
1- استخراج داده های تراکنشی (http://nazmaran.com/Content.aspx?ObjectName=DW&name=%u0645%u0631%u0627%u062d%u0644+%u0627%u06cc%u 062c%u0627%u062f+%u0627%u0646%u0628%u0627%u0631+%u 062f%u0627%u062f%u0647) از پایگاه های داده (http://nazmaran.com/Content.aspx?ObjectName=DW&name=%u0645%u0631%u0627%u062d%u0644+%u0627%u06cc%u 062c%u0627%u062f+%u0627%u0646%u0628%u0627%u0631+%u 062f%u0627%u062f%u0647) به یک مخزن واحد (http://nazmaran.com/Content.aspx?ObjectName=DW&name=%u0645%u0631%u0627%u062d%u0644+%u0627%u06cc%u 062c%u0627%u062f+%u0627%u0646%u0628%u0627%u0631+%u 062f%u0627%u062f%u0647)
شناخت منابع داده های سازمان و استخراج داده های ارزشمند از آنها یکی از اصلی ترین مراحل ایجاد انبار داده (http://nazmaran.com/Content.aspx?ObjectName=DW&name=%u0645%u0631%u0627%u062d%u0644+%u0627%u06cc%u 062c%u0627%u062f+%u0627%u0646%u0628%u0627%u0631+%u 062f%u0627%u062f%u0647) می باشد.
2- تبدیل داده ها (http://nazmaran.com/Content.aspx?ObjectName=DW&name=%u0645%u0631%u0627%u062d%u0644+%u0627%u06cc%u 062c%u0627%u062f+%u0627%u0646%u0628%u0627%u0631+%u 062f%u0627%u062f%u0647) در انبار داده (http://nazmaran.com/Content.aspx?ObjectName=DW&name=%u0645%u0631%u0627%u062d%u0644+%u0627%u06cc%u 062c%u0627%u062f+%u0627%u0646%u0628%u0627%u0631+%u 062f%u0627%u062f%u0647)
از آنجائیکه سیستمهای اطلاعاتی (http://nazmaran.com/Content.aspx?ObjectName=DW&name=%u0645%u0631%u0627%u062d%u0644+%u0627%u06cc%u 062c%u0627%u062f+%u0627%u0646%u0628%u0627%u0631+%u 062f%u0627%u062f%u0647) و برنامه های کاربردی یک سازمان (http://nazmaran.com/Content.aspx?ObjectName=DW&name=%u0645%u0631%u0627%u062d%u0644+%u0627%u06cc%u 062c%u0627%u062f+%u0627%u0646%u0628%u0627%u0631+%u 062f%u0627%u062f%u0647) غالبا توسط افراد و پروژه های مختلف به مـرور زمان در مواجهـه با نیـازهای جدید سـاخته یا تغییر شـکل داده (http://nazmaran.com/Content.aspx?ObjectName=DW&name=%u0645%u0631%u0627%u062d%u0644+%u0627%u06cc%u 062c%u0627%u062f+%u0627%u0646%u0628%u0627%u0631+%u 062f%u0627%u062f%u0647) می شـوند، یکسـان سـازی آنها امری ضروری می باشد.در بسیاری از موارد نیز سیستمهای اطلاعاتی در بستر های مختلف پایگاه داده (http://nazmaran.com/Content.aspx?ObjectName=DW&name=%u0645%u0631%u0627%u062d%u0644+%u0627%u06cc%u 062c%u0627%u062f+%u0627%u0646%u0628%u0627%u0631+%u 062f%u0627%u062f%u0647) مانند Microsoft SQL Server ،Oracle ، Sybase (http://nazmaran.com/Content.aspx?ObjectName=DW&name=%u0645%u0631%u0627%u062d%u0644+%u0627%u06cc%u 062c%u0627%u062f+%u0627%u0646%u0628%u0627%u0631+%u 062f%u0627%u062f%u0647) ، Microsoft Access و غیره طراحی گردیده اند. بررسی جداول، برقراری ارتباط بین فیلدها و یک شکل سازی داده ها (http://nazmaran.com/Content.aspx?ObjectName=DW&name=%u0645%u0631%u0627%u062d%u0644+%u0627%u06cc%u 062c%u0627%u062f+%u0627%u0646%u0628%u0627%u0631+%u 062f%u0627%u062f%u0647) در این مرحله صورت می پذیرد.
3- بارگذاری داده ها (http://nazmaran.com/Content.aspx?ObjectName=DW&name=%u0645%u0631%u0627%u062d%u0644+%u0627%u06cc%u 062c%u0627%u062f+%u0627%u0646%u0628%u0627%u0631+%u 062f%u0627%u062f%u0647)ی تبدیل شده به یک پایگاه داده چند بعدی (http://nazmaran.com/Content.aspx?ObjectName=DW&name=%u0645%u0631%u0627%u062d%u0644+%u0627%u06cc%u 062c%u0627%u062f+%u0627%u0646%u0628%u0627%u0631+%u 062f%u0627%u062f%u0647) در انبار داده (http://nazmaran.com/Content.aspx?ObjectName=DW&name=%u0645%u0631%u0627%u062d%u0644+%u0627%u06cc%u 062c%u0627%u062f+%u0627%u0646%u0628%u0627%u0631+%u 062f%u0627%u062f%u0647)
بر خلاف پایگاه داده سیستمهای عملیاتی (http://nazmaran.com/Content.aspx?ObjectName=DW&name=%u0645%u0631%u0627%u062d%u0644+%u0627%u06cc%u 062c%u0627%u062f+%u0627%u0646%u0628%u0627%u0631+%u 062f%u0627%u062f%u0647) (OLTP) که دارای معماری رابطه ای (http://nazmaran.com/Content.aspx?ObjectName=DW&name=%u0645%u0631%u0627%u062d%u0644+%u0627%u06cc%u 062c%u0627%u062f+%u0627%u0646%u0628%u0627%u0631+%u 062f%u0627%u062f%u0647) می باشند و از اصول نرمالیزه استفاده می کنند، طراحی انبار داده (http://nazmaran.com/Content.aspx?ObjectName=anbar%20dade) به شکلی ویژه بدون بهره گیری از اصول نرمالیزاسیون می باشد. درانبار داده (http://nazmaran.com/Content.aspx?ObjectName=DW&name=%u0645%u0631%u0627%u062d%u0644+%u0627%u06cc%u 062c%u0627%u062f+%u0627%u0646%u0628%u0627%u0631+%u 062f%u0627%u062f%u0647) فیلدها در جاهای مختلفی تکرار می شوند و روابط بین جداول کمتر به چشم می خورند. علت آن هم افزایش سرعت پردازش اطلاعات (http://nazmaran.com/Content.aspx?ObjectName=DW&name=%u0645%u0631%u0627%u062d%u0644+%u0627%u06cc%u 062c%u0627%u062f+%u0627%u0646%u0628%u0627%u0631+%u 062f%u0627%u062f%u0647) هنگام گزارشات و عملیات آماری می باشد.
4- تولید مقادیر از پیش محاسبه شده جهت افزایش سرعت گزارش گیری در انبار داده (http://nazmaran.com/Content.aspx?ObjectName=DW&name=%u0645%u0631%u0627%u062d%u0644+%u0627%u06cc%u 062c%u0627%u062f+%u0627%u0646%u0628%u0627%u0631+%u 062f%u0627%u062f%u0647)
مـقادیر از پیـش محاسـبه شده را تراکـم نیـز مـی نامـند. ایـن مرحلــه توســط سیستـمهایی نظــیرMicrosoft SQL Server Analysis Services (http://nazmaran.com/Content.aspx?ObjectName=DW&name=%u0645%u0631%u0627%u062d%u0644+%u0627%u06cc%u 062c%u0627%u062f+%u0627%u0646%u0628%u0627%u0631+%u 062f%u0627%u062f%u0647) بسیار ساده تر شده است. ایـن تراکم ها کـه در ابـعاد مختلـف انبار داده (http://nazmaran.com/) سـاخته می شوند، موجب می شوند که سرعت انجام عملیات گزارش گیری (http://nazmaran.com/Content.aspx?ObjectName=DW&name=%u0645%u0631%u0627%u062d%u0644+%u0627%u06cc%u 062c%u0627%u062f+%u0627%u0646%u0628%u0627%u0631+%u 062f%u0627%u062f%u0647) به شکل محسوسی افزایش یابد. بایدتوجه داشت که عملیات ساخت این مقادیر بسیار زمان گیر بوده و نیازمند حافظه زیادی بر روی سروراست.
5- ساخت ( یا خرید ) یک ابزار گزارش گیری (http://nazmaran.com/Content.aspx?ObjectName=DW&name=%u0645%u0631%u0627%u062d%u0644+%u0627%u06cc%u 062c%u0627%u062f+%u0627%u0646%u0628%u0627%u0631+%u 062f%u0627%u062f%u0647) در انبار داده (http://nazmaran.com/Content.aspx?ObjectName=DW&name=%u0645%u0631%u0627%u062d%u0644+%u0627%u06cc%u 062c%u0627%u062f+%u0627%u0646%u0628%u0627%u0631+%u 062f%u0627%u062f%u0647)
پس از انجام مراحل فوق، شـما می توانـید نسبـت به ساخت یا خـرید یـک نرم افزار گزارش گیـری (http://nazmaran.com/Content.aspx?ObjectName=DW&name=%u0645%u0631%u0627%u062d%u0644+%u0627%u06cc%u 062c%u0627%u062f+%u0627%u0646%u0628%u0627%u0631+%u 062f%u0627%u062f%u0647)تصمیم گیری نمایید. به طور معمـول هزینه سـاخت یک نرم افزار گزارش گـیری (http://nazmaran.com/Content.aspx?ObjectName=DW&name=%u0645%u0631%u0627%u062d%u0644+%u0627%u06cc%u 062c%u0627%u062f+%u0627%u0646%u0628%u0627%u0631+%u 062f%u0627%u062f%u0647)، بالاتـر از هزینـه خریـد آن از یک شرکت خارجـی می شود.
ویژگیهای اصلی داده های انبار داده (http://nazmaran.com/Content.aspx?ObjectName=DW&name=%u0645%u0631%u0627%u062d%u0644+%u0627%u06cc%u 062c%u0627%u062f+%u0627%u0646%u0628%u0627%u0631+%u 062f%u0627%u062f%u0647) هادادههای موجود در انبار داده ها (http://nazmaran.com/Content.aspx?ObjectName=anbar%20dade) از سیستمهای عملیاتی متنوع (نظیر سیستمهای پایگاه دادهها (http://nazmaran.com/Content.aspx?ObjectName=DW&name=%u0645%u0631%u0627%u062d%u0644+%u0627%u06cc%u 062c%u0627%u062f+%u0627%u0646%u0628%u0627%u0631+%u 062f%u0627%u062f%u0647)) ومنابع دادهای خارجی (http://nazmaran.com/Content.aspx?ObjectName=DW&name=%u0645%u0631%u0627%u062d%u0644+%u0627%u06cc%u 062c%u0627%u062f+%u0627%u0646%u0628%u0627%u0631+%u 062f%u0627%u062f%u0647) (نظیر پایگاه دادههای آماری (http://nazmaran.com/Content.aspx?ObjectName=DW&name=%u0645%u0631%u0627%u062d%u0644+%u0627%u06cc%u 062c%u0627%u062f+%u0627%u0646%u0628%u0627%u0631+%u 062f%u0627%u062f%u0647) و WWW )یکپارچه میشوند. تفاوتهای ساختاری ومعنایی دادهها (http://nazmaran.com/Content.aspx?ObjectName=DW&name=%u0645%u0631%u0627%u062d%u0644+%u0627%u06cc%u 062c%u0627%u062f+%u0627%u0646%u0628%u0627%u0631+%u 062f%u0627%u062f%u0647) باید پیش از یکپارچه سازی انسجام یابند. برای مثال دادهها باید مطابق با مدل دادهای یکپارچه (http://nazmaran.com/Content.aspx?ObjectName=DW&name=%u0645%u0631%u0627%u062d%u0644+%u0627%u06cc%u 062c%u0627%u062f+%u0627%u0646%u0628%u0627%u0631+%u 062f%u0627%u062f%u0647) "همگن" شوند. بعلاوه، مقادیر دادهای سیستمهای عملیاتی باید پاک شوند تا دادههای صحیحی در انبار داده (http://nazmaran.com/Content.aspx?ObjectName=DW&name=%u0645%u0631%u0627%u062d%u0644+%u0627%u06cc%u 062c%u0627%u062f+%u0627%u0646%u0628%u0627%u0631+%u 062f%u0627%u062f%u0647) ها وارد شوند. نیاز به دادههای تاریخی یکی از موارد مهم درشیوه انبار داده (http://nazmaran.com/Content.aspx?ObjectName=DW&name=%u0645%u0631%u0627%u062d%u0644+%u0627%u06cc%u 062c%u0627%u062f+%u0627%u0646%u0628%u0627%u0631+%u 062f%u0627%u062f%u0647) هاست. دادههای تاریخی برای تحلیل روند کسب وکار (http://nazmaran.com/Content.aspx?ObjectName=DW&name=%u0645%u0631%u0627%u062d%u0644+%u0627%u06cc%u 062c%u0627%u062f+%u0627%u0646%u0628%u0627%u0631+%u 062f%u0627%u062f%u0647)ضروری هستند. البته هزینه نگهداری این گونه داده ها نیز باید مورد توجه قرار گیرد. بعلاوه، داده های انبار داده (http://nazmaran.com/Content.aspx?ObjectName=DW&name=%u0645%u0631%u0627%u062d%u0644+%u0627%u06cc%u 062c%u0627%u062f+%u0627%u0646%u0628%u0627%u0631+%u 062f%u0627%u062f%u0647) ها ثابت هستند، برای مثال دسترسی به DWH از نوع خواندنی است. انجام اصلاحات در این دادهها فقط هنگامی صورت میگیرد که اصلاحات دادههای منبع در انبار انتشار یابند. DWH دادههای دیگری به نام دادههای اشتقاق یافته (derived data) دارد. این داده ها به طور صریح در منابع عملیاتی ذخیره نمیشوند، بلکه در حین بعضی از فرایندها از داده های عملیاتی (http://nazmaran.com/Content.aspx?ObjectName=DW&name=%u0645%u0631%u0627%u062d%u0644+%u0627%u06cc%u 062c%u0627%u062f+%u0627%u0646%u0628%u0627%u0631+%u 062f%u0627%u062f%u0647)، اشتقاق مییابند. برای مثال داده های فروش را میتوان در سطوح مختلف (هفتگی، ماهانه، فصلی) در انبار ذخیره نمود.
Data Warehouseسیستم های انبار داده (http://nazmaran.com/Content.aspx?ObjectName=DW&name=%u0645%u0631%u0627%u062d%u0644+%u0627%u06cc%u 062c%u0627%u062f+%u0627%u0646%u0628%u0627%u0631+%u 062f%u0627%u062f%u0647) ها
سیستم انبار داده (http://nazmaran.com/Content.aspx?ObjectName=DW&name=%u0645%u0631%u0627%u062d%u0644+%u0627%u06cc%u 062c%u0627%u062f+%u0627%u0646%u0628%u0627%u0631+%u 062f%u0627%u062f%u0647) ها (DWS) شامل انبار داده ها و همه مولفه هایی است که برای ساخت، دستیابی و نگهداری DWH به کار میروند. انبار داده (http://nazmaran.com/Content.aspx?ObjectName=DW&name=%u0645%u0631%u0627%u062d%u0644+%u0627%u06cc%u 062c%u0627%u062f+%u0627%u0646%u0628%u0627%u0631+%u 062f%u0627%u062f%u0647) ها بخش مرکزی سیستم انبار داده (http://nazmaran.com/Content.aspx?ObjectName=DW&name=%u0645%u0631%u0627%u062d%u0644+%u0627%u06cc%u 062c%u0627%u062f+%u0627%u0646%u0628%u0627%u0631+%u 062f%u0627%u062f%u0647) ها را تشکیل میدهد. گاهی اوقات انبار داده (http://nazmaran.com/Content.aspx?ObjectName=DW&name=%u0645%u0631%u0627%u062d%u0644+%u0627%u06cc%u 062c%u0627%u062f+%u0627%u0646%u0628%u0627%u0631+%u 062f%u0627%u062f%u0647) ها حجم عظیمی از اطلاعات را در واحدهای منطقی کوچکتر به نام Data Mart نگهداری میکند. مولفه آماده سازی، مسوولیت کسب یا دریافت داده ها را بر عهده دارد. این مولفه شامل همه برنامهها وبرنامههای کاربردی ای است که مسوول استخراج داده ها از منابع عملیاتی هستند. مولفه دستیابی شامل برنامههای کاربردی مختلف (OLAP یا برنامههای کاربردی داده کاوی) است که امکان استفاده از اطلاعات ذخیره شده در انبار داده (http://nazmaran.com/Content.aspx?ObjectName=DW&name=%u0645%u0631%u0627%u062d%u0644+%u0627%u06cc%u 062c%u0627%u062f+%u0627%u0646%u0628%u0627%u0631+%u 062f%u0627%u062f%u0647)ها را فراهم میآورند.
مولفه مدیریت Metadata، وظیفه مدیریت، تعریف و دستیبابی به انواع مختلف Metadata را بر عهده دارد. در اصل ،Metadata "داده هایی درباره دادهها" یا "داده هایی است که مفهوم دادهها (http://nazmaran.com/Content.aspx?ObjectName=DW&name=%u0645%u0631%u0627%u062d%u0644+%u0627%u06cc%u 062c%u0627%u062f+%u0627%u0646%u0628%u0627%u0631+%u 062f%u0627%u062f%u0647) را توصیف میکنند". انواع مختلف Metadata در انبار دادهها (http://nazmaran.com/Content.aspx?ObjectName=DW&name=%u0645%u0631%u0627%u062d%u0644+%u0627%u06cc%u 062c%u0627%u062f+%u0627%u0646%u0628%u0627%u0631+%u 062f%u0627%u062f%u0647) وجود دارند. مثلا اطلاعاتی درباره منابع عملیاتی، ساختار دادههای DWH و کارهایی که در حین ساخت، نگهداری و دستیبابی به DWH انجام میشوند. نیاز به Metadata شناخته شده است. پیاده سازی یک DWS منسجم ،کار پیچیده و دشواری است و شامل دو فاز می باشد. درفاز اول که پیکربندی DWS نام دارد، دیدگاه مفهومی انبار دادهها مطابق با نیازمندیهای کاربر مشخص میشود. سپس منابع دادهای دخیل و روش استخراج و بار گذاری در انبار دادهها (http://nazmaran.com/Content.aspx?ObjectName=DW&name=%u0645%u0631%u0627%u062d%u0644+%u0627%u06cc%u 062c%u0627%u062f+%u0627%u0646%u0628%u0627%u0631+%u 062f%u0627%u062f%u0647) تعیین میگردد. سرانجام، درباره پایگاه داده ها (http://nazmaran.com/Content.aspx?ObjectName=DW&name=%u0645%u0631%u0627%u062d%u0644+%u0627%u06cc%u 062c%u0627%u062f+%u0627%u0646%u0628%u0627%u0631+%u 062f%u0627%u062f%u0647)ی مورد نظر و روشهای دستیبابی دادهها تصمیم گیری خواهد شد. پس از بار گذاری اولیه، در فاز عملیات DWS باید دادههایانبار داده ها (http://nazmaran.com/Content.aspx?ObjectName=DW&name=%u0645%u0631%u0627%u062d%u0644+%u0627%u06cc%u 062c%u0627%u062f+%u0627%u0646%u0628%u0627%u0631+%u 062f%u0627%u062f%u0647) به منظور منظم refresh شوند.
طراحی انبار داده ها (http://nazmaran.com/Content.aspx?ObjectName=DW&name=%u0645%u0631%u0627%u062d%u0644+%u0627%u06cc%u 062c%u0627%u062f+%u0627%u0646%u0628%u0627%u0631+%u 062f%u0627%u062f%u0647)
روشهای طراحی انبار داده ها (http://nazmaran.com/Content.aspx?ObjectName=DW&name=%u0645%u0631%u0627%u062d%u0644+%u0627%u06cc%u 062c%u0627%u062f+%u0627%u0646%u0628%u0627%u0631+%u 062f%u0627%u062f%u0647) امکان پردازش کارآمد query را برروی حجم عظیمی از داده ها فراهم میآورند. نوع ویژهای از الگوی پایگاه داده ها به نام star برای مدل سازی انبار داده ها (http://nazmaran.com/Content.aspx?ObjectName=DW&name=%u0645%u0631%u0627%u062d%u0644+%u0627%u06cc%u 062c%u0627%u062f+%u0627%u0646%u0628%u0627%u0631+%u 062f%u0627%u062f%u0647) ی چند بعدی به کار میرود. در این حالت، پایگاه داده ها از یک جدول مرکزی واقعیت یا fact و جداول چند بعدی تشکیل شده است. جدول واقعیت حاوی tuple هایی است که بیانگر واقعیت های کسب و کار مانند فروش یا عرضه هستند. هر tuple جدول واقعیت به tupleهای جدول چند بعدی اشاره دارد. هرtuple جدول چند بعدی مواردی نظیر محصولات، مشتریان، زمان و فروشنده را نشان میدهد.
ساخت انبار داده (http://nazmaran.com/Content.aspx?ObjectName=DW&name=%u0645%u0631%u0627%u062d%u0644+%u0627%u06cc%u 062c%u0627%u062f+%u0627%u0646%u0628%u0627%u0631+%u 062f%u0627%u062f%u0647)ساخت انبار داده در سازمان (http://nazmaran.com/Content.aspx?ObjectName=DW&name=%u0645%u0631%u0627%u062d%u0644+%u0627%u06cc%u 062c%u0627%u062f+%u0627%u0646%u0628%u0627%u0631+%u 062f%u0627%u062f%u0647)
بسیاری از شرکت ها و سازمانها به این باور رسیده اند که گردآوری، سازمان دهی (http://nazmaran.com/Content.aspx?ObjectName=DW&name=%u0645%u0631%u0627%u062d%u0644+%u0627%u06cc%u 062c%u0627%u062f+%u0627%u0646%u0628%u0627%u0631+%u 062f%u0627%u062f%u0647) و یکپارچه سازی داده ها (http://nazmaran.com/Content.aspx?ObjectName=DW&name=%u0645%u0631%u0627%u062d%u0644+%u0627%u06cc%u 062c%u0627%u062f+%u0627%u0646%u0628%u0627%u0631+%u 062f%u0627%u062f%u0647) در یک مخزن داده (http://nazmaran.com/Content.aspx?ObjectName=DW&name=%u0645%u0631%u0627%u062d%u0644+%u0627%u06cc%u 062c%u0627%u062f+%u0627%u0646%u0628%u0627%u0631+%u 062f%u0627%u062f%u0647) برای مدیریت بهینه و اتخاذ تصمیمات کلان (http://nazmaran.com/Content.aspx?ObjectName=DW&name=%u0645%u0631%u0627%u062d%u0644+%u0627%u06cc%u 062c%u0627%u062f+%u0627%u0646%u0628%u0627%u0631+%u 062f%u0627%u062f%u0647) یک ضرورت می باشد.
به طور کلی ساخت یک انبار داده (http://nazmaran.com/Content.aspx?ObjectName=DW&name=%D9%85%D8%B1%D8%A7%D8%AD%D9%84%20%D8%A7%DB%8C %D8%AC%D8%A7%D8%AF%20%D8%A7%D9%86%D8%A8%D8%A7%D8%B 1%20%D8%AF%D8%A7%D8%AF%D9%87)، به شکل یک پروژه شامل مراحل اصلی زیر می باشد:
1- استخراج داده های تراکنشی (http://nazmaran.com/Content.aspx?ObjectName=DW&name=%u0645%u0631%u0627%u062d%u0644+%u0627%u06cc%u 062c%u0627%u062f+%u0627%u0646%u0628%u0627%u0631+%u 062f%u0627%u062f%u0647) از پایگاه های داده (http://nazmaran.com/Content.aspx?ObjectName=DW&name=%u0645%u0631%u0627%u062d%u0644+%u0627%u06cc%u 062c%u0627%u062f+%u0627%u0646%u0628%u0627%u0631+%u 062f%u0627%u062f%u0647) به یک مخزن واحد (http://nazmaran.com/Content.aspx?ObjectName=DW&name=%u0645%u0631%u0627%u062d%u0644+%u0627%u06cc%u 062c%u0627%u062f+%u0627%u0646%u0628%u0627%u0631+%u 062f%u0627%u062f%u0647)
شناخت منابع داده های سازمان و استخراج داده های ارزشمند از آنها یکی از اصلی ترین مراحل ایجاد انبار داده (http://nazmaran.com/Content.aspx?ObjectName=DW&name=%u0645%u0631%u0627%u062d%u0644+%u0627%u06cc%u 062c%u0627%u062f+%u0627%u0646%u0628%u0627%u0631+%u 062f%u0627%u062f%u0647) می باشد.
2- تبدیل داده ها (http://nazmaran.com/Content.aspx?ObjectName=DW&name=%u0645%u0631%u0627%u062d%u0644+%u0627%u06cc%u 062c%u0627%u062f+%u0627%u0646%u0628%u0627%u0631+%u 062f%u0627%u062f%u0647) در انبار داده (http://nazmaran.com/Content.aspx?ObjectName=DW&name=%u0645%u0631%u0627%u062d%u0644+%u0627%u06cc%u 062c%u0627%u062f+%u0627%u0646%u0628%u0627%u0631+%u 062f%u0627%u062f%u0647)
از آنجائیکه سیستمهای اطلاعاتی (http://nazmaran.com/Content.aspx?ObjectName=DW&name=%u0645%u0631%u0627%u062d%u0644+%u0627%u06cc%u 062c%u0627%u062f+%u0627%u0646%u0628%u0627%u0631+%u 062f%u0627%u062f%u0647) و برنامه های کاربردی یک سازمان (http://nazmaran.com/Content.aspx?ObjectName=DW&name=%u0645%u0631%u0627%u062d%u0644+%u0627%u06cc%u 062c%u0627%u062f+%u0627%u0646%u0628%u0627%u0631+%u 062f%u0627%u062f%u0647) غالبا توسط افراد و پروژه های مختلف به مـرور زمان در مواجهـه با نیـازهای جدید سـاخته یا تغییر شـکل داده (http://nazmaran.com/Content.aspx?ObjectName=DW&name=%u0645%u0631%u0627%u062d%u0644+%u0627%u06cc%u 062c%u0627%u062f+%u0627%u0646%u0628%u0627%u0631+%u 062f%u0627%u062f%u0647) می شـوند، یکسـان سـازی آنها امری ضروری می باشد.در بسیاری از موارد نیز سیستمهای اطلاعاتی در بستر های مختلف پایگاه داده (http://nazmaran.com/Content.aspx?ObjectName=DW&name=%u0645%u0631%u0627%u062d%u0644+%u0627%u06cc%u 062c%u0627%u062f+%u0627%u0646%u0628%u0627%u0631+%u 062f%u0627%u062f%u0647) مانند Microsoft SQL Server ،Oracle ، Sybase (http://nazmaran.com/Content.aspx?ObjectName=DW&name=%u0645%u0631%u0627%u062d%u0644+%u0627%u06cc%u 062c%u0627%u062f+%u0627%u0646%u0628%u0627%u0631+%u 062f%u0627%u062f%u0647) ، Microsoft Access و غیره طراحی گردیده اند. بررسی جداول، برقراری ارتباط بین فیلدها و یک شکل سازی داده ها (http://nazmaran.com/Content.aspx?ObjectName=DW&name=%u0645%u0631%u0627%u062d%u0644+%u0627%u06cc%u 062c%u0627%u062f+%u0627%u0646%u0628%u0627%u0631+%u 062f%u0627%u062f%u0647) در این مرحله صورت می پذیرد.
3- بارگذاری داده ها (http://nazmaran.com/Content.aspx?ObjectName=DW&name=%u0645%u0631%u0627%u062d%u0644+%u0627%u06cc%u 062c%u0627%u062f+%u0627%u0646%u0628%u0627%u0631+%u 062f%u0627%u062f%u0647)ی تبدیل شده به یک پایگاه داده چند بعدی (http://nazmaran.com/Content.aspx?ObjectName=DW&name=%u0645%u0631%u0627%u062d%u0644+%u0627%u06cc%u 062c%u0627%u062f+%u0627%u0646%u0628%u0627%u0631+%u 062f%u0627%u062f%u0647) در انبار داده (http://nazmaran.com/Content.aspx?ObjectName=DW&name=%u0645%u0631%u0627%u062d%u0644+%u0627%u06cc%u 062c%u0627%u062f+%u0627%u0646%u0628%u0627%u0631+%u 062f%u0627%u062f%u0647)
بر خلاف پایگاه داده سیستمهای عملیاتی (http://nazmaran.com/Content.aspx?ObjectName=DW&name=%u0645%u0631%u0627%u062d%u0644+%u0627%u06cc%u 062c%u0627%u062f+%u0627%u0646%u0628%u0627%u0631+%u 062f%u0627%u062f%u0647) (OLTP) که دارای معماری رابطه ای (http://nazmaran.com/Content.aspx?ObjectName=DW&name=%u0645%u0631%u0627%u062d%u0644+%u0627%u06cc%u 062c%u0627%u062f+%u0627%u0646%u0628%u0627%u0631+%u 062f%u0627%u062f%u0647) می باشند و از اصول نرمالیزه استفاده می کنند، طراحی انبار داده (http://nazmaran.com/Content.aspx?ObjectName=anbar%20dade) به شکلی ویژه بدون بهره گیری از اصول نرمالیزاسیون می باشد. درانبار داده (http://nazmaran.com/Content.aspx?ObjectName=DW&name=%u0645%u0631%u0627%u062d%u0644+%u0627%u06cc%u 062c%u0627%u062f+%u0627%u0646%u0628%u0627%u0631+%u 062f%u0627%u062f%u0647) فیلدها در جاهای مختلفی تکرار می شوند و روابط بین جداول کمتر به چشم می خورند. علت آن هم افزایش سرعت پردازش اطلاعات (http://nazmaran.com/Content.aspx?ObjectName=DW&name=%u0645%u0631%u0627%u062d%u0644+%u0627%u06cc%u 062c%u0627%u062f+%u0627%u0646%u0628%u0627%u0631+%u 062f%u0627%u062f%u0647) هنگام گزارشات و عملیات آماری می باشد.
4- تولید مقادیر از پیش محاسبه شده جهت افزایش سرعت گزارش گیری در انبار داده (http://nazmaran.com/Content.aspx?ObjectName=DW&name=%u0645%u0631%u0627%u062d%u0644+%u0627%u06cc%u 062c%u0627%u062f+%u0627%u0646%u0628%u0627%u0631+%u 062f%u0627%u062f%u0647)
مـقادیر از پیـش محاسـبه شده را تراکـم نیـز مـی نامـند. ایـن مرحلــه توســط سیستـمهایی نظــیرMicrosoft SQL Server Analysis Services (http://nazmaran.com/Content.aspx?ObjectName=DW&name=%u0645%u0631%u0627%u062d%u0644+%u0627%u06cc%u 062c%u0627%u062f+%u0627%u0646%u0628%u0627%u0631+%u 062f%u0627%u062f%u0647) بسیار ساده تر شده است. ایـن تراکم ها کـه در ابـعاد مختلـف انبار داده (http://nazmaran.com/) سـاخته می شوند، موجب می شوند که سرعت انجام عملیات گزارش گیری (http://nazmaran.com/Content.aspx?ObjectName=DW&name=%u0645%u0631%u0627%u062d%u0644+%u0627%u06cc%u 062c%u0627%u062f+%u0627%u0646%u0628%u0627%u0631+%u 062f%u0627%u062f%u0647) به شکل محسوسی افزایش یابد. بایدتوجه داشت که عملیات ساخت این مقادیر بسیار زمان گیر بوده و نیازمند حافظه زیادی بر روی سروراست.
5- ساخت ( یا خرید ) یک ابزار گزارش گیری (http://nazmaran.com/Content.aspx?ObjectName=DW&name=%u0645%u0631%u0627%u062d%u0644+%u0627%u06cc%u 062c%u0627%u062f+%u0627%u0646%u0628%u0627%u0631+%u 062f%u0627%u062f%u0647) در انبار داده (http://nazmaran.com/Content.aspx?ObjectName=DW&name=%u0645%u0631%u0627%u062d%u0644+%u0627%u06cc%u 062c%u0627%u062f+%u0627%u0646%u0628%u0627%u0631+%u 062f%u0627%u062f%u0647)
پس از انجام مراحل فوق، شـما می توانـید نسبـت به ساخت یا خـرید یـک نرم افزار گزارش گیـری (http://nazmaran.com/Content.aspx?ObjectName=DW&name=%u0645%u0631%u0627%u062d%u0644+%u0627%u06cc%u 062c%u0627%u062f+%u0627%u0646%u0628%u0627%u0631+%u 062f%u0627%u062f%u0647)تصمیم گیری نمایید. به طور معمـول هزینه سـاخت یک نرم افزار گزارش گـیری (http://nazmaran.com/Content.aspx?ObjectName=DW&name=%u0645%u0631%u0627%u062d%u0644+%u0627%u06cc%u 062c%u0627%u062f+%u0627%u0646%u0628%u0627%u0631+%u 062f%u0627%u062f%u0647)، بالاتـر از هزینـه خریـد آن از یک شرکت خارجـی می شود.
ویژگیهای اصلی داده های انبار داده (http://nazmaran.com/Content.aspx?ObjectName=DW&name=%u0645%u0631%u0627%u062d%u0644+%u0627%u06cc%u 062c%u0627%u062f+%u0627%u0646%u0628%u0627%u0631+%u 062f%u0627%u062f%u0647) هادادههای موجود در انبار داده ها (http://nazmaran.com/Content.aspx?ObjectName=anbar%20dade) از سیستمهای عملیاتی متنوع (نظیر سیستمهای پایگاه دادهها (http://nazmaran.com/Content.aspx?ObjectName=DW&name=%u0645%u0631%u0627%u062d%u0644+%u0627%u06cc%u 062c%u0627%u062f+%u0627%u0646%u0628%u0627%u0631+%u 062f%u0627%u062f%u0647)) ومنابع دادهای خارجی (http://nazmaran.com/Content.aspx?ObjectName=DW&name=%u0645%u0631%u0627%u062d%u0644+%u0627%u06cc%u 062c%u0627%u062f+%u0627%u0646%u0628%u0627%u0631+%u 062f%u0627%u062f%u0647) (نظیر پایگاه دادههای آماری (http://nazmaran.com/Content.aspx?ObjectName=DW&name=%u0645%u0631%u0627%u062d%u0644+%u0627%u06cc%u 062c%u0627%u062f+%u0627%u0646%u0628%u0627%u0631+%u 062f%u0627%u062f%u0647) و WWW )یکپارچه میشوند. تفاوتهای ساختاری ومعنایی دادهها (http://nazmaran.com/Content.aspx?ObjectName=DW&name=%u0645%u0631%u0627%u062d%u0644+%u0627%u06cc%u 062c%u0627%u062f+%u0627%u0646%u0628%u0627%u0631+%u 062f%u0627%u062f%u0647) باید پیش از یکپارچه سازی انسجام یابند. برای مثال دادهها باید مطابق با مدل دادهای یکپارچه (http://nazmaran.com/Content.aspx?ObjectName=DW&name=%u0645%u0631%u0627%u062d%u0644+%u0627%u06cc%u 062c%u0627%u062f+%u0627%u0646%u0628%u0627%u0631+%u 062f%u0627%u062f%u0647) "همگن" شوند. بعلاوه، مقادیر دادهای سیستمهای عملیاتی باید پاک شوند تا دادههای صحیحی در انبار داده (http://nazmaran.com/Content.aspx?ObjectName=DW&name=%u0645%u0631%u0627%u062d%u0644+%u0627%u06cc%u 062c%u0627%u062f+%u0627%u0646%u0628%u0627%u0631+%u 062f%u0627%u062f%u0647) ها وارد شوند. نیاز به دادههای تاریخی یکی از موارد مهم درشیوه انبار داده (http://nazmaran.com/Content.aspx?ObjectName=DW&name=%u0645%u0631%u0627%u062d%u0644+%u0627%u06cc%u 062c%u0627%u062f+%u0627%u0646%u0628%u0627%u0631+%u 062f%u0627%u062f%u0647) هاست. دادههای تاریخی برای تحلیل روند کسب وکار (http://nazmaran.com/Content.aspx?ObjectName=DW&name=%u0645%u0631%u0627%u062d%u0644+%u0627%u06cc%u 062c%u0627%u062f+%u0627%u0646%u0628%u0627%u0631+%u 062f%u0627%u062f%u0647)ضروری هستند. البته هزینه نگهداری این گونه داده ها نیز باید مورد توجه قرار گیرد. بعلاوه، داده های انبار داده (http://nazmaran.com/Content.aspx?ObjectName=DW&name=%u0645%u0631%u0627%u062d%u0644+%u0627%u06cc%u 062c%u0627%u062f+%u0627%u0646%u0628%u0627%u0631+%u 062f%u0627%u062f%u0647) ها ثابت هستند، برای مثال دسترسی به DWH از نوع خواندنی است. انجام اصلاحات در این دادهها فقط هنگامی صورت میگیرد که اصلاحات دادههای منبع در انبار انتشار یابند. DWH دادههای دیگری به نام دادههای اشتقاق یافته (derived data) دارد. این داده ها به طور صریح در منابع عملیاتی ذخیره نمیشوند، بلکه در حین بعضی از فرایندها از داده های عملیاتی (http://nazmaran.com/Content.aspx?ObjectName=DW&name=%u0645%u0631%u0627%u062d%u0644+%u0627%u06cc%u 062c%u0627%u062f+%u0627%u0646%u0628%u0627%u0631+%u 062f%u0627%u062f%u0647)، اشتقاق مییابند. برای مثال داده های فروش را میتوان در سطوح مختلف (هفتگی، ماهانه، فصلی) در انبار ذخیره نمود.
Data Warehouseسیستم های انبار داده (http://nazmaran.com/Content.aspx?ObjectName=DW&name=%u0645%u0631%u0627%u062d%u0644+%u0627%u06cc%u 062c%u0627%u062f+%u0627%u0646%u0628%u0627%u0631+%u 062f%u0627%u062f%u0647) ها
سیستم انبار داده (http://nazmaran.com/Content.aspx?ObjectName=DW&name=%u0645%u0631%u0627%u062d%u0644+%u0627%u06cc%u 062c%u0627%u062f+%u0627%u0646%u0628%u0627%u0631+%u 062f%u0627%u062f%u0647) ها (DWS) شامل انبار داده ها و همه مولفه هایی است که برای ساخت، دستیابی و نگهداری DWH به کار میروند. انبار داده (http://nazmaran.com/Content.aspx?ObjectName=DW&name=%u0645%u0631%u0627%u062d%u0644+%u0627%u06cc%u 062c%u0627%u062f+%u0627%u0646%u0628%u0627%u0631+%u 062f%u0627%u062f%u0647) ها بخش مرکزی سیستم انبار داده (http://nazmaran.com/Content.aspx?ObjectName=DW&name=%u0645%u0631%u0627%u062d%u0644+%u0627%u06cc%u 062c%u0627%u062f+%u0627%u0646%u0628%u0627%u0631+%u 062f%u0627%u062f%u0647) ها را تشکیل میدهد. گاهی اوقات انبار داده (http://nazmaran.com/Content.aspx?ObjectName=DW&name=%u0645%u0631%u0627%u062d%u0644+%u0627%u06cc%u 062c%u0627%u062f+%u0627%u0646%u0628%u0627%u0631+%u 062f%u0627%u062f%u0647) ها حجم عظیمی از اطلاعات را در واحدهای منطقی کوچکتر به نام Data Mart نگهداری میکند. مولفه آماده سازی، مسوولیت کسب یا دریافت داده ها را بر عهده دارد. این مولفه شامل همه برنامهها وبرنامههای کاربردی ای است که مسوول استخراج داده ها از منابع عملیاتی هستند. مولفه دستیابی شامل برنامههای کاربردی مختلف (OLAP یا برنامههای کاربردی داده کاوی) است که امکان استفاده از اطلاعات ذخیره شده در انبار داده (http://nazmaran.com/Content.aspx?ObjectName=DW&name=%u0645%u0631%u0627%u062d%u0644+%u0627%u06cc%u 062c%u0627%u062f+%u0627%u0646%u0628%u0627%u0631+%u 062f%u0627%u062f%u0647)ها را فراهم میآورند.
مولفه مدیریت Metadata، وظیفه مدیریت، تعریف و دستیبابی به انواع مختلف Metadata را بر عهده دارد. در اصل ،Metadata "داده هایی درباره دادهها" یا "داده هایی است که مفهوم دادهها (http://nazmaran.com/Content.aspx?ObjectName=DW&name=%u0645%u0631%u0627%u062d%u0644+%u0627%u06cc%u 062c%u0627%u062f+%u0627%u0646%u0628%u0627%u0631+%u 062f%u0627%u062f%u0647) را توصیف میکنند". انواع مختلف Metadata در انبار دادهها (http://nazmaran.com/Content.aspx?ObjectName=DW&name=%u0645%u0631%u0627%u062d%u0644+%u0627%u06cc%u 062c%u0627%u062f+%u0627%u0646%u0628%u0627%u0631+%u 062f%u0627%u062f%u0647) وجود دارند. مثلا اطلاعاتی درباره منابع عملیاتی، ساختار دادههای DWH و کارهایی که در حین ساخت، نگهداری و دستیبابی به DWH انجام میشوند. نیاز به Metadata شناخته شده است. پیاده سازی یک DWS منسجم ،کار پیچیده و دشواری است و شامل دو فاز می باشد. درفاز اول که پیکربندی DWS نام دارد، دیدگاه مفهومی انبار دادهها مطابق با نیازمندیهای کاربر مشخص میشود. سپس منابع دادهای دخیل و روش استخراج و بار گذاری در انبار دادهها (http://nazmaran.com/Content.aspx?ObjectName=DW&name=%u0645%u0631%u0627%u062d%u0644+%u0627%u06cc%u 062c%u0627%u062f+%u0627%u0646%u0628%u0627%u0631+%u 062f%u0627%u062f%u0647) تعیین میگردد. سرانجام، درباره پایگاه داده ها (http://nazmaran.com/Content.aspx?ObjectName=DW&name=%u0645%u0631%u0627%u062d%u0644+%u0627%u06cc%u 062c%u0627%u062f+%u0627%u0646%u0628%u0627%u0631+%u 062f%u0627%u062f%u0647)ی مورد نظر و روشهای دستیبابی دادهها تصمیم گیری خواهد شد. پس از بار گذاری اولیه، در فاز عملیات DWS باید دادههایانبار داده ها (http://nazmaran.com/Content.aspx?ObjectName=DW&name=%u0645%u0631%u0627%u062d%u0644+%u0627%u06cc%u 062c%u0627%u062f+%u0627%u0646%u0628%u0627%u0631+%u 062f%u0627%u062f%u0647) به منظور منظم refresh شوند.
طراحی انبار داده ها (http://nazmaran.com/Content.aspx?ObjectName=DW&name=%u0645%u0631%u0627%u062d%u0644+%u0627%u06cc%u 062c%u0627%u062f+%u0627%u0646%u0628%u0627%u0631+%u 062f%u0627%u062f%u0647)
روشهای طراحی انبار داده ها (http://nazmaran.com/Content.aspx?ObjectName=DW&name=%u0645%u0631%u0627%u062d%u0644+%u0627%u06cc%u 062c%u0627%u062f+%u0627%u0646%u0628%u0627%u0631+%u 062f%u0627%u062f%u0647) امکان پردازش کارآمد query را برروی حجم عظیمی از داده ها فراهم میآورند. نوع ویژهای از الگوی پایگاه داده ها به نام star برای مدل سازی انبار داده ها (http://nazmaran.com/Content.aspx?ObjectName=DW&name=%u0645%u0631%u0627%u062d%u0644+%u0627%u06cc%u 062c%u0627%u062f+%u0627%u0646%u0628%u0627%u0631+%u 062f%u0627%u062f%u0647) ی چند بعدی به کار میرود. در این حالت، پایگاه داده ها از یک جدول مرکزی واقعیت یا fact و جداول چند بعدی تشکیل شده است. جدول واقعیت حاوی tuple هایی است که بیانگر واقعیت های کسب و کار مانند فروش یا عرضه هستند. هر tuple جدول واقعیت به tupleهای جدول چند بعدی اشاره دارد. هرtuple جدول چند بعدی مواردی نظیر محصولات، مشتریان، زمان و فروشنده را نشان میدهد.