PDA

View Full Version : Data Mning



kazem_khodaei
پنج شنبه 04 شهریور 1389, 19:14 عصر
سلام
در این قسمت قصد دارم در خصوص دیتا ماینینگ یا داده کاوی صحبت کنم
بیشتر منابع استفاده شده من از MSDN و کتاب Wiley Publishing - Data Mining with SQL Server 2005 هستش. همچنین از بعضی مسائل تئوری از کتاب داده کاوی آقای شهرابی استفاده میکنم.


تعریف داده کاوی:

در طول دهه گذشته حجم زیادی از داده ها در پایگاه داده ها انباشته و ذخیره شده اند و نتیجه این انباشتگی این است که سازمان ها در داده غنی ولی در کسب دانش بسیار ضعیف می باشند.

با پیشرفت روز افزون کاربرد پایگاه داده ها، حجم داده های ثبت شده به طور متوسط هر 5 سال 2 برابر می شود. در این میان سازمان­هایی موفق هستند که بتوانند حداقل 7% داده هایشان را مدیریت نمایند. تحقیقات انجام یافته نشان از آن دارد که سازمان ها امروزه کمتر از یک درصد از داده هایشان را برای تحلیل استفاده می نمایند. به عبارت دیگر امروزه سازمان ها در اطلاعات غرق شده اند در حالیکه گرسنه دانش هستند چرا که سازمان ها داده های زیادی را در تصرف خود دارند درحالیکه هنوز با فقدان دانش پنهان درون داده ها مواجه هستند.

امروزه با توجه به تنوع زیاد مخاطبین، مشتریان، بازارها، تنوع و پیچیدگی خدمات و محیطهای کسب و کار، دسترسی به اطلاعات مناسب برای تصمیم گیری صحیح ضروری می باشد. از این‌رو استفاده از راهکار های مناسب برای طبقه بندی و تولید اطلاعات از میان انبوهی از داده ها برای سازمان ها امری ضروری و حیاتی است. علم داده کاوی پاسخی به این نیاز به منظور کشف دانش پنهان داده‌ها و تامین اطلاعات مورد نیاز مدیران می‌باشد. دانش داده کاوی ابزاری است که مدیران را قادر می سازد تا سریع تر نسبت به آینده عمل نمایند، فعال باشند بجای آنکه واکنش پذیر باشند و بدانند و مطمئن باشند بجای آنکه حدس بزنند . واضح است که با داشتن این قابلیت، سازمان ها قادر می باشند دانش ارزشمندی را از داده هایشان بدست آورند.

داده کاوی پل ارتباطی میان علم آمار ، علم کامپیوتر ، هوش مصنوعی ، الگوشناسی ، فراگیری ماشین و بازنمایی بصری داده می باشد. داده کاوی فرآیندی پیچیده جهت شناسایی الگوها و مدل های صحیح، جدید و به صورت بالقوه مفید، در حجم وسیعی از داده می باشد، به طریقی که این الگوها و مدلها برای انسانها قابل درک باشند. داده کاوی به صورت یک محصول قابل خریداری نمی باشد، بلکه یک رشته علمی و فرآیندی است که بایستی به صورت یک پروژه پیاده سازی شود.
کاوش داد ه ها به معني کنکاش داده هاي موجود در پايگاه داده و انجام تحليل هاي مختلف بر روي آن به منظور استخراج اطلاعات مي باشد.

در اینجا برای درک بهتر داده کاوی به شرح یک مثال میپردازیم.

فروشگاهی را در نظر بگیرید که اطلاعات مشتریان خود را دارد ولی استفاده خاصی از این اطلاعات نمی کند در صورتی که می تواند با مقایسه این اطلاعات به نتیجه خاصی برسید به طور مثال زمانی که در 80 در صد مواقع مشتریان شیر را با کره میخرند پس می توان گفت که مشتریانی که شیر میخرند به کره هم نیاز دارند.فروشنده میتواند به مشتریان خود که شیر میخرند پیشنهاد خریدن کره هم بدهد چرا که شاید مشتری خریدن کره را فراموش کرده باشد. و در نهایت فروشنده در می یابد ، زمانی که شیر برای فروش دارد ،می تواند مقدار زیادی هم کره بفروشد. امروزه از این مثال در سبد خرید کالای آمریکا استفاده می شود