PDA

View Full Version : انتخاب الگوریتم مناسب برای خوشه بندی داده ها



fa_te64
سه شنبه 30 اردیبهشت 1393, 16:43 عصر
سلام
در رابطه با خوشه بندی داده ها به دنبال الگوریتم مناسبی هستم. الگوریتم انتخابی برای خوشه بندی باید سرعت مناسب داشته باشد و دقت بالایی داشته باشد. در درجه اول دقت دسته بندی داده ها ملاک است. تعداد ویژگی های داده های ورودی نیز 4 ویژگی است و تعداد دسته ها نامشخص است.
برای این کار خوشه بندی را با الگوریتم EM انجام دادم. همچنین خوشه بندی را با Kmeans نیز تکرار کردم و برای تعیین تعداد دسته ها تعداد مختلف کلاستر را انتخاب کردم و برای تعیین تعداد مناسب کلاستر برای تعداد کلاسترهای مختلف میانگین واریانس داخلی هر کلاستر را محاسبه کردم و میزان ماکزیمم jump در دو حالت متوالی را به عنوان معیار برای انتخاب تعداد مناسب کلاستر در الگوریتم Kmeans استفاده کردم. نتایج الگوریتم EM در مقایسه با Kmeans برای یکی از محیط های آزمایشی بهتر بود و برای محیط آزمایشی دیگر الگوریتم kmeans نتایج بهتری داشت (دقت بالاتر). در زمینه نتایج بدست آمده و نحوه انتخاب تعداد مناسب کلاسترها لطفا دیدگاه خودتان را بیان کنید.