PDA

View Full Version : مساله افراد مشابه در بیگ دیتا



forogh68
سه شنبه 15 دی 1394, 20:55 عصر
سلاتم. وقت بخیر.
ما در بیگ دیتا یک الگوریتم داریم بنام lsh که تکنیکی برای پسدا کردن چیزهای شبیه بهم می باشد.
حالا ما چطور می تونیم از این الگوریتم برای پیدا کردن افراد مشابه بهره بگیریم، مثلا در شبکه های اجتماعی نظیر واتساپ یا تلگرام؟

phoenix87
پنج شنبه 08 بهمن 1394, 14:31 عصر
این الگوریتم شباهت زیادی به تکنیک خوشه بندی یا clustering ،در تکنیک های یادگیری ماشین یا همان Machine Learning داره.در تکنیک کلاسترینگ هدف پیدا کردن عناصری هست که رفتارهای مشابه دارند و به این ترتیب اونها رو در یک کلاستر یا خوشه می گذاره.معروف ترین الگوریتم در این زمینه k-means هست که در زمینه بیگ دیتا چه در hadoop چه در spark زیاد استفاده می شه.