سلاتم. وقت بخیر.
ما در بیگ دیتا یک الگوریتم داریم بنام lsh که تکنیکی برای پسدا کردن چیزهای شبیه بهم می باشد.
حالا ما چطور می تونیم از این الگوریتم برای پیدا کردن افراد مشابه بهره بگیریم، مثلا در شبکه های اجتماعی نظیر واتساپ یا تلگرام؟
سلاتم. وقت بخیر.
ما در بیگ دیتا یک الگوریتم داریم بنام lsh که تکنیکی برای پسدا کردن چیزهای شبیه بهم می باشد.
حالا ما چطور می تونیم از این الگوریتم برای پیدا کردن افراد مشابه بهره بگیریم، مثلا در شبکه های اجتماعی نظیر واتساپ یا تلگرام؟
این الگوریتم شباهت زیادی به تکنیک خوشه بندی یا clustering ،در تکنیک های یادگیری ماشین یا همان Machine Learning داره.در تکنیک کلاسترینگ هدف پیدا کردن عناصری هست که رفتارهای مشابه دارند و به این ترتیب اونها رو در یک کلاستر یا خوشه می گذاره.معروف ترین الگوریتم در این زمینه k-means هست که در زمینه بیگ دیتا چه در hadoop چه در spark زیاد استفاده می شه.