PDA

View Full Version : کمک برای word clustering



mehrab1387
سه شنبه 06 دی 1390, 19:36 عصر
سلام دوستان
موضوع پروژه کارشناسی من word clustering است.من برای اینکار یک مجموعه اطلاعات دارم که باید روی انها کار کنم.من 9دسته موضوع مثل اجتماعی ،ورزشی و... دارم که هر کدام از دسته ها دارای 1000 سند متنی txt می باشد.یعنی مجموعا با 9000 فایل متنی رو به رو هستم که باید برای کلمات مشخصی که باید کلاستر شوند ،روی این سندها جستجو انجام بدم.
مثلا کلمه فوتبال :باید ببینم که در این مجموعه سند چندتای آن شامل کلمه فوتبال است.
البته باید جستجوهای 2 تایی نیز داشته باشم،مثلا فوتبال and توپ و...
می خواهم بدانم به نظرشما،همین طور روی فایل ها سرچ کنم بهتر است یا اینکه به SQL منتقل کنم؟
اگر بخواهم به SQLمنتقل کنم چطور باید انجام بدهم؟
چه کار هایی انجام دهم تا سرعت این برنامه زیاد تر بشه؟