PDA

View Full Version : سوال: تشخیص موضوع از متن



abasfar
یک شنبه 08 اسفند 1389, 00:40 صبح
سلام من 100000رکورد متن از نوع text منضورم یک کلمه دو کلمه نیست دارم که میخوام بدونم هر کدام موضوع بحث شون در مورد چی است
مثلا یکی کامپیوتر
2- نجوم
3- ریاضی
و...
حالا باید چیکار کنم
یک الگریتم نمونه مثلا اگر برید به کد گوگلی گوگل فقط سایتهای برنامه نویسی را جستجو میکنه یا بخش پزشکی فقط پزشکی را جستجو میکننه یعنی تشخیص میده این موضو ع مربوط به کدام بخشه

abasfar
یک شنبه 15 اسفند 1389, 16:00 عصر
بابا کسی نیست کمکم کنه خدا خیرتون بده:متعجب::عصبانی++:
یکی از دوستان گفت روش خوشه ای
یکی از دوستان گفت کلمات کلیدی وشما گفتید:کف:

abasfar
یک شنبه 22 اسفند 1389, 15:44 عصر
من ازیکی از استادان پرسیدم گفت روش ژنتیک بهترین است
چون روش بالایی خیلی حافظه وسرعت را میگیره دو عامل به وجود اورنده الگریتم جدید
اما روش ژنتیک کسی هست کمک کنه چه طوری پیاده سازی کنم

aminfarajian
سه شنبه 24 اسفند 1389, 08:46 صبح
با سلام به شما دوست عزیز.
این موضوعی رو که مطرح کردید یکی از موضوعات و شاخه های پردازش متنه که تحت عنوان text classification یا text categorization شناخته میشه. با یک جستجوی ساده در این زمینه میتونید مقالات زیادی رو پیدا کنید که از روشهای مختلف این موضوع رو بررسی کردن و براش راه حل ارائه کردن.
رده بندی یا دسته بندی موضوعی متون رو به ۳ روش نظارت شده، فاقد نظارت و نیمه نظارتی و با استفاده از الگوریتمهای مختلفی میشه پیاده سازی کرد، مثل شبکه عصبی، نزدیکترین همسایه، درختهای تصمیم گیری، الگوریتم بیزین و ...
این هم لینک یه فایل ویدیویی که یکی از اساتید دانشگاه کارنگی ملون در مورد رده بندی اسناد توش صحبت میکنن. فکر میکنم خیلی میتونه کمکتون کنه.
http://videolectures.net/mlas06_cohen_tc/
من پیشنهاد میکنم که یه نگاه به این ویدیو بنداز، یه چندتا مقاله هم بخون (ترجیحا از ۲۰۰۷ به بعد) بعد اگه باز هم سوالی بود بنده در خدمتم.

abasfar
سه شنبه 24 اسفند 1389, 11:28 صبح
سلام
ممنون دوست عزیز لطف کردین حتما اگر مشکل داشتم مزاهمتان میشم ممنونم:قلب: