نمایش نتایج 1 تا 4 از 4

نام تاپیک: پشتیبانی فارسی در SCIKIT LEARN جهت استفاده از ماشین لرنینگ برای دسته بندی متون فارسی

  1. #1
    کاربر دائمی آواتار n.nowroozi
    تاریخ عضویت
    مرداد 1392
    محل زندگی
    تهران
    پست
    480

    پشتیبانی فارسی در SCIKIT LEARN جهت استفاده از ماشین لرنینگ برای دسته بندی متون فارسی

    سلام

    یه دستی توی کد scikit learn بردم که بشه متن فارسی رو هم با دقت بیشتری دسته بندی کرد اگه کسی خواست میتونی اینجا ببینه.

  2. #2
    کاربر دائمی آواتار n.nowroozi
    تاریخ عضویت
    مرداد 1392
    محل زندگی
    تهران
    پست
    480

    نقل قول: پشتیبانی فارسی در SCIKIT LEARN جهت استفاده از ماشین لرنینگ برای دسته بندی متون فارسی

    در ادامه پست قبل یه مطلب هم نوشتم واسه آموزش machine learning که میتونید اینجا ببینید.

  3. #3

    نقل قول: پشتیبانی فارسی در SCIKIT LEARN جهت استفاده از ماشین لرنینگ برای دسته بندی متون فارسی

    سلام آقا نیما


    نیازی به این کار نبود، پارامتر stop_words میتونه یک لیستی از کلمات رو هم دریافت کنه و اونها رو به عنوان ایست واژه درنظر بگیره.
    درضمن ترجمه ایست واژه های انگلیسی و قرار دادن آن به عنوان ایست واژه های فارسی خیلی کار درستی نیست چون کاربردشون فرق میکنه. ایست واژه ها کلمات متدوال هر زبانی هستند که خیلی به بار معنایی سند مورد نظر کمکی نمی کنند مثل حروف ربط و معمولا حذف آنها در اکثر مسائل باعث افزایش دقت مدل و کاهش فضای ذخیره سازی و بار محساباتی می شود اما همیشه هم حذف این ها باعث افزایش دقت مدل نمیشه و در بعضی مسئله ها مثل عقیده کاوی، نباید حذف بشوند.

  4. #4
    کاربر دائمی آواتار n.nowroozi
    تاریخ عضویت
    مرداد 1392
    محل زندگی
    تهران
    پست
    480

    نقل قول: پشتیبانی فارسی در SCIKIT LEARN جهت استفاده از ماشین لرنینگ برای دسته بندی متون فارسی

    نقل قول نوشته شده توسط amsjavan مشاهده تاپیک
    سلام آقا نیما


    نیازی به این کار نبود، پارامتر stop_words میتونه یک لیستی از کلمات رو هم دریافت کنه و اونها رو به عنوان ایست واژه درنظر بگیره.
    درضمن ترجمه ایست واژه های انگلیسی و قرار دادن آن به عنوان ایست واژه های فارسی خیلی کار درستی نیست چون کاربردشون فرق میکنه. ایست واژه ها کلمات متدوال هر زبانی هستند که خیلی به بار معنایی سند مورد نظر کمکی نمی کنند مثل حروف ربط و معمولا حذف آنها در اکثر مسائل باعث افزایش دقت مدل و کاهش فضای ذخیره سازی و بار محساباتی می شود اما همیشه هم حذف این ها باعث افزایش دقت مدل نمیشه و در بعضی مسئله ها مثل عقیده کاوی، نباید حذف بشوند.
    سلام
    اره میتونی ولی توی کد به نظر من قشنگ نیست که قرار بگیره، حالا نظر شخصیمه شما میتونی قرار بدی.
    برای حذف حروف اضافه هم توی پروژه من نیاز بود قطعا توی پروژه ای که نیاز به انجامش نباشه مثل موردی که ذکر کردید این گزینه غیر فعال میشه .

تاپیک های مشابه

  1. دسته بندی متون با استفاده از الگوریتم knn
    نوشته شده توسط nabavi1387 در بخش PHP
    پاسخ: 1
    آخرین پست: شنبه 30 فروردین 1393, 00:32 صبح
  2. آموزش: استفاده از کنترل webbrowser برای نمایش متن های فارسی
    نوشته شده توسط فاطی.جدا در بخش VB.NET
    پاسخ: 0
    آخرین پست: سه شنبه 07 خرداد 1392, 18:42 عصر
  3. بهترین راه برای Justify کردن متون فارسی چیست؟
    نوشته شده توسط meh_ham در بخش Android Studio
    پاسخ: 0
    آخرین پست: چهارشنبه 02 اسفند 1391, 18:50 عصر
  4. سوال: طریقه استفاده از یک کامپیوننت برای صفحه بندی GridView
    نوشته شده توسط IranVisual در بخش ASP.NET Web Forms
    پاسخ: 1
    آخرین پست: سه شنبه 07 خرداد 1387, 08:24 صبح

قوانین ایجاد تاپیک در تالار

  • شما نمی توانید تاپیک جدید ایجاد کنید
  • شما نمی توانید به تاپیک ها پاسخ دهید
  • شما نمی توانید ضمیمه ارسال کنید
  • شما نمی توانید پاسخ هایتان را ویرایش کنید
  •