پردازش متن فارسی در پایتون
با سلام دوستان
من یک پروژه دارم که پردازش متن برای زبان فارسی است
حالا یک سوال دارم
اینکه آیا کسی میدونه چطور میشه نوشت که " وقتی یک متن فارسی بهش میدیم، کلمه ها رو که جدا کرد ، از کلمه ی اول شروع کنه ، حرف اول کلمه رو بخونه اگه مثلا ب بود، بره توی فایل تکست به نام b و بگرده اون کلمه توش هست یا نه "
من الان اون قسمتش رو میخوام که "حرف اول کلمه رو بخونه اگه مثلا ب بود، بره توی فایل تکست به نام b و بگرده اون کلمه توش هست یا نه "
نمیدونم برای زبان فارسی چطور امکان پذیرهاین کدی که من میزنم و هیچ اروری نمیده و ران میشه ، ولی هیچ اتفاقی نمیفته :
for word in wordlist :
if word[0] == ['ب'] :
if word in b :
print word
نقل قول: پردازش متن فارسی در پایتون
برای پردازش متن حتما از کتابخونه regular experesion یا همون re استفاده کنید.
نقل قول: پردازش متن فارسی در پایتون
با سلاماولین مساله ای که توی هر زبان برنامه نویسی برای کار با زبانهای غیر از انگلیسی مطرحه، بحث encoding هستش (utf-8 برای فارسی)پیشنهاد میکنم در وحله اول این چالش رو حل کنید.بحث بدی اینکه ممکنه فایل تکستتون توی اون مسیری نباشه که باید!!یه شرط برای فایلتون بگذارید که مشخص بشه توی اوم مسیر هست یا نهو در آخر اینکه شما از متد string.starts_with میتونید براحتی استفاده کنید یا حتی("string.find("my_wordموفق باشید