PDA

View Full Version : پردازش متن فارسی در پایتون



hedieh_h
یک شنبه 05 بهمن 1393, 15:36 عصر
با سلام دوستان

من یک پروژه دارم که پردازش متن برای زبان فارسی است
حالا یک سوال دارم
اینکه آیا کسی میدونه چطور میشه نوشت که " وقتی یک متن فارسی بهش میدیم، کلمه ها رو که جدا کرد ، از کلمه ی اول شروع کنه ، حرف اول کلمه رو بخونه اگه مثلا ب بود، بره توی فایل تکست به نام b و بگرده اون کلمه توش هست یا نه "

من الان اون قسمتش رو میخوام که "حرف اول کلمه رو بخونه اگه مثلا ب بود، بره توی فایل تکست به نام b و بگرده اون کلمه توش هست یا نه "
نمیدونم برای زبان فارسی چطور امکان پذیره
این کدی که من میزنم و هیچ اروری نمیده و ران میشه ، ولی هیچ اتفاقی نمیفته :





for word in wordlist :


if word[0] == ['ب'] :
if word in b :
print word

n.nowroozi
یک شنبه 05 بهمن 1393, 18:15 عصر
برای پردازش متن حتما از کتابخونه regular experesion یا همون re (https://docs.python.org/2/library/re.html) استفاده کنید.

modjtaba.yousefi
یک شنبه 12 بهمن 1393, 14:03 عصر
با سلاماولین مساله ای که توی هر زبان برنامه نویسی برای کار با زبانهای غیر از انگلیسی مطرحه، بحث encoding هستش (utf-8 برای فارسی)پیشنهاد میکنم در وحله اول این چالش رو حل کنید.بحث بدی اینکه ممکنه فایل تکستتون توی اون مسیری نباشه که باید!!یه شرط برای فایلتون بگذارید که مشخص بشه توی اوم مسیر هست یا نهو در آخر اینکه شما از متد string.starts_with‌ میتونید براحتی استفاده کنید یا حتی("string.find("my_wordموفق باشید