PDA

View Full Version : سوال: تشخیص زبان یک نوشته با کد نویسی



mohsen-unique
یک شنبه 16 اسفند 1388, 11:46 صبح
با سلام
دوستان آیا راهی هست که بشه زبان یک نوشته رو با کد نویسی تشخیص داد؟:عصبانی++:
منظورم اینه که بفهمیم این نوشته فارسیه ، انگلیسیه یا روسیه؟:گیج:
خیلی نیاز دارم ممنون می شم راهنمایییم کنید:لبخندساده:

Rejnev
یک شنبه 16 اسفند 1388, 11:56 صبح
سلام
باید یک دیکشنری از هر زبانی داشته باشید و بعد کلمه به کلمه رو در دیکشنری ها جستجو کنید تا به اطمینان برسید که مربوط به کدوم زبانه
پس یک دیتابیس با چند جدول برای هر زبان مورد نیازه.

asefy2008
یک شنبه 16 اسفند 1388, 15:28 عصر
سلام منظورتون دست خط هست یا تایپی هست؟

FastCode
یک شنبه 16 اسفند 1388, 18:26 عصر
سلام منظورتون دست خط هست یا تایپی هست؟

فکر نمیکنم که کسی که می خواد OCR بنویسه چنین سوالی بپرسه.

Rejnev
یک شنبه 16 اسفند 1388, 23:28 عصر
با سلام
دوستان آیا راهی هست که بشه زبان یک نوشته رو با کد نویسی تشخیص داد؟:عصبانی++:
منظورم اینه که بفهمیم این نوشته فارسیه ، انگلیسیه یا روسیه؟:گیج:
خیلی نیاز دارم ممنون می شم راهنمایییم کنید:لبخندساده:


سلام منظورتون دست خط هست یا تایپی هست؟
من فکر کردم یک متن تایپ شده منظور شماست.

فکر نمیکنم که کسی که می خواد OCR بنویسه چنین سوالی بپرسه.

mohsen-unique
دوشنبه 17 اسفند 1388, 17:11 عصر
دوستان جریان اینه که می خوام توی یه فولدر سرچ کنم و فایل ها رو بر اساس نامشون دسته بندی کنم
مثلا اگه از حروف روسی استفاده شده به یک فولدر به نام روسی منتقل کنم اگه فارسی باشه به پوشه ی فارسی و...
دوستان با کد اسکی نمی شه نوع حرف رو تشخیص داد؟

peymanjon
دوشنبه 17 اسفند 1388, 17:47 عصر
میتونید با داشتن حروف هر زبان این کا رو بکنید ، به عنوان مثال حرف اول اسم فولدر را بگیری و با 32 حرف فارسی مقایسه کنی اگه مقایسه true شد فایل را به فولدر فارسی ببری وگرنه به با یک زبان مورد نظر دیگه مقایسه کنی و الی آخر...(البته حروف فارسی با در نظر گرفتن آ با کلاه و بی کلاه و با همزء و ... بیشتر از 32 تا میباشد )

mohsen-unique
سه شنبه 18 اسفند 1388, 12:05 عصر
آیا راه حل بهتری هست؟ :عصبانی++:
آخه اگه بخوام همچین کاری کنم برنامه خیلی سنگین می شه؟:افسرده:
من حروف روسی رو از کجا پیدا کنم؟:گریه:

Asad.Safari
سه شنبه 18 اسفند 1388, 12:21 عصر
میتونید با داشتن حروف هر زبان این کا رو بکنید

در سایت http://langid.net این برادر یه همچین چیز نوشته است . که در راه خدا و به صورت صلواتی API اش را می تونه یه جوری به شما بدهد .

برای این منظور به این صفحه http://langid.net/identify-language-from-api.html بروید و فرم را پر نمایید .

موفق باشید

Rejnev
سه شنبه 18 اسفند 1388, 12:24 عصر
میتونید با داشتن حروف هر زبان این کا رو بکنید ، به عنوان مثال حرف اول اسم فولدر را بگیری و با 32 حرف فارسی مقایسه کنی اگه مقایسه true شد فایل را به فولدر فارسی ببری وگرنه به با یک زبان مورد نظر دیگه مقایسه کنی و الی آخر...(البته حروف فارسی با در نظر گرفتن آ با کلاه و بی کلاه و با همزء و ... بیشتر از 32 تا میباشد )


آیا راه حل بهتری هست؟ :عصبانی++:
آخه اگه بخوام همچین کاری کنم برنامه خیلی سنگین می شه؟:افسرده:
من حروف روسی رو از کجا پیدا کنم؟:گریه:
البته راه حل پیمان جون نمیتونه مثلا یک نوشته روسی یا آلمانی یا هر چیزی رو تشخیص بده چون اونها هم حروف مشترک دارن.
باید بیاین برای هر فایل و فولدری که در دستور حلقه تون بدست میاد بر اساس نام اون یک سری پردازش انجام بدید و یک کلمه ازش استخراج کنید(شاید یک فایل شامل حروف انگلیسی و فارسی باشه). بعد از استخراج کلمه باید زبانش رو با یک دیکشنری تشخیص بدید و...
این ساده ترین کاره.
کاری که الآن باید انجام بدید تهیه دیکشنریه.تحقیق کنید ببینید میشه از spell Checker ورد استفاده کرد. اگه نه باید یک دیتابیس خودتون پیدا کنید

mohsen-unique
سه شنبه 18 اسفند 1388, 12:41 عصر
در سایت http://langid.net این برادر یه همچین چیز نوشته است . که در راه خدا و به صورت صلواتی API اش را می تونه یه جوری به شما بدهد .

برای این منظور به این صفحه http://langid.net/identify-language-from-api.html بروید و فرم را پر نمایید .

موفق باشید

مرسی
ولی یه سوال ثبت نام که کردم فقط بم یه کدفعال سازی داد خود API رو کجا گذاشته:گیج:

mohsen-unique
سه شنبه 18 اسفند 1388, 12:46 عصر
الان که چک کردم مثل اینکه این API اینترنتی هستش و فقط برای استفاده در سایت ها طراحی شده
راه حل ساده ای نیست:گریه:

sky_in_iran
سه شنبه 18 اسفند 1388, 18:19 عصر
سلام دوست عزيز
نميدونم درسته يا نه اما فكر نكنم نيازي به ديكشنري يا چيزه ديگه باشه شما يكسري فايل داري كه نامشون فارسيه يا انگليسي يا روسي درسته ؟
اگه سوالت و درست فهميده باشم براي اينكا حرف اول نام فولدرو بخون خوب كد اسكيشو چك كن مثلا حروف بزرگ و كوچيك در انگليسي مثلا 65 a هست بزرگش يادم نيست و قطعا حرف اول فولدر يا فايلي كه اسمش روسي يا ايراني با اين كد شروع نشده پس مشخص ميشه چيه و به چه زبانيه اما اگه ميخواي تو متن بگردي همون كه اساتيد گفتند بايد ديكشنري و بقيه مسائل
موفق باشيد

mohsen-unique
شنبه 22 اسفند 1388, 10:39 صبح
حالا اگه از کد اسکی استفاده کنم باید الفبای همه ی زبونا رو داشته باشم درسته؟
کسی از دوستان نمی دونه از کجا می تونم این الفبا رو بدست بیارم؟
روسی و هندی برام خیلی مهم تر از همه شونه

sky_in_iran
شنبه 22 اسفند 1388, 11:39 صبح
دوست عزيز يه جستجو كني در وب كد هاي اسكي همه زبونارو به دست مياري يه كاريم ميتوني انجام بدي يه آرايه از حروف هرزبان درست كني بعد ايندكس بندي كني و نام فايل و بخوني و اگه تو آرايه مورد نظر پيدا كردي خوب زبان هم مشخص ميشه روش زياده بايد امتحان كني بهترين و انتخاب كني
موفق باشي