با سلام
دوستان آیا راهی هست که بشه زبان یک نوشته رو با کد نویسی تشخیص داد؟
منظورم اینه که بفهمیم این نوشته فارسیه ، انگلیسیه یا روسیه؟
خیلی نیاز دارم ممنون می شم راهنمایییم کنید
با سلام
دوستان آیا راهی هست که بشه زبان یک نوشته رو با کد نویسی تشخیص داد؟
منظورم اینه که بفهمیم این نوشته فارسیه ، انگلیسیه یا روسیه؟
خیلی نیاز دارم ممنون می شم راهنمایییم کنید
سلام
باید یک دیکشنری از هر زبانی داشته باشید و بعد کلمه به کلمه رو در دیکشنری ها جستجو کنید تا به اطمینان برسید که مربوط به کدوم زبانه
پس یک دیتابیس با چند جدول برای هر زبان مورد نیازه.
سلام منظورتون دست خط هست یا تایپی هست؟
دوستان جریان اینه که می خوام توی یه فولدر سرچ کنم و فایل ها رو بر اساس نامشون دسته بندی کنم
مثلا اگه از حروف روسی استفاده شده به یک فولدر به نام روسی منتقل کنم اگه فارسی باشه به پوشه ی فارسی و...
دوستان با کد اسکی نمی شه نوع حرف رو تشخیص داد؟
میتونید با داشتن حروف هر زبان این کا رو بکنید ، به عنوان مثال حرف اول اسم فولدر را بگیری و با 32 حرف فارسی مقایسه کنی اگه مقایسه true شد فایل را به فولدر فارسی ببری وگرنه به با یک زبان مورد نظر دیگه مقایسه کنی و الی آخر...(البته حروف فارسی با در نظر گرفتن آ با کلاه و بی کلاه و با همزء و ... بیشتر از 32 تا میباشد )
آیا راه حل بهتری هست؟
آخه اگه بخوام همچین کاری کنم برنامه خیلی سنگین می شه؟
من حروف روسی رو از کجا پیدا کنم؟
در سایت http://langid.net این برادر یه همچین چیز نوشته است . که در راه خدا و به صورت صلواتی API اش را می تونه یه جوری به شما بدهد .
برای این منظور به این صفحه http://langid.net/identify-language-from-api.html بروید و فرم را پر نمایید .
موفق باشید
البته راه حل پیمان جون نمیتونه مثلا یک نوشته روسی یا آلمانی یا هر چیزی رو تشخیص بده چون اونها هم حروف مشترک دارن.
باید بیاین برای هر فایل و فولدری که در دستور حلقه تون بدست میاد بر اساس نام اون یک سری پردازش انجام بدید و یک کلمه ازش استخراج کنید(شاید یک فایل شامل حروف انگلیسی و فارسی باشه). بعد از استخراج کلمه باید زبانش رو با یک دیکشنری تشخیص بدید و...
این ساده ترین کاره.
کاری که الآن باید انجام بدید تهیه دیکشنریه.تحقیق کنید ببینید میشه از spell Checker ورد استفاده کرد. اگه نه باید یک دیتابیس خودتون پیدا کنید
الان که چک کردم مثل اینکه این API اینترنتی هستش و فقط برای استفاده در سایت ها طراحی شده
راه حل ساده ای نیست
سلام دوست عزيز
نميدونم درسته يا نه اما فكر نكنم نيازي به ديكشنري يا چيزه ديگه باشه شما يكسري فايل داري كه نامشون فارسيه يا انگليسي يا روسي درسته ؟
اگه سوالت و درست فهميده باشم براي اينكا حرف اول نام فولدرو بخون خوب كد اسكيشو چك كن مثلا حروف بزرگ و كوچيك در انگليسي مثلا 65 a هست بزرگش يادم نيست و قطعا حرف اول فولدر يا فايلي كه اسمش روسي يا ايراني با اين كد شروع نشده پس مشخص ميشه چيه و به چه زبانيه اما اگه ميخواي تو متن بگردي همون كه اساتيد گفتند بايد ديكشنري و بقيه مسائل
موفق باشيد
حالا اگه از کد اسکی استفاده کنم باید الفبای همه ی زبونا رو داشته باشم درسته؟
کسی از دوستان نمی دونه از کجا می تونم این الفبا رو بدست بیارم؟
روسی و هندی برام خیلی مهم تر از همه شونه
دوست عزيز يه جستجو كني در وب كد هاي اسكي همه زبونارو به دست مياري يه كاريم ميتوني انجام بدي يه آرايه از حروف هرزبان درست كني بعد ايندكس بندي كني و نام فايل و بخوني و اگه تو آرايه مورد نظر پيدا كردي خوب زبان هم مشخص ميشه روش زياده بايد امتحان كني بهترين و انتخاب كني
موفق باشي