View Full Version : سوال: OCR فارسی
gbg
دوشنبه 24 مرداد 1390, 09:19 صبح
سلام دوستان
کسی سورس یا کامپوننت برای OCR فارسی یا عربی داره؟
یا حتی مقاله به درد بخور که بشه باهاش OCR نوشت ، البته برای حروف چاپی نه دست خط
ممنون
BORHAN TEC
دوشنبه 24 مرداد 1390, 16:23 عصر
من هنوز چنین چیزی ندیده ام. ولی فکر می کنم که قابلیت اضافه شده تحت عنوان Gesture و یا پیاده سازی قابلیتی تا حدودی شبیه به آن بتواند چنین مشکلاتی را حل کند. البته من زیاد روی این موضوع کار نکرده ام و تجربیات زیادی هم برای این کار ندارم ولی شاید مقاله ای تحت عنوان Mouse Gestures که در مجله C++ Builder Developer's Journal وجود دارد بتواند یک جرقه ای را در ذهن شما به وجود آورد.
این مجله را می توانید از این آدرس دانلود کنید:
http://bcbjournal.org/bcbj_vol9_num6.pdf
من فکر می کنم که با خواندن این مقاله و کار کردن بر روی آن بتوانید اشکال مربوط به حروف را تشخیص دهید.
موفق باشید.
یوسف زالی
دوشنبه 24 مرداد 1390, 18:50 عصر
سلام.
برای این کار شما دنبال شبکه های پرسپترون و همینگ باش.
کتاب شبکه های عصبی مصنوعی محمد باقر منهاج می تونه کمکتون کنه.
برای فونتهای استاندارد به خوبی جواب میده.
vcldeveloper
دوشنبه 24 مرداد 1390, 19:05 عصر
من هنوز چنین چیزی ندیده ام. ولی فکر می کنم که قابلیت اضافه شده تحت عنوان Gesture و یا پیاده سازی قابلیتی تا حدودی شبیه به آن بتواند چنین مشکلاتی را حل کند. البته من زیاد روی این موضوع کار نکرده ام و تجربیات زیادی هم برای این کار ندارم ولی شاید مقاله ای تحت عنوان Mouse Gestures که در مجله C++ Builder Developer's Journal وجود دارد بتواند یک جرقه ای را در ذهن شما به وجود آورد.
ربطی به موضوع سوال نداره.
یا حتی مقاله به درد بخور که بشه باهاش OCR نوشت ، البته برای حروف چاپی نه دست خط
باید در تالار الگوریتم ها و هوش مصنوعی سوالتون رو ارسال کنید.
gbg
سه شنبه 25 مرداد 1390, 15:50 عصر
Gesture که چیز دیگه ایه کلا
خب آخه من کامپوننت دلفی و یا نمونه سورس دلفی می خواستم و مقاله در درجه پایین تری قرار داشت اینجا پرسیدم
BORHAN TEC
سه شنبه 25 مرداد 1390, 20:31 عصر
Gesture که چیز دیگه ایه کلا
می دونم. من اصلاً منظورم خود Gesture نیست، بلکه منظورم الگوریتم شناسایی ای است که در Gesture نهفته است. همانطور که می دانید ما توسط این قابلیت می توانیم اشکال از پیش تعریف شده ای را تعریف کنیم و موقعی که مکانیزم Gesture آن شکل های از پیش تعریف شده را تشخیص دهد می تواند کاری را انجام دهد. منظور من همین الگوریتم شناسایی بوده که آن را پیشنهاد دادم. به هر حال حتماً الگوریتم های بهتری هم برای این کار وجود دارد. :متفکر:
gbg
سه شنبه 25 مرداد 1390, 23:43 عصر
خب این الگوریتمش ساده تره ، نقطه شروع حرکت و جهت های حرکت مشخص هستش
مصطفی ساتکی
چهارشنبه 26 مرداد 1390, 08:46 صبح
مثل اینکه هر چقدر جناب کشاورز سعی کردند نتوستن شما رو قانع کنند که در تالار هوش مصنوعی تاپیک ایجاد کنید.
به هر حال همچین کامپوننت رایگانی برای زبان های عربیک وجود نداره و بعضی از کتابخانه های رایگان وجود داره که اگر شما بهشون مسلط باشید می تونید اونو به عربیک هم تبدیل کنید چون ocr های لاتین شامل چندین از اساسی که مهمترین شون feature extract هستش که شما با اونا می تونید این کارو انجام بدید و برای جداسازی کاراکترها هم به صورت فازی عمل می کنند که برای عربیک اون مرحله هم باید تغییراتی درش داده شده و در مرحله پایانی که dictionary می باشد با توجه توالی و رانکینگ حروف در کلمه از hmm استفاده میشه .
نکته پایانی : برای اجرا و تغییر این کتابخانه های به سبک خودتون نیاز به image processing و pattern recognition دارید.
موفق باشید
MohsenB
چهارشنبه 26 مرداد 1390, 09:54 صبح
سلام
این یه پروژه تغریبا کامل DCR هستش . یعنی تشخیص کاراکتر دیجیتال .
شما تو این پروژه میتونید از یه عکس یا نوشته ای که یا موس می نویسید متن استخراج ( Recognise ) کنید .
امکان ویرایش کتابخانه و یا ساخت کتابخانه جدید هم به شما می دهد . که شما می توانید خودتان به برنامه فارسی اضافه کنید .
امیدوارم بدردتون بخوره .
موفق باشید
73932
gbg
چهارشنبه 26 مرداد 1390, 12:28 عصر
مثل اینکه هر چقدر جناب کشاورز سعی کردند نتوستن شما رو قانع کنند که در تالار هوش مصنوعی تاپیک ایجاد کنید.
به هر حال همچین کامپوننت رایگانی برای زبان های عربیک وجود نداره و بعضی از کتابخانه های رایگان وجود داره که اگر شما بهشون مسلط باشید می تونید اونو به عربیک هم تبدیل کنید چون ocr های لاتین شامل چندین از اساسی که مهمترین شون feature extract هستش که شما با اونا می تونید این کارو انجام بدید و برای جداسازی کاراکترها هم به صورت فازی عمل می کنند که برای عربیک اون مرحله هم باید تغییراتی درش داده شده و در مرحله پایانی که dictionary می باشد با توجه توالی و رانکینگ حروف در کلمه از hmm استفاده میشه .
نکته پایانی : برای اجرا و تغییر این کتابخانه های به سبک خودتون نیاز به image processing و pattern recognition دارید.
موفق باشید
اونجا بیشتر بحث MATLAB هست و من هم از MATLAB خوشم نمیاد!
بعدش دنبال مقالات بی سر و ته یا پربار نبودم ، دنبال کاری بودم که جواب داده باشه. البته نه کامل حتی اگه در حد ابتدایی ، یه پایه ای باشه که بشه روش کار کرد
مصطفی ساتکی
چهارشنبه 26 مرداد 1390, 23:04 عصر
اونجا بیشتر بحث MATLAB هست و من هم از MATLAB خوشم نمیادmatlab زبان R&D و شما خوشتون نمياد يه بحث جداست من در انجا نياز ببينم به هر زباني مي تونم قطعه كد بنويسم
بعدش دنبال مقالات بی سر و ته یا پربار نبودمبي سر و ته نيست ممكن شما در اون زمينه اطلاعات نداشته باشيد همچين تصوري كنيد
دنبال کاری بودم که جواب داده باشه. البته نه کامل حتی اگه در حد ابتدایی ، یه پایه ای باشه که بشه روش کار کردوقتي متدي خوب جواب ميده كه OCR هاي بزرگ جهان در اون روش به اجماع رسيده باشند در sample ي كه دوست عزيزمون قرار دارند يكي از ابتدايي ترين روش هاست.
feature extraction در اين sample جز ضعيف ترين موارده يعني فقط به محل قرار گيري پيكسل ها توجه شده كه با كمي نويز و اوجاج يا affine transform ديگه خاصيت خودشو از دست ميده .
انتخاب classifier در حالت ACON و همچنين مشخص نبودن استراتژي train و adaptive نبودن استفاده از classifier ها از جمله اشكالاتشه.
امروزه جهت افزايش ميزان دقت classifier ها انها رو با روش هاي Boosting استفاده مي كند كه خطاي رايج موجود اكثر classifier ها رو ديگه نداره
نكته :در ضمن وقتي ميشه كه اين تاپيك در تالار هوش مصنوعي عنوان بشه به اين خاطر كه تو اين فيلد ملاك مباحث مربوط به image و pattern نه زبان برنامه نويسي به طور مثال همين sample رو كه در بالا قرار دادن با سي و جاوا و پايتون يا هر زبان ديگه هم ميشه پياده سازي كرد كه معمولا اولويت اول در زمينه پياده سازي engine با زبان C++ يا Ansi C
موفق باشيد
دلفــي
یک شنبه 15 مرداد 1402, 14:25 عصر
سلام دوستان
کسی سورس یا کامپوننت برای OCR فارسی یا عربی داره؟
یا حتی مقاله به درد بخور که بشه باهاش OCR نوشت ، البته برای حروف چاپی نه دست خط
ممنون
من قبلا یه پروژه در این خصوص کار کرده بودم ==> https://github.com/alirezapouyafar/PersianOCR
BORHAN TEC
پنج شنبه 20 مهر 1402, 09:23 صبح
سلام،
با این هم میشه چنین کاری انجام داد و برای متون فارسی هم خوب کار میکنه:
https://www.winsoft.sk/ocr.htm
vBulletin® v4.2.5, Copyright ©2000-1404, Jelsoft Enterprises Ltd.