PDA

View Full Version : سوال: تشخیص متون از روی فایل اسکن شده (ocr)



nima20-20
چهارشنبه 01 دی 1395, 23:30 عصر
با سلام خدمت اساتید

من میخام برنامه ای بنویسم که کارت ویزیت رو اسکن کرده و شماره تلفن و مثلا ادرس رو کپی کرده و در یک فایل متنی ذخیره کنم
در واقع میخام ocr فارسی انجام بدم

بیشتر در قسمت فارسی مشکل دارم


آیا کسی راهکاری یا روشی به ذهنش میرسه

لطفا در صورت وجود منبع ذکر نمایید

با تشکر

reza_ali202000
چهارشنبه 01 دی 1395, 23:39 عصر
سلام دوست عزیز
تشخیص متن از روی عکس واقعا کار مشکلی هست مخصوصا فارسی. چرا چون حروف به هم چسبیده هستن و تشخیصشون دیتابیس خیلی بزرگی میخواد. برای اعداد نمونه سورس های زیادی هست ولی برای فارسی خیر.
ساده ترین راه حل اینه که بیاید جاهایی که رنگ زمینه سفید هست رو حذف کنید و بقیه جاها رو بریزید توی یک ارایه و اون آرایه رو با دیتابیسی که موجود دارید مقایسه کنید شبیه ترین عکس به عکس موجود توی دیتابیستون همون حرف متناظری که توی دیتابیس ذخیره کردید بزارید.
البته در حرف کار راحتی ولی موقع عمل پوست ادم کنده میشه.
این کار نیازمند کار گروهی هست و تک نفره واقعا سخته.

nima20-20
جمعه 17 دی 1395, 23:47 عصر
از دوستان کسی راهکاری نداره

خیلی نیازمنده این پروژه هستم

لطفا راهنمایی بفرمایید

در صورت امکان لینک یا سورس هم بدین

c0mmander
شنبه 18 دی 1395, 01:41 صبح
ocr فارسی open source که چیزی نیست اما میتونید از گوگل drive رایگان استفاده کنید.

متاسفانه OCR های فارسی (تا جایی که بنده اطلاع دارم) هنوز به بلوغ کاملی نرسیدن.

من حتی بعضی از نسخه های موجود تحت لایسنس رو هم دیدم فقط متون استاندارد با فونت ها رایج (و نه فونت ها استفاده شده در اکثر کتوب) با دقت بالای 90 درصد برگردان میکردن و موفقیت عمومیشان بالا 81 و یا بعضیا 64 درصد هم میرسید. که نیاز به ویرایش نسبتا زیادی هست.

nima20-20
شنبه 18 دی 1395, 18:35 عصر
با این حساب من چیکار کنم
لطفا راهکاری پیشنهاد بدید
یعنی تا حالا تو ایران کسی تو این زمینه کار نکرده؟

[younes]
شنبه 18 دی 1395, 20:59 عصر
اگر فکر میکنید برنامه نویس هستید ، خب یکی بنویسید!

hi level hdd
یک شنبه 19 دی 1395, 14:52 عصر
با سلام من میتونم فونت های مختلفی رو به او سی آر ها آموزش بدم. در مورت اعداد به نتیجه قابل قبولی رسیدم.
اگر مایل بودید پیغام بگذارید

nima20-20
شنبه 25 دی 1395, 12:38 عصر
جناب hi level hdd (http://barnamenevis.org/member.php?57913-hi-level-hdd) پیام دادم

از دوستان دیگه کسی منبعی برای این کار نمیدونید
واقعا لازم دارم
باا تشکر

nima20-20
سه شنبه 05 بهمن 1395, 18:29 عصر
کسی تو این زمینه کار نکرده

rahmatipoor
چهارشنبه 06 بهمن 1395, 11:59 صبح
دوست عزیز
کسی توی این زمینه کار کرده باشه فکر نمی کنم به همین راحتی بیاد در اختیار من و شما قرار بده

nima20-20
چهارشنبه 06 بهمن 1395, 12:32 عصر
درسته ولی خب میتونن که راهنمایی کن
لااقل یه خطی بدن تا بتونم به دنبالش برم

ممنون

rahmatipoor
چهارشنبه 06 بهمن 1395, 12:58 عصر
شما توی سایتهای انگلیسی سرچ کنی شاید زود تر به نتیجه برسی
در مورد الگوریتمهای OCR

mr.sirwan
چهارشنبه 06 بهمن 1395, 13:24 عصر
دوست عزیز، اینکار پیچیده و طاقت فرسایی هستش که بخواین خودتون، اونم به تنهایی بیاین دوباره چرخ رو اختراع کنین :لبخند: شما میتونین از کتابخونه ها و DLL های نوشته شده توسط شرکت های دیگه استفاده کنین که البته باید بابتش هزینه بدین. برای این منظور یه سرچ با مضمون "ocr فارسی" توی گوگل انجام بدین فک کنم به نتایجی برسین

rahmatipoor
پنج شنبه 07 بهمن 1395, 12:08 عصر
http://farsiocr.ir/

336699
جمعه 08 بهمن 1395, 00:31 صبح
http://farsiocr.ir/

این سایت دموی رایگان برنامه تشخیص پلاک خودرو را برای تست قرار داده و یکسری هم عکس پلاک خودرو گذاشته که برنامه پلاک ها را می خواند.

به یکی از اون پلاکها مقداری نویز اضافه کردم ، ولی برنامه موفق به خواندن پلاک نشد.

روی همون پلاک چند خط افقی اضافه کردم ، بازهم برنامه موفق به خواندن پلاک نشد

( بعضی ها یه طلق هایی روی پلاک نصب میکنن که یکسری خطوط افقی مشکی داره :لبخند:)

144314

144315

rahmatipoor
شنبه 09 بهمن 1395, 12:36 عصر
من به عنوان نمونه این سایت رو مثال زدم