با سلام و درود خدمت همه دوستان حاضر در فروم برنامه‌نویس.

حدود آذرماه ۱۴۰۰ بود که دوستی به من پیشنهاد یک پروژه برای خواندن پلاک خودرو داد. پروژه برای من بسیار جالب بود و خب طبیعتا شروع به انجامش کردم. در حین انجام این پروژه، یک گلوگاه بزرگ داشتیم. گلوگاه این بود که یک OCR درست و حسابی که اعداد فارسی رو پشتیبانی کنه، موجود نبود. به همین خاطر مجبور به آموزش مدل YOLOv5 به صورت دستی شدم (جزییات این پروژه رو اینجا نوشتم) و خب بعد ار این که این پروژه انجام شد، با خودم گفتم چرا یک OCR فارسی جامع نه؟!
انجام پروژه پلاکخوان دو ماهی طول کشید و همین امر باعث شد که خیلی خسته و به عبارتی Burn out بشم. از طرفی مشغله‌های کاری که پیش آمد هم اجازه کار روی این پروژه نمی‌داد تا همین حدود یک هفته پیش که تصمیم گرفتم هرچه تحقیقات انجام دادم رو به یک پروژه آزاد و متن‌باز تبدیل کنم. نتیجه شد این که چند فاز برای این پروژه تعریف کردم و این فازها از ساده به سخت مرتب شدند.
نخستین فاز، تشخیص عدد فارسی بود. چرا که پیش‌تر روی اون کار شده بود و حالا نوبتی هم که باشه، نوبت اینه که صرفا تایپ‌فیس‌های اعداد فارسی رو گسترش بدیم تا به نتیجه منطقی برسیم. اولین فاز - یعنی تشخیص عدد - به این شکل پیش رفت:
و حالا پروژه در فاز حروف و کلمه خودش قرار داره (در تاریخ ۳۱ خرداد ۱۴۰۱ و ساعت ۸ صبح که این متن نوشته شده، سیستم تشخیص حروف در حال ترین شدنه).

سورس‌کدها اینجا قرار دارند: https://github.com/prp-e/persian_ocr_project
منتظر سوالات، نظرات، پیشنهادات و بازخوردهای شما دوستان عزیزم هستم.