PDA

View Full Version : حرفه ای: حروف دستنویس گسسته فارسی



Reyhane7
شنبه 29 خرداد 1389, 09:01 صبح
اين اطلاعات براي افرادي که در زمينه ocr و تشخيص دست خط کار ميکنند مفيد است::چشمک:

پایگاه داده آموزشی
پایگاه داده آموزشی این مسابقه بخشی از بانک اطلاعاتی تربیت و آزمون "حدف ۸۴" میباشد که به سفارش دبیرخانه شورای عالی اطلاع رسانی – کار گروه خط و زبان فارسی و توسط "شرکت اندیشه نرم افزار پایا" تهیه شده است.:بامزه:

حجم:
در بانک اطلاعاتی حدف ۸۴ ، بیش از ده میلیون نمونه تصویر از حروف دستنویس گسسته ی فارسی وجود دارد. کل بانک به ۵۱ مجموعه تفکیک شده است که تعداد نمونه های هر مجموعه تقریبا ۲۰۰۰۰۰ میباشد. حجم هر مجموعه بالغ بر ۲/۴ GB است که با استفاده از فشرده سازی حجم آن تا ظرفیت یک CD کاهش یافته است.
این بانک اطلاعاتی به صورت فشرده و در قالب ۸ عدد DVD قابل عرضه میباشد.

نوع:
حروف دستنویس گسسته فارسی.
(منظور از حروف گسسته ، حروف تنها ، شکل آخر سایر حروف و ارقام فارسی میباشد.)

اطلاعات کلی مربوط به داده ها:
نوع فایل تصاویر: BMP
ابعاد: ۸/۰۴*۶/۵۲ میلیمتر (۹۵*۷۷ پیکسل)
وضوح: ۳۰۰ dpi

شیوه ذخیره سازی:
نمونه ها در پرونده هایی با نامهای ۱ تا ۳۵ برای حروف الفبا (۳۲ حروف الفبا به ترتیب , آ با کد ۳۳ ، ء با کد ۳۴ ، ﻫ و ﻪ با کد ۳۵) و ۸۵ تا ۹۶ برای اعداد (۸۵ تا ۹۴ برای اعداد ۰ تا ۹ فارسی و ۹۵ و ۹۶ برای ٤ و ٦ که اعداد عربی هستند.) قرار داده شده اند. نمونه جدول تناظر شماره با حروف (جدول ۱) در ادامه آورده شده است.
جدول ۱ – شماره حروف در بانک اطلاعاتی حدف (http://majlesi.info/ocr/database/table1.jpg)
جدول ۲ – آمارگان حروف در بانک اطلاعاتی حدف (http://majlesi.info/ocr/database/table2.jpg)

دانلود بانکهای اطلاعاتی:
بانکهای اطلاعاتی این مسابقه به سه قسمت مجزای زیر تقسیم بندی شده اند. لازم به ذکر است که فایلها توسط برنامه WinRAR فشرده سازی شده اند.

دریافت بانک اطلاعاتی اول با حجم ۳۶/۱ مگابایت (http://majlesi.info/ocr/database/OCR_Competition_DB1.rar)
دریافت بانک اطلاعاتی دوم با حجم ۶۱/۹ مگابایت (http://majlesi.info/ocr/database/OCR_Competition_DB2.rar)
دریافت بانک اطلاعاتی سوم با حجم ۷۲/۵ مگابایت (http://majlesi.info/ocr/database/OCR_Competition_DB3.rar)
----------------------------------------------------
دریافت هر سه قسمت بانکهای اطلاعاتی در یک فایل فشرده شده با حجم ۱۵۳ مگابایت (http://majlesi.info/ocr/database/OCR_Competition_DB123.zip)


.......
منبع: ششمین کنفرانس ماشین بینایی و پردازش تصویر ایران (http://mvip2010.ui.ac.ir/) (قسمت مسابقات جانبي):قلب:

mohammaduu
جمعه 28 تیر 1392, 20:19 عصر
با سلام و خسته نباشید
بنده به پایگاه داده حروف و کلمات دست نویس گسسته فارسیبرای ارزیابی روش هایی که برای استخراج ویژگی کاراکترها پیاده سازی کرده ام، نیاز دارم
این پایگاه داده را نتوانستم دانلود کنم، اگر برایتان امکان پذیر بود آن را برای من بفرستید
salahshoor.mohammad@ymail.com
با تشکر

navidimani
جمعه 22 آذر 1392, 16:47 عصر
:اشتباه::اشتباه::اشتباه::اشت اه::اشتباه::اشتباه::اشتباه:: شتباه::اشتباه::اشتباه::اشتب ه::اشتباه:

لینک‌ها قابل استفاده نیستند، اگر ممکن است به نحوی این اطلاعات را در اختیار ما قرار دهید، برای یک کار تحقیقی به چنین دیتاستی نیاز داریم، با سپاس بسیار

:اشتباه::اشتباه::اشتباه::اشت اه::اشتباه::اشتباه::اشتباه:: شتباه::اشتباه::اشتباه::اشتب ه::اشتباه:

haniyeh.ghassami
یک شنبه 31 خرداد 1394, 15:53 عصر
کسی این دیتابیس را نداره؟
خواهش میکنم نیاز داریم بهش واسه پایان نامه:عصبانی++::عصبانی++::عصبا ی++::عصبانی++::عصبانی++::عصبان ++::عصبانی++::عصبانی++::عصبانی+ +:

:قلب: