system32
سه شنبه 26 خرداد 1388, 21:19 عصر
دوستان این تاپیک راه انداختم تا بقیه هم مثل من با این موضوع بیشتر آشنا شوند. من خودم یک مقاله کوچیک در این باره می زارم. لطفا اگر دوستان هم در این زمینه مطلب یا کامپوننت یا نظری دارند بزارند. در این راستا امیدوارم به جواب این سوالم برسم: می خواهم کاری کنم تا متن جایی که ماوس روی آن قرار داره برگردونه. (چه عکس باشه چه متن) مثل بابیلون.
OCR كه سررشته كلمات Optical Character Recognition مي باشد، به تكنيكي اطلاق مي شود كه در طي آن يك برنامه كامپيوتري متون موجود درتصاوير ديجيتالي را شناسايي كرده و آنها را به صورت خودكار به فايلهاي متني قابل ويرايش تبديل مي كند.
لزوم استفاده از OCR
فرض كنيد شما يك متن كاغذي مانند نام، قرارداد، RFP، مقاله، كتاب و ... را در اختيار داريد و بايد آن را وارد كامپيوتركنيد تا در مطالعات خود يا تهيه گزارشات و ... مورد استفاده قرار دهيد.
اولين راهي كه به ذهن مي رسد و متأسفانه تا كنون در مورد متون فارسي مورد استفاده قرار گرفته است، اين است كه متن موجود در اين اسناد دوباره بوسيله اپراتور تايپ شود. بديهي است اين كار بسيار وقت گير است، به علاوه وقتي بخواهيم حجم انبوه اسناد مكتوب را به صورت ديجيتال درآوريم ، اين مشكلات نمود بيشتري خواهد داشت. دومين راهي كه با گسترش فناوري اطلاعات در سالها ي اخير در بسياري از سازمانها مورد استفاده قرار گرفته است ، تصوير برداري از روي اسناد كاغذي به وسيله اسكنرها و انتقال تصاوير ديجيتالي توليد شده به سيستم هاي كامپيوتري مي باشد.
گر چه در اين روش با ايجاد آرشيو الكترونيكي از اسناد بهبود نسبي در فرآيند نگهداري اسناد و دستيابي به آنها ايجاد شده است اما كماكان امكان جستجو در داخل متن اين اسناد و بهره برداري از آنها وجود ندارد ، به عبارت ديگر تصاوير ديجيتالي اسناد كه با استفاده از اسكنر بدست مي آيند فاقد ارزش كافي مي باشند مگر آنكه بتوان در متن آنها جستجو نمود.
نرم افزار OCR مشكل فوق را برطرف مي كند، به اين ترتيب كه تصوير ديجيتال اسناد را دريافت كرده و با تحليل محتواي آنها اطلاعات مختلف موجود را شناسايي كرده و با توجه به نوع آنها، فرآيند تبديل خودكار تصوير به متن را انجام مي دهد.
فناوريOCR
چنانچه فرآيندOCR رابه صورت يك (Black Box) در نظر بگيريم ورودي آن تصوير سند مورد نظر و خروجي آن فايل ديجيتالي قابل ويرايش از اطلاعات سند (مثلاً به فرمت MS- Word) مي باشد.
http://www.farsiocr.com/images/ocr_inout.PNG
شكل زير فرآيند OCR را با جزئيات بيشتري نشان مي دهد. در اين شكل مراحل مختلف OCR كه به صورت جعبه سياه معرفي شده بودند ، تشريح شده است:
http://www.farsiocr.com/images/ocr_process.PNG
منبع: http://www.farsiocr.com/whatisocr (http://www.farsiocr.com/whatisocr)
OCR كه سررشته كلمات Optical Character Recognition مي باشد، به تكنيكي اطلاق مي شود كه در طي آن يك برنامه كامپيوتري متون موجود درتصاوير ديجيتالي را شناسايي كرده و آنها را به صورت خودكار به فايلهاي متني قابل ويرايش تبديل مي كند.
لزوم استفاده از OCR
فرض كنيد شما يك متن كاغذي مانند نام، قرارداد، RFP، مقاله، كتاب و ... را در اختيار داريد و بايد آن را وارد كامپيوتركنيد تا در مطالعات خود يا تهيه گزارشات و ... مورد استفاده قرار دهيد.
اولين راهي كه به ذهن مي رسد و متأسفانه تا كنون در مورد متون فارسي مورد استفاده قرار گرفته است، اين است كه متن موجود در اين اسناد دوباره بوسيله اپراتور تايپ شود. بديهي است اين كار بسيار وقت گير است، به علاوه وقتي بخواهيم حجم انبوه اسناد مكتوب را به صورت ديجيتال درآوريم ، اين مشكلات نمود بيشتري خواهد داشت. دومين راهي كه با گسترش فناوري اطلاعات در سالها ي اخير در بسياري از سازمانها مورد استفاده قرار گرفته است ، تصوير برداري از روي اسناد كاغذي به وسيله اسكنرها و انتقال تصاوير ديجيتالي توليد شده به سيستم هاي كامپيوتري مي باشد.
گر چه در اين روش با ايجاد آرشيو الكترونيكي از اسناد بهبود نسبي در فرآيند نگهداري اسناد و دستيابي به آنها ايجاد شده است اما كماكان امكان جستجو در داخل متن اين اسناد و بهره برداري از آنها وجود ندارد ، به عبارت ديگر تصاوير ديجيتالي اسناد كه با استفاده از اسكنر بدست مي آيند فاقد ارزش كافي مي باشند مگر آنكه بتوان در متن آنها جستجو نمود.
نرم افزار OCR مشكل فوق را برطرف مي كند، به اين ترتيب كه تصوير ديجيتال اسناد را دريافت كرده و با تحليل محتواي آنها اطلاعات مختلف موجود را شناسايي كرده و با توجه به نوع آنها، فرآيند تبديل خودكار تصوير به متن را انجام مي دهد.
فناوريOCR
چنانچه فرآيندOCR رابه صورت يك (Black Box) در نظر بگيريم ورودي آن تصوير سند مورد نظر و خروجي آن فايل ديجيتالي قابل ويرايش از اطلاعات سند (مثلاً به فرمت MS- Word) مي باشد.
http://www.farsiocr.com/images/ocr_inout.PNG
شكل زير فرآيند OCR را با جزئيات بيشتري نشان مي دهد. در اين شكل مراحل مختلف OCR كه به صورت جعبه سياه معرفي شده بودند ، تشريح شده است:
http://www.farsiocr.com/images/ocr_process.PNG
منبع: http://www.farsiocr.com/whatisocr (http://www.farsiocr.com/whatisocr)