PDA

View Full Version : سوال: استخراج متن از pdf فارسی



niloofar13
پنج شنبه 08 خرداد 1393, 11:06 صبح
سلام من الان سه روزه دارم دنبال برنامه ای می گردم که بتونه متن رو از فایل pdf فارسی استخراج کنه ولی متاسفانه به جایی نرسیدم. روشهای مختلف مثل itextsharp ، pdfbox و غیره رو به کار بردم ولی هیچ فایده ای نداشته. برنامه ای دارم که متن رو از pdf فارسی استخراج می کنه ولی فقط با فونتهای انگلیسی مثل tahoma کار می کنه و برای فونتهای فارسی مثل bnazanin فایده ای نداره. چون در برنامم فایل pdf رو به عنوان ورودی از کاربر دریافت می کنم بنابراین طبیعتا فونت اکثر فایلها فارسی است و نمیشه محدودیت گذاشت. لطفا اگه کسی راه حلی داره بهم کمک کنه خیلی ممنون میشم واقعا به چنین چیزی نیاز دارم.