PDA

View Full Version : به دست آوردن متن یک فایل PDF



armin8651
چهارشنبه 11 دی 1392, 13:57 عصر
سلام
چه طور میتونم متن یک فایل PDF رو توی یک RichTextBox بریزم؟
ممنون

armin8651
جمعه 13 دی 1392, 17:25 عصر
کامپوننتی هم برای این کار وجود نداره؟

rahnema1
شنبه 14 دی 1392, 06:39 صبح
شما می تونید از iTextSharp استفاده کنید. یک کتابخانه اپن سورس که به زبانهای دات نت و جاوا و آندروید این هم لینکش http://sourceforge.net/projects/itextsharp/ و این هم آموزش استخراج متن البته به زبان جاوا که با کمی تغییر میشه به دات نت تبدیل کرد http://itextpdf.com/examples/iia.php?id=240

sinus71
شنبه 14 دی 1392, 10:30 صبح
به نظرم باید سورس برنامه ای مثل pdf to word رو پیدا کنی و تو برنامه انکلود کنی ......... یا سورس برنامه pdf رو سرچ کنی که فکر نکم پیدا کنی
سینوس سافت 30nus.vcp.ir

armin8651
دوشنبه 16 دی 1392, 14:50 عصر
شما می تونید از iTextSharp استفاده کنید. یک کتابخانه اپن سورس که به زبانهای دات نت و جاوا و آندروید این هم لینکش http://sourceforge.net/projects/itextsharp/ و این هم آموزش استخراج متن البته به زبان جاوا که با کمی تغییر میشه به دات نت تبدیل کرد http://itextpdf.com/examples/iia.php?id=240

ممنون، نتونستم این کدها را به درستی تبدیل کنم. اگه به زبان vb برام بنویسید ممنون میشم

rahnema1
دوشنبه 16 دی 1392, 21:49 عصر
بفرما این هم برنامه اما فراموش نکن ابتدا به فایل itextsharp.dll رفرنس بده
114970

armin8651
سه شنبه 17 دی 1392, 08:24 صبح
مرسی، برای pdfهای انگلیسی عالی کار کرد، خیلی ممنون
برای فارسی که طبق معمول مشکل داشت، مثل همه برنامه ها، این راه حل نداره؟

rahnema1
سه شنبه 17 دی 1392, 11:15 صبح
واسه فارسی هم یه راه حل پیدا شد اما بعضی حروف مشکل دارن باید بیشتر روش کار بشه
114993

armin8651
سه شنبه 17 دی 1392, 15:28 عصر
بهتر شد ولی بازم مشکل داره
اگه راه بهتری پیدا کردین لطفاً اطلاع بدین
خیلی ممنون

rahnema1
سه شنبه 17 دی 1392, 18:46 عصر
بهتر شد ولی بازم مشکل داره
اگه راه بهتری پیدا کردین لطفاً اطلاع بدین
خیلی ممنون

پیشنهاد می کنم شما هم روی این موضوع کار کنید در صورتیکه به نتیجه ای رسیدید ما را هم بی خبر نذارید

armin8651
چهارشنبه 18 دی 1392, 08:12 صبح
پیشنهاد می کنم شما هم روی این موضوع کار کنید در صورتیکه به نتیجه ای رسیدید ما را هم بی خبر نذارید

بله دارم کار می کنم
تا اینجا فهیمدم که رو نیم فاصله ها مشکل داره، ولی در کل هنوز نفهمیدم که کجا ها مشکل داره تا برطرفشون کنم.

rahnema1
شنبه 21 دی 1392, 12:56 عصر
از طریق مثال های زیر میشه یک فایل PDF رو درون برنامه نمایش بدیم

با تشکر توجه کنید این دوستمون می خواهد متن را استخراج کنه نه اینکه بخواد فایل را نمایش بده

armin8651
شنبه 21 دی 1392, 14:04 عصر
از طریق مثال های زیر میشه یک فایل PDF رو درون برنامه نمایش بدیم.

به صورت سوال دقت کنید.

boveiryghasem
شنبه 21 دی 1392, 14:54 عصر
سجاد جان قربونت شما هر جا میرسی پست میزاری در مورد چیزی که نمیدونی پست نزار اول ببین سوال چیه؟ بلدی هستی؟ نیستی؟.

sagggad
شنبه 21 دی 1392, 15:20 عصر
بابا شما ها دیگه کی هستین...:متعجب:
حالا ما یه چیزی اشتباه فهمیدیم
متاسفم که همش سعی میکنید خود نمایی کنید
جناب rahnema1 (http://barnamenevis.org/member.php?305905-rahnema1) گفتن و من هم متوجه شدم
شما boveiryghasem (http://barnamenevis.org/member.php?181138-boveiryghasem) فک نکنم نیازی بود حرف میزدین
الان پست من خیلی محتواش بیشتر از پست شما بود(چون فنی بود ولی به هرحال پاکش کردم)...

boveiryghasem
شنبه 21 دی 1392, 15:38 عصر
لطفا دوستان مراقب لحن صحبت کردنشون باشن اینجا جایی نیست که بخاییم شعورمون رو به دیگران نشون بدیم بلکه باید از اطلاعات هم استفاده کنیم اگر کسی سوالی داره و بلدیم درست جوابشو بدیم، نه اینکه همین جوری جوابی بدیم که هم اون بنده خدا گم راه بشه هم تاپیک رو شلوغ کنیم. در ضمن دوستان انگار مسابقه پست گذاشتن به هر سوالی جواب بیراه میدن تعداد پست ها رو به طریقی بره بالا.

sagggad
شنبه 21 دی 1392, 15:46 عصر
اینطوری که من میبینم الان شما داری پست بی محتوا میذاری:
من یه پست گذاشتم اول اون هم برای این بود که درست متوجه منظور ایشون نشده بودم،ایشون میخواست پی دی اف رو به صورت متن وارد برنامه کنه من اشتباها باز کردن فایل PDF رو بهشون گفتم...
بعد هم پست رو پاک کردم
جناب Rahnama1 و armin8651 هم قبل از شما این موضوع رو به من گفتن...
پس دیگه احتیاجی به گفتن و تاکید شما نبود
پس به عبارتی میشه گفت من پست فنی گذاشتم اما درست متوجه منظور نشده بودم اما شما جز پست های بی محتوا(از نظر فنی)چیز دیگری نذاشتید...

rahnema1
شنبه 21 دی 1392, 18:49 عصر
یه برنامه هست به نام justPDF که از همین کتابخانه itextsharp استفاده می کنه اگه اجرا کنید و روی OCR کلیک کنید متن رو استخراج می کنه توی لینک زیر هم سورس برنامه هست و هم برنامه نصب خیلی از اشکالات برطرف شده تا اونجایی که بررسی کردم فقط در مورد لا درست عمل نمی کنه فقط این نکته رو بگم اگر چه لا از دو حرف لام و الف تشکیل شده ولی در جدول فونت ها به صورت یک کاراکتر ذخیره میشه و فکر کنم اشکال از همین جا پیش میاد : http://sourceforge.net/projects/justpdf/files/

armin8651
شنبه 21 دی 1392, 19:38 عصر
یه برنامه هست به نام justPDF که از همین کتابخانه itextsharp استفاده می کنه اگه اجرا کنید و روی OCR کلیک کنید متن رو استخراج می کنه توی لینک زیر هم سورس برنامه هست و هم برنامه نصب خیلی از اشکالات برطرف شده تا اونجایی که بررسی کردم فقط در مورد لا درست عمل نمی کنه فقط این نکته رو بگم اگر چه لا از دو حرف لام و الف تشکیل شده ولی در جدول فونت ها به صورت یک کاراکتر ذخیره میشه و فکر کنم اشکال از همین جا پیش میاد : http://sourceforge.net/projects/justpdf/files/

خیلی ممنون که پیگیر هستین
برنامه رو اجرا کردم، بازم مشکل هاش کم نیست
در ضمن از سورس کد نتونستم اجرا کنم، ارور میداد، از برنامه تست کردم