PDA

View Full Version : سوال: پردازش فایل با فورمت پی دی اف در سی++



BeginnerProgrammer
یک شنبه 26 تیر 1390, 11:02 صبح
با سلام
چطوری میشه به محتوای یه فایل .pdf تو سی++ دسترسی داشت؟(بشه مثل یک فایل txt اونو خوند؟)

.:saeed:.
یک شنبه 26 تیر 1390, 14:13 عصر
برای خوندن این جور فایل ها شما باید به ساختار اون فایل آشنایی داشته باشید و خیلی پیچیده تر از یه فایل تکست خواهد بود مسلما . چون دیگه فایل تکستی در کار نیست و این فایل ها فایل های باینری هستند و هر شرکتی و هر برنامه ای فرمت فایل خودشو داره که مثلا میگه بایت n ام چه معنی ای داره . معمولا ساختار این جور فایل ها رو میشه از سایت سازندشون بدست آورد مثلا توی گوگل سرچ کنید pdf format specification . تا ساختار این فایل رو ندونید خودتون نمیتونید این جور فایلها رو بخونید

BORHAN TEC
یک شنبه 26 تیر 1390, 17:11 عصر
باید بگم که ساختار فایلهای PDF زیاد پیچیده نیست و بیشتر به XML شباهت دارد. به عنوان مثال در زیر می توانید یک نمونه PDF ساده را مشاهده کنید:

%PDF-1.2
1 0 obj
<<
/Author (Santa Claus)
/Producer (Inside Delphi Book - TPDFExport Component)
/Subject ()
/Title (Christmas Presents)
>>
endobj
2 0 obj
<< /Type /Font
/Subtype /Type1
/Name /F1
/BaseFont /Courier
/Encoding /WinAnsiEncoding
>>
endobj
3 0 obj
<< /ProcSet [ /PDF /Text]
/Font <<
/F1 2 0 R
>>
>>
endobj
4 0 obj
<< /Length 76
>>
stream
BT
/F1 12 Tf
72 720 Td
(A very simple PDF document...) Tj
0 -12 TD
ET
endstream
endobj
5 0 obj
<< /Type /Pages
/Kids [
6 0 R
]
/Count 1
>>
endobj
6 0 obj
<< /Type /Page
/Parent 5 0 R
/MediaBox [0 0 612 792]
/Contents 4 0 R
/Resources 3 0 R
>>
endobj
7 0 obj
<< /Type /Catalog
/Pages 5 0 R
>>
endobj
xref
0 8
0000000000 65535 f
0000000010 00000 n
0000000156 00000 n
0000000269 00000 n
0000000342 00000 n
0000000473 00000 n
0000000540 00000 n
0000000652 00000 n
trailer
<< /Size 9
/Root 7 0 R
/Info 1 0 R
>>
startxref
706
%%EOF

BeginnerProgrammer
یک شنبه 26 تیر 1390, 19:05 عصر
طبق مثالی که زدین چطوری میفهمید محتوای فایل چیه؟ من میخوام با استفاده از سی++ فایلو بخونم بعد محتواشو داخل فایل تکست بنویسیم

یوسف زالی
دوشنبه 27 تیر 1390, 16:45 عصر
سلام.
در این سایت فرمت فایل های مختلف بررسی شده و ساختار اونها دقیقا شرح داده شده.
از PDF بگیر تا DBF و حتی EXE
http://www.wotsit.org (http://www.wotsit.org/)