PDA

View Full Version : بدست آوردن سورس آیتم های گرافیکی وب سایت



sobhan1990
سه شنبه 09 دی 1399, 08:15 صبح
سلام

من میخوام با استفاده از jsoup از یک سایت سورس یک عکس را بخونم و در برنامه ام نشون بدم

مشکلی که دارم اینه که وقتی در مرورگر کروم روی آیتم مورد نظر کلیک راست میکنی و inspect را میزنی به درستی اطلاعات(شامل div و کلاس و سورس عکس و ..) را نشان میده ولی وقتی که کلیک راست میکنم و View Page Sourse را میزنم مطالب ذیگه ای نشون داده میشه که در اون خبری از اطلاعات اون عکس و div و ... نیست , و وقتی از طریق jsoup سایت را میخونم اطلاعات View Page Sourse میاد و خبری از آدرس عکس مورد نظر نیست.

نمیدونم تونستم منظورم را درست برسونم یا نه؟

چطور میشه به اطلاعاتی که از طریق inspect میشه دید دسترسی پیدا کرد؟

با تشکر

sobhan1990
پنج شنبه 11 دی 1399, 05:05 صبح
68 بازدید و بدون یک پاسخ یا راهنمایی !!!

گل بگیرید انجمن رو

Nevercom
شنبه 20 دی 1399, 14:28 عصر
با توجه به توضیحات شما، اون سایت بصورت SPA ساخته شده، یعنی تمام محتوای سایت همون اول در DOM وجود ندارن و پس از لود سایت توسط جاوااسکریپت لود میشن و در DOM قرار داده میشن.
اگر امکان اعمال تغییرات در سایت رو دارید (مثلن سایت خودتون یا مشتری هست)، راه حلش استفاده از Server-Side Rendering هست. SSR علاوه بر این که مشکل شما رو حل می‌کنه، به موتورهای جستجو هم این امکان رو میده که سایت رو بهتر ببینن.

در غیر اینصورت، با JSoup به تنهایی نمی‌تونید محتوای مدنظرتون رو بخونید و باید به شکلی عملیاتی که خود سایت انجام میده برای لود محتوا رو شبیه‌سازی کنید..
باید اون سایتو Requestهایی که ارسال می‌کنه رو بررسی کنید، اگه درخواستی پیدا کردید که در پاسخش محتوای مدنظر شما وجود داره که خب کارتون راحته
در غیر اینصورت احتمالن باید از کتابخانه‌هایی که قابلیت Headless Browser رو ارائه میدن مثل HtmlUnit یا PhantomJS استفاده کنید