PDA

View Full Version : استخراج لینک های یک سایت



ابوذر محمودی
چهارشنبه 26 تیر 1387, 15:07 عصر
سلام .

کسی می دونه که ساده ترین راه برای استخراج لینک های درون یک صفحه وب چیه ؟

من برای اینکار از توابع InStr و mid استفاده کردم آیا روش دیگه ای هم وجود داره ؟؟

r0ot$harp
چهارشنبه 26 تیر 1387, 21:09 عصر
سلام .

کسی می دونه که ساده ترین راه برای استخراج لینک های درون یک صفحه وب چیه ؟

من برای اینکار از توابع InStr و mid استفاده کردم آیا روش دیگه ای هم وجود داره ؟؟

دوست عزیز به نظر من نمونه ای از کد HTML رو اینجا قرار دهید و ذکر کنید که کدام تگ ها وقست ها رو احتیاج دارین تا روش بحث بشه .



باتشکر احسان

اوبالیت به بو
چهارشنبه 26 تیر 1387, 21:17 عصر
ربطي به HTML نداره

r0ot$harp
چهارشنبه 26 تیر 1387, 21:22 عصر
ربطي به HTML نداره

ببینم ایشون مگه نمی خواد از داخل کد های HTML لینک رو دربیاره از لایه کدهای CSS که نمی خواد لینک در بیاره !!!!!!!!!! :متعجب: :خجالت: :کف: :لبخند:


باتشکر احسان

ابوذر محمودی
پنج شنبه 27 تیر 1387, 00:53 صبح
کدام تگ ها وقست ها رو احتیاج دارین تا روش بحث بشه
به عنوان مثال تگ های IMG .
مسیرهای معتبری که در href قرار گرفته اند .
مسیر فایلهای CSS که در صفحه وب فراخوانی شده اند.
لینک های داده شده به فایلها
در کل هر چیزی که نبودنش باعث نقص در ظاهر وب سایت می شه

r0ot$harp
پنج شنبه 27 تیر 1387, 01:03 صبح
سلام .

نمونه کد مثلا صفحه اصلی یاهو . می تونین دانلود کنید بعد با وی بی تمام لینک های اون رو استخراج کنید .

حالا ممکنه این آدرسها و لینک ها به یک صفحه وب دیگه یا یک فایل یا تصویر ارجاع داده بشه.

ببین دوست عزیز اصلا احتیاج نیست بری و دانلود کنی شما کار با Winsock رو یاد بگیرید بعد برید سر وقت POST DATA و GET DATA این دورو یاد بگیری هر کاری بخوای بکنی می تونی .

برای گرفتن لینک ها هم بهترین راه همون Instr و Mid و Split هست . فقط باید جایه Tag ها رو در بیاری .


باتشکر احسان

ابوذر محمودی
پنج شنبه 27 تیر 1387, 01:43 صبح
سلام .

ببین دوست عزیز اصلا احتیاج نیست بری و دانلود کنی شما کار با Winsock رو یاد بگیرید بعد برید سر وقت POST DATA و GET DATA این دورو یاد بگیری هر کاری بخوای بکنی می تونی .

من منظورم استخراج لینک های درون یک صفحه html - php -asp و ... هستش ، حالا ممکنه این صفحات روی هارد ذخیره شده باشند .
شما اینو گفتید :

دوست عزیز به نظر من نمونه ای از کد HTML رو اینجا قرار دهید
منم گفتم یه صفحه دانلود کنید بعد هم لینکهاشو استخراج کنید .

برای گرفتن لینک ها هم بهترین راه همون Instr و Mid و Split هست . فقط باید جایه Tag ها رو در بیاری
آره مثل اینکه راه حل دیگه ای نیست

r0ot$harp
پنج شنبه 27 تیر 1387, 01:53 صبح
سلام .


من منظورم استخراج لینک های درون یک صفحه html - php -asp و ... هستش ، حالا ممکنه این صفحات روی هارد ذخیره شده باشند .
شما اینو گفتید :

منم گفتم یه صفحه دانلود کنید بعد هم لینکهاشو استخراج کنید .

آره مثل اینکه راه حل دیگه ای نیست
چشم دوست عزیز ولی باید به این توجه کنید که در HTML کد های a href و src= هر دو می تونند دارای لینک باشند . یعنی شما باید تمام مقدارهای بین Tag های این کد ها رو جدا کنید .



باتشکر احسان

koruir
پنج شنبه 27 تیر 1387, 02:09 صبح
سلام. بهترين راه استفاده از InStr هست. که من اين کار رو کردم.
اما براي سورس صفحه؛ من از MSINET.OCX استفاده کردم.
و اين که ميتونه سورس رو از Clipboard و File From HDD هم بگيره.

برنامه ميتونه اعداد - آي پي ها - ميل ها و URL هاي داخل سورس رو پيدا کنه و ليست کنه.
فکر کنم بقيه اش عکس معلوم باشه.

نکته: برنامه هنوز بيرون نيومده. دارم رو Software Lock کار ميکنم. چون نميخوام به اين زوديا و به اين راحتي برنامم کرک بشه.

عکس برنامه رو آپلود ميکنم.

mpmsoft
پنج شنبه 27 تیر 1387, 09:47 صبح
دوست عزیز شما باید سورس HTML اون صفحه رو دربیاری و به دنبال تگهای @ و یا www و یا .com و یا حتی تگهای ارتباطی HTML

ابوذر محمودی
پنج شنبه 27 تیر 1387, 10:49 صبح
دوست عزیز شما باید سورس HTML اون صفحه رو دربیاری و به دنبال تگهای @ و یا www و یا .com و یا حتی تگهای ارتباطی HTML

سلام .

دوست عزیزم من هم از همین روش استفاده کردم ، و مکان هر قسمتی که لینک داده شده رو پیدا کردم و اون لینک رو با mid بیرون کشیدم.

گفتم شاید راه ساده تری باشه . ولی پیداست که همین ، تنها راه این مسئله هست .

r0ot$harp
پنج شنبه 27 تیر 1387, 15:01 عصر
سلام .

دوست عزیزم من هم از همین روش استفاده کردم ، و مکان هر قسمتی که لینک داده شده رو پیدا کردم و اون لینک رو با mid بیرون کشیدم.

گفتم شاید راه ساده تری باشه . ولی پیداست که همین ، تنها راه این مسئله هست .

اگر استباه نکنم در Php یه تابع هست که میاد رشته بین دو علامت رو در میاره مثلا :

/forum/newreply

میاد newreply که بین دو (/) هست در میاره ولی در Vb نمی دونم چیه ؟ :گریه::گریه::گریه::گریه::گریه:



باتشکر احسان