PDA

View Full Version : استفاده از دستور file_get_contents



mehdi4467
پنج شنبه 17 فروردین 1396, 12:05 عصر
سلام
من با دستور
file_get_contents($url);
اطلاعات یک صفحه وب رو به صورت یک رشته ذخیره می کنم ولی روی برخی از آدرس ها کار نمی کند.
مثلا آدرس زیر رو امتحان کنید:

http://new.tse.ir/instrument/%D8%BA%D8%A8%D8%B4%D9%87%D8%B11_IRO1SBEH0001.html

آیا روش خاصی وجود دارد یا دستور دیگری؟

ممنون

plague
پنج شنبه 17 فروردین 1396, 12:32 عصر
1 - بعضی سایت ها هدر ها رو چک میکنن و اگه مثلا هدر user agent نداشته باشه درخواستتون متوجه میشه که یه ربات یا اسکریپته دراه درخواست میده و جلوی دسترسی رو میگیره
بهتره از curl استفاده کنید و هدر ها رو ست کنید تا کاملا یه مرورگر کلاینت معمولی رو شبیه سازی کنید

2 - وقتی شما به سایت دیگه وصل بشید و اطلاعات بگیرید کد های جاوا اسکریپت اجرا نخواهند شد در نتیجه اگه سایت از Js برای لود کردن اطلاعاتش استفاده کرده باشه مثلا تمپلیت انجین js یا فریم ورک هایی مثل انگولار شما اونها رو نخواهید دید در خروجیتون


سایتی که شما لینک دادین از انگولار استفاده میکنه

bugless.ir
جمعه 18 فروردین 1396, 19:32 عصر
نمونه کد :

curl_setopt($ch,CURLOPT_USERAGENT,'Mozilla/5.0 (Windows; U; Windows NT 5.1; en-US; rv:1.8.1.13) Gecko/20080311 Firefox/2.0.0.13');