hamedg1366
شنبه 16 مرداد 1395, 00:51 صبح
با عرض سلام وادب خدمت همه عزیزان
من با استفاده از کد زیر اطلاعات ی یک صفحه ی وب رو استخراج می کنم و مشکلی با آدرس های انگلیسی ندارم:
$ch = curl_init();
curl_setopt($ch,CURLOPT_RETURNTRANSFER,true);
curl_setopt($ch,CURLOPT_URL,$url);
$ret = curl_exec($ch);
curl_close($ch);
$site=$ret;
//$ret=""
$htmlDoc = new DomDocument('1.0', 'UTF-8');
@$htmlDoc->loadHTML(mb_convert_encoding($site, 'HTML-ENTITIES', 'UTF-8'));
$xpath = new DOMXPath( $htmlDoc );
اگه لینک صفحه به صورت زیر باشه مشکلی نیس :
http://www.mashreghnews.ir/fa/news/613248/%D8%B3%D8%A7%DB%8C%D9%87-%D8%AC%D9%86%DA%AF-%D9%87%DB%8C%DA%86%E2%80%8C%DA%AF%D8%A7%D9%87-%D8%A8%D8%B1-%D8%B3%D8%B1-%D9%85%D9%84%D8%AA-%D8%A7%DB%8C%D8%B1%D8%A7%D9%86-%D9%86%D8%A8%D9%88%D8%AF%D9%87-%D8%A7%D8%B3%D8%AA%D8%AF%D8%B3%D8%AA%D8%A7%D9%88%D 8%B1%D8%AF%D9%87%D8%A7%DB%8C-%D8%A8%D8%B1%D8%AC%D8%A7%D9%85-%DA%A9%D8%AC%D8%A7%D8%B3%D8%AA
مشکل اونجایی ایجاد میشه که لینک بصورت زیر در میاد :
http://www.mashreghnews.ir/fa/news/613248/سایه-جنگ-هیچگاه-بر-سر-ملت-ایران-نبوده-استدستاوردهای-برجام-کجاست
وقتی لینک بصورت بالا در میاد $xpath هیچی نداره ،
این لینک رو هم (http://stackoverflow.com/questions/21374832/why-does-it-not-return-utf-8-in-php) دیدم اما جواب نداد بهم
من با استفاده از کد زیر اطلاعات ی یک صفحه ی وب رو استخراج می کنم و مشکلی با آدرس های انگلیسی ندارم:
$ch = curl_init();
curl_setopt($ch,CURLOPT_RETURNTRANSFER,true);
curl_setopt($ch,CURLOPT_URL,$url);
$ret = curl_exec($ch);
curl_close($ch);
$site=$ret;
//$ret=""
$htmlDoc = new DomDocument('1.0', 'UTF-8');
@$htmlDoc->loadHTML(mb_convert_encoding($site, 'HTML-ENTITIES', 'UTF-8'));
$xpath = new DOMXPath( $htmlDoc );
اگه لینک صفحه به صورت زیر باشه مشکلی نیس :
http://www.mashreghnews.ir/fa/news/613248/%D8%B3%D8%A7%DB%8C%D9%87-%D8%AC%D9%86%DA%AF-%D9%87%DB%8C%DA%86%E2%80%8C%DA%AF%D8%A7%D9%87-%D8%A8%D8%B1-%D8%B3%D8%B1-%D9%85%D9%84%D8%AA-%D8%A7%DB%8C%D8%B1%D8%A7%D9%86-%D9%86%D8%A8%D9%88%D8%AF%D9%87-%D8%A7%D8%B3%D8%AA%D8%AF%D8%B3%D8%AA%D8%A7%D9%88%D 8%B1%D8%AF%D9%87%D8%A7%DB%8C-%D8%A8%D8%B1%D8%AC%D8%A7%D9%85-%DA%A9%D8%AC%D8%A7%D8%B3%D8%AA
مشکل اونجایی ایجاد میشه که لینک بصورت زیر در میاد :
http://www.mashreghnews.ir/fa/news/613248/سایه-جنگ-هیچگاه-بر-سر-ملت-ایران-نبوده-استدستاوردهای-برجام-کجاست
وقتی لینک بصورت بالا در میاد $xpath هیچی نداره ،
این لینک رو هم (http://stackoverflow.com/questions/21374832/why-does-it-not-return-utf-8-in-php) دیدم اما جواب نداد بهم