PDA

View Full Version : چگونه می توانم از سورس سایت قسمت تگ را بیرون بکشم ؟



dele_ghamgin_2008
یک شنبه 04 خرداد 1393, 20:27 عصر
سلام . من یک وب بروزر دارم که توش صفحه ای رو باز می کنم . آدرس صفحه در زیر آمده است :

http://www.iranraiment.com/fa/%DA%A9%D9%81%D8%B4/news/2424/%D9%86%D9%85%D8%A7%DB%8C%D9%86%D8%AF%DA%AF%DB%8C-%DA%A9%D9%81%D8%B4-%D8%A2%D8%AF%D8%A7%DA%A9-%D8%AF%D8%B1-%D8%AA%D9%87%D8%B1%D8%A7%D9%86
پس از اینکه این صفحه در وب بروزر لود شد ، سورس آن درون یک تکست باکس1 نمایش داده می شود . حال می خواهم وقتی روی باتن کلیک کردم ، برچسب ها رو برام پیدا کنه و بریزه توی تکست باکس2 . منظور من از برچسب ها همون تگ هایی است که سایت ایجاد کرده . به عنوان مثال در صفحه بالا برچسب ها عبارت اند از :

برچسب ها : کفش آداک در تهران (http://www.iranraiment.com/fa/control/tag/tagresult/2935/%DA%A9%D9%81%D8%B4%20%D8%A2%D8%AF%D8%A7%DA%A9%20%D 8%AF%D8%B1%20%D8%AA%D9%87%D8%B1%D8%A7%D9%86) , نمایندگی کفش آداک (http://www.iranraiment.com/fa/control/tag/tagresult/2949/%D9%86%D9%85%D8%A7%DB%8C%D9%86%D8%AF%DA%AF%DB%8C%2 0%DA%A9%D9%81%D8%B4%20%D8%A2%D8%AF%D8%A7%DA%A9)

لطفاً منو راهنمایی کنید . از همه روش ها هم بهره گرفتم . ولی موفق نشدم .

Davidd
دوشنبه 05 خرداد 1393, 08:15 صبح
از htmlAgillityPack استفاده كن.
يه تايپيك مشابه با عنوان استخراج قيمت از سايت بود كه اونجا راهنمايي كردم.

dele_ghamgin_2008
دوشنبه 05 خرداد 1393, 09:20 صبح
از htmlAgillityPack استفاده كن.
يه تايپيك مشابه با عنوان استخراج قيمت از سايت بود كه اونجا راهنمايي كردم.

دوست عزیزهمانطور که گفتم
از همه روش ها هم بهره گرفتم . ولی موفق نشدم .
همه جای این سایت رو زیرو رو کردم چون چیزی پیدا نکردم تاپیک جدید زدم. اینی که میگویید کار منو راه نمیندازه . شما سورس سایتی که دادم رو ببینید.

HtmlDocument xhtml = GetXHtmlFromUri("http://www.iranhoney.net/fa/%D8%AE%D8%B1%DB%8C%D8%AF-%D8%B9%D8%B3%D9%84/news/868/%D8%AE%D8%B1%DB%8C%D8%AF-%D8%A7%D8%B1%D8%B2%D8%A7%D9%86-%D8%B9%D8%B3%D9%84-%D8%B7%D8%A8%DB%8C%D8%B9%DB%8C-%DA%AF%D9%88%D9%86");
lblDollar.Text = xhtml.DocumentNode.SelectSingleNode("//*[@class=\"tag\"]/class=\"tagList\"/a href[1]/title=/text()").InnerText;

Davidd
دوشنبه 05 خرداد 1393, 10:47 صبح
دوست عزيز شما لقمه آماده ميخاي. اينجا براي راهنمايي است نه انجام كار و كد نوشتن. اين پارامتر آدرس در متد SelectSingleNode نميدونم بر چه اساسي نوشتي! شانسي كه نميشه آخه. حداقل 20 تا تگ تودرتو وجود داره بعدش ميرسه به تگ موردنظر : html/body/......

dele_ghamgin_2008
دوشنبه 05 خرداد 1393, 12:16 عصر
دوست عزيز شما لقمه آماده ميخاي. اينجا براي راهنمايي است نه انجام كار و كد نوشتن. اين پارامتر آدرس در متد SelectSingleNode نميدونم بر چه اساسي نوشتي! شانسي كه نميشه آخه. حداقل 20 تا تگ تودرتو وجود داره بعدش ميرسه به تگ موردنظر : html/body/......

دوست عزیز اینجا جای نصیحت و دردو دل نیست . لطفاً اگر پاسخ سوال رو بلد نیستید و نمی توانید کمکی بکنید الکی تاپیک رو شلوغ نفرمایید. با تشکر

dele_ghamgin_2008
دوشنبه 05 خرداد 1393, 12:35 عصر
دوستان از کد زیر استفاده کردم . فقط تا اونجایی که اول تگ رو می خواد بنویسیه تشخیص میده . نمیدونم قسمت فارسی رو چجور فراخوانی کنم . اگر تگ ها انگلیسی بود می دونستم . لطفاً راهنمایی کنید :
Regex ox = new Regex(@"\bfa/control/tag/tagresult/+[A-Z0-9._%+-]+/\b", RegexOptions.IgnoreCase | RegexOptions.Singleline); foreach (object obj in ox.Matches(txtSorce.Text))
txtDescription.Text += obj.ToString();

dele_ghamgin_2008
دوشنبه 05 خرداد 1393, 12:51 عصر
آقا من از یک روش دیگه رفتم . شدش و پیدا کرد . ولی فارسی ها رو عجق وجق نشون میده . به همون utf8 اینگار مربوط میشه . چیکار باید بکنم ؟