PDA

View Full Version : خواندن تگ



hamid##
سه شنبه 05 اردیبهشت 1391, 14:50 عصر
سلام دوستان من می خوام آدرس داخل تگ <A> رو داخل فایل html بخونم . می تونید برام راه حل بدید؟

Hamishebahar
سه شنبه 05 اردیبهشت 1391, 15:27 عصر
بنام خدا.
سلام.
اگه میخواهید لینک های یک HTML را دریافت کنید.
از این تابع استفاده کنید:
public List<string> GetThisPageItems(string html)
{
Regex r;
Match m;

r = new Regex("<a href\\s*=\\s*(?:\"(?<1>[^\"]*)\"|(?<1>\\S+))",
RegexOptions.IgnoreCase | RegexOptions.Compiled);
List<string> items = new List<string>();
for (m = r.Match(html); m.Success; m = m.NextMatch())
{
string txt = m.Groups[1].Value;
if (!items.Contains(txt) && (txt.Contains("http://") || txt.Contains("www.")))
items.Add(txt);
}
return items;
}

hamid##
سه شنبه 05 اردیبهشت 1391, 17:55 عصر
خیلی خوب بود کد رو کاملا متوجه شدم اما اگر میشه لطفا namespace مورد استفاده رو بگید. اگر هم ممکنه کد رو توضیح بدید ممنون.

Hamishebahar
چهارشنبه 06 اردیبهشت 1391, 11:38 صبح
بنام خدا.
System.Text.RegularExpressions.Regex
برای مدیریت رشته ها باید از Regax استفاده کنید.
موفق و سربلند باشید در پناه حق.