PDA

View Full Version : استخراج url توسط RegularExpressions



debugger
چهارشنبه 26 خرداد 1389, 22:10 عصر
سلام به تمامی دوستان عزیزم

من میخوام ادرس زیر را توی سورس یک وب سایت پیدا کنم



id="imgcodepage" src="http://www.nice.com/public/public/html/imagecode.php?str=46eecec0247feb30f393815a0416fbe5 e6e7cd78____lbpivvr35"


حالا اومدم regex زیر را براش نوشتم




id="imgcodepage" src="(http|https)://([\w-]+\.)+[\w-]+(/[\w- ./?%&=]*)?



این الگویی که نوشتم در نرم افزار EditPad Pro کاملا درست جواب میده و کاملا درست هم پیدا می کنه (راهنمایی بوسیله این نرم افزار می توانید الگوهایی را که نوشتین تست کنید ببینید جواب میده یا نه)


ولی تو کد نویسی ویژوال استدیو به w ها گیر میده و زیرش خط قرمز میکشه


کد را بدین صورت نوشتم




Regex urlRegex = new Regex("id=\"imgcodepage\" src=\"(http|https)://([\w-]+\.)+[\w-]+(/[\w- ./?%&=]*)?", RegexOptions.IgnoreCase);




لطفا کمک کنید که این RegularExpressions روی اعصابم داره راه میره




بی نهایت سپاس

Sajjad.Aghapour
چهارشنبه 26 خرداد 1389, 23:27 عصر
خوب شما اعصابت رو خورد نکن.فقط یه @ قبل از Pattern بذار درست میشه...

debugger
پنج شنبه 27 خرداد 1389, 08:50 صبح
دوست عزیز قبلا @ هم گذاشتم ولی جواب نداده . اگر میشه خودتون هم یک تست بکنید

اینم عکسش

http://img16.img98.com/out.php/i94165_help.jpg

وقتی @ را بر میدارم به صورت زیر میشه

http://img16.img98.com/out.php/i94171_help2.jpg

Sajjad.Aghapour
پنج شنبه 27 خرداد 1389, 11:02 صبح
کافیه کاراکترهای Literal رو در یک رشته ignore کنید....


Regex r = new Regex("id=\"imgcodepage\" src=\"(http|https)://([\\w-]+\\.)+[\\w-]+(/[\\w- ./?%&=]*)?");