PDA

View Full Version : استخراج ایمیل از سایت به شیوه نوین



maxtools
یک شنبه 25 خرداد 1393, 14:05 عصر
سلام

.... اول سورس سایت مورد نظر رو بدست میاریم
.... بعد از استخراج سورس و درج سورس در تکس باکس حالا روش استخراج که بعد از جستجو بیشتر به این روش توجه شده بود که بیاد : مثلا

Mailto:Test@gmail.com

از mailto تا بستن تگ > استخراج کنه این روش به نظر من مشکل بزرگی داره چون بیشتر کسایی که ایمیلشون رو میزارن از تگ استفاده نمی کنن فقط ایمیل رو میزنن توی سایت Test@gmail.com

روشی که بدون این که از دستور HTML استفاده بشه استخراج کنه ؟

ایلیا آخوندزاده
یک شنبه 25 خرداد 1393, 14:30 عصر
منظورتون رو واضح تر بیان کنید.

maxtools
یک شنبه 25 خرداد 1393, 15:11 عصر
منظورتون رو واضح تر بیان کنید.

ببینید یک سایت داریم که ایمیلش رو به صورت لینک قرار نمیده میخوایم اون رو توی سورس سایتش پیدا کنیم به چه طریق ؟؟؟

از طریق لینک راحته چون ایمیل رو از طریق تگ های اچ تی ام ال میتونیم پیدا کنیم اما اگر به صورت لینک نگذاشته باشه سخته !! مثلا فقط آدرس ایمیلش test @gmail.com قرار داده به این روش نذاشته


<a href="mailto:test@gmail.com">Email</a>

Dr Saeed
دوشنبه 26 خرداد 1393, 14:11 عصر
ببینید یک سایت داریم که ایمیلش رو به صورت لینک قرار نمیده میخوایم اون رو توی سورس سایتش پیدا کنیم به چه طریق ؟؟؟

از طریق لینک راحته چون ایمیل رو از طریق تگ های اچ تی ام ال میتونیم پیدا کنیم اما اگر به صورت لینک نگذاشته باشه سخته !! مثلا فقط آدرس ایمیلش test @gmail.com قرار داده به این روش نذاشته


<a href="mailto:test@gmail.com">Email</a>


صفحه رو با webbrowser باز کن بعد این کد رو روی دکمت بنویس یه لیست باکسم بزار

Dim link As Object
For Each link In WebBrowser1.Document.All.tags("a")
If link.href Like "*@gmail.com" Then
List1.AddItem link.href
End If
Next

محمد فدوی
دوشنبه 26 خرداد 1393, 16:22 عصر
برای چک کردن الگوی ایمیل از RegExp استفاده کن (هرچند Regex استانداردی برای ایمیل وجود نداره ولی اینی که من نوشتم فکر کنم تاحدود زیادی خطا رو کم کنه):

Dim rex As New RegExp
rex.Pattern = "[A-Z0-9._%+-:]+@[A-Z0-9.-]+\.[A-Z]{2,4}"


''' For Each ...


If rex.Test(link.href) Then
''' Add to your Listbox
End If


''' Next


ویرایش: قصدت رو از پروژت نمیدونم ولی به نظرم شاید بعضیا ایمیلشون رو حتی بصورت لینک اصلا وارد نکنن. یه نفر مثل من که اینجوری ایمیل بنویسه هم پیدا میشه:
Something@Somewhere.com

به نظرم اگه کل Web Page رو چک کنی با تمام متنش نتایج بیشتری به دست میاری.

موفق باشی.

maxtools
دوشنبه 26 خرداد 1393, 18:11 عصر
برای چک کردن الگوی ایمیل از RegExp استفاده کن (هرچند Regex استانداردی برای ایمیل وجود نداره ولی اینی که من نوشتم فکر کنم تاحدود زیادی خطا رو کم کنه):

Dim rex As New RegExp
rex.Pattern = "[A-Z0-9._%+-:]+@[A-Z0-9.-]+\.[A-Z]{2,4}"


''' For Each ...


If rex.Test(link.href) Then
''' Add to your Listbox
End If


''' Next


ویرایش: قصدت رو از پروژت نمیدونم ولی به نظرم شاید بعضیا ایمیلشون رو حتی بصورت لینک اصلا وارد نکنن. یه نفر مثل من که اینجوری ایمیل بنویسه هم پیدا میشه:
Something@Somewhere.com

به نظرم اگه کل Web Page رو چک کنی با تمام متنش نتایج بیشتری به دست میاری.

موفق باشی.

سلام و عرض ادب

ایمیل رو فقط از طریق کد های که توی تکس باکس هست جستجو کنه ... نه تو وب بروزر .....
اگر ممکنه سورسش رو قرار بدید یک دنیا ممنونتون می شم