PDA

View Full Version : بدست آوردن دیتا از فایل html



linux
سه شنبه 24 خرداد 1384, 13:49 عصر
روشی هست که اطلاعات که در یک جدول فایل html را بدست آورد

یاشار
سه شنبه 24 خرداد 1384, 17:13 عصر
می‌تونید از یک کلاس html parser استفاده کنید. اگر نمیخواهید کل صفحه رو تجزیه کنید می‌تونید از RegularExpression استفاده کنید.

linux
سه شنبه 24 خرداد 1384, 17:30 عصر
ممنون از راهنمایی اگر میشه این کلاسی که می گید و یا هر چیز دیگه یک مثال کوچک بزنید

یاشار
سه شنبه 24 خرداد 1384, 19:21 عصر
مثلا می‌خواهیم همه تاریخ‌هایی که اول هر پست تو همین صفحه وجود داره رو پیدا کنیم. با یک نگاه به source صفحه متوجه می‌شیم که این تاریخ‌ها بین تگهای span class="postdetails" و span class="gen" قرار دارند. ( عکس پایین ) با فرض اینکه strSource، همون source صفحه html باشه، با استفاده از RegEx می‌تونیم تمام تاریخ‌ها رو استخراج کنیم. ( البته Pattern رو می‌شه خیلی بهینه‌تر نوشت ولی این رو سریع نوشتم )


Dim Pattern As String

Pattern = "(?<=<span class=""postdetails"">)" 'look behind
Pattern &= "[^<]+" 'actual value to capture
Pattern &= "(?=<span class=""gen"">)" 'look ahead

Dim RE As New Regex(Pattern, RegexOptions.IgnoreCase Or RegexOptions.Singleline Or RegexOptions.Multiline)

Dim matches As MatchCollection = RE.Matches(strSource)

If matches.Count > 0 Then
For Each m As Match In matches
MsgBox(m.Value)

Next
End If


در مورد کلاس‌های Parser هم هر کلاسی طرز استفاده خودش رو داره. باید به Doc خود کلاس مراجعه کنید.