View Full Version : بدست آوردن دیتا از فایل html
linux
سه شنبه 24 خرداد 1384, 14:49 عصر
روشی هست که اطلاعات که در یک جدول فایل html را بدست آورد
یاشار
سه شنبه 24 خرداد 1384, 18:13 عصر
میتونید از یک کلاس html parser استفاده کنید. اگر نمیخواهید کل صفحه رو تجزیه کنید میتونید از RegularExpression استفاده کنید.
linux
سه شنبه 24 خرداد 1384, 18:30 عصر
ممنون از راهنمایی اگر میشه این کلاسی که می گید و یا هر چیز دیگه یک مثال کوچک بزنید
یاشار
سه شنبه 24 خرداد 1384, 20:21 عصر
مثلا میخواهیم همه تاریخهایی که اول هر پست تو همین صفحه وجود داره رو پیدا کنیم. با یک نگاه به source صفحه متوجه میشیم که این تاریخها بین تگهای span class="postdetails" و span class="gen" قرار دارند. ( عکس پایین ) با فرض اینکه strSource، همون source صفحه html باشه، با استفاده از RegEx میتونیم تمام تاریخها رو استخراج کنیم. ( البته Pattern رو میشه خیلی بهینهتر نوشت ولی این رو سریع نوشتم )
Dim Pattern As String
Pattern = "(?<=<span class=""postdetails"">)" 'look behind
Pattern &= "[^<]+" 'actual value to capture
Pattern &= "(?=<span class=""gen"">)" 'look ahead
Dim RE As New Regex(Pattern, RegexOptions.IgnoreCase Or RegexOptions.Singleline Or RegexOptions.Multiline)
Dim matches As MatchCollection = RE.Matches(strSource)
If matches.Count > 0 Then
For Each m As Match In matches
MsgBox(m.Value)
Next
End If
در مورد کلاسهای Parser هم هر کلاسی طرز استفاده خودش رو داره. باید به Doc خود کلاس مراجعه کنید.
vBulletin® v4.2.5, Copyright ©2000-1403, Jelsoft Enterprises Ltd.