PDA

View Full Version : گرفتن متن سایت



aleas2
یک شنبه 19 دی 1389, 13:38 عصر
سلام خسته نباشید کد نویسی اماده برای تمام سایت ها هسته که متن کل چند تا پست اخری بگه چیه؟یا مثلا لینک یه پست رو بهش بدی متن کامل پست بهم بده؟

aleas2
یک شنبه 19 دی 1389, 14:26 عصر
اینی گفتم شدنی هسته؟مثلا میخوام متن این ادرسو بدست بیاره بریزه تو تکست
http://www.irna.ir/HTML/1389/13891019/30177508.htm
همرا با لینک اون عکس؟

hamidhws
دوشنبه 20 دی 1389, 09:30 صبح
اینی گفتم شدنی هسته؟مثلا میخوام متن این ادرسو بدست بیاره بریزه تو تکست
http://www.irna.ir/HTML/1389/13891019/30177508.htm
همرا با لینک اون عکس؟

با سلام
اگه منظورتون سورس سایت هست بله میشه و اگه منظورتون متن نوشته ها (فارسی یا انگلیسی) هست بازم با یکم خورده کاریه بیشتر قابل انجام هست(یادت باشه هیچ چیز نشدنی نیست)

موفق باشید

aleas2
دوشنبه 20 دی 1389, 10:45 صبح
عزیز میدونم هیچ چیز نشدنی نیسته
ولی میگم شاید یه کد اماده برای تمام وب ها باشه مثلا برای rssتمام سایت ها از این کد میشه استفاده کرد

Set rss = CreateObject("msxml2.domdocument")
rss.async = False
rss.Load ("اینجا آدرس rss وارد کنید")
List1.Clear
Me.Refresh
Set myItem = rss.getElementsByTagName("item")

For i = 0 To myItem.length - 1
List1.AddItem myItem(i).getElementsByTagName("link").Item(0).firstChild.nodeValue
Next i
من خودم برای هر سایت با یه کد نویسی مخصوصا همون سایت متن ارسالی رو میگیرم ولی میگم شاید مثل rssکدی باشه که برای تمام وب ها کار کنه

hamidhws
دوشنبه 20 دی 1389, 11:05 صبح
بنده منظورم از طریق winsock بود و شبیه سازی یک مرورگر
این طوری به راحتی میتونید خودتون رو جای هر مرورگری جا بزنید و هر اطلاعاتی خواستید از هر سایتی بگیرید

موفق باشید دوست عزیز

aleas2
دوشنبه 20 دی 1389, 12:02 عصر
خب با همین روشی میگین یکم بیشتر توضیح میدین اخه من باwinsock کار نکردم تا حالا

hamidhws
دوشنبه 20 دی 1389, 12:20 عصر
خب با همین روشی میگین یکم بیشتر توضیح میدین اخه من باwinsock کار نکردم تا حالا
http://barnamenevis.org/showthread.php?2563-%D8%A7%D8%B3%D8%AA%D9%81%D8%A7%D8%AF%D9%87-%D8%A7%D8%B2-%DA%A9%D9%86%D8%AA%D8%B1%D9%84-Winsock

xxxxx_xxxxx
دوشنبه 20 دی 1389, 23:34 عصر
سلام،
دنبال کد آماده نباشید. آستین ها رو بالا بزنید و خودتون دست به کیبورد بشین.

مثل همون کدی که برای RSS استفاده کردید باید با یک آبجکت DOM Document ایجاد کنید و به تجزیه و تحلیل Element های صفحه بپردازید تا متن موردنظر رو بتونید استخراج کنید.

Slytherin
سه شنبه 21 دی 1389, 14:02 عصر
RSS همیشه ساختار یکسانی دارد و به همین دلیل کد آن یکسان هست اما صفحات وب می توانند بی نهایت با هم متفاوت باشند.
همانطوری که دوستان گفتند شما می بایست پس از دریافت سورس صفحه، آن را تجزیه و تحلیل کتید و سپس اطلاعات دلخواه خود را از آن خارج کنید و پس از آن هر طوری که مایلید آن را نمایش دهید.
موفق باشید.

aleas2
سه شنبه 21 دی 1389, 14:53 عصر
دوستان عزیز xxxxx_xxxxx (http://barnamenevis.org/member.php?46030-xxxxx_xxxxx) من قبلا استین هامو بالا زدم و دست به کیبرد هم زدم !!!برنامه شو نوشتم که بتونم متن از سایت دلخوام استخراج کنه و چون از چندسایت دگه هم میخوام متن استخراج کنم اینو پرسیدم گفتم شاید مثل کد rss کدی برای اینکار هم وجود داشته باشه که متن دراورد و شک داشتم و پرسیدن بهتراز نپرسیدنه

reza_program
یک شنبه 17 اردیبهشت 1391, 12:20 عصر
^
سلام
میشه نحوه خوندن متن رو یه مقدار توضیح بدید؟