PDA

View Full Version : چطور متن یک وب سایت را در نرم افزار نمایش بدم؟



asefy2008
دوشنبه 25 آذر 1392, 15:05 عصر
سلام دوستان می خواستم بدونم چطور می تونم متن یک وب سایت را در نرم افزار نمایش بدم؟(مثل سایت های خبری و ویکی و ....)
می دونم میشه از قابلیت rss استفاده کرد اما برای سایت هایی که این قابلیت رو ندارن چه باید کرد؟
می خوام تنها متن نوشته مورد نظر در برنامه نمایش داده بشه.

ممنون

abbasalim
دوشنبه 25 آذر 1392, 19:45 عصر
خب کار راحت اینه rss ریدر رو سایتت نصب کنی :شیطان:

rubiks.kde
دوشنبه 25 آذر 1392, 23:28 عصر
یه کار راحت تر هم میشه کرد توی برنامه تنها یک وب ویو بزارید و سایت رو نمایش بدید.

asefy2008
سه شنبه 26 آذر 1392, 01:11 صبح
یه کار راحت تر هم میشه کرد توی برنامه تنها یک وب ویو بزارید و سایت رو نمایش بدید.
ممنون از راهنماییتون
من سایت رو نمی خوام نمایش بدم می خوام تنها متنش به عبارتی به هیچ وجه نباید سایت مشخص باشه تنها اون متنی که تو سایت مورد نظر هست رو می خوام جدا کنم و نمایش بدم. حالا موندم چه کنم!!

rubiks.kde
سه شنبه 26 آذر 1392, 01:28 صبح
ممنون از راهنماییتون
من سایت رو نمی خوام نمایش بدم می خوام تنها متنش به عبارتی به هیچ وجه نباید سایت مشخص باشه تنها اون متنی که تو سایت مورد نظر هست رو می خوام جدا کنم و نمایش بدم. حالا موندم چه کنم!!

سایت واسه خودتونه یا نه؟اگه آره که به پیشنهاد دوستمون rss درست کنید یا خودتون api براش بنویسید.

asefy2008
سه شنبه 26 آذر 1392, 01:49 صبح
سایت واسه خودتونه یا نه؟اگه آره که به پیشنهاد دوستمون rss درست کنید یا خودتون api براش بنویسید.
نه برای خودم نیست. سایت ها مختلف هستن مثلا یک بار ویکی یه بار یه سایت خبری و به همین ترتیب و همچنین سایت ها کاملا انگلیسی هست.
من خودم راه حلی به ذهنم نرسید به همین خاطر این سوال اینجا گذاشتم ببینم نظر دوستان چیه.
شاید بشه از هوش مصنوعی کمک گرفت ولی حالا چطور نمی دونم.

hamedjj
سه شنبه 26 آذر 1392, 02:06 صبح
یه با یه برنامه تو github دیده بودم که با استفاده از RSS جدید ترین اخبار بی بی سی و CNET و... را درون برنامه قرار می داد
دقیقا به همین شکلی که میگی بود و فقط متن با عنوان را نشان می داد
فکر کنم تنها راهش همین RSS باشه

فکر کنم RSS Reader تو github سرچ کنی پیدا کنی

asefy2008
سه شنبه 26 آذر 1392, 02:27 صبح
یه با یه برنامه تو github دیده بودم که با استفاده از RSS جدید ترین اخبار بی بی سی و CNET و... را درون برنامه قرار می داد
دقیقا به همین شکلی که میگی بود و فقط متن با عنوان را نشان می داد
فکر کنم تنها راهش همین RSS باشه

فکر کنم RSS Reader تو github سرچ کنی پیدا کنی
درسته من هم تقزیبا می خوام یه همچین کاری بکنم ولی برای سایتهای مثل ویکی یا سایتهایی که rss ندارن باید چه کنم؟
ایده ای به ذهنتون میرسه؟

rubiks.kde
سه شنبه 26 آذر 1392, 02:36 صبح
یه با یه برنامه تو github دیده بودم که با استفاده از RSS جدید ترین اخبار بی بی سی و CNET و... را درون برنامه قرار می داد
دقیقا به همین شکلی که میگی بود و فقط متن با عنوان را نشان می داد
فکر کنم تنها راهش همین RSS باشه

فکر کنم RSS Reader تو github سرچ کنی پیدا کنی

دوست عزیز شما از rss reader زمانی میتونی استفاده کنی که rss اون سایتها رو داشته باشی حالا اومدیم و این سایتهایی که مد نظر دوستمونه rss نداشت اون وقت چی؟
والا پایه خیلی از برنامه ها به این صورته.


نه برای خودم نیست. سایت ها مختلف هستن مثلا یک بار ویکی یه بار یه سایت خبری و به همین ترتیب و همچنین سایت ها کاملا انگلیسی هست.
من خودم خیلی وقت پیش چنین برنامه نوشتم که میومد قیمت یه سری از کالا ها رو از یه سری سایت که مشخص کرده بودم نمایش میداد.ولی برای این کار اومدم با php یه اسکریپت نوشتم که اون سایتها رو میرفت اطلاعات رو باتوجه به الگویی که داده بودم تجزیه میکرد و بعد به برنامه میفرستاد.
این روش دو مشکل داشت یکی اینکه با زیاد شدن کاربرام میزان پردازش روی سرورم خیلی زیاد شده بود و دوم اینکه بعضی از این سایت ها به دلیل درخواست خیلی زیاد از طرف سرور من ؛ آی پی من رو بلاک کرده بودن

smemamian
سه شنبه 26 آذر 1392, 08:18 صبح
html صفحه سایت رو parse کنید. کار براتون سخت میشه و اگه در قالب شخص تغییری انجام بشه برنامتون با مشکل روبرو میشه !

asefy2008
سه شنبه 26 آذر 1392, 13:47 عصر
html صفحه سایت رو parse کنید. کار براتون سخت میشه و اگه در قالب شخص تغییری انجام بشه برنامتون با مشکل روبرو میشه !
مورد دوستمون که گفتن اسکریپت بنویسم رو می فرمایید سخت میشه و به مشکل می خوره؟
در مورد html فکر کنم منظورتون این هست که یک شبهه کامپایلر بنویسم، درسته؟

asefy2008
جمعه 06 دی 1392, 16:04 عصر
دوستان یکی بهم گفت کار crawler یا خزشگر همین هست. کسی در این مورد میدونه؟

asefy2008
شنبه 07 دی 1392, 13:39 عصر
The actual content extraction is a whole different topic. a crawler is used to jump from page to page using the URL-structure of pages

payamsp
یک شنبه 08 دی 1392, 21:37 عصر
کار یکم مشکله اما با regex هم می تونید این کار رو بکنید ...