PDA

View Full Version : چگونگی دریافت متن کامل توسط فید خوان شخصی



ایمان اختیاری
یک شنبه 19 آبان 1392, 14:26 عصر
یه فید خوان خیلی ساده دارم می نویسم به مشکل خوردم
بعضی سایت ها هستن خروجی rss که می دن متن کامل خبر توش نیس .. یه خلاصه و عنوان و ایناس ..
چطوری می تونم اون متن کامل خبر رو بکشم بیرون ؟ دو سه جور کد زدم کل صفحه رو داد بهم.. .. فقط اون متن خالی مد نظرمه .
یه چیزی مثل دکمه get full article که توی فید خوان Inoreader هست ...

CannibalCorpse
یک شنبه 19 آبان 1392, 15:05 عصر
من متاسفانه تاحالا ار اس اسی ندیدم که تمام خبر رو بده. معمولا عنوان، خلاصه لینک خبر و تاریخ رو حداکثر میده. فکر نمی کنم منطقی هم به نظر بیاد که یه سایت تمام خبرش رو در اختیار شما قرار بده که شما فید کنی.

ایمان اختیاری
سه شنبه 21 آبان 1392, 08:46 صبح
درست می فرمایید .. تا الان سه جور rss دیدم .. یکی مثلا عصر ایران که هیچ توضیحی نداره ..
یکی هم به خلاصه خبری می ذاره ..
یکی هم مثل وردپرس متن کامل می ده ..

مورد دیگه اینکه دیدم سایت های فیدخوان مثل inoreader از سرویس Readability استفاده می کنن که متن کامل خبر رو می یاره . خواستم منم از همین سرویس استفاده کنم راستش بعد از تعطیل شدن گوگل ریدر و فیلتر شدن خیلی سایت ها وبن شدن ماها تصمیم گرفتم خودم یه همچین چیزی رو بنویسم ..
حالا دنبال راهنمایی می گردم که چطوری کار می کنن..

smksmk
سه شنبه 21 آبان 1392, 10:00 صبح
سلام ، اگر منظورت اینه که توی RSS چیزی ننوشتن که شما بخای بکشی بیرون ولی داخل خود سایت هست میتونی از کلاس DOMDocument استفاده کنی که البته اگه ساختار محتوای سایت منطقی باشه کارت خیلی هم راحت میشه . ساختار منطقی هم که میگم اینه که مثلاً تگ هایی که شما بهش نیاز داری اسم یک کلاس خاص روشون باشه یا آیدی متفاوتی داشته باشن . موفق باشی .

ایمان اختیاری
سه شنبه 21 آبان 1392, 17:44 عصر
متشکرم دوست عزیز از راهنمایی ارزنده تون .. الان داشتم یه سری سایت که قراره دیتا ازشون بگیرم رو نیگا می کردم متاسفانه ساختار استاندارد ندارن ..
بعضیا اومدن متن خبر رو توی تگ <p> گذاشتن.. بعضیا اومدن یه css خاص تعریف کردن توی اون مطلب رو نشون میدن .. اصلا یه آش شله قلمکاریه شده ..
واقعا نمی دونم چیکار کنم. باید برای هر سایت یه سری کد بنویسم ؟ :|

smksmk
سه شنبه 21 آبان 1392, 17:57 عصر
دوست عزیز پاسخ من برای PHP بود ، چون کلاس DOMDOCUMENT از php هست و از این بابت معذرت میخام اصلاً حواسم به ASP نبود . برای ASP من هیچ تخصصی ندارم . امیدوارم دوستان دیگه کمکتون کنن .
اگر هم اینجا به نتیجه نرسیدین به نادیا (http://nadiya.ir) سر بزنید تا با هزینه براتون انجام بدن کسانی که مهارت دارن .

سید علی گتمیری
سه شنبه 21 آبان 1392, 20:22 عصر
دوست گرامی

اگر سایت مورد نظر کل خبر را فید نکرده باشد بنابر این با فیدر قابل خواند نیست، پس شما دو راه دارید. اول لینک سایت مرجع را در انتهای خبر قرار دهید، دوم خبر را از سایت مرجع بخوانید و در سایت خود نشان دهید.
روش دوم در صورتی که سایت مبدا ساختار خود را تغییر دهد قابل استفاده نیست و همچنین ممکن است در صورت خواندن مداوم فایروال سایت شما را بلاک کند.
برای پیاده سازی این روش بهتر است ابتدا صفحات مورد نظر را با Async بصورت پارالل بخوانید سپس متن دریافتی را پارس کنید که من پارسر زیر را پیشنهاد می کنم که از آن استفاده نموده ام و سرعت بالایی دارد :
http://htmlagilitypack.codeplex.com

بلی شما باید به ازای هر سایت کد مربوط به استخراج اخبار را خودتان بنویسید.

در ضمن این پاسخ مربوط به زمانی است که سایت کل خبر را در فیدر خود قرار نمی دهد. اما اگر سایت کل خبر را در فیدر خود دارد و شما قادر به استخراج آن نیستید این مسئله ای دیگر است که کمی عجیب است.
اگر موضوع این است، پیشنهاد می شود سایت مورد نظر را معرفی نمایید تا اینجانب و سایر دوستان نیز بررسی نمایند که مشکل از کجاست.

موفق باشید

ایمان اختیاری
شنبه 25 آبان 1392, 08:04 صبح
با تشکر فراوان از راهنماییتون ..
من توی سرچ هایی که داشتم به یه موردی جالبی برخوردم..
این لینک رو ملاحظه بفرمایید .. ( لینک (http://www.readability.com/read?url=http://www.asriran.com/fa/news/303996/%D8%A7%D9%88%D8%A8%D8%A7%D9%85%D8%A7-%DA%A9%D9%86%DA%AF%D8%B1%D9%87-%D8%AA%D8%AD%D8%B1%DB%8C%D9%85-%D8%AC%D8%AF%DB%8C%D8%AF%DB%8C-%D8%B9%D9%84%DB%8C%D9%87-%D8%A7%DB%8C%D8%B1%D8%A7%D9%86-%D8%A7%D8%B9%D9%85%D8%A7%D9%84-%D9%86%DA%A9%D9%86%D8%AF-%DA%A9%D8%B1%DB%8C-%D8%A8%D8%AE%D8%B4%DB%8C-%D8%A7%D8%B2-45-%D9%85%DB%8C%D9%84%DB%8C%D8%A7%D8%B1%D8%AF-%D8%AF%D9%84%D8%A7%D8%B1-%D9%BE%D9%88%D9%84-%D8%A8%D9%84%D9%88%DA%A9%D9%87-%D8%B4%D8%AF%D9%87-%D8%A7%DB%8C%D8%B1%D8%A7%D9%86-%D8%B1%D8%A7-%D8%A2%D8%B2%D8%A7%D8%AF-%D9%85%DB%8C-%DA%A9%D9%86%DB%8C%D9%85))
یه لینک اون بالا داره نوشته Enjoy this article by switching to Readability view
وقتی روی لینکش کلیک می شه متن خبر رو می یاره ..
خیلی کارش برام جالبه و نمی دونم چطور این کار رو می کنه ... جالبیش اینه با اکثر سایت هایی که می شناسم درست کار می کنه ..