PDA

View Full Version : استفاده از محتوا سایت ها



Hamed Beyranvand
سه شنبه 04 شهریور 1393, 15:59 عصر
سلام دوستان.یه سایت درج آگهی و مقاله و اخبار طراحی کردم که چند وقتیه فکرم مشغول اینه که محتوا رو از کجا بیارم برای شروع(با ذکر منبع).یه سری سایت های پربازدید هستن که می خوام مطالب از اونجا بکشم،نکته قابل توجه اینه که خود این سایت ها بیشتر محتوا رو از یه جای دیگه اوردن.مثلا اگهی رو از همشهری اخبار رو از سایت های خبری مثل ایرنا،خبرگزاری فارس و...،نکته مهمتر اینه که مطالب این سایت ها رتبه بالاتری نسبت به منبع اصلی محتوا دارن:متعجب:!!!این سایت ها دقیقا چطوری مطالب رو می کشن میارن تو سایت خودشون و چطوری گوگل متوجه تکراری بودن این مطالب نمیشه:متفکر:!!!لطفا اگه کسی اطلاعات کافی داره کمک کنه
یه نگاه به این صفحه بندازین.اینجا (http://www.aftabir.com/advertising/job.php).هرکجا منبع همشهری زده یه کلیک کنید.بسیار ممنون:لبخندساده:

Mohammadsgh
سه شنبه 04 شهریور 1393, 18:48 عصر
با curl و rss میتونید این کار رو انجام بدید.این سایت ها با خزنده هم دادها رو میکشن هم زمان کشیدن دادها اون ها رو فیلتر میکنن:لبخندساده:

Hamed Beyranvand
سه شنبه 04 شهریور 1393, 20:28 عصر
اگه ممکنه یکم بیشتر توضیح بدین.خیلی سرچ زدم در مورد این موضوع ولی چیزی پیدا نکردم.curl وقتی ادرس مشخصی نداریم چطوری می تونه داده ها بکشه؟؟؟ممکنه ما در هر صفحه به انتخاب چندتا از اخبار رو بکشیم،این کار چطوری صورت می گیره؟و منظورتون از فیلتر داده ها چیه؟؟؟لطفا بیشتر توضیح بدین

مهرداد سیف زاده
سه شنبه 04 شهریور 1393, 21:50 عصر
curl یکم کثسف کاری هست. ولی اصل کار رو باید با rss و api انجام داد
rss سایتهای خبری براحتی قابل استفاده هست. در واقع rss همون xml هست که میتونید براحتی آدرس xml رو میگیرید و با ماژولهای پارس کردن rss داده رو برمیدارید و وارد سایت خودتون میکنید. برای پارس کردن rss در php از ماژول زیر استفاده کنید
simplepie.org
در مورد نیازمندیهای همشهری این سایت هیچ خروجی نمیده و شاید سایتهای مثل آفتاب ازش api گرفتن. شما برای این کار باهاشون تماس بگیرید و بگید قصد نشون داده آگهی‌های نیازمندیها در سایت خودتون رو دارید.
در مورد رتبه بالای این گونه سایتها مشکل از خود گوگل هست که نمیتونه در زبان فارسی صفحات کاذب رو شناسایی کنه. والا انصافه هم سخته. شما فرض کن خبر در سایت خبری نوشته فیلم معراجی‌ها با اولین هفته اکران فلان مقدار فروش داشته حالا سایتهای کاذب همین خبر رو با اضافه کردن تگهای دانلود معراجی‌ها,دانلود معراجی با کیفیتhd, دانلود dvd معراجی ها و خلاصه چیزهای دیگه. افراد هم قاعدتا در اینترنت دنبال دانلود این فیلم هستن که خب انقدر جستجو کردن و روی اولین لینکهای کاذب کلیک کردن باعث بالا رفتن رتبه شدن
البته بیشتر سایتهای خبری فعلی از یک کیلومتری seo هم ردن نشدن. مثلا شما لینک نشون دادن یک خبر روی در بیشتر سایتهای خبری بررسی کنید میبینید که به هیچ وجه از نظر seo بهینه نیست.

Hamed Beyranvand
سه شنبه 04 شهریور 1393, 22:27 عصر
بسیار بسیار ممنون.کامل کامل بود توضیح شما.اگه با simplepie ادرس rss رو بهش بدم میره همه اخبار رو میکشه!!حالا چطوری اون دسته از اخباری رو که می خوامو بکشم بیارم تو بانک؟؟همون فیلتر کردن میشه فکر کنم!!

مهرداد سیف زاده
سه شنبه 04 شهریور 1393, 22:35 عصر
مثلا لینک زیر لیست rssهای سایت خبرآنلاین هست
http://khabaronline.ir/page/rss
حالا شما فقط خبرهای اقتصادی رو لازم دارید پس لینک زیر رو وردارید
http://khabaronline.ir/RSS/Service/economy
البته بعضی از سایتها هم بصورت کلی میدن که باید ببینید هر کدوم از attributeهای اون چه داده ای داره مثلا امکان داره بجای گروه بندی خبر همه رو یهو بهتون بده که باید توی داده ها بگردید و خوب پارس کنید.

Hamed Beyranvand
سه شنبه 04 شهریور 1393, 22:41 عصر
دقیقا مشکل همون دسته بندی عناوین و انتخاب عناوین مورد نظر!!مثلا توی لینک rss بالا من اگه بخوام دوتا از اخبار رو به انتخاب نمایش بدم باید اطلاعات رو بیارم ذخیره کنم بعد خودم به صورت دستی محتوا رو edit کنم؟؟؟؟

مهرداد سیف زاده
سه شنبه 04 شهریور 1393, 22:51 عصر
در مورد تغییر محتوا بله راهی جز اسن ندارید مثلا میتونید خودکار محتوا رو بگیرید توی دیتابیس ذخیره کیند و بعد توی پنل ادمین ببینید چه چیزی لازم دارید و تغییرات رو انجام بدید و بزارید روی سایت

Hamed Beyranvand
سه شنبه 04 شهریور 1393, 22:57 عصر
یه سوال دیگه و سوال اخر.بعد از همه این کارا هر کدوم از این صفحات که قرار به نمایش دراد در تگ متا nofolow بزارم یا به نظر شما امنه؟؟امنه یعنی گوگل محتوا تکراری در نظر نگیره هرچه زحمت کشیدم نقش برآب شه؟؟؟
و این ارجاع (http://www.aftabir.com/advertising/external.php?url=http://www.rahnama.com/cat/index/aid/3136657/%D9%86%D8%A8%D8%B1%D8%AF%D8%B4%D9%85%D8%A7%D9%84%D B%8C---%D8%AE%DB%8C%D8%A7%D8%A8%D8%A7%D9%86-%D9%86%D8%A8%DB%8C-%D8%A7%DA%A9%D8%B1%D9%85) 301 یا 302 برای فرار از دست گوگله یا خود سایت rahnama مجبور به این کارش کرده؟؟؟اینم گذاشته کنار تگa rel="nofollow noindex"

Hamed Beyranvand
چهارشنبه 05 شهریور 1393, 15:09 عصر
if ($feed->data)
{
// display the title
echo '<h1>' .
'<a href="' . $feed->get_feed_link() . '">' .
$feed->get_feed_title() .
'</a>' .
'</h1>';

// display a maximum of 5 feed items
$max = $feed->get_item_quantity(100);
for ($x=0; $x<$max; $x++)
{
$item = $feed->get_item($x);

// display feed link and title
echo '<h2>' .
'<a href="' . $item->get_permalink() . '">' .
$item->get_title() .
'</a>' .
'</h2>';
// display feed description
echo '<p>' . $item->get_description() . '</p>';

}
}

کد بالا فقط میره هرچیزی که در rrs وجود داره میکشه میاره(در rss فقط یه سری عنوان و لینکن) در صورتی که قاعدتا باید محتوا اون title که در rss هستنو بکشه.اینم هرچی میگردم چه simplepie و چه curl فقط محتوا یه لینک رو میکشن.اینجارو چیکار کنم؟؟

مهرداد سیف زاده
چهارشنبه 05 شهریور 1393, 15:37 عصر
rss فقط مقداری که درون همون فایل xml هست رو میکشه و نه چیز بیشتر. بعضی سایتها هیچ چیزی نمیدن بجز یک title خالی ولی بعضی ها هم داده کامل میدن. شما هم بدنبال منابعی بگردید که کامل باشن و کار شما رو راه بندازه. سایت زیاده بگردید rss رو که مدنظرتون هست رو پیدا میکنید

Hamed Beyranvand
چهارشنبه 05 شهریور 1393, 15:44 عصر
ببینید الان این لینک (http://www.aftabir.com/articles/view/social/family_home/c4_1409122274p1.php/%D8%AF%D8%B9%D9%88%D8%A7%D9%87%D8%A7%DB%8C-%D8%B2%D9%86-%D9%88-%D8%B4%D9%88%D9%87%D8%B1%DB%8C-%DA%A9%D8%A7%D8%B1-%D8%A7%D8%B2-%DA%A9%D8%AC%D8%A7-%D8%AE%D8%B1%D8%A7%D8%A8-%D8%B4%D8%AF) دقیقا محتواشو از اینجا (http://sara.jamejamonline.ir/NewsPreview/1621908186403764505) اورده و اینم لینک rss (http://www.jamejamonline.ir/rssfeed?code=01-07-260) و رتبشم بالاتره از خود منبع اصلی.پس بنا به چیزی که شما فرمودین سایت افتاب محتوا رو به صورت دستی کپی کرده؟؟؟چون rrs سایت جام جم فقط لینکن.هیچ راهی نداره دیگه؟؟؟