PDA

View Full Version : حرفه ای: ایده در مورد جلوگیری از سرقت اطلاعات نمایش داده شده در صفحه



id1385
دوشنبه 20 شهریور 1391, 00:06 صبح
با سلام
دوستان کمک کنید که چطور میتونم از سرقت اطلاعاتم در صفحه نمایش داده شده بشوم.
چون اطلاعاتی که میخوام بزارم توی سایت برای من و دوستانم هزینه بردار است و نمیخوام که نیم ساعت دیگه از گوکل ایندکسشو باز کنم و توی 100 سایت ببینم.

نشه از روی صفحه یا از سورس صفحه بشه اطلاعات رو استخراج کرد، البته من خودم به flash و عکس کردن تکستها فکر کردم ولی اینا سرعت پردازش و همچنین callback رو ازمون میگیرن و در سرعتهای پایین اصلاً خارج از حوصله است.

منتظر ایده های شما هستیم، با تشــکر.:بوس:

≡ ALEX ≡
دوشنبه 20 شهریور 1391, 00:56 صبح
جلوی Select شدن و کپی کردن مطالب رو میشه با CSS و یا Javascript گرفت. ولی به تنهایی روش های مطمئنی نیستند. چون هر دو قابلیت غیر فعال شدن توسط مرورگر رو دارند. قراردادن تصویر با پس زمینه Transparent بر روی صفحه هم به همین شکل هستش و میشه دورش زد. اگر هم از Obfuscation و Encryption استفاده کنید باز هم راه برای دور زدنش هست هرچند خیلی سخت تر بشه.

به نظر من میتونید به جای متن، تصویر رو به خروجی بفرستید. هر چند شاید سایت تون به درستی در همه مرورگر ها و device ها دیده نشه ولی میتونه جلوی انتشار غیر مجاز رو به شکل بهتری بگیره. کافیه متن رو به شکل تصویر درآورده، یک watermark کم رنگ بصورت تکراری روی آن اجرا کرده و به خروجی بفرستید. در این مورد عملیات Caching و فشرده سازی نیز جهت عدم فشار به سرور و لود سریعتر سایت به کار شما خواهند آمد.

البته در مورد SEO تا جایی که من میدونم چون سایت شما اولین کسی است که مطالب رو منتشر می کند در صورتیکه اقدامات اولیه بهینه سازی SEO بر روی سایت شما انجام گرفته باشد و sitemap شما به فرمت های xml و tar.gz بصورت پیوسته آپدیت شده و در اختیار موتور جستجو قرار گیرد، بصورت خودکار در رتبه بالاتری نسبت به سایرین قرار خواهید گرفت. یک منتشر کننده RSS نیز به این پروسه کمک بیشتری خواهد کرد. همچنین چون معمولا مطلب دزدی توسط ربات از سایت های دیگر انجام می شود می توانید با تنظیم فایل robots.txt و htaccess. جلوی اکثر این ربات ها و Ripper ها رو بگیرید.

ravand
دوشنبه 20 شهریور 1391, 08:01 صبح
همچنین چون معمولا مطلب دزدی توسط ربات از سایت های دیگر انجام می شود می توانید با تنظیم فایل robots.txt و htaccess. جلوی اکثر این ربات ها و Ripper ها رو بگیرید.
چجوری میشه این کار رو کرد؟

≡ ALEX ≡
دوشنبه 20 شهریور 1391, 18:27 عصر
کافیه در فایل robots.txt مقدار User-Agent نرم افزار ها رو پیدا کرده و دسترسی آن ها به تمام Directory ها را ببندید. نمونه ای رو ضمیمه کرده ام برای اکثر نرم افزار های Ripper قالب کار می کند. شما فقط کافیه مقدار User-Agent ربات های مطلب دزد را طبق همین نمونه وارد این فایل کنید تا از ورود و دسترسی آن ها جلوگیری شود.

≡ ALEX ≡
دوشنبه 20 شهریور 1391, 21:53 عصر
هر یک از Request های HTML اطلاعاتی را به سمت سرور ارسال می کنند. یکی از این موارد HTTP_USER_AGENT هستش که درباره کاربر توضیحاتی ارایه می کند. همچون نوع سیستم عامل و مرورگر وب. مثلا من با استفاده از یک کد ساده PHP:


<?php
echo $_SERVER['HTTP_USER_AGENT'];
?>

و تست آن بر روی localhost این مقدار رو پرینت گرفتم:


Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.1 (KHTML, like Gecko) Chrome/21.0.1180.83 Safari/537.1

نرم افزار ها یا همان روبات های وب نیز چنین مقادیری را از خود باقی می گذارند که ما نیز به شناسایی همین مقادیر می توانیم visitor را شناسایی کرده و سطح دسترسی و index کردن وی را مشخص کنیم. مثلا برای ربات گوگل این مقدار برابر GoogleBot هستش که معمولا برای اینکه ربات گوگل صفحات یا Directory های خاصی رو index نکنه از این تنظیمات استفاده می کنیم.

tehro0n
دوشنبه 20 شهریور 1391, 21:58 عصر
کافیه در فایل robots.txt مقدار User-Agent نرم افزار ها رو پیدا کرده و دسترسی آن ها به تمام Directory ها را ببندید. نمونه ای رو ضمیمه کرده ام برای اکثر نرم افزار های Ripper قالب کار می کند. شما فقط کافیه مقدار User-Agent ربات های مطلب دزد را طبق همین نمونه وارد این فایل کنید تا از ورود و دسترسی آن ها جلوگیری شود.

این روش به ربات های خوب اجازه دسترسی نمی ده، اگه ربات به قول شما دزد باشه به این دسترسی ها توجهی نداره، خود گوگل هم برخی جاها با این که بهش اجازه نمی دی باز هم میاد صفحت رو دنبال می کنه ولی شاید تو جستجو هاش نشون نده
پس این روش برای دزدها دزدگیر نیست

≡ ALEX ≡
دوشنبه 20 شهریور 1391, 22:25 عصر
این روش به ربات های خوب اجازه دسترسی نمی ده، اگه ربات به قول شما دزد باشه به این دسترسی ها توجهی نداره، خود گوگل هم برخی جاها با این که بهش اجازه نمی دی باز هم میاد صفحت رو دنبال می کنه ولی شاید تو جستجو هاش نشون نده
پس این روش برای دزدها دزدگیر نیست

شما قبل از اینکه ربات های بد رو Disallow کنید می بایست دستوری برای همه User-Agent ها توسط کاراکتر * تعریف کرده و آن ها رو Allow کنید. در نتیجه همه به غیر از ربات های بد به سایت دسترسی خواهند داشت. ولی در کل راست می گویید، این یک روش جهت جلوگیری از ابزار موجود است و ممکن است یک برنامه نویس ابزاری را با نامی دیگر و یا حتی با تکنیکی دیگر وارد کار کرده و از آن استفاده کند. ولی خوب کمتر چنین چیزی پیش می آید، در ایران عرض می کنم.

ولی همانطور هم که قبلا گفتم، بهترین راه همان خروجی تصویری مطالب به همراه استفاده از تکنیک های دیگر مخصوصا تکنیک های چند تکه کردن تصاویر و نیز Encryption کدهای سمت کاربر در سطح نرمال است. فقط اشاره کنم که عکس ها رو میشه به چندین تکه تقسیم کرد و در خروجی کنار هم قرار داد تا یک تصویر به نظر برسند. من روشی را به موازات این روش طراحی کرده بودم که بجای کنار هم گذاشتن تصاویر، آن ها را روی هم میچیدیم تا یک تصویر واحد بدست آید. مثلا 50 یا 100 تا تصویر هم سایز داریم که همه آن به غیر از بخشی بصورت Transparent است و تنها چند پیکسل رندوم از تصویر اصلی در آن جاسازی شده و مجموعه این تصاویر تصویر اصلی ما را تشکیل می دهند.

ایده ها و تکنیک های زیادی رو میشه به کار گرفت، بحث این است که آیا ارزشش را دارد؟!

id1385
دوشنبه 20 شهریور 1391, 22:43 عصر
با تشکر از همه ی دوستان
دوستان مشکل من روباتها نیستن چون مشکلی با ایندکس شدن اطلاعات ندارم فقط میخوام کسی نتونه اطلاعات رو کپی کنه، دوست عزیزمون هم که گفته عکس کم رنگ بزار این عملو با div هم میشه انجام داد ولی چون نیاز به select شدن المنتهای صفحه است این کار هم نمیشه، بغیر flash و عکس روش بهتری که مثل خروجی html باشه میخوام :-؟

با تشکر از همه ی عزیزان

tehro0n
دوشنبه 20 شهریور 1391, 22:58 عصر
شما قبل از اینکه ربات های بد رو Disallow کنید می بایست دستوری برای همه User-Agent ها توسط کاراکتر * تعریف کرده و آن ها رو Allow کنید.

من کلا در مورد robots.txt عرض کردم، این فایل فقط یک پیشنهاد است و بایدی وجود نداره، مثل زمانی که در صفحه noindex و nofollow می دهیم، تمامی این ها فقط یک پیشنهاد هستند و روبات ها و .. می تونن این ها رو نادیده بگیرند و تو برنامه خودشون هیچ شرطی برای ادامه ندادن نگذارند!

tehro0n
دوشنبه 20 شهریور 1391, 23:06 عصر
با تشکر از همه ی دوستان
دوستان مشکل من روباتها نیستن چون مشکلی با ایندکس شدن اطلاعات ندارم فقط میخوام کسی نتونه اطلاعات رو کپی کنه، دوست عزیزمون هم که گفته عکس کم رنگ بزار این عملو با div هم میشه انجام داد ولی چون نیاز به select شدن المنتهای صفحه است این کار هم نمیشه، بغیر flash و عکس روش بهتری که مثل خروجی html باشه میخوام :-؟

با تشکر از همه ی عزیزان

فایل های فلش که کلا هیچی، البته اگه به سئو و مرورگرهای همه کاربرات اهمیت می دی
عکس و غیره هم هیچی :لبخند:

شما تنها کار برای کاربران معمولی سلکت و راست کلیک رو قفل کن، فکر کنم jQuery شو دیده بودم که خوب جی کوئری برای همه مرورگرهاست
کار دیگه ای نمی تونی بکنی و برای کسانی هم که بخوان این اطلاعاتت برداشته میشه، نمونه سادش صفحت رو ذخیره می کنه و فایل جاواتو حذف، حالا راحت مطالبت کپی میشه :تشویق:

در هر حال شما هرکاری بکنی برای کسی که واقعا به مطالبت نیاز داشته شدنیه، خوندن صفحت برای کاربرای عادی که همون کار اسپایدر رو می کنه ممکنه، و غیره..
ولش کن بگذار همه استفاده کنند :بامزه:

تشکر یادت نره این همه کمکت کردم!

رضا قربانی
دوشنبه 20 شهریور 1391, 23:43 عصر
pdf
====================
عزیز من هیچ راهی وجود نداره که مطالب بسیار زیبا و ارزنده شما که خیلی هم مهم هستن دزدی نشه.

شما هیچ کاره ای - انقدر دنبال چاره نگرد و عمرت رو حروم نکن
(دنبال چاره باش که مطالب سایتت اولین رکورد جستجوگر باشه ، اصلا بذار همه کپی کنن)
نمونه اش سایت نارنجی و ...
موفق باشید

tehro0n
سه شنبه 21 شهریور 1391, 00:03 صبح
الان فقط من اولش رو نفهمیدم که pdf راه حل بود یا نه؟
چون pdf اگه سلکت رو قفل کنی که به درد سئو باز نمی خوره و همون اول هم گفتم بستگی داره که به سئو اهمیت میدی یا نه!

≡ ALEX ≡
سه شنبه 21 شهریور 1391, 00:11 صبح
با تشکر از همه ی دوستان
دوستان مشکل من روباتها نیستن چون مشکلی با ایندکس شدن اطلاعات ندارم فقط میخوام کسی نتونه اطلاعات رو کپی کنه، دوست عزیزمون هم که گفته عکس کم رنگ بزار این عملو با div هم میشه انجام داد ولی چون نیاز به select شدن المنتهای صفحه است این کار هم نمیشه، بغیر flash و عکس روش بهتری که مثل خروجی html باشه میخوام :-؟

با تشکر از همه ی عزیزان

علاوه بر این میتونید از CSS یا JS هم استفاده کنید. من CSS رو پیشنهاد می کنم. ولی به این معنی نیست که غیر قابل دور زدن هستش! اتفاقا به راحتی دور زده میشه. استایل مربوطه خدمت شما:

.disabled-text-select {
-webkit-user-select: none;
-khtml-user-select: none;
-moz-user-select: none;
-ms-user-select: none;
-o-user-select: none;
user-select: none;
}



من کلا در مورد robots.txt عرض کردم، این فایل فقط یک پیشنهاد است و بایدی وجود نداره، مثل زمانی که در صفحه noindex و nofollow می دهیم، تمامی این ها فقط یک پیشنهاد هستند و روبات ها و .. می تونن این ها رو نادیده بگیرند و تو برنامه خودشون هیچ شرطی برای ادامه ندادن نگذارند!

بله، در جریان هستم. همانطور هم که قبلا عرض کردم من از این روش در جلوگیری از RiP شدن وبسایت هام توسط نرم افزار های معروف Ripper و کپی قالب، جلوگیری کرده ام. شاید به خاطر استفاده این نرم افزار ها از هسته مرورگر IE برای انجام کارهاشون باشه.

≡ ALEX ≡
سه شنبه 21 شهریور 1391, 00:24 صبح
راستی، ابزاری هست که به کمک آن میتونید بهترین روش های موجود رو برای حفاظت از وبسایت تون در برابر کپی شدن انجام بدهید: HTMLGuard (http://www.htmlguard.com/)

ابزار دیگری هست که امتحان خودش رو نزد من پس داده و چند بار برای پروژه هام از اون استفاده کرده ام. کار شما رو هم راه می اندازه ولی اصل کارش در رابطه با عدم کپی شدن قالب وبسایت هست: HTMLProtector (http://www.antssoft.com/htmlprotector/index.htm)

≡ ALEX ≡
سه شنبه 21 شهریور 1391, 00:29 صبح
الآن داشتم ورژن جدید HTMLGuard رو بررسی می کردم، چیز بسیار خوب و مناسبی هستش. امکان کپی شدن وبسایت تون رو به نزدیک صفر می رسونه. هر چند هنوز صفر نیست! :چشمک: