PDA

View Full Version : آیا این آدرس یک صفحه ی اینترنتی است؟



هانی هاشمی
دوشنبه 21 خرداد 1386, 00:01 صبح
سلام به همه دوستان:لبخندساده:

من چند تا آدرس اینترنتی دارم به صورت زیر:
www.barnamenevis.org/index.php
www.barnamenevis.org/forum/data/program.exe
و ....

حالا می خوام بفهمم کدومشون یک صفحه ی اینترنتی هستش و کدومشون بقیه چیزا (عکس و فایل اگزه و ...)

یه راهی به ذهنم رسید برای انجام این کار اونم اینکه پسوند هاشون رو چک کنم و با پسوند های صفحات اینترنتی مقایسشون کنم اما تو این کار یه مشکلی هستش . اونم اینه که یه عالمه پسوند صفحه ی اینترنتی داریم به این آدرس که آقا ی hisitech (http://www.barnamenevis.org/forum/member.php?u=24326) بهم دادن یه نگاه بندازین:
http://www.fileinfo.net/filetypes/web

تابعی برای این کار هستش؟؟؟
شما چه راهی رو پیشنهاد می کنید؟؟؟؟

پیشاپیش ممنونم :لبخندساده:

oxygenws
دوشنبه 21 خرداد 1386, 08:17 صبح
هیچ راهی وجود نداره!!!! یعنی به هر حال هر کاری بکنی ممکنه آدرس باشه و ممکنه نباشه!!
دقیقا بگو برای چه کاری می خوای، شاید بشه کمکت کرد.

musiox
دوشنبه 21 خرداد 1386, 17:21 عصر
خب یه صفحه با پسوند php می تونه هر فایلی باشه .

Keramatifar
دوشنبه 21 خرداد 1386, 17:31 عصر
سلام به همه دوستان:لبخندساده:

پسوند صفحه ی اینترنتی داریم به این آدرس که آقا ی hisitech (http://www.barnamenevis.org/forum/member.php?u=24326) بهم دادن یه نگاه بندازین:
http://www.fileinfo.net/filetypes/web
پیشاپیش ممنونم :لبخندساده:

تازه این صفحه ناقص است و کلی پسوند ها رو هم نداره مثال ashx و ...

piter1355
دوشنبه 21 خرداد 1386, 21:05 عصر
و حتی خیلی از url ها به نام سایت ختم میشه .(دیگه نام و پسوندی قابل شناسایی نیست)

شاید خواندن هدر فایل مشکل رو حل کنه

jhoseinii
دوشنبه 21 خرداد 1386, 21:05 عصر
فکر میکنم، اگه بتونی هدر خروجی url رو در بیاری، بشه فهمید که این خروجی text/plain یا html/plain یا ...

هانی هاشمی
دوشنبه 21 خرداد 1386, 22:31 عصر
دقیقا بگو برای چه کاری می خوای، شاید بشه کمکت کرد.

راسیتش دارم یه موتور جستجو می نویسم . الان به مرحله ای رسیدم که باید آدرس های صفحات وب رو از فایل ها و عکس ها و ... جدا کنم .


شاید خواندن هدر فایل مشکل رو حل کنه


فکر میکنم، اگه بتونی هدر خروجی url رو در بیاری، بشه فهمید که این خروجی text/plain یا html/plain یا ...

منظورتون از هدر چیه ؟؟؟
یعنی ادرس مورد نظر رو باز کنم و بگرم توش ببینم از کلمه ی html استفاده شده یا نه؟؟

بیشتر توضیح بدین مممنونم

musiox
سه شنبه 22 خرداد 1386, 04:22 صبح
از این استفاده کن حله .

$url = 'http://www.barnamenevis.org/forum/data/program.exe';

print_r(get_headers($url,1));

بعد ازگرفتن این اطلاعات و فهمیدی که یه صفحه وبه می تونی متا ها شو بگیری .

array get_meta_tags ( string filename [, bool use_include_path] )

oxygenws
سه شنبه 22 خرداد 1386, 10:16 صبح
راسیتش دارم یه موتور جستجو می نویسم . الان به مرحله ای رسیدم که باید آدرس های صفحات وب رو از فایل ها و عکس ها و ... جدا کنم
برای کار دانشگاهی می خوای یا پروژه تجاری؟!
اگر کار دانشگاهی می خوای خوب روش موسیوکس خوبه... و گر نه، بهتره بی خیال بشی و با این اطلاعاتی که داری نمی تونی چیز خوبی درست کنی.

musiox
سه شنبه 22 خرداد 1386, 10:34 صبح
با php , کراولر نمی نویسن . php بدرد نمایش اطلاعات می خوره . کار جمع آوری اطلاعات با اپلیکیشن های دیگست .

هانی هاشمی
سه شنبه 22 خرداد 1386, 17:10 عصر
با php , کراولر نمی نویسن . php بدرد نمایش اطلاعات می خوره . کار جمع آوری اطلاعات با اپلیکیشن های دیگست .با چه اپلیکیشنی می نویسن؟؟

musiox
چهارشنبه 23 خرداد 1386, 18:46 عصر
والا من در مورد این جور چیزا که در مورد موتور جستجو هستش زیاد اطلاعات ندارم ولی توی همین سایت سرچ کنی کلی بحث در موردش میتونی پیدا کنی ولی من فکر کنم که سیستمش این جوریه که یه برنامه , جستجو گرا رو کنترل می کنه و جستجو گرا هم دنبال url ها می رن و اطلاعات مورد نظر را جمع آوری می کنند و در پایگاه ثبت میکنند . از این طرف هم نمایش اطلاعات جمع آوری شده . اون بخش نمایش اطلاعات با زبونی مثله php هستش . این زبونا زبونایی هستن که تا وقتی که درخواستی بهشون ندن عکس العمل ندارن . مثلا وقتی شما درخواست رو به سرور ارسال می کنید در مورد دیدن یه صفحه ای که قبلا برنامشو نوشتید و رو سرور گذاشتید , اون برنامه اجرا می شه و در صوزت دیگه ای نمی تونه اجرا بشه . ولی یه برنامه رو تو ویندوز در نظر بگیر , وقتی که به اینترنت وصل می شی اگه در حال اجرا باشه , ممکنه که به اینترنت وصل بشه و خودکار آپدیت بشه . در مورد برنامه های کاربردی ( اپلیکیشن ها ) , اینطوری . نمی دونم شاید این اطلاعاتی که من دارم غلط باشه و یا توضحاتم اشتباه باشه بهر حا ببخشید . اون اپلیکیشن ها رو هم می تونی با cpp یا csharp و یا زبونهایی که در vs.net هستن بنویسی ویا ... .

MAiLDEREMi
پنج شنبه 24 خرداد 1386, 08:03 صبح
با سلام

فکر میکنم، اگه بتونی هدر خروجی url رو در بیاری، بشه فهمید که این خروجی text/plain یا html/plain یا ...

فکر نمی کنم این کار بتونه درست جواب بده چون هدر همه فایلها رو نمی تونه بخونه ضمنان نقص هایی در وب وجود داره نمونه ای از اونا اشکال در خواندن ساختار فایلی PNG و ... (دلیل اول)

برای نمونه در صورتی که بعد از هدر فایل PNG به صورت دستی ما یک Script به زبان HTML یا JS بذاریم وب اون فایل PNG رو به صورت یک صفحه HTML نشون میده.

یه چیز دیگه هم هست:
نمی دونم با C99 کار کردید یا نه اما این رو بگم که این امکان وجود داره که درون یک فایل PHP یا ASP یا ... سورس فایل با صورت Hex قرار داده شود و بعد درون خود صفحه از این فایلها استفاده شود. (این هم دلیل دوم)

oxygenws
پنج شنبه 24 خرداد 1386, 11:33 صبح
فکر نمی کنم این کار بتونه درست جواب بده چون هدر همه فایلها رو نمی تونه بخونه ضمنان نقص هایی در وب وجود داره نمونه ای از اونا اشکال در خواندن ساختار فایلی PNG و ... (دلیل اول)
اشتباه می کنی، با هدر می شه اطلاعاتی به دست آورد.

برنامه C99 هم فقط در شرایط مناسب می تونه کارش رو انجام بده... این قضیه ربطی به پروتکل های اینترنتی و هدر نداره و این قضایا استاندارد نیست.

jhoseinii
پنج شنبه 24 خرداد 1386, 14:07 عصر
موافقم
به هر حال، فکر نمیکنم چاره ی دیگه ای باشه
چون اگه بخاید به چند کارکت رآخر url حساس بشید نمیتونید روی خروجی فایل هایی مثل asp php aspx cfm .. درست تصمیم بگیرید

musiox
دوشنبه 11 تیر 1386, 22:26 عصر
نمی دونم به دردت می خوره یا نه .

mmehdyt
سه شنبه 12 تیر 1386, 16:22 عصر
شما آدرس ها رو بذار توی url اگه خواست داونلود بشه صفحه ی وب نیست و اگه صفحه ای باز شد اون آدرس صفحه ی اینترنتی هست!

ealvandi
سه شنبه 12 تیر 1386, 22:24 عصر
شما آدرس ها رو بذار توی url اگه خواست داونلود بشه صفحه ی وب نیست و اگه صفحه ای باز شد اون آدرس صفحه ی اینترنتی هست!


روش خوبی نیست ؛ مثلا در فایلهای pdf چه کار میکنی ؟
اگه DAP رو دستگاه نصب بود چی ؟

armin390
جمعه 15 تیر 1386, 23:04 عصر
دوستان اگه یک مقدار در مورد وب بیشتر مطالعه داشته باشند همچین بحث هایی(سوال و جواب!!) هرگز نمی شه...
در انجمن قبلاً بحث شده...

likable6
دوشنبه 18 تیر 1386, 02:27 صبح
سلام
من تو hotscripts یه چند تا وب کراولر و جستجو گر لینک و موتور جستجو .. قبلا دیده ام بهتره یکی از اونا رو بگیرید ببینید اونا چیکار کردن
موفق باشید