View Full Version : سوال: گرفتن سورس یک سایت در متغیر رشته ای
zh00bin
دوشنبه 25 فروردین 1393, 23:20 عصر
سلام دوستان
پروژه هوش مصنوعی ام و طراحی یه سرچ انجین ساده برداشتم
روی انتخاب زبان برنامه نویسی مناسب زیاد فکر کردم ابتدا می خواستم C# باشه واسه سادگی کار ولی فک کردم ممکنه در اینده بخوام این پروژه را توسعه بدم و روی وب قرار بدم به همین خاطر فکر کردم واسه بهینه کردن این سرچ انجین بیام سراغ زبان c ++ . حالا یه سوال داشتم اون هم اینکه چطوری میتونم سورس یه صفحه را بگیرم و در یک متغیر رشته ای ذخیره کنم. پیشاپیش از راهنمایی های دوستان تشکر میکنم.
ali chegini
سه شنبه 26 فروردین 1393, 21:37 عصر
سلام.
ببخشید شما می خواید موتور جست و جو رو برای وب بنویسید ؟
اگه برای وب هست بهتر نیست با php بنویسید.
با php :
$homepage = file_get_contents('http://www.google.com/');
echo $homepage;
echo htmlentities($homepage);
zh00bin
چهارشنبه 27 فروردین 1393, 20:06 عصر
سلام.
ببخشید شما می خواید موتور جست و جو رو برای وب بنویسید ؟
اگه برای وب هست بهتر نیست با php بنویسید.
با php :
$homepage = file_get_contents('http://www.google.com/');
echo $homepage;
echo htmlentities($homepage);
سلام دوست عزیز
با php هم میشه ولی دنبال این بودم که با سی بنویسم اطلاعات روی یه پایگاه داده ذخیره میشه و قسمت مربوط به سرچ حالا پی اچ پی یا اس پی هستش. دلیل انتخاب سی هم سرعت بالای اونه
یکی از مشکلات دیگه اینه که اسپایدر و ایندکسر موتور جستوجو باید به صورت یه ترد دائما در حال اجرا باشه حالا نمیدونم میشه این کار و با پی اچ پی انجام داد یا نه چون معمولا وقتی یه دستور پی اچ پی به اجرا درمیاد که توسط کاربر فراخوانی بشه
ali chegini
پنج شنبه 28 فروردین 1393, 11:46 صبح
php هم چند نخی داره اینو ببین :
http://www.php.net/manual/en/class.thread.php
برای گرفتن سورس سایت با c++ باید سوکت نویسی انجام بدی اینو ببین.
http://www.codeproject.com/Articles/13071/Programming-Windows-TCP-Sockets-in-C-for-the-Begin
به نظرم شما تو طراحی سرچ انجین بهتره مسائل مهمتر رو حل کنید بعد یه سری ورودی بهش میدید و تست میکنید.
منظورم از مسائل مهمتر : نحوه ذخیره سازی ورودی در پایگاه داده.- حدس زدن لغات - رفع اشتباهات در کلمات و ...
vBulletin® v4.2.5, Copyright ©2000-1404, Jelsoft Enterprises Ltd.