صفحه 1 از 6 123 ... آخرآخر
نمایش نتایج 1 تا 40 از 203

نام تاپیک: فراخوان ایجاد یک موتور جستجوی داخلی

  1. #1

    فراخوان ایجاد یک موتور جستجوی داخلی

    با درود و احترام فراوان
    دوستان عزیز و گرامی بنده قصد دارم برنامه نویسی یک موتور جستجوی کاملا اختصاصی رو شروع کنم
    ممکنه در اوایل خیلی پیشرفته نباشه و ... اما مطمئننا در ادامه مطمئناحرفی برای گفتن خواهیم داشت
    از اونجایی که موتور جستجو نیازمند تفکرات دست جمعی و برنامه نویسی چند گانه هست بنده از دوستانی که واقعا تحت وب مسلط هستن به برنامه نویسی و دوست دارن در این ضمینه به بنده کمک کنن و درنهایت در لیست سازندگان این موتورجستجو قرار بگیرن میتونن از طریق خصوصی با من در ارتباط باشن تا راه های ارتباطی رو شرح بدم براشون
    دوستان اینو هم بگم که هرکس میخواد کمک کنه باید بدون هیچ چشم داشتی بیاد جلو چون بنده بودجه ای ندارم و یک کار دولتی هم نیست که بخوام حقوق بدم یا بدن
    بهرحال مطمئنا در آینده خیلی خوب میشه برای ما(سازندگانش)

    منتظرم دوستان نظراتشونو بگن و از طریق خصوصی درارتباط باشن
    درضمن اینو هم بگم که تاحالا تمام موتور های جستجوی ایرانی که فقط اسمشون ایرانیه نتایجشونو از یاهو بینگ و گوگل دریافت میکنن و به هیچ عنوان اختصاصی نیستن
    پس بیاید یه موتورجستجوگر قدرتمند ایرانی اختصاصی بنویسیم
    به امید دیدار
    یا حق

  2. #2
    کاربر دائمی
    تاریخ عضویت
    آبان 1388
    محل زندگی
    کرج
    پست
    321

    نقل قول: فراخوان ایجاد یک موتور جستجوی داخلی

    فکر قشنگیه.قبل از شروع کار یه نگاه به جیبت بنداز.از روی تجربه عرض کردم.

  3. #3
    کاربر دائمی آواتار ravand
    تاریخ عضویت
    اردیبهشت 1389
    محل زندگی
    راوند کاشان
    پست
    3,378

    نقل قول: فراخوان ایجاد یک موتور جستجوی داخلی

    شما که میخوای یه موتور جستجوگر بومی بسازی این همه اطلاعات رو میخوای کجا ذخیره کنی؟ کلی هزینه ی هاستش هست! چقدر میخوای هزینه کنی؟ هر روز خدا باید فضای هاست رو ، پهنای باند رو باید افزایش بدی.

  4. #4

    نقل قول: فراخوان ایجاد یک موتور جستجوی داخلی

    از لحاظ سرور مشکلی نیست خیالتون راحت
    دوستان خوشحال میشم پیشنهاداتتونو میشنوم

  5. #5
    کاربر دائمی آواتار ravand
    تاریخ عضویت
    اردیبهشت 1389
    محل زندگی
    راوند کاشان
    پست
    3,378

    نقل قول: فراخوان ایجاد یک موتور جستجوی داخلی

    من همیشه دوست داشتم یه موتور جستجوگر بسازم که فقط دارای مطالب آموزشی و بدرد بخور باشه. الان این توی گوگل وقتی جستجو میکنی به جای مثلا اموزش به مطالب تبلیغاتی برخورد میکنی. برای همین میگم اطلاعات سایت هایی که توی موتور جستجوگر شما قراره ثبت بشه خودتون تایید کنید بهتره. نمیدونم شایدم کار سختی و وقت گیری باشه. ولی حالا هر چی هست باید مطالب سایت هایی که مطلب درست و حسابی ندارن و تبلیغاتی هستن حذف بشه.

  6. #6

    نقل قول: فراخوان ایجاد یک موتور جستجوی داخلی

    میشه امکان Report کردن لینکهای تبلیغاتی و... رو به سیستم اضافه کرد.

  7. #7

    نقل قول: فراخوان ایجاد یک موتور جستجوی داخلی

    باید یک سیستم رتبه بندی سایت ها داشته باشید و در ابتدای کار خوتون به سایت های معروف رتبه بدید بعد هم با توجه به کلیک ها و موارد دیگه رتبه بندی رو آپدیت کنید

  8. #8

    نقل قول: فراخوان ایجاد یک موتور جستجوی داخلی

    درحال حاظر اصلی ترین مشکل بنده خزنده ی موتور جستجو هست که سایت هارو پیدا کنه و وارد دیتابیس کنه و آپدیت سایت هایی که وارد دیتابیس شده !

  9. #9

    نقل قول: فراخوان ایجاد یک موتور جستجوی داخلی

    ایده ای داری در این مورد؟

  10. #10

    نقل قول: فراخوان ایجاد یک موتور جستجوی داخلی

    به نظر من ساخت موتور جستجوگر با وجود سرمایه کار عقلانی ای نیست ، چه برسه بدون داشتن سرمایه !

    قصد نا امید کردنتون رو ندارم ، برای رسیدن به امکانات پایه موتورهای جستجوگر چند سال زمان میبره (اونم هم در صورتی که تیم مجرب و سرمایه کافی داشته باشی)

    از نظر تئوری شاید ساختن موتور جستجوگر کار دشواری نباشه ، مبنای همه موتورهای جستجوگر اینه که یک خزنده میره بین سایت های میچرخه اطلاعات سایت ها رو تو یک دیتابس ذخیره میکنه و بعد به کاربرها این امکان رو میده که بین اون داده های جستجو کنن.

    اما در عمل مشکلات زیادی وجود داره ، چطور سایت های رو به اساس ارتباط شون به موضوع نمایش بدیم ، چطور محتوای مرتبط رو نشون بدیم ، چطور سایت های اسپمر رو شناسایی کنیم (کاری که هنوز گوگل هم تو سایت های فارسی نتونسته انجام بده / یا اصلا نخواسته :دی) ، چطور مفهوم یک مطلب رو درک نه و.... حالا مشکلاتی مثل مدیریت داده های با حجم بالا و سرعت جستجو و.. نگفتم.

  11. #11

    نقل قول: فراخوان ایجاد یک موتور جستجوی داخلی

    خب دوست عزیز
    تمام اینهایی که گفتید رو گوگل یه شبه که انجام نداده
    25 سال طول کشیده
    منم نمیخوام یک شبه انجام بدم
    هنگامی که گوگل تشکیل شد حتی دیتابیس نداشت و اطلاعات روی هارد سیستم خودشون ذخیره میشد !
    بهرحال من فقط میخوام برای ایران کاری کرده باشم

    در مورد خزنده هم باید بگم تا حالا تونستم چیزی بنویسم
    که بهش یک ادرس بدی اون خزنده بره به اون اردس و تمام لینک هایی که تو تمام صفحاتش هست رو لیست میکنه + تایتل و کلمه کلیدی و توضیحات + لینک های سایت های دیگری که توی اون سایت وجود داشت + تایتیل و توضیحات و کلمه های کلیدی رو پیدا میکنه و وارد دیتابیس میکنه
    باید حدودا بگم خزنده ش داره به یه جاهایی میرسه
    اما در مورد اینکه چطور این همه سایت آپدیت بشه و یا اینکه برای اینکه این خزنده کار کنه نیازه تا یک ادرس بهش داده بشه ولی تعداد محدودی صفحه از اون ادرس میتونه وارد دیتابیسش کنه
    اما من میخوام طوری باشه که تمام سایت ها رو جستجو کنه اون خزنده

    بازم میگم مشکل اساسی من یکی خزنده ش هست که باز یکم انجامش دادم و اینکه سایت هایی که وارد دیتابیس شده چطور دوباره محتویاتش آپدیت بشه

  12. #12
    محروم شده
    تاریخ عضویت
    مرداد 1393
    پست
    219

    نقل قول: فراخوان ایجاد یک موتور جستجوی داخلی

    نقل قول نوشته شده توسط sourceweb مشاهده تاپیک
    خب دوست عزیز
    تمام اینهایی که گفتید رو گوگل یه شبه که انجام نداده
    25 سال طول کشیده
    منم نمیخوام یک شبه انجام بدم
    هنگامی که گوگل تشکیل شد حتی دیتابیس نداشت و اطلاعات روی هارد سیستم خودشون ذخیره میشد !
    بهرحال من فقط میخوام برای ایران کاری کرده باشم

    در مورد خزنده هم باید بگم تا حالا تونستم چیزی بنویسم
    که بهش یک ادرس بدی اون خزنده بره به اون اردس و تمام لینک هایی که تو تمام صفحاتش هست رو لیست میکنه + تایتل و کلمه کلیدی و توضیحات + لینک های سایت های دیگری که توی اون سایت وجود داشت + تایتیل و توضیحات و کلمه های کلیدی رو پیدا میکنه و وارد دیتابیس میکنه
    باید حدودا بگم خزنده ش داره به یه جاهایی میرسه
    اما در مورد اینکه چطور این همه سایت آپدیت بشه و یا اینکه برای اینکه این خزنده کار کنه نیازه تا یک ادرس بهش داده بشه ولی تعداد محدودی صفحه از اون ادرس میتونه وارد دیتابیسش کنه
    اما من میخوام طوری باشه که تمام سایت ها رو جستجو کنه اون خزنده

    بازم میگم مشکل اساسی من یکی خزنده ش هست که باز یکم انجامش دادم و اینکه سایت هایی که وارد دیتابیس شده چطور دوباره محتویاتش آپدیت بشه
    سلام
    سایت ها توی دیتابیس ثبت میشن با یه cron job میشه هر روز یه بار چک کرد اونارو و اگه مطلب جدیدی داشتن (بر اساس پارامترهایی مثله عنوان و...) اضافه بشه و در صورت تغییر در صفحات موجود اونها آپدیت بشه.
    الان گوگل بیشتر از heading ها استفاده میکنه. تگ هایی مثله session و nav و footer و header هم تشخیص میده که چه قسمتی از سایت هست.
    در کل موفق باشید :)

  13. #13

    نقل قول: فراخوان ایجاد یک موتور جستجوی داخلی

    موتور جستجو های باز متن هم هستن. می تونید سورس اونها رو ببینید، از اونها ایده بگیرید یا بهترشون کنید

  14. #14

    نقل قول: فراخوان ایجاد یک موتور جستجوی داخلی

    نقل قول نوشته شده توسط n0o0b_sina مشاهده تاپیک
    سلام
    سایت ها توی دیتابیس ثبت میشن با یه cron job میشه هر روز یه بار چک کرد اونارو و اگه مطلب جدیدی داشتن (بر اساس پارامترهایی مثله عنوان و...) اضافه بشه و در صورت تغییر در صفحات موجود اونها آپدیت بشه.
    الان گوگل بیشتر از heading ها استفاده میکنه. تگ هایی مثله session و nav و footer و header هم تشخیص میده که چه قسمتی از سایت هست.
    در کل موفق باشید :)
    خب منم همینکارو با کرون جاب میخواستم انجام بدم اما حساب کردم اگر 1 ملیون صفحه وجود داشته باشه و کمترین حالت کرون جاب یک دقیقه هست یعنی در رروز 1440 سایت رو میتونه آپدیت کنه یعنی برای 1 ملیون صفحه حدودا 900 روز طول میکشه آپدیت بشه درحالی که حدودا در ایران تنها 12 ملیون صفحه وجود داره


    دوست عزیزی ک گفتن موتور های سورس باز رو نگاه کن نگاه کردم اونها بسیار ساده بودن

  15. #15
    کاربر دائمی آواتار leaping
    تاریخ عضویت
    آذر 1391
    محل زندگی
    تهران از سنندج
    پست
    480

    نقل قول: فراخوان ایجاد یک موتور جستجوی داخلی

    دوستان در اینجا که از وب سایتهای تبلغایت و مطالب نامرتبط گله میکردن توی گوگل باید بهشون بگم احتمالا فقط توی گوگل از جست و جو استفاده میکنید.در حالی که گوگل تنظیمات بسیار زیادی برای حذف این وب سایتها , ست کردن رده بندی , جست و جو بر اساس رتبه وب سایت , جست و جو بر اساس بازده وب سایت و همه اینهارو داره کافیه یک gmail داشته باشید و این تنظیمات رو شخصی سازی کنید.
    به نظرم وقتی چیزی به اسم گوگل هست اینکارها فقط وقت تلف کردنه
    مگر اینکه بازهم دنبال سناریوی بزرگ توطئه جهانی و جاسوسی و هزارتا چیز دیگه تو ذهن عزیزان باشه , حتی در این مورد هم باز ترجیح میدم از گوگل استفاده کنم.
    به جای این کارها به نظرم بشیینید و به یک ایده بهتر فکر کنید خیلی بهتر میتونه باشه به ملت هم میشه خدمت کرد.

  16. #16
    محروم شده
    تاریخ عضویت
    مرداد 1393
    پست
    219

    نقل قول: فراخوان ایجاد یک موتور جستجوی داخلی

    فکر نمیکنم اینطوری باشه، cron job که میاد صفحه رو میبینه 1 میلیون رکور هیچ 1 میلیاردم باشه تموم میکنه میره دیگ!

  17. #17

    نقل قول: فراخوان ایجاد یک موتور جستجوی داخلی

    نقل قول نوشته شده توسط n0o0b_sina مشاهده تاپیک
    فکر نمیکنم اینطوری باشه، cron job که میاد صفحه رو میبینه 1 میلیون رکور هیچ 1 میلیاردم باشه تموم میکنه میره دیگ!
    نمیشه که همه سایت ها با یک بار بازدید همه سایت هارو آپدیت کنه !
    باید قطعه قطعه بشه سایت ها
    مثلا دفعه ای 100 تا سایت در حالی که هر سایت رو آپدیت میکنه باز اگر لینک جدیدی داشت اضاف کنه به دیتابیس !

  18. #18
    [younes]
    مهمان

    نقل قول: فراخوان ایجاد یک موتور جستجوی داخلی

    به نظر من این کار برای استفاده واقعی و گسترده بی نتیجه است اما به عنوان یک پروژه تحقیقی/مطالعاتی شخصی ایده جالبی به نظر میاد.

  19. #19

    نقل قول: فراخوان ایجاد یک موتور جستجوی داخلی

    تصویر از خزنده ای که نوشتم ! (کامل نیست)

  20. #20

    نقل قول: فراخوان ایجاد یک موتور جستجوی داخلی

    خوب مگه نمیشه چندتا خزنده داشت؟ برای جلو گیری از تداخل و اینکه یک سایت دوبار چک نشه هم بر یه اساسی مثلا حروف الفبا یا حوزه کاری یا اینکه وبلاگ هستن یا سایت اونهارو محدود کرد.

  21. #21
    کاربر تازه وارد
    تاریخ عضویت
    بهمن 1389
    محل زندگی
    بیرجند
    پست
    52

    نقل قول: فراخوان ایجاد یک موتور جستجوی داخلی

    نقل قول نوشته شده توسط sourceweb مشاهده تاپیک
    با درود و احترام فراوان
    دوستان عزیز و گرامی بنده قصد دارم برنامه نویسی یک موتور جستجوی کاملا اختصاصی رو شروع کنم
    ممکنه در اوایل خیلی پیشرفته نباشه و ... اما مطمئننا در ادامه مطمئناحرفی برای گفتن خواهیم داشت
    از اونجایی که موتور جستجو نیازمند تفکرات دست جمعی و برنامه نویسی چند گانه هست بنده از دوستانی که واقعا تحت وب مسلط هستن به برنامه نویسی و دوست دارن در این ضمینه به بنده کمک کنن و درنهایت در لیست سازندگان این موتورجستجو قرار بگیرن میتونن از طریق خصوصی با من در ارتباط باشن تا راه های ارتباطی رو شرح بدم براشون
    دوستان اینو هم بگم که هرکس میخواد کمک کنه باید بدون هیچ چشم داشتی بیاد جلو چون بنده بودجه ای ندارم و یک کار دولتی هم نیست که بخوام حقوق بدم یا بدن
    بهرحال مطمئنا در آینده خیلی خوب میشه برای ما(سازندگانش)

    منتظرم دوستان نظراتشونو بگن و از طریق خصوصی درارتباط باشن
    درضمن اینو هم بگم که تاحالا تمام موتور های جستجوی ایرانی که فقط اسمشون ایرانیه نتایجشونو از یاهو بینگ و گوگل دریافت میکنن و به هیچ عنوان اختصاصی نیستن
    پس بیاید یه موتورجستجوگر قدرتمند ایرانی اختصاصی بنویسیم
    به امید دیدار
    یا حق
    .سلام
    یه زمانی من هم یه همچین کاری می خواستم بکنم حتی پروژه پایانی دانشگاهم همین موتورهای جستجو بود. حیف که وقت ندارم وگر نه کمکت می کردم. مشکل اینه که تو کشور ما به این جور کارها بها داده نمی شه و کسی حاضر نیست از این جور طرح ها حمایت مالی کنه !

  22. #22
    محروم شده
    تاریخ عضویت
    مرداد 1393
    پست
    219

    نقل قول: فراخوان ایجاد یک موتور جستجوی داخلی

    نقل قول نوشته شده توسط sourceweb مشاهده تاپیک
    نمیشه که همه سایت ها با یک بار بازدید همه سایت هارو آپدیت کنه !
    باید قطعه قطعه بشه سایت ها
    مثلا دفعه ای 100 تا سایت در حالی که هر سایت رو آپدیت میکنه باز اگر لینک جدیدی داشت اضاف کنه به دیتابیس !
    چرا نمیشه؟ شما امتحان کن میشه! شما هر روز ساعته 3 شب cron job رو فعال کنید تا صبح همرو تموم میکنه مطمئن باشید!!! توی اول کار که تعداد سایت ها زیاد نیست هم که خیلی زودتر تموم میشه!
    به نظرم از زبانی مثله C++‎ استفاده کنید سیستم خیلی سریعتر میشه ولی خب سخت ترم میشه، به نظرم میاد اگه به سطح وبسایت های جهانی هم وارد بشید php یکم کند تر عمل کنه (دوستان تجربه نداشتم فقط احتمال میدم چون C++‎ بیش از 10 برابر سریعتر از php هست)
    متاسفانه سرم فعلا خیلی شلوغه واگرنه به خاطر تجربش هم شده بهتون ملحق میشدم

  23. #23

    نقل قول: فراخوان ایجاد یک موتور جستجوی داخلی

    نقل قول نوشته شده توسط n0o0b_sina مشاهده تاپیک
    چرا نمیشه؟ شما امتحان کن میشه! شما هر روز ساعته 3 شب cron job رو فعال کنید تا صبح همرو تموم میکنه مطمئن باشید!!! توی اول کار که تعداد سایت ها زیاد نیست هم که خیلی زودتر تموم میشه!
    به نظرم از زبانی مثله C++‎‎ استفاده کنید سیستم خیلی سریعتر میشه ولی خب سخت ترم میشه، به نظرم میاد اگه به سطح وبسایت های جهانی هم وارد بشید php یکم کند تر عمل کنه (دوستان تجربه نداشتم فقط احتمال میدم چون C++‎‎ بیش از 10 برابر سریعتر از php هست)
    متاسفانه سرم فعلا خیلی شلوغه واگرنه به خاطر تجربش هم شده بهتون ملحق میشدم
    البته از یک نظر حرف شما صحیحه چون از سمت سرور اجرا میشه و سرعت سرور خیلی بالاست و ممکنه تمام سایت هارو آپدیت کنه
    پس تنها باید کوئری نوشته بشه که تمام سایت هارو سلکت کنه از دیتابیس و یک حلقه ایجاد کنه داخلشون و یکی یکی بره داخل سایت تایتل و غیره رو آپدیت کنه و بره سایت بعدی


    خب بعد چجوری متوقت بشه؟

  24. #24
    محروم شده
    تاریخ عضویت
    مرداد 1393
    پست
    219

    نقل قول: فراخوان ایجاد یک موتور جستجوی داخلی

    نقل قول نوشته شده توسط sourceweb مشاهده تاپیک
    البته از یک نظر حرف شما صحیحه چون از سمت سرور اجرا میشه و سرعت سرور خیلی بالاست و ممکنه تمام سایت هارو آپدیت کنه
    پس تنها باید کوئری نوشته بشه که تمام سایت هارو سلکت کنه از دیتابیس و یک حلقه ایجاد کنه داخلشون و یکی یکی بره داخل سایت تایتل و غیره رو آپدیت کنه و بره سایت بعدی


    خب بعد چجوری متوقت بشه؟
    php خودش معمولا بعد از 30 ثانیه متوقف میکنه اسکریپت رو، چون ما نیازی به توقف نداریم و سرورمون هم حتما یه سرور اختصاصی قدرتمنده که کم نمیاره، پس میزاریم همینجوری به کارش ادامه بده :)

  25. #25

    نقل قول: فراخوان ایجاد یک موتور جستجوی داخلی

    من همین خزنده ای که دیدین رو به انتهاش یک کد اضاف کردم که همین چیزایی ک اکو میکنه رو سیو کنه تو یه فایل متنی
    بعد بهش ادرس آپارات رو دادم و گزاشتمش تو کرون جاب
    اما عمل نکرد حتی 30 دقیقه بعدشم نگاه کردم فایل وجود نداشت
    احتمالا کرون جاب فقط چند ثانیه در اون صفحه میمونه و بعدش به عبارتی اون کرون جاب بسته میشه

  26. #26
    محروم شده
    تاریخ عضویت
    مرداد 1393
    پست
    219

    نقل قول: فراخوان ایجاد یک موتور جستجوی داخلی

    نقل قول نوشته شده توسط sourceweb مشاهده تاپیک
    من همین خزنده ای که دیدین رو به انتهاش یک کد اضاف کردم که همین چیزایی ک اکو میکنه رو سیو کنه تو یه فایل متنی
    بعد بهش ادرس آپارات رو دادم و گزاشتمش تو کرون جاب
    اما عمل نکرد حتی 30 دقیقه بعدشم نگاه کردم فایل وجود نداشت
    احتمالا کرون جاب فقط چند ثانیه در اون صفحه میمونه و بعدش به عبارتی اون کرون جاب بسته میشه
    فکر نمیکنم اینجوری باشه من چند تا سایت خبر خوان که نوشتم توی هیچ کدوم همچین مشکلی نداشتم و به خوبی کار میکرد!

  27. #27

    نقل قول: فراخوان ایجاد یک موتور جستجوی داخلی

    خب شما اینو هم د ر نظر بگیر که در این فایل اگر 1000 تا لینک وجود داشته باشه که اپارات سایت بزرگیه و همچین چیزی غیر ممکن نیست اگر حساب کنیم 1000 تا لینک داشته باشه و این بخواد 1000 صفحه رو باز کنه و تایتل و توضیحاتو .... رو برداره امکانش هست که نتونه انجام بده

  28. #28

    نقل قول: فراخوان ایجاد یک موتور جستجوی داخلی


  29. #29
    محروم شده
    تاریخ عضویت
    مرداد 1393
    پست
    219

    نقل قول: فراخوان ایجاد یک موتور جستجوی داخلی

    نقل قول نوشته شده توسط sourceweb مشاهده تاپیک
    خب شما اینو هم د ر نظر بگیر که در این فایل اگر 1000 تا لینک وجود داشته باشه که اپارات سایت بزرگیه و همچین چیزی غیر ممکن نیست اگر حساب کنیم 1000 تا لینک داشته باشه و این بخواد 1000 صفحه رو باز کنه و تایتل و توضیحاتو .... رو برداره امکانش هست که نتونه انجام بده
    چرا نتونه؟

  30. #30

    نقل قول: فراخوان ایجاد یک موتور جستجوی داخلی

    نقل قول نوشته شده توسط n0o0b_sina مشاهده تاپیک
    چرا نتونه؟
    اگر صفحه 10 دیقه طول بکشه تا کامل لینک ها و صفحات ایندکس بشه
    بازم کرون جاب میتونه اینکارو کنه؟

  31. #31
    محروم شده
    تاریخ عضویت
    مرداد 1393
    پست
    219

    نقل قول: فراخوان ایجاد یک موتور جستجوی داخلی

    نقل قول نوشته شده توسط sourceweb مشاهده تاپیک
    اگر صفحه 10 دیقه طول بکشه تا کامل لینک ها و صفحات ایندکس بشه
    بازم کرون جاب میتونه اینکارو کنه؟
    هر صفحه 10 دقیقه؟ :دی چه خبره برادر؟ ولی اگه 10 دقیقه هم باشه بله میتونه. سرعته سرور خیلی بیشتر از سرعته ماست ها

  32. #32

    نقل قول: فراخوان ایجاد یک موتور جستجوی داخلی

    تست کردم نمیتونه انجام بده
    به این نتیجه رسیدم با این خزنده همه لینکای یک سایت توی همه صفحاتش (فقط لینک هاش) رو ثبت کنم تو دیتابیس و با یک خزنده دیگه سایت هایی ک ثبت شده رو هر دقیقه 10 تا سایت رو آپدیت کنم
    اینطوری احتمالا عملی بشه

  33. #33
    کاربر تازه وارد
    تاریخ عضویت
    بهمن 1389
    محل زندگی
    بیرجند
    پست
    52

    نقل قول: فراخوان ایجاد یک موتور جستجوی داخلی

    .چون حجم دیتاها زیاده باید کار به صورت موازی توسط چند سرور انجام بشه . می تونی از فناوری نگاشت کاهش یا همون map - reduce استفاده کنی ابزارهای خوبی مثل hadoop هم تو این زمینه هستن.
    http://hadoop.apache.org/

  34. #34
    کاربر تازه وارد
    تاریخ عضویت
    بهمن 1389
    محل زندگی
    بیرجند
    پست
    52

    نقل قول: فراخوان ایجاد یک موتور جستجوی داخلی

    .به نظرم تو شروع کار رو مسائل فنی وقت نذار چون اگه از نظر سخت افزار مورد نیاز مشکل نداشته باشی این مسائل قابل حل شدن هستن! بهتره رو الگوریتم های مورد نیاز و شیوه پیاده سازی وقت بذاری مثلا هوش مصنوعی سیستم ، شیوه رتبه بندی ، زبان شناسی ، شیوه ذخیره سازی تا هم حجم دیتابیس زیاد نشه هم سرعت استخراج از دیتابیس بالا بره و ...
    آخرین ویرایش به وسیله mhf693 : سه شنبه 12 اسفند 1393 در 19:46 عصر

  35. #35
    کاربر تازه وارد
    تاریخ عضویت
    بهمن 1389
    محل زندگی
    بیرجند
    پست
    52

    نقل قول: فراخوان ایجاد یک موتور جستجوی داخلی

    نقل قول نوشته شده توسط sourceweb مشاهده تاپیک
    اینکه سایت هایی که وارد دیتابیس شده چطور دوباره محتویاتش آپدیت بشه
    .لازم نیست با هر تغییری که در یک صفحه از سایت رخ داد موتور جستجوی شما بلافاصله متوجه بشه و اون رو دوباره ذخیره کنه.شما باید سه پارامتر برای ذخیره سازی مجدد یک صفحه در نظر بگیری 1.تاریخ مراجعه بعدی 2.میزان کاهش فاصله بازدید بعدی در صورت تغییر صفحه 3.میزان افزایش فاصله بازدید بعدی اگر صفحه تغییر نکرده باشه
    مثلا شما در تنظیمات خزنده ات مشخص می کنی که صفحه ای که امروز ذخیره شده سی روز دیگه باید دوباره ذخیره بشه بعد سی روز می بینی صفحه نسبت به قبل تغییر کرده در نتیجه مثلا 30 رو در هشت دهم ضرب می کنی می شه 24 تاریخ بازدید بعدی می شه 24 روز بعد. بعد 24 روز می بینی دوباره محتویات تغییر کرده دوباره در هشت دهم ضرب می کنی می شه حدود 19 روز بعد. پس مراجعه بعدی 19 روز بعده به عبارتی اگه خزنده تشخیص بده صفحه داره مرتب بروز می شه تاریخ مراجعه بعدی رو به مرور کم می کنه(البته باید یه حداقلی داشته باشه مثلا یک روز که از اون کمتر نشه) اما اگر در یک بازدید دید صفحه تغییر نکرده بر عکس تاریخ بازدید بعدی رو افزایش می ده مثلا اگر بعد 19 روز مراجعه دید صفحه تغییر نکرده به جای این که در هشت دهم ضرب کنه در 12 دهم ضرب می کنه می شه حدود 23 روز دیگه و الی اخر...!

  36. #36

    نقل قول: فراخوان ایجاد یک موتور جستجوی داخلی

    نقل قول نوشته شده توسط mhf693 مشاهده تاپیک
    .به نظرم تو شروع کار رو مسائل فنی وقت نذار چون اگه از نظر سخت افزار مورد نیاز مشکل نداشته باشی این مسائل قابل حل شدن هستن! بهتره رو الگوریتم های مورد نیاز و شیوه پیاده سازی وقت بذاری مثلا هوش مصنوعی سیستم ، شیوه رتبه بندی ، زبان شناسی ، شیوه ذخیره سازی تا هم حجم دیتابیس زیاد نشه هم سرعت استخراج از دیتابیس بالا بره و ...
    خب اول از همه باید ببینم میتونم خزنده ش رو بنویسم یا نه
    و یا اینکه آپدیت کردن سایت ها طبق گفته های شما
    البته اگر سرور ابری با سخت افزاری قدرتمند باشه ممکنه حتی تا 1000 تا سایت همزمان بتونه دیتا بگیره و ذخیره کنه

  37. #37

    نقل قول: فراخوان ایجاد یک موتور جستجوی داخلی

    دوستان گفتم اطلاع رسانی کنم
    به این نتیجه رسیدم که سعی کنم یه لیست کامل و جامع از سایت های ایرانی(فعلا ایرانی) تهیه کنم
    و یه خزنده بنویسم که بیاد از این لیست یکی یکی به ترتیب بره داخل لینک ها توضیحات و متن های صفحه رو برداره و در دیتابیس ذخیره کنه اما در سرچ این سایت هارو لود نکنه یعنی توی کوئری بنویسم where title !="" بعد یه ربات دیگه بنویسم که بیاد سایت هایی که تایتل و اینا ندارن رو هر یک دقیقه یک بار هر بار 10 تا سایت رو تایتل و ایناشو توی دیتابیس آپدیت کنه و ردیفی به نام update رو برابر 1 کنه
    و یه ربات هم باشه که هر 24 ساعت چک کنه اگر تمام سایت ها 1 بودن آپدیت هاش یعنی همه آپدیت بودن همرو 0 کنه و ربات آپدیت دوباره سایت هارو آپدیت کنه
    یعنی هر 24 ساعت سایت ها آپدیت میشه البته ممکنه آپدیت سایت ها به 3 4 روز هم برسه زمانی که سایت ها زیاد بشه
    فعلا همین هارو میخوام پیاده سازی کنم
    اگر کسی نظری داره خوشحال میشم بشنوم

  38. #38

    نقل قول: فراخوان ایجاد یک موتور جستجوی داخلی

    با سلام به دوست عزیز

    فرض قضیه : شما یک موتور جرفه ای ساختید ( حتی قوی تر از موتور کنونی گوگل ) .

    - آیا می توانید این موتور رو به افراد جوامع محتلف معرفی کنید ؟ پیش نیاز برند شدن جهانی ایده + سرمایه هستش , ایا شما این دو رو دارید ؟ آیا فکر میکنید کشوری مثل عربستان از موتور ایرانی استفاده می کند ؟ ( و یا سریع فیلترش می کند ) چین چه طور ؟
    - چند کشور هم اکنون با ایران دشمن هستند ؟ کشور های زیادی هستند که نمیخواهند ما ایرانی ها وجود داشته باشیم . حالا به نظرتون اجازه بزرگ شدن یک موتور جستجو گر رو به ما در سطح جهان می دهند ؟ خب مشخص است به راحتی هرچه تمام تر شما رو منهدم می کنند . چه از نظر برندینگ و چه از نظر فیلترینک در کشور های دیگه .
    -----------
    حدود یک سالی میشه که شرکت بیان اومده و این کارو داره انجام میده . موتور جستجوگر ایرانی *** سلام salam.ir *** که بعد از مدتی احتمالا موتور تمام ایرانی زال رو پیاده سازی می کنند که موتور زال webmaster هم داره و تمام ایرانی و بومی هستش .
    ----------
    گوگل سرمایه گزاری عظیمی برای پایداری نسل خود کرده . بی شک دیدیم که جتی موتور bing هم نتوانست با ان همه پشتیوانه مالی و برنامه نویسی در برابر گوگل قد علم کند . گوگل یک برند ابدی هستش . و خواهد بود .
    گوگل رازی پنهان داره تو خودش . راز اون فقط موتورش نیست . رازش هم بستگی چند سایت بزرگ دنیا هستش ( محصولات خودش نظیر youtube.com / gmail.com/blogger va ...... که لازمه فعالیت در انها داشتن یک حساب gmail خواهد بود .
    از همه مهم تر . انسجام اون با سیستم عامل دوم دنیا یعنی اندروید
    وجو بهترین نقشه دنیا که حتی اپل در برابر استفاده نکردن از ان تسلیم شده بود .
    تسلیم کردن شرکت های بزرگ دنیای دیجیتال htc-samsung-sony-lg-glx va .........
    همانظور که گفته شده گوگل اومده که بمونه . و با کارش داره بهت ثابت می کنه که چقدر تسط بر دنیای اینترنت داره .

    -----------
    پس قبلش رزومه گوگل رو بخونیم و بفهمیم رقیبمون چه کسیه

  39. #39

    نقل قول: فراخوان ایجاد یک موتور جستجوی داخلی

    پروژه موتورهای جست و جوی میلی که با اعتبار بیش از 170 میلیارد( پولی که می تونست صرف اشتغالزایی و هزاران مورد مفید دیگر بشه ) تومن و حمایت های دولتی به جایی نرسید . و مقالاتی که مردم رو تشویق می کنه از این موتورهای جست و جو استفاده کنن منو یاد رانندگانی می اندازه که تو ترمینال به رهگذران گیر می دن . کدوم شهری ؟!
    اون وقت شما میخواین موتور جست و جو طراحی کنین که چی بشه ؟

  40. #40
    کاربر تازه وارد
    تاریخ عضویت
    بهمن 1389
    محل زندگی
    بیرجند
    پست
    52

    نقل قول: فراخوان ایجاد یک موتور جستجوی داخلی

    . سخن رهبر انقلاب در جمع دانشگاهیان همدان در سال 83 به نقل از سایت راسخون :
    غربی ها علم را از ما یاد گرفتند. شما به کتاب پیروسو - «تاریخ علوم» - نگاه کنید؛ آن جا می گوید: چهار پنج قرن قبل تاجری در یکی از کشورهای اروپایی به استادی مراجعه می کند و می گوید می خواهم فرزندم درس بخواند؛ او را به کدام مدرسه بفرستم؟ استاد در جواب می گوید اگر به همین چهار اصل عمل اصلی – جمع و ضرب و تفریق و تقسیم- قانع هستی، می توانی او را به هر کدام از مدارس کشور ما یا دیگر کشورهای اروپایی بفرستی؛ اما اگر بالاتر از آن را لازم داری، باید او را به کشور اندلس یا به مناطق مسلمان نشین بفرستی. این را پیرروسو می نویسد؛ این حرف من نیست. چنگ های صلیبی به آن ها کمک کرد تا از ما بیاموزند. هجرت دانشمندان ما به این مناطق، کمک کرد تا از ما بیاموزند. هجرت دانشمندان ما به مناطق آن ها و منتقل شدن کتاب های ما به آن ها، کمک کرد تا از ما بیاموزند. یک روز آن ها از ما یادگرفتند و شاگرد ما بودند، بعد شدند استاد ما؛ الان هم ما از آن ها یاد می گیریم و شاگرد آن ها می شویم و بعد می شویم استاد آن ها. پس نسل دانش پژوه و محقق و پژوهنده ی کشور ما بداند؛ امروز اگر برتری علمی با غربی ها است، در آینده ی نه چندان دوری با همت و اراده ی شما می توان کاری کرد که فردا آن ها از شما یاد بگیرند.
    این که این دوستمون با چه هدفی می خواد یه موتور جستجو بنویسه خودش می دونه ولی مشکل ما سر اینه که تو کشور ما یه وحدت رویه نیست و هر کسی ساز خودش رو می زنه! مثلا در مورد همین موتور جستجو موازی کاری زیاد می شه : موتور جستجوی یوز - گرگر - زال - ... اگه به جای این همه موازی کاری همه متخصصین تو این حوزه با هم کار می کردند چرا نمی تونستند به جایی برسند! این که دوستان می گن نمی تونیم در برابر گوگل رقابت کنیم اولا به نظرم چرا می تونیم ، من خودم دو سه سال پیش که فیلم توهین آمیز به پیامبر(ص) روی یوتیوب منتشر شد و حاضر نشدن برش دارن با خودم گفتم چرا ما باید به قول یکی از معلمانم سیب زمینی بی رگ باشیم که اونا به عزیزترین کسان ما توهین می کنن و اون وقت گذشته از این که ما از محصولات اونا استفاده می کنیم تعریف و تمجید محصولات اونا رو هم می کنیم! همون موقع یادمه چند روزی بعضی کشورها گوگل رو تحریم کردن حتی تو کشور خودمون حدود یه هفته ای سایت گوگل باز نمی شد و همین عدم استفاده ما باعث شد سایت گوگل بعد از چند سال از رتبه یک بین سایت های اینترنتی به رتبه دوم تنزل کنه! پس اگه گوگل و امثال اون به جایی رسیدن ما هم مقصریم!!! دوما به نظر من قرار به رقابت با موتور جستجویی مثل گوگل نیست چون موتور جستجوی ایرانی هدفش برظرف کردن نیاز عامه مردم هست که اکثرا از سایت های فارسی استفاده می کنن و با تمرکز روی سایت های فارسی می شه به جاهای خوبی هم رسید. در هر صورت من به شخصه کار دوستمون رو تحسین می کنم حتی اگه به هیچ جا نرسه!!!

صفحه 1 از 6 123 ... آخرآخر

تاپیک های مشابه

  1. ایجاد جستجو برای سایت شبیه موتور جستجوی گوگل
    نوشته شده توسط morteza_mokhtari در بخش ASP.NET Web Forms
    پاسخ: 1
    آخرین پست: دوشنبه 02 دی 1392, 22:50 عصر
  2. سوال: موتور جستجوی داخلی سایت
    نوشته شده توسط mehcosoft در بخش PHP
    پاسخ: 4
    آخرین پست: شنبه 06 مهر 1392, 15:10 عصر
  3. فراخوان:ایجاد راهنمای آغاز به کار با لینوکس::
    نوشته شده توسط hosseinzadeh در بخش توسعه‌ی لینوکس و نرم افزارهای آزاد
    پاسخ: 2
    آخرین پست: دوشنبه 18 خرداد 1383, 15:18 عصر

قوانین ایجاد تاپیک در تالار

  • شما نمی توانید تاپیک جدید ایجاد کنید
  • شما نمی توانید به تاپیک ها پاسخ دهید
  • شما نمی توانید ضمیمه ارسال کنید
  • شما نمی توانید پاسخ هایتان را ویرایش کنید
  •