ورود

View Full Version : google چطوری search می کنه؟



farnaz2003
یک شنبه 24 دی 1385, 16:07 عصر
من دنبال اینم که بدونم search GOOGLE دقیقا چطوری کار می کند منظورم مباحث ایندکس گذاری وranking و یا هر چیز تخصصی دیگر است .
لطفا چند سایت مناسب بهم معرفی کنید.
ممنون.

american_iran2006
یک شنبه 24 دی 1385, 20:31 عصر
سلام دوست من :::

امید وارم که به دردت بخوره

:::::::::::::::::::::::::::::::::::::::::::::::::: :::::::::::::::::::::::::::::::::::

farnaz2003
دوشنبه 25 دی 1385, 08:26 صبح
ممنونم ولی منظورم اینست که الگوریتمی که search GOOGLE باهاش نوشته شده چیه؟
آخه من می خواهم یه search توی همون مایه های search GOOGLE بنویسم و می خوام ایده و متد های گوگل را بدانم.نه اینکه یک کاربر چه امکاناتی برای استفاده از گوگل در اختیار دارد.

whitehat
دوشنبه 25 دی 1385, 08:38 صبح
شما برای این کار بهتره در مورد موتور های جستجو و وب crawler ها تحقیق کنید.اگر فقط می خواهید در مورد گوگل بدانید باید به دنبال الگوریتم هایی که این موتور جستجو استفاده می کند ، باشید. برای شروع من لینک زیر را پیشنهاد می کنم ، هر چند که موارد بهتری را با جستجو می توانید پیدا کنید :
http://www.rankforsales.com/search-engine-algorithms/google-hilltop-algorithm.html

oVERfLOW
سه شنبه 26 دی 1385, 09:56 صبح
اساس سرعت در جستجو
استفاده از سیستم قوی و استفاده از الگوریتم دودویی هست

mahdy_cd
چهارشنبه 04 بهمن 1385, 12:02 عصر
تا اوجایی که از ساختمان داده یادم مونده و با توجه به زمان اجرای الگویتم ها
فکر نکنم برای موتور جستجو از binary search استفاده بشه!!!!!!!!!
اگه اشتباه نکنم از ساختمان داده dictionary توی موتور های جستجو استفاده
میکنن

oVERfLOW
چهارشنبه 04 بهمن 1385, 12:22 عصر
به این سادگی‌ها نیست
اول یه لیست از تمام لغات موجود توی اینترنت ساخته می‌شه و مرتب می‌شه تا خیلی سریع بشه لغات وارد شده رو پیدا کنه
در مرحله‌ی بعد فقط صفحاتی که لغت مورد نظر توش بوده جستجو می‌شه تا کلمات ترکیبی هم پیدا بشن
و یه موضوع دیگه هم اینکه کل نتایج جستجو نمی‌شه بلکه فقط یه تعداد خاصی جستجو می‌شه و به همین دلیل اگه توی تعداد پیدا شده نگاه کنید تعداد یه عدد تقریبی هست و نه تعداد دقیق...

Developer Programmer
پنج شنبه 05 بهمن 1385, 00:15 صبح
آخه من می خواهم یه search توی همون مایه های search GOOGLE بنویسمموتورهای جستجو، هوشمند هستن. یعنی از الگوریتم های مربوط به هوش مصنوعی استفاده میکنن.

استفاده از الگوریتم دودویی هستکدوم دودویی؟ جستجوی دودویی؟ جستجوی دودویی بیشتر روی آرایه ای که از قبل مرتب شده باشه، کاربرد داره. اما موتورهای جستجو الزاما فقط از آرایه استفاده نمیکنن.


اول یه لیست از تمام لغات موجود توی اینترنت ساخته می‌شه و مرتب می‌شه ساختمان داده ای که بتونه تمام واژگان اینترنتی رو نگه داره، حافظه بسیار بسیار بزرگی میخواد. به جای نگه داشتن کل لغتهای اینترنت، اطلاعات لازم رو Cache میکنن.

oVERfLOW
پنج شنبه 05 بهمن 1385, 11:54 صبح
1 - آرایه فقط یه محل برای نگهداری اطلاعات توی حافظه هست و کارای هوقشره (اون برنامه‌ی تلویزیون) رو بلد نیست انجام بده - فقط همین !!!

2 - نیازی نیست که اطلاعات روی حافظه موقت ذخیره بشن
اگه اطلاعات مرتب شده باشن خیلی سریع با استفاده از الگوریتم دودویی می‌شه مقصد را پیدا کرد حتی اگه روی حافظه‌ی دائمی باشه - خیلی خیلی سریع‌تر از جستجوی عادی توی حافظه‌ی موقت - OK?

3 - هوش مصنوعی دیگه چیه؟ - اینم همون مورد هوقشتره رو مطالعه کنید -
جستجو زمان و نیرو نیاز داره
این نیرو و زمان فقط یه بار و موقع Index کردن یا همون Cache که شما می‌گی انجام می‌شه
و در دفعات بعدی خیلی سریع با استفاده از الگوریتم دودویی اون لغت و صفحاتی که اون لغت توش به کار رفته پیدا می‌شه...

Developer Programmer
پنج شنبه 05 بهمن 1385, 14:13 عصر
آرایه فقط یه محل برای نگهداری اطلاعات توی حافظه هست و کارای هوقشره (اون برنامه‌ی تلویزیون) رو بلد نیست انجام بده
- نیازی نیست که اطلاعات روی حافظه موقت ذخیره بشنمرتب سازی محتویات روی هارددیسک، خیلی بیشتر از آرایه ای که روی RAM باشه زمان میبره. OK؟

میدونی که توی هرمی که واسه سرعت دسترسی رسانه ها ترسیم میکنند. RAM ،Cache RAM و Hard Disk کجا قرار دارن؟

پیش شرط جستجوی دودویی مرتب سازی داده ها به صورت صعودی یا نزولی است، همین مرتب سازی میتونه یه سربار به حساب بیاد ضمن اینکه قرار نیست لیستت رو صعودی یا نزولی مرتب کنی، فقط میخوای Index بذاری. ok؟


هوش مصنوعی دیگه چیه؟ هوش مصنوعی همون درس 3 واحدیه که در دوران کارشناسی باید پاس کنی، تا بدونی که چطور برنامه میتونه براساس شرایط محیط، منطقی تصمیم بگیره و احیانا چطور دانشش رو بدون نیاز به کاربر، بیشتر کنه.

این نیرو و زمان فقط یه بار و موقع Index کردن یا همون Cache که شما می‌گی انجام می‌شه cache یه چیزه، index یه چیز دیگه. ممکنه فقط از یکی استفاده بشه، یا از ترکیب هر دو.

farnaz2003
دوشنبه 16 بهمن 1385, 11:15 صبح
من دنبال نحوه ایندکس کردنم لطفا اگه میدونید دقیقا برام بگین.

behbah
سه شنبه 17 بهمن 1385, 12:25 عصر
شما با مراجعه به مباحث ساختمان داده ÷یشرفته نظیر ایندکس چند سطحی و BTree,B+Tree,... می توانید روشهای خوبی برای سازماندهی اظلاعات ودر نتیجه سرعت بالاتر در جستجو پیدا کنید

این مباحث در کتابهای ذخیره و بازیابی اطلاعات هم آمده است

farnaz2003
سه شنبه 17 بهمن 1385, 15:12 عصر
من می خوام بدونم دقیقا چطوری ایندکس می کنه ؟ودر ضمن page ranking اش براساس چه معیارهایی است. لطفا سایت معرفی کنید.

behbah
چهارشنبه 18 بهمن 1385, 13:32 عصر
http://www.ams.org/featurecolumn/archive/pagerank.html


http://www.vaughns-1-pagers.com/internet/google-ranking-factors.htm