من دنبال اینم که بدونم search GOOGLE دقیقا چطوری کار می کند منظورم مباحث ایندکس گذاری وranking و یا هر چیز تخصصی دیگر است .
لطفا چند سایت مناسب بهم معرفی کنید.
ممنون.
Printable View
من دنبال اینم که بدونم search GOOGLE دقیقا چطوری کار می کند منظورم مباحث ایندکس گذاری وranking و یا هر چیز تخصصی دیگر است .
لطفا چند سایت مناسب بهم معرفی کنید.
ممنون.
سلام دوست من :::
امید وارم که به دردت بخوره
:::::::::::::::::::::::::::::::::::::::::::::::::: :::::::::::::::::::::::::::::::::::
ممنونم ولی منظورم اینست که الگوریتمی که search GOOGLE باهاش نوشته شده چیه؟
آخه من می خواهم یه search توی همون مایه های search GOOGLE بنویسم و می خوام ایده و متد های گوگل را بدانم.نه اینکه یک کاربر چه امکاناتی برای استفاده از گوگل در اختیار دارد.
شما برای این کار بهتره در مورد موتور های جستجو و وب crawler ها تحقیق کنید.اگر فقط می خواهید در مورد گوگل بدانید باید به دنبال الگوریتم هایی که این موتور جستجو استفاده می کند ، باشید. برای شروع من لینک زیر را پیشنهاد می کنم ، هر چند که موارد بهتری را با جستجو می توانید پیدا کنید :
http://www.rankforsales.com/search-e...algorithm.html
اساس سرعت در جستجو
استفاده از سیستم قوی و استفاده از الگوریتم دودویی هست
تا اوجایی که از ساختمان داده یادم مونده و با توجه به زمان اجرای الگویتم ها
فکر نکنم برای موتور جستجو از binary search استفاده بشه!!!!!!!!!
اگه اشتباه نکنم از ساختمان داده dictionary توی موتور های جستجو استفاده
میکنن
به این سادگیها نیست
اول یه لیست از تمام لغات موجود توی اینترنت ساخته میشه و مرتب میشه تا خیلی سریع بشه لغات وارد شده رو پیدا کنه
در مرحلهی بعد فقط صفحاتی که لغت مورد نظر توش بوده جستجو میشه تا کلمات ترکیبی هم پیدا بشن
و یه موضوع دیگه هم اینکه کل نتایج جستجو نمیشه بلکه فقط یه تعداد خاصی جستجو میشه و به همین دلیل اگه توی تعداد پیدا شده نگاه کنید تعداد یه عدد تقریبی هست و نه تعداد دقیق...
موتورهای جستجو، هوشمند هستن. یعنی از الگوریتم های مربوط به هوش مصنوعی استفاده میکنن.نقل قول:
آخه من می خواهم یه search توی همون مایه های search GOOGLE بنویسم
کدوم دودویی؟ جستجوی دودویی؟ جستجوی دودویی بیشتر روی آرایه ای که از قبل مرتب شده باشه، کاربرد داره. اما موتورهای جستجو الزاما فقط از آرایه استفاده نمیکنن.نقل قول:
استفاده از الگوریتم دودویی هست
ساختمان داده ای که بتونه تمام واژگان اینترنتی رو نگه داره، حافظه بسیار بسیار بزرگی میخواد. به جای نگه داشتن کل لغتهای اینترنت، اطلاعات لازم رو Cache میکنن.نقل قول:
اول یه لیست از تمام لغات موجود توی اینترنت ساخته میشه و مرتب میشه
1 - آرایه فقط یه محل برای نگهداری اطلاعات توی حافظه هست و کارای هوقشره (اون برنامهی تلویزیون) رو بلد نیست انجام بده - فقط همین !!!
2 - نیازی نیست که اطلاعات روی حافظه موقت ذخیره بشن
اگه اطلاعات مرتب شده باشن خیلی سریع با استفاده از الگوریتم دودویی میشه مقصد را پیدا کرد حتی اگه روی حافظهی دائمی باشه - خیلی خیلی سریعتر از جستجوی عادی توی حافظهی موقت - OK?
3 - هوش مصنوعی دیگه چیه؟ - اینم همون مورد هوقشتره رو مطالعه کنید -
جستجو زمان و نیرو نیاز داره
این نیرو و زمان فقط یه بار و موقع Index کردن یا همون Cache که شما میگی انجام میشه
و در دفعات بعدی خیلی سریع با استفاده از الگوریتم دودویی اون لغت و صفحاتی که اون لغت توش به کار رفته پیدا میشه...
نقل قول:
آرایه فقط یه محل برای نگهداری اطلاعات توی حافظه هست و کارای هوقشره (اون برنامهی تلویزیون) رو بلد نیست انجام بده
مرتب سازی محتویات روی هارددیسک، خیلی بیشتر از آرایه ای که روی RAM باشه زمان میبره. OK؟نقل قول:
- نیازی نیست که اطلاعات روی حافظه موقت ذخیره بشن
میدونی که توی هرمی که واسه سرعت دسترسی رسانه ها ترسیم میکنند. RAM ،Cache RAM و Hard Disk کجا قرار دارن؟
پیش شرط جستجوی دودویی مرتب سازی داده ها به صورت صعودی یا نزولی است، همین مرتب سازی میتونه یه سربار به حساب بیاد ضمن اینکه قرار نیست لیستت رو صعودی یا نزولی مرتب کنی، فقط میخوای Index بذاری. ok؟
هوش مصنوعی همون درس 3 واحدیه که در دوران کارشناسی باید پاس کنی، تا بدونی که چطور برنامه میتونه براساس شرایط محیط، منطقی تصمیم بگیره و احیانا چطور دانشش رو بدون نیاز به کاربر، بیشتر کنه.نقل قول:
هوش مصنوعی دیگه چیه؟
cache یه چیزه، index یه چیز دیگه. ممکنه فقط از یکی استفاده بشه، یا از ترکیب هر دو.نقل قول:
این نیرو و زمان فقط یه بار و موقع Index کردن یا همون Cache که شما میگی انجام میشه
من دنبال نحوه ایندکس کردنم لطفا اگه میدونید دقیقا برام بگین.
شما با مراجعه به مباحث ساختمان داده ÷یشرفته نظیر ایندکس چند سطحی و BTree,B+Tree,... می توانید روشهای خوبی برای سازماندهی اظلاعات ودر نتیجه سرعت بالاتر در جستجو پیدا کنید
این مباحث در کتابهای ذخیره و بازیابی اطلاعات هم آمده است
من می خوام بدونم دقیقا چطوری ایندکس می کنه ؟ودر ضمن page ranking اش براساس چه معیارهایی است. لطفا سایت معرفی کنید.