موتورهای جستجوگر

**mas'ood** · سه شنبه 22 آذر 1384, 16:03 عصر

روست عزیزم Vb
درمورد اینکه چرا 2 تا تاپیک گذاشتم باید بگم که دلیلی نداشته! فقط یه اشتباه
در مورد اینکه تایید کردی که کار خوبییه (بحث در مورد موتورها) هم خیلی ممنون. متشکرم دوست عزیز
و اما صحبت اصلی که داشتم راجع به سوالاتی بود که داشتی و اینکه ما در واقع نمیدونیم "بحث اصلی" چیه و ما اصلا قصدمون چیه هم باید بگم تا حدودی شما درست میگی ولی خب خیلی هم از جریان بدور نیستیم و تقریبا میتونیم روش بحث کنیم من یه سری تحقیقاتی رو توی این زمینه داشتم و چند تایی هم مقاله.
سعی میکنم هر از چند گاهی مطالبی رو بیان کنم ببینیم کار به کجا میرسه البته به شرطی که شما هم کمک کنید و راهنمایی هم فراموش نشه.برای شروع کار هم به معرفی انواع موتورها میپردازیم:

ساختار موتورهای جستجو

ساختار کلی کار موتورها بدین ترتیب است که هنگامی که شما مثلا عبارت "فناوری اطلاعات آزاد قزوین" را جستجو میکنید در ابتدا موتور در بانک اطلاعاتی خود جستجو کرده و وب سایتهایی را که دارای کلمات "فناوری" "اطلاعات" "آزاد" و "قزوین" هستند را لیست میکند. و سپس با توجه به معیارهی خاصی مثل دوری و نزدیکی و تراکم کلمات در سایت آنهاا را رتبه بندی و لیست میکند. این یک تعریف بسیار کلی از کاری بود که موتورها انجام میدهند.در ادامه سعی میکنیم کمی دقیق تر به موضوع نگاه کنیم.
موتورهای معمولا متشکل از 5 بخش اصلی میباشند :
1- Spider : که به آن "عنکبوت" نیز گفته میشود دارای وظیفه جستجو و جو و گشت و گذار در اینترنت میباشند. بدین معنی که این ابزار (Application) در زمانهای مشخصی فعال شده و به اینترنت و وب سایتهای مختلف رفته و وب سایتها را همانند یک کاربر معمولی بازدید میکند و وظیفه اش پیدا کردن وب سایتهای جدیدی است که تازه ایجاد شده و یا وب سایتهایی که تا بحال در بانک اطلاعاتی آن موتور ثبت نشده اند است.
2- Crawler : این ابزار در واقع کار مدیریت Spider را بر عهده دارد.
من در بسیاری از مقالات و در کتابهای مختلف دیده ام که دوستان Spider و Crawler را یکسان میدانند! این در حالیست که Crawler وظیفه اش مدیریت و کنترل Spider است بدین معنی که Crawler مشخص میکند که Spider در چه زمانی میبایست فعال شود و تا چه سطحی از وب سایت را میتواند جلو برود و بازدید کند. خیلی وقتها اتفاق میفتد هنگامی که Spider به داخل وب سایتی میرود در یک حلقه (Loop) گرفتار میشود و نمیتواند از آن سایت بیرون بیاید و در واقع وظیفه اینگونه کنترلها بر عهده Crawler است.
3- Indexer : هنگامی کهSpider کار مشاهده را انجام داد و اطلاعات وب سایت را خواند , این اطلاعات را تحویل Indexer میدهد و Indexer شروع به تجزیه و تحلیل کردن و مشخص کردن کلمات کلیدی و تراکم کلمات است تا بتواند از این آمار و ارقام در رتبه بندی سایتها استفاده کند.همچنین بعضی از Indexer ها با توجه به موضوع آن وب سایت , آن را در بخش مربوطه قرار میدهند.مثلا اگر موضوع سایت درباره "بیماری جنون گاوی" باشد Indexer آن سایت را در قسمت Health قرار میدهد.
4 – Database : همان طور که از اسم آن نیز مشخص است وظیفه اش نگهداری اطلاعات دسته بندی شده است تا بتوان براحتی به آن دسترسی داشت.
5 – Algorithm : چهار قسمتی که در بالا معرفی شد در اکثر موتورها مشترک و یکسان است. مهمترین و اصلی ترین قسمت موتورهای جستجوگر همین قسمت "الگوریتم" است که موتورها را از هم متمایز میکند. هر موتور برای خود یک الگریتم خاص دارد. و اما وظیفه این الگوریتم , رتبه بندی وب سایتها بر اساس معیارهای خاص خود است.

تا اینجا تقریبا مختصر به موتور نگاه کردیم. سعی میکنم در پست های بعد آنرا بیشتر باز کنم و دقیق تر به موضوع نگاه کنیم.
لازم به ذکر است که مطالب بالا قسمتهایی از یکی از مقالات چاپ شده بنده در یکی از مجلات میباشد بنابراین فکر نمیکنم لازم باشد که از "خودم" برای استفاده از آنها اجازه بگیرم یا ذکر نام کنم
.::Mas'ood::..

نام تاپیک: موتورهای جستجوگر

ابزار های تاپیک

نمایش

Threaded View

قوانین ایجاد تاپیک در تالار