لینک دانلود و خرید پایین توضیحات
دسته بندی : وورد
نوع فایل : word (..doc) ( قابل ويرايش و آماده پرينت )
تعداد صفحه : 26 صفحه
قسمتی از متن word (..doc) :
2
معماري موتورهاي جستجوگر
مقدمه:
از آنجائي كه هر پايگاه ميتواند بسياري از صفحات وب را در خود داشته باشد اين باعث ميشود كه تعداد بيشتري از صفحات وب بوجود آيد. در حاليكه كيفيت بسياري از صفحات ممكن است مورد سؤال باشد و نگهداري بسياري از صفحات پراكنده است. اما صفحات معتبري هم وجود دارد كه اطلاعات با ارزشي در مورد بسياري از موضوعات ارائه ميدهد. علاوه بر آن انتخاب موتورهاي جستجوي مناسب ممكن است براي استفادهكنندگان عمومي به علت رويههاي پيچيده، مهمتر باشد.
تعريف :
موتورهاي جستجوگر به برنامه اي اطلاق ميشود كه موضوعات مورد نظر كاربران را در قالب كلمات كليدي ، درون اسناد و اطلاعات موجود در اينترنت كاوش كرده و نتايج بدست آمده را در قالب آدرس محل ذخيره عرضه مي نمايد.
برخي از موتورها صرفا براي يك سايت خاصي طراحي و پياده ميشوند مثل سايتهاي فروش كالا از طريق اينترنت كه داراي يك موتور انحصاري هستند كه فقط در همان وب سايت كاوش ميكنند ولي موتورهاي جستجوي عمومي محتويات وبسايتهاي موجود در كل اينترنت را پيمايش و جستجو ميكنند .
2
معماري كلي موتورهاي جستجو :
درون كاو :
تمام موتورهاي جستجو به ماجولي عملياتي به نام درون كاو متكي هستند درون كاو پهنه وسيع وب را يطور زمان بندي شده پيمايش ميكند و به جمع آوري صفحات بي شمار ذخيره شده در گوشه و كنار وب ميپردازد كه از تعداد قابل توجهي برنامه كوچك تشكيل شده كه هر كدام با هسته يك وب سايت خاص آغاز ميكنند اين برنامه هاي كوچك درون كاوي خود را تحت كنترل ماجول آغاز و بر اساس استراتژي اين ماجول كنترلي به پايان ميبرند .
كنترل درون كاو :
اين ماجول موظف است كه مجموعه برنامه هاي درون كاوي را با تحويل مورد نظر راه اندازي كرده و بكار درون كاوي بگمارد . ماجول كنترل درون كاو تعيين ميكند كه پس از دريافت صفحه جاري كدام صفحه بايد دريافت چرا كه يك صفحه واحد صفحات متعددي لينك دارد و ترتيب اين لينكها بر عهده ماجول كنترل درون كاو ميباشد . انباره صفحات :
3
صفحاتي كه توسط ماجول درون كاو از گستره جهاني وب استخراج مي شوند در يك بانك اطلاعاتي به نام انباره صفحات ذخيرهميشوند تا به منظور شاخص دهي و تحليل محتوائي ، در اختيار ديگر ماجولها قراربگيرند در اين الگوريتم عمليات استخراج صفحات از يك سايت وب با آدرس خاص آغاز و به تمام آدرسهاي ديگري نيز كه در ايين صفحات درج شده اند تسري مي يابد . در گونه ديگري از الگوريتمهاي كنترل درون كاو ، استخراج صفحات بين حوزه هاي سطح بالا محدود ميماند .
ماجول شاخص دهي :
اين ماجول يكيايك صفحات موجود در انباره صفحات را مرور كرده و كلمات در آنها را پس از استخراج به همراه مربوطه در يك جدول بسيار عظيم درج ميكند در نتيجه مشخص مي شود كه هر كلمه در كدام صفحه ، با چه آدرسي و در كجاي صفحه ظاهر شود . يكي ديگر از خروجي هاي ماجول شاخص دهي بانك اطلاعاتي شاخص ساختاري است كه چگونگي پيوند خوردن صفحات به يكديگر را منعكس ميكند .
برچسب ها:
تحقیق درباره موتور های جستجو گر اینترنتی موتور های جستجو گر اینترنتی دانلود تحقیق درباره موتور های جستجو گر اینترنتی موتور های جستجو اینترنتی تحقیق درباره موتور جستجو اینترنتی