دوره های آموزشی آکادمی پی وی لرن (پروژه محور و ویژه بازار کار)



  • ۲۰
  • آبان

جلسه ۳۱ : موتورهای جستجو – تکنولوژی اینترنتی

  • دسته‌بندی‌ها :
جلسه ۳۱ : موتورهای جستجو – تکنولوژی اینترنتی
    • جزئیات

      مقدمه

      سلام دوستان عزیز وب سایت آموزشی پی وی لرن و وقت بخیر به علاقمندان آموزش تکنولوژی های اینترنتی. موتورهای جستجو و اجزای موتور جستجو در این بخش از آموزش دنبال خواهیم نمود.

      موتورهای جستجو

      موتور جستجو به بانک اطلاعاتی عظیمی از منابع اینترنتی مانند صفحات وب ، گروه های خبری ، برنامه ها ، تصاویر و غیره اشاره دارد. این امر به مکان یابی اطلاعات در شبکه وب جهان گستر (World Wide Web) کمک می کند.

      کاربر می تواند با ارسال پرس و جو در قالب کلمات کلیدی یا عبارت ، هرگونه اطلاعات را جستجو کند. سپس اطلاعات مربوطه در پایگاه داده جستجو شده و به کاربر باز می گردد.

       

      موتورهای جستجو

      موتورهای جستجو

      در ادامه اجزای موتور جستجو رو معرفی خواهیم نمود.

      اجزای موتور جستجو

      به طور کلی سه مؤلفه اساسی در یک موتور جستجو وجود دارد که در زیر ذکر شده است:

      • خزنده وب (Web Crawler)
      • بانک اطلاعات (Database)
      • رابط های جستجو (Search Interfaces)

      خزنده وب (Web Crawler)

      خزنده وب، به عنکبوت یا ربات ها نیز معروف است. این یک جزء نرم افزاری است که وب را برای گردآوری اطلاعات پیمایش می کند.

      بانک اطلاعات (Database)

      تمام اطلاعات موجود در وب، در پایگاه داده (Database) ذخیره می شوند. و شامل منابع عظیم وب است.

      رابط های جستجو (Search Interfaces)

      این مؤلفه واسط بین کاربر و بانک اطلاعات است. این کمک می کند تا کاربر از طریق پایگاه داده جستجو کند.

      کار موتور جستجو

      خزنده وب ، بانک اطلاعاتی و رابط جستجو ، مؤلفه های اصلی یک موتور جستجو هستند که در واقع موتور جستجو را به کار می گیرند. موتورهای جستجو برای محدود کردن و گسترده تر کردن نتایج جستجو از عبارت AND, OR, NOT استفاده می کنند. مراحل زیر توسط موتور جستجو انجام می شود:

      • موتور جستجو به جای مراجعه مستقیم به وب برای جستجوی کلمه کلیدی ، به دنبال کلمه کلیدی در ایندکس برای پایگاه داده از پیش تعریف شده است.
      • سپس از نرم افزار برای جستجوی اطلاعات موجود در پایگاه داده استفاده می کند. این مؤلفه نرم افزاری به عنوان خزنده ی وب (web crawler) شناخته می شود.
      • هنگامی که خزنده وب صفحات را پیدا کرد ، موتور جستجو صفحات وب مربوطه را در نتیجه نشان می دهد. این صفحات وب بازیابی شده معمولاً شامل عنوان صفحه ، اندازه بخش متن ، چند جمله اول و غیره است.

      این معیارهای جستجو ممکن است از یک موتور جستجو به دیگری متفاوت باشد. اطلاعات بازیابی شده با توجه به فاکتورهای مختلف از جمله فراوانی کلمات کلیدی ، ارتباط اطلاعات ، پیوندها و غیره رتبه بندی می شوند.
      کاربر می تواند بر روی هر یک از نتایج جستجو کلیک کند تا آن را باز نماید.

      معماری

      معماری موتور جستجو شامل سه لایه اساسی است که در زیر ذکر شده است:

      • جمع آوری مطالب و پالایش.
      • هسته جستجو
      • رابط کاربری و برنامه

       

      معماری موتور جستجو

      معماری موتور جستجو

      فرآیند موتور جستجو

      فرآیند ایندکسینگ

      فرآیند ایندکسینگ شامل سه کار زیر است:

      • دستیابی متن
      • تبدیل متن
      • ایجاد ایندکس

      دستیابی متن

      اسناد را برای ایندکسینگ شناسایی و ذخیره می کند.

      تبدیل متن

      سند را به شرایط یا ویژگی های ایندکس تبدیل می کند.

      ایجاد ایندکس

      شرایط ایندکس ایجاد شده توسط تبدیل متن را می گیرد و ساختار داده ها را برای جستجوی سریع جستجو می کند.

      فرآیند پرس و جو (Query)

      فرایند پرس و جو شامل موارد زیر است:

      • تعامل کاربر
      • رتبه بندی
      • ارزیابی

      تعامل کاربر

      ایجاد و پالایش پرس و جوی کاربر را پشتیبانی می کند و نتایج را نمایش می دهد.

      رتبه بندی

      برای ایجاد لیست رتبه بندی اسناد از کوئری و ایندکس ها استفاده می کند.

      ارزیابی

      اثربخشی و کارآیی را نظارت و اندازه گیری می کند. به صورت آفلاین انجام می شود.

      مثال ها

      در زیر چندین موتور جستجو موجود است:

       

      موتور جستجوتوضیحات
      Googleدر ابتدا BackRub نامیده می شد. این محبوب ترین موتور جستجوگر در سطح جهان است.
      Bingدر سال ۲۰۰۹ توسط مایکروسافت راه اندازی شد. این آخرین موتور جستجوی مبتنی بر وب است که نتایج یاهو را نیز ارائه می دهد.
      Askاین در سال ۱۹۹۶ راه اندازی شد و در ابتدا با نام Ask Jeeves شناخته می شد. Ask شامل پشتیبانی از فرهنگ لغت و سوال مکالمه است.
      AltaVistaاین شرکت توسط Digital Equipment Corporation در سال ۱۹۹۵ راه اندازی شد. از سال ۲۰۰۳ ، این فناوری توسط یاهو تولید می شود.
      AOL.Searchتوسط گوگل نیرو می گیرد.
      LYCOSاین ۵ پورتال برتر اینترنتی و سیزدهمین دارایی آنلاین با توجه به Media Matrix است.
      Alexaاین شرکت تابع آمازون است و برای تهیه اطلاعات مربوط به ترافیک وب سایت استفاده می شود.

      کلام پایانی

      با موتورهای جستجو و اجزای موتور جستجو در این بخش از آموزش تکنولوژی اینترنت آشنا شدیم. در بخش بعدی به Internet Collaboration می پردازیم.

      QR:  جلسه ۳۱ : موتورهای جستجو – تکنولوژی اینترنتی
      به اشتراک بگذارید