انواع موتور جستجو
موتورهای عمومی که در کلیه پایگاهها فارغ از نوع آن جستجو می کنند. موتورهای عمومی معروف عبارتند از: altavista.com, google.com, go.com, hotbot.com موتورهای تخصصی در یک رشته خاص مانند اخبار “news.com”، تجارت “deja.com”، شرکتها “yellow pages.com”،افراد “whowhere.com”، مقالات و انتشارات “infojump.com”
موتورهای تخصصی در خدمات اینترنت مانند گروههای خبری و مباحثه “deja.com”، بهترین پایگاه “magellan.com”.
موتورهای کلان ; این موتورها عبارت مورد جستجو را همزمان به چند موتور جستجو داده و پاسخها را اولویت بندی کرده و با ذکر نام موتور جستجو نمایش می دهند.مانند mamma.com,savvysearch.com
نقطه شروع ; اینگونه سایت ها موتورهای جستجو را برحسب موضوعات مختلف معرفی می کنند. درصورتی که موتورهای تخصصی و عمومی را نمی شناسید از این پایگاهها شروع کنید. مانند allonesearch.com
موتور اختصاصی پایگاهها; بعضی از پایگاههای بزرگ مانند مایکروسافت ، جنرال الکتریک ،… از داخل پایگاه خود موتور جستجو دارند. جدیدا می توان از موتورهای جستجو عمومی مانند hotbot,altavista,… در یک پایگاه جهت جستجو در آن استفاده کرد.
تقسیم بندی دیگری که از موتور جستجو می توان کرد، موتورهای جستجوگر، و دوم موتورهایی است که پایگاهها را دسته بندی موضوعی کرده اند و به آنها web directoryگفته می شود. معروفترین آنها webcrawear,yahooاست . درحال حاضر اکثر موتورهای جستجو دسته بندی موضوعی نیز دارند و در هر دسته و یا زیرشاخه های بعدی می توان جستجو کرد.
نحوه کار موتورهای جستجو
در این مقاله فقط نحوه کار موتورهای عمومی بررسی می شود. موتورهای عمومی ازبرنامه هایی معروف به crawler,robot و یا spiderبرای یافتن و مرور صفحات وب استفاده می کنند. نحوه کار این برنامه ها بدین صورت است که با یافتن یک صفحه کلمات مورداستفاده در آن را شناسایی کرده و به جداول فهرست بانک اطلاعاتی خود اضافه می کنند درواقع موتورها صفحات وب را در بانک اطلاعاتی نگهداری نمی کنند بلکه دربانک اطلاعاتی فهرستی از کلمات وآدرس صفحات مشمول این کلمات می باشد.
کار دیگر این برنامه ها این است که به صفحات فهرست شده قبلی مراجعه کرده ودرصورت به روز شدن صفحات ، مجددا آنها را فهرست بندی می کنند. ممکن است پایگاه موردنظرموجودنبوده ویاآدرس آن عوض شده باشد.
عوامل مهم در فهرست کردن یک صفحه وب ، تعداد وقوع کلمه در صفحه ، محل قرارگیری آن ، نوع فایلهای مورداستفاده در صفحه ، درجه اهمیت کلمه در صفحه با توجه به کلید واژه های تعیین شده توسط مالک صفحه و توضیحات آمده در بخش دستورات meta در شناسنامه صفحه می باشد.
موتورهای جستجو باتوجه به حجم بانک اطلاعاتی و برنامه هایشان به پایگاههای جدید مراجعه می کنند ولی مطمئنا تمام پایگاههای وب را شامل نمی شوند. بزرگترین موتور جستجوی عمومی حدود ۵۰۰ میلیون صفحه وب را شامل می شود. درصورتی که می خواهید پایگاه وب شما به بانک اطلاعاتی یک موتور جستجو اضافه شود پایگاه وب خود را به آن موتور جستجو معرفی کنید در صفحات وب ، در بخش دستورات شناسنامه ای صفحه ، کلید واژه های موردنظر خود را معرفی کنید. موتورهای جستجو عمومی به دو روش کلمات را فهرست بندی می کنند.
۱- keyword indexing اغلب موتورهای جستجو براساس کلمات فهرست بندی می کنند. در واقع درجستجوکلمات هم معنی راتشخیص نمی دهند.
concept based indexing – 2براساس مفهوم کلمه فهرست بندی می کنند. بدین ترتیب که اگر شما به دنبال کلمه y2kبگردید، صفحاتی که کلمات ۲۰۰۰ year problem نیز در نتایج می آید.
معروفترین موتوری که براساس مفهوم جستجو می کند excite.com می باشد.
نکته دیگری که در فهرست بندی باید بدانید این است که هر موتور چه بخشهایی ازیک صفحه را فهرست می کند. برای مثال ممکن است فقط hyperlink,heading, titleها ویا چند خط اول صفحه را فهرست کند. در برخی از موتورهای جستجو مانند opentextمی توان تعیین کرد که کلمه مورد جستجو در کجای صفحه باشد. برای مثال در…,heading,title نکته دیگر کلمات معروف به stop word هستند مانندweb,and,or,the,is,an,a و… بعضی از موتورها این کلمات را درنظر نمی گیرند.
عوامل مهم در انتخاب موتور جستجو
عوامل زیردرانتخاب موتور جستجو مهم هستند:
حجم بانک اطلاعاتی موتور جستجو و تعداد صفحات مرور شده توسط آن
به روز بودن بانک اطلاعاتی
تعداد صفحات مرورشده در روز
سرعت برگرداندن نتایج جستجو
تعداد سرویس دهنده های آن در شبکه اینترنت جهت کاهش ترافیک و افزایش سرعت
نحوه نمایش نتایج جستجو و کنترل آن توسط کاربر
نحوه اولویت بندی نتایج حاصله و ارتباط آنها با یکدیگر و کنترل آن توسط کاربر
راحتی استفاده
صفحات معرفی شده به آن طی چند روز در فهرست قرار می گیرند
پشتیبانی ,imagemap,frameامنیت در پایگاهها
قابلیت جستجو در نتایج
پشتیبانی stop words
حساس به حروف بزرگ و کوچک
پشتیبانی عبارت
عدم محدودیت درتعدادحروف عبارت جستجو
دسته بندی موضوعی وامکان جستجودرهردسته
جستجو در خدمات اینترنت شامل وب ، گروههای خبری و مباحثه ،…
پشتیبانی عملگرهای جستجو
پشتیبانی زبانهای مختلف وتبدیل زبانهابه یکدیگر
جستجو براساس تاریخ
ارائه امکانات بهتر از جمله ارسال نتایج به آدرس پست الکترونیک ، ارائه تبلیغات “banner” مرتبط با عبارت .
جستجو براساس نوع فایل مانند تصویر
جستجو در مکان خاصی از صفحه وب
جستجو در دستورات “tag” صفحه وب
ارائه کلید واژه ها و نتایج مشابه
عملگرهای جستجو
عملگر REQUIRED TERM “+” وقتی این عملگر در کنار یک کلمه می آید به معنی این است که کلمه موردنظر حتما در صفحه باشد.
عملگر PROHIBITED TERM”-” با گذاشتن این عملگر کنار کلمه ، صفحاتی آورده می شود که کلمه موردنظر در آن نباشد، در مثال language-english +تمام صفحاتی آورده می شود که کلمه language در آن باشد ولی زبان english در آنها نباشد.
عملگر PROXIMITY کلمات موردنظر در کنار هم و یا نزدیک هم باشند. با عملگرnear/n دو کلمه به تعداد n کلمه نزدیک یکدیگر باشند. با عملگر followed byمابین دوکلمه ، دوکلمه دقیقا در کنار هم و با ترتیب قیدشده بیایند. موتور جستجوی webcrawler قویترین موتور در زمینه PROXIMITY است .
عملگرWILDCARD”* ویا$” با این عملگر برای مثال radio* تمام صفحاتی که کلمه radio و مشتقات آن را داشته باشد می آورد. مثل کلمه radiology، باتوجه به موتور،تعداد حروف آورده شده بعداز کلمه متفاوت خواهدبود.
عملگر منطقی BOOLEAN شامل
AND NOT, OR, AND با استفاده از ANDمابین دوکلمه صفحاتی که هم کلمه اول وهم کلمه دوم را شامل شود می آورد. با استفاده ORمابین دوکلمه ، صفحاتی که یا کلمه اول و یا کلمه دوم را شامل شود می آورد.
بااستفاده AND NOT مابین دوکلمه ، صفحاتی آورده می شود که شامل کلمه اول باشد و حتی شامل کلمه دوم نباشد. بجای عبارت AND NOT,OR,AND می توان ازنشانه های آن استفاده کرد:
& به جای AND، ا به جای OR و ! به جای NOT
گروهبندی منطقی با استفاده از پرانتز () مثل : iran and “tourism or hotel”
استفاده از quotation mark برای مشخص کردن عبارت . ” search engine” دقیقا دوکلمه به صورت یک عبارت در صفحه باشد. می توان برای مشخص کردن عبارت ازعلامت |;بین کلمات استفاده کرد.
بسیاری از موتورهای جستجو در دو حالت ساده و پیشرفته “advanced” جستجومی کنند. معمولا درحالت پیشرفته ، عملگرهای منطقی و PROXIMITY قابل استفاده می باشد.
چگونه جستجوی بهتری انجام دهیم
بخاطر داشته باشید کلید جستجوی موفق در این است که شما باهوش تر از کامپیوترهستید.
ابتدا ببینیدکه به دنبال چه موضوعی هستید باتوجه به انواع موتور جستجو که درابتدای مقاله ذکر شد، موتور خود را انتخاب کنید. قبل از جستجو لازم است با مراجعه به برنامه helpهر موتور دستورالعمل های آن را مطالعه کنید تا حداکثراستفاده ازآن رابکنید.عملگرهای گفته شده دربالا معمولا دراکثرموتورهاقابل استفاده هستند.
علاوه بر نکات قیدشده در مقاله رعایت نکات ذیل کمک بسیاری در انجام جستجوی بهتر دارد:
۱ – از حروف بزرگ برای جستجو اسامی خاص ، شرکتها و محصولات استفاده کنید. درانگلیسی بسیاری از کلمات عام و خاص هستند مثلORACLE که به معنی الهام غیبی است ولی به صورت خاص ORACLE یک RDBMSاست .
۲ – بعضی از کلمات از سایر کلمات مشتق شده است کوچکترین آن مجموعه را بدهید.
۳ – از کلمات مفرد استفاده کنید جمع آن نیز در نتایج خواهدآمد.
۴ – اگر تلفظ صحیح یک کلمه را نمی دانید چند تلفظ را با هم بدهید مثل : dostoyevski dostoevski dostoevsky
۵ – از عبارت استفاده کنید ” best search engine ”
۶ – چند مترادف کلمه را باهم بدهید.
secure security privacy safe
۷ – می توان درجه بندی نتایج را کنترل کرد و یا می توان به یک کلمه در یک عبارت وزن بیشتری داد برای مثال shopping shopping shopping mall
۸ – از کلمات عمومی مثل کتاب car استفاده نکنید بلکه با استفاده از عبارت ، دقیقا دریک زمینه ســــوال کنیـد بــــرای مثــــال اگر می خواهید ماشین بخرید نام ماشین و
شهر موردنظر خود را وارد کنید
“toyota dealership” and texas
۹ – بسیاری از موتورهای جستجو در کنار نتایج حاصله similar sites دارند که امکان دسترسی به نتایج بهتر را می دهند.
۱۰ – تاریخ صفحات را مشخص کنید.
۱۱ – نوع زبان را مشخص کنید.
در انتها پایگاههایی هستند که می توان از طریق آنها استراتژی جستجو را تعریف کرد.باتوجه به عوامل مهم ازنظر شما، موتور جستجوی مناسب را معرفی می کند. نمونه آن noodlequest.com است .
منبع:http://www.imi.ir/tadbir/tadbir-105/NetReport-105/1.asp