ساختار URL
یو ار ال URL یک سایت باید تا حد امکان ساده باشد. سازماندهی مطالب به گونه ای در نظر گرفته شود که یو ار ال ها به طور منطقی و قابل فهم (تا حدی که امکان دارد کلمات قابل خواندن ، تا این که به صورت اعداد طولانی ID باشد ) برای افراد ساخته شود . به عنوان مثال ، اگر در جستجوی مطالبی در مورد هوانوردی هستید ، یو الی مثل http://en.wikipedia.org/wiki/Aviation می تواند به شما در جهت تصمیم گیری بر کلک کردن یا نکردن بر ان لینک کمک کند. یک یو ار ال مثل http://www.example.com/index.php?id_sezione=360&sid=3a5ebc944f41daa6f849f730f1, می تواند در خواست بسیار کمتری را از جانب کاربرها به همراه داشته باشد.
استفاه از نقطه گذاری در یو ار ال را در نظر داشته باشید. یو ار الی مثل http://www.example.com/green-dress.html برای ما بسیار مفید تر از http://www.example.com/greendress.html است. توصیه می کنیم که در یو ار ال از هایفن (-) به جای علامات تاکید ( _ ) استفاده شود.
یو ار ال های بیش از حد پیچیده ، مخصوصا آن هایی که در برگیرنده پارامترهای چندگانه هستند، می توانند به واسطه ایجاد اعداد بالای غیر ضروری از یو ار ال هایی که به مطالب یکسان یا مشابه در سایت اشاره دارند برای پیمایش گرها ایجاد مشکل کنند. بنابراین، گوگل بوت باید از وسعت باندی بیشتری نسبت به آنچه احتیاج دارد استفاده کند، یا ممکن است به طور کامل قادر به شاخص گذاری همه مطالب سایت نشود.
دلایل متداول از این گونه مشکلات
اعداد بالای غیر ضروری از یو ار ال ها میتواند در نتیجه برخی از مسائل بوجود آمده باشد. این مسائل عبارتند از:
فیلترینگ افزایشی از یک مجموعه از آیتم ها بسیاری از سایت ها شیوه های مختلف دید از یک مجموعه مشابه از آیتم ها یا نتایج جستجو را فراهم می کنند، که اغلب به کاربر اجازه فیلتر این مجموعه را که از معیار تعریف شده استفاده می کند را می دهد (برای مثال: هتل های موجود در ساحل را نشانم بده) زمانی که فیلتر ها بتوانند با شیوه افزایشی ترکیب شوند (به عنوان مثال: هتل های موجود در ساحل و همراه با مرکز سلامت) تعداد یو ار ال ها (با داده تطبیق دارند) در سایت ها از سر حد خود عبور می کند. ایجاد تعداد زیادی از لیست های مختلف بی اهمیت از هتل ها کار زائدی است، زیرا گوگل بوت تنها نیاز به مشاهده تعداد کمی از لیست ها دارد که بتواند به از آن طریق به صفحه موجود برای هر هتل دسترسی داشته باشد. برای مثال:
مشخصات هتل به شکل “ارزیابی مفید “:
http://www.example.com/hotel-search-results.jsp?Ne=292&N=461
مشخصات هتل به شکل “ارزیابی مفید ” در ساحل:
http://www.example.com/hotel-search-results.jsp?Ne=292&N=461+4294967240
مشخصات هتل به شکل “ارزیابی مفید” در ساحل همراه با مرکز سلامت:
http://www.example.com/hotel-search-results.jsp?Ne=292&N=461+4294967240+4294967270
· تولید پویا پوشه ها:
این می تواند در نتیجه تغییرات کوچکی به علت شمارگر ها ، timestamps یا آگهی ها بوجود امده باشد.
· پارامترهای مشکل دار در یو ار ال:
جلسه IDs، برای مثال، می تواند مقدار زیادی از کپی ها و تعداد بیشتری از یو ار ال ها را ایجاد کند.
· پارامتر های طبقه بندی شده:
برخی از سایت های خرید راه های زیادی جهت طبقه بندی آیتم های مشابه بکار می گیرند که افزایش تعداد یو ار ال ها را منجر می شود. برای مثال:
http://www.example.com/results?search_type=search_videos&search_query=tpb&search_sort=relevance
&search_category=25
· پارامترهای نامربوط در یو ار ال، از قبیل پارامتر های مرجوعی. برای مثال:
http://www.example.com/search/noheaders?click=6EE2BF1AF6A3D705D5561B7C3564D9C2&clickPage=OPD+Product+Page&cat=79http://www.example.com/discuss/showthread.php?referrerid=249406&threadid=535913http://www.example.com/products/products.asp?N=200063&Ne=500955&ref=foo%2Cbar&Cn=Accessories
· مسائل (موضوعات) تقویم:
یک تقویم ایجاد شده پویا می تواند لینک هایی برای تاریخ های آینده و قبل بدون محدودیت های از شروع تاریخ پایان ایجاد کند.
http://www.example.com/calendar.php?d=13&m=8&y=2011
http://www.example.com/calendar/cgi?2008&month=jan
· لینک های شکسته شده مرتبط:
لینک های شکسته شده مرتبط اغلب می توانند باعث باعث فضاهای نامحدود شوند. بسیاری از اوقات، این مشکل به علت تکرار عوامل مسیر PATH صورت می گیرد. برای مثال:
http://www.example.com/index.shtml/discuss/category/school/061121/html/interview/category/health/070223/html/category/business/070302/html/category/community/070413/html/FAQ.htm
مراحل رفع مشکل:
جهت اجتناب از مشکلات موجود با ساختار یو ار ال ، موارد زیر را توصیه میکنیم :
· استفاده از robot.txt را جهت مسدود کردن دسترسی گوگل بوت به یو ار ال های مشکل دار مد نظر قرار دهید. به طور معمول، باید مسدود کردن یو ار ال های پویا یا دینامیک را، از قبیل یو ار ال هایی که نتایج جستجو را بوجود می آورد ، یا یو ار ال هایی که می تواند فضاهای نامحدود ایجاد کند، از قبیل تقویم ها را مورد توجه قرار دهید. استفاده مرتب اصطلاحات در فایل robot.txt می تواند براحتی اجازه مسدود کردن یو ار ال های زیادی را به شما بدهد .
· هر جا که ممکن است، ازاستفاده از جلسه IDs در یو ار ال ها امتناع کنید. به جای آن استفاه از Cookies را مد نظر داشته باشید. دستور های وب مستر را جهت کسب اطلاعات بیشتر بررسی کنید .
· هر وقت که ممکن است، یو ار ال ها را با استفاده از پارامتر های غیر ضروری مرتب کنید .
· اگر سایت یک تقویم نامحدود دارد، جهت لینک با صفحات تقویمی که بطور پویا ایجاد شده است یک مشخصه nofollow اضافه کنید .