آموزش کامل بخش pages سرچ کنسول گوگل
pages سرچ کنسول (coverage سابق) یکی از مهمترین بخش های ابزار سرچ کنسول گوگل است که وضعیت صفحات سایت را به صورت مرتب رسد میکند و به ما نمایش میدهد. یکی از سوالات مهم سئوکاران تازه کار این است که از کجا بفهمیم صفحات سایت ایندکس شده یا ایندکس نشده است و مشکل ایندکس نشدن برخی از صفحات چیست؟
بله! وظیفه بخش pages در سرچ کنسول گوگل دقیقا همین است و اطلاعات بسیار ارزشمندی درباره وضعیت صفحات سایت به شما گزارش میدهد که با بررسی کردن آنها میتوانید، مشکلات بوجود آمده را شناسایی و برطرف کنید.
در این آموزش گوگل سرچ کنسول به صورت کامل بخش pages سرچ کنسول را توضیح میدهیم و تمام خطاهای آن را قدم به قدم به صورت تصویری آموزش خواهیم داد.
بخش pages سرچ کنسول گوگل
بخش pages سرچ کنسول گوگل یک گزارش کامل از وضعیت url تمام صفحات سایت در اختیار ما قرار میدهد. در آپدیت جدید سرچ کنسول، گزارش pages در بخش indexing قرار گرفته است. بخش pages به شما نشان میدهد که چه تعداد از صفحات توسط خزندههای گوگل ایندکس شده است. کدام صفحات توسط رباتهای گوگل خزیده شده، ولی به خاطر وجود برخی خطاها ایندکس نشده است.
به طور کلی هر صفحهای (URL) که در سایت وجود داشته باشد، گوگل سعی میکند آنها را بخزد و اگر مشکلی نداشته باشد، ایندکس کند. ولی اگر صفحه یا URL مشکلی داشته باشد با نمایش خطا به شما هشدار میدهد تا آنها را بررسی و برطرف کنید. بخش pages با گزارشات ارزشمند خود به ما کمک میکند تا یک دید کلی از وضعیت خطاهای سایت داشته باشیم و با یک تصمیم گیری اساسی آنها را برطرف کنیم.
معرفی پارامترهای بخش pages سرچ کنسول
قبل از شروع آموزش بخش pages سرچ کنسول ابتدا باید مفهوم و منظور پارامترهای که در این بخش قرار دارند را بلد باشید تا ادامه آموزش را بهتر یاد بگیرید.
همان طور که در تصویر زیر میبینید در سمت چپ بالای صفحه یک زبانهای وجود دارد که از چند گزینه تشکیل شده است. با انتخاب هر کدام از این گزینهها، اطلاعاتی که نمایش میدهد، تغییر خواهد کرد.
- All known pages: این گزینه تمام صفحات سایت شما را که گوگل در دنیای وب پیدا کرده است را نشان میدهد.
- All submitted pages: تمام صفحاتی که در سایت مپ ثبت کردهاید را نشان میدهد.
- Unsubmitted pages only: فقط صفحاتی را نشان میدهد که در سایت مپ ثبت نشدهاند.
در قسمت پایین این گزینهها اگر سایت شما خیلی بزرگ باشد و چند سایت مپ داشته باشید، گزینههای سایت مپ را نشان میدهد که میتوانید یکی از آنها را انتخاب کنید تا اطلاعات آن را نمایش دهد.
نکته: بهترین گزینه انتخاب All known pages میباشد و بهتر است در همان حالت پیش فرض باقی بماند. چرا که ممکن است شما صفحاتی که لازم ندارید ایندکس شوند را در سایت مپ قرار نداده باشید، ولی در این حالت گوگل تمام صفحات ایندکس نشده را هم نمایش میدهد.
نکته: اگر شما نقشه سایت را در سرچ کنسول ثبت نکرده باشید، احتمالا گزینه All submitted pages را نخواهید دید و باید نقشه سایت را ثبت کنید تا این گزینهها دیده شوند.
- پارامتر Last updated در pages سرچ کنسول
در بالای نمودار سمت راست صفحه، عبارت Last updated را میبینید. تاریخی که در مقابل این عبارت نشان میدهد، آخرین خزشی است که ربات های گوگل بر روی سایت انجام دادهاند.
- پارامترهای جدول گزارش pages در سرچ کنسول (تصویر پایین)
- Reason (دلیل): دلایل ایندکس نشدن urlها را با نوع خطا نمایش میدهد که اگر بر روی هرکدام از آنها کلیک کنید، تمام urlهایی که با آن خطا مواجه شدهاند را خواهید دید.
- Source (منبع): این ستون منشا و منبع مشکل ایندکس نشدن urlها را نمایش میدهد. یعنی اینکه مشکل از وبسایت خودمان است یا گوگل.
- Validation (اعتبارسنجی): وقتی شما مشکلات را حل میکنید و به گوگل درخواست بررسی مجدد میدهید. اگر نتیجه اعتبار سنجی شکست بخورد (failed) نمایش میدهد و اگر (not started) باشد، یعنی هنوز اعتبار سنجی شروع نشده است.
- Trend (روند): وضعیت صفحات را به صورت یک نمودار کوچک نشان میدهد.
- Pages (صفحات): تعداد صفحات یا urlهایی که به مشکل خورده را نمایش میدهد.
آموزش بخش های مختلف pages سرچ کنسول
تا قبل آگوست سال 2022 وقتی بخش pages سرچ کنسول را باز میکردید یک نمودار با 4 رنگ مختلف با نام های Errors ،valid with warning ،valid و Excluded را مشاهده میکردید که هرکدام بیانگر نوع خاصی از صفحات بودند.
اما در آپدیت جدید سرچ کنسول برخی از این بخشها حذف یا باهم ادغام شدند که امروزه با نام جدید نشان داده میشوند. در بروزرسانی که انجام شد، بخشهای valid with warning و valid در گروه indexed و بخشهای Errors و Excluded در گروه Not indexed قرار گرفتند.
شما وقتی گزارش psges سرچ کنسول جدید را باز میکنید یک نمودار با دو رنگ متفاوت مثل تصویر زیر را مشاهده میکنید. در زیر این نمودار یک باکسی با عنوان Why pages aren’t indexed قرار داد که دلایل ایندکس نشدن urlهای سایت را با نوع خطاها نمایش میدهد.
در ادامه به صورت مفصل این دوبخش و خطاهایی که در آنها نمایش داده میشود را توضیح خواهیم داد.
بخش indexed در pages سرچ کنسول
همان طور که در تصویر بالا میبینید، بخش indexed که در نمودار با میلههای سبز رنگ است، urlهایی را نشان میدهد که بدون هیچ مشکلی ایندکس شدهاند. در پایین نمودار اگر بر روی عنوان View data about indexed page کلیک کنید، آدرس صفحاتی که ایندکس شده اند را خواهید دید. صفحاتی که در بخش indexed قرار دارند، هیچ مشکل و خطایی ندارند و به همین دلیل، جزئیات زیادی برای نمایش هم وجود ندارد.
بخش Not Indexed در psges سرچ کنسول
همان طور که در تصویر بالا میبینید، صفحاتی که به هر دلیلی ایندکس نشدهاند در بخش Not Indexed با میلههای خاکستری رنگ نشان داده میشود. توجه کنید که این ایندکس نشدن میتواند دلایل مختلفی داشته باشد و شاید خود شما بعضی از صفحاتی مانند: سبد خرید، قوانین و مقررات، صفحه پرداخت و غیره را از ایندکس شدنشان جلوگیری کردید.
پایین نمودار زیر عنوان Why pages aren’t indexed شما میتوانید همانند تصویر زیر نوع خطا، منبع خطا، دلایل ایندکس نشدن و تعداد آنها را مشاهده کنید. اگر بر روی هرکدام از عناوین خطا کلیک کنید یک صفحه جدیدی باز میشود که در آن یک نمودار مختص به آن خطا و تعداد urlهایی که با این خطا روبرو شدهاند را خواهید دید. همچنین در صفحهای که برای هر کدام از خطاها باز میشود، تاریخ اولین و آخرین باری که این خطا برای هر صفحه مشاهده شده را خواهید دید.
نکته: تعداد عناوین خطاهایی که در تصویر بالا میبینید برای هر سایتی فرق میکند. اگر شما هر کدام از این خطاها را در سایت نداشته باشید، قطعا برخی از این عناوین خطاها را نخواهید دید.
اما رایج ترین خطاهای بخش Not Indexed کدامند و چگونه باید آنها را برطرف کنیم؟
رایج ترین خطاهای بخش Not Indexed
Excluded by noindex tag
صفحاتی که در داخل آنها تگ noindex استفاده شده باشد در این بخش نمایش داده میشود. اکثر اوقات سئوکاران برای بهینهسازی سئو سایت برخی از صفحات را نوایندکس میکنند و گوگل آدرس آن صفحات را در این بخش لیست میکند. شما باید تمام این urlها را بررسی کنید، اگر خودتان noindex کردهاید که لازم نیست اقدامی انجام دهید، گوگل فقط برای آگاهی شما آنها را نمایش میدهد. ولی اگر صفحهای در لیست وجود دارد که نباید noindex باشد، باید آنها را شناسایی و تگ نوایندکس آن صفحات را حذف کنید.
Alternate Page with Proper Canonical Tag
صفحاتی که به صفحه دیگر کنونیکال شدهاند در این قسمت لیست میشوند. شما باید آدرس تمام صفحات را در این لیست بررسی کنید و اگر خودتان در این صفحات تگ کنونیکال قرار دادهاید، نیازی نیست اقدامی انجام دهید. اما اگر صفحه بود که شما آن را به صفحه دیگر کنونیکال نکردهاید، باید به آن صفحه مراجعه و تک کنونیکال را اصلاح کنید.
Not Found (404)
صفحاتی که خزندههای گوگل به آنها مراجعه کرده ولی آن صفحات در دسترس نبودند و با خطای 404 روبرو شده است. یا به عبارتی صفحاتی که قبلا وجود داشته و الان به هر دلیلی در سایت شما نیست و 404 شدهاند. صفحات 404 را گوگل در این بخش لیست میکند و به شما نمایش میدهد تا شما آگاه باشید.
بهتر است صفحاتی که با خطای 404 مواجه شدهاند را به صفحات مرتبط ریدایرکت کنید. با این کار کاربر را به صفحه مرتبط هدایت میکنید و اگر برای آن صفحه لینکی هم گرفتهاید، از آن بهره میبرید.
Page with Redirect
صفحاتی را که در سایت خود به صفحه دیگر ریدایرکت 301 یا 302 کرده باشید، گوگل در این بخش آدرس آنها را لیست میکند تا شما را آگاه کند. شما باید آدرس تمام این صفحات را بررسی کنید و ببینید که خودتان آنها را ریدایرکت کردهاید یا نه.
اگر خودتان انجام دادهاید که جای نگرانی نیست. ولی اگر صفحهای را دیدید که شما آن را به صفحه دیگر ریدایرکت نکردهاید، بهتر است آن را شناسایی و برطرف کنید تا از بروز خطاهای دیگر جلوگیری شود.
Duplicate without User-selected Canonical
صفحاتی که تکراری هستند و تک کنونیکال در آنها استفاده نشده است را گوگل در این بخش لیست میکند. در این حالت گوگل نمیتواند تشخیص دهد که کدام صفحه اولویت شماست و باید ایندکس کند. شما باید این صفحات تکراری را شناسایی و تگ کنونیکال به آنها اظافه کنید. در واقع سئوکار با قرار دادن تگ کنونیکال در صفحات تکراری، صفحهای که در اولویت است را به گوگل معرفی میکند تا آن ایندکس شود.
مثلا: فرض کنید یک سایت فروشگاه موبایل دارید. یکی از محصولات شما گوشی A15 است که این مدل گوشی خودش چند مدل متفاوت 64 گیگ، 128 گیگ و 256 گیگ دارد که هر کدام صفحات جداگانهای دارند. مسلما تمام جزئیات آنها شبیه به هم هستند به غیر از چند مورد جزئی. خب در این مواقع شما باید یک از این صفحات را به عنوان صفحه اصلی در اولویت قرار دهید تا ایندکس شود و صفحات دیگر را به صفحهای که در اولویت شماست، تگ کنیونیکال بزنید.
Discovered–currently not indexed
این خطا به معنی این است که گوگل این صفحات را پیدا کرده، ولی بنا به دلایلی آنها را ایندکس نکرده است. معمولا اگر بارگزاری صفحات بیش از حد طول بکشد، گوگل ایندکس کردن آنها را به خزش بعدی موکول میکند. شما باید صفحاتی که در این بخش لیست شدهاند را بررسی کنید و اگر مشکلی مشاهده نکردید، برای سریعتر ایندکس شدن، به صورت دستی از قسمت URL Inspection تقاضای ایندکس مجدد کنید. با این کار اگر صفحه مورد نظر واقعا مشکلی نداشته باشد، گوگل در خزش بعدی حتما آن را ایندکس میکند.
Crawled–currently not indexed
این خطا یعنی اینکه گوگل این صفحات را پیدا کرده و در آنها هم خزیده است، ولی به دلایلی صلاح ندیده آنها را ایندکس کند. به صورت رسمی و واضح گوگل دلیل این خطا را بیان نکرده است، ولی موارد زیر میتواند علت اصلی بروز این خطا باشد:
- صفحاتی که محتوای ضعیف، محتوای کپی یا تکراری دارند.
- صفحاتی که بی ارزش هستند.
- اگر سرعت بارگزاری صفحه خیلی کند و ضعیف باشد.
- صفحه تجربه کاربری خوبی نداشته باشد.
- اگر صفحه noindex باشد.
- صفحهای به صفحه دیگر کنونیکال شده باشد.
شما باید تک تک این صفحات را بررسی کنید و اول از همه ببینید که آیا محتوای شما ارزشمند و یونیک است یا نه. سپس سایر موارد را بررسی کنید تا دلیل ایندکس نکردن گوگل را متوجه شوید.
Blocked by robots.txt
صفحاتی که توسط فایل robots.txt مسدود شده است، گوگل در این بخش لیست میکند. معمولا سئوکاران برای بهبود سئو سایت و افزایش بودجه خزش، آدرس برخی از صفحات را در فایل robots.txt مسدود میکنند. اگر آدرس صفحاتی را که در این لیست مشاهده میکنید، خودتان مسدود کردهاید، جای نگرانی نیست. اما اگر در بین این لیست آدرس صفحاتی را مشاهده میکنید که نمیخواستید مسدود شوند، باید به فایل robots.txt مراجعه کنید و کدی را که باعث مسدود شدن این صفحه یا صفحات دیگر شدهاند را اصلاح کنید.
Duplicate, Google Chose different canonical than user
این خطا برای صفحاتی رخ میدهد که گوگل تشخیص داده آنها به صفحات مناسبتری میتوانستند، کنونیکال شوند. معمولا گوگل به صورت مستقیم از سایت به این صفحات نرسیده است، بلکه از طریق لینکهای خارجی به این صفحات دسترسی پیدا میکند. به دلیل مغایرت با کنونیکالی که کاربر انتخاب کرده با کنونیکالی که گوگل آن را مناسب میداند، این صفحات ایندکس نمیشوند. پس باید این صفحات را بررسی کنید و ببینید که آیا شما تگ کنونیکالی را که قرار داده اید، درست و مناسب بوده است یا نه.
Blocked due to other 4xx issue
صفحاتی که گوگل برای دسترسی به آنها با مشکل مواجه شده است را در این بخش لیست میکند و با خطای 4xx نشان میدهد. این خطاها معمولا در بازه 400 تا 451 قرار دارند.
Server error (5XX)
زمانی که خزندههای گوگل به سایت شما سرزدهاند، ولی سرور سایت دچار مشکل بوده و ربات گوگل با ارور 500 مواجه شده است. گاهی اتفاق میافتد که سرور سایت برای چند دقیقه دچار مشکل میشود و همان لحظه رباتها هم به سایت سر میزنند که در نتیجه با ارور 500 روبرو میشوند.
معمولا این خطا به خاطر مشکلات میزبانی سایت یا سرعت پایین اینترنت اتفاق میافتد و طبیعی است. اگر تعداد صفحاتی که با این خطا مواجه شدهاند زیاد باشد و هر روز هم به تعداد آنها اظافه میشود، باید فکری به حال سرور سایت خود بکنید و آن را ارتقا دهید یا سرور خود را عوض کنید.
Blocked by page Removal Tool
صفحاتی را که در بخش Removals سرچ کنسول حذف کردهاید، گوگل در این قسمت لیست میکند و به شما نشان میدهد. برای حذف کردن صفحات شما باید دسترسی کامل (owner ) به سرچ کنسول داشته باشید.
Blocked due to unauthorized request (401)
برای صفحاتی که شما رمز ایجاد کردهاید و برای بازدید نیاز به مجوز دارند؛ گوگل نمیتواند به آنها دسترسی داشته باشند و آن صفحات را بخزند. پس باید درخواست مجوز یا رمز عبوری که قرار دادهاید را حذف کنید تا رباتهای گوگل به راحتی بتوانند به آن صفحات دسترسی داشته باشند.
Blocked due to access forbidden (403)
صفحاتی که برای دسترسی رباتهای گوگل از سمت سرور بسته شده است با این خطا نمایش داده میشوند. اما این کار اشتباه است و بهتر است صفحاتی را که نمیخواهیم گوگل به آنها دسترسی داشته باشد و ایندکس کند، با تگ noindex آنها را مسدود کنیم.
Soft 404
صفحاتی که کد 200 را بر میگردانند، ولی گوگل معتقد است این صفحات باید کد 404 بر میگرداندند. این خطا زمانی رخ میدهد که یک صفحه اصلا محتوایی ندارد، یا اینکه باید محتوای صفحه ارور نشان میداده که نداده است. این موضوع باعث میشود که خزنده های گوگل گیج شوند و در تشخیص وضعیت آن صفحات اشتباه کنند.
کلام آخر:
تحلیل و آنالیز در سئو حرف اول را میزند. تحلیل درست و اصولی میتواند مسیر را برای رسیدن به هدف و موفقیت هموار کند. سرچ کنسول یکی از ابزارهای قدرتمند گوگل است که میتواند، بهترین و کاملترین اطلاعات را در اختیار شما قرار دهد. همان طور که در این مقاله گفتیم بخش pages یکی از مهمترین بخش های سرچ کنسول گوگل است که گزارش های بسیار ارزشمندی در اختیار سئوکاران قرار میدهد.
در بخش pages گوگل سرچ کنسول گزارشاتی از وضعیت صفحاتی که ایندکس شدهاند و صفحاتی که به دلایل مختلفی ایندکس نشدهاند را به ما نشان میدهد. شما میتوانید با خطاهایی که در گزارش pages مشاهده میکنید، علت مشکلات بوجود آمده را شناسایی و برطرف کنید.
دیدگاهتان را بنویسید