본문 바로가기
일상다반사

초보자 구글 서치 콘솔 색인 문제 해결 방법

by 토끼곰댁 2024. 7. 14.

 

블로그를 운영하고 관리하기 위해서는 양질의 콘텐츠를 꾸준히 기록하는 습관도 중요하지만,

구글 서치콘솔을 통해 내 게시물이 구글 검색에 노출되도록 색인되는 것도 매우 중요하다는

걸 느꼈습니다.

 

구글 서치콘솔 색인 문제로 인해 어려움을 겪고 계신가요? 토끼곰댁도 비슷한 문제를

경험했는데, 이번 포스팅에서는 구글 서치콘솔 색인 문제의 주요 사유와 그 해결 방법에

대해 소개해드리겠습니다.

구글 서치 콘솔 색인 문제 사유 종류

 

사유 설명
크롤링되지 않음 (Discovered - currently not indexed) 해당 페이지를 발견했지만 아직 크롤링하지 않았다는 의미
404 오류 (404 error) 해당 페이지가 존재하지 않음
robots.txt에 의해 차단됨 (Blocked by robots.txt) robots.txt 파일이 페이지 크롤링을 차단한 경우
Noindex 태그에 의해 차단됨 (Blocked by noindex tag) HTML 코드에 noindex 메타 태그가 포함되어 구글이 색인하지 않도록 지시된 경우
Soft 404 오류 (Soft 404) 콘텐츠가 매우 적거나 부정확하여 구글이 페이지를 유효하지 않은 것으로 간주한 경우
대체된 페이지 (Duplicate page without canonical tag) 중복 콘텐츠로 간주되며, 캐노니컬 URL이 설정되지 않은 경우
페이지 리디렉션됨 (Page redirected) 페이지가 다른 URL로 리디렉션 될 때, 최종 URL이 색인됨
Crawl anomaly 페이지 크롤링을 시도했지만 알 수 없는 이유로 실패한 경우
서버 오류 (Server error) 크롤링 중 서버 오류
사이트의 질이 낮음 (Low quality content) 콘텐츠가 얇거나 품질이 낮아 구글이 색인을 생략하는 경우

 

구글-서치콘솔에서-웹사이트-성능을-분석하는-사람
구글 서치콘솔을 통해 웹사이트의 성능을 분석하는 모습. 검색 트래픽과 색인 문제를 확인할 수 있다.

카테고리 이름 수정으로 인한 중복 페이지 발생

블로그를 개설한 지 얼마 되지 않았고, 카테고리 분류 이름을 고민하고 있을 때 토끼곰댁네

첫 게시물은 발행되었습니다. 그렇게 색인 요청은 진행되었고 생성까지 되었으나 중간에

카테고리 이름을 수정해 버렸습니다.

 

보고서를 확인하니 URL에 이름이 다른 것이었습니다. 만약 원본 게시물이 수정되었다면,

구글은 새로운 내용을 크롤링해서 업데이트했을 것이므로, 문제 사유가 발생하지 않았을 것입니다.

 

이에 대한 해결 방안으로, 원래는 HTML 코드를 열어서 잘못된 캐노니컬 태그를 수정해야 되지만,

너무 기술적인 부분입니다. 그래서 토끼곰댁은 가장 간단한 URL 검사 도구를 사용하여 수정된

페이지를 제출하고 색인 생성 요청을 다시 했고 현재는 생성 완료된 상태입니다.

구글-서치콘솔에서-페이지-색인이-생성되지-않은-이유에-대한-메시지-화면
구글 서치콘솔에서 페이지 색인이 생성되지 않은 이유를 보여주는 메시지 화면. 적절한 표준 태그가 포함된 대체 페이지, robots.txt에 의해 차단됨, 다른 4xx 문제로 인한 차단 등이 포함됨.

의도하지 않은 크롤링 차단

● robots.txt에 의해 차단됨
만약 구글 서치콘솔 색인 문제에서 'robots.txt에 의해 차단됨' 오류를 발견했다면,

이 파일을 수정하여 구글이 페이지를 크롤링할 수 있도록 허락해야 합니다.

 

다만, 토끼곰댁은 이 페이지가 의도적으로 차단된 것이기 때문에 특별히 수정하지 않았습니다.

일단 이 부분은 애드센스 승인 전까지 데이터를 확보하기 위해 현재 상태로 유지하려고 합니다.

이후 어떻게 진행했는지에 대해 따로 게시글로 공유하겠습니다.

일시적인 구글의 현상

● 다른 4xx문제로 인해 차단됨
구글 서치콘솔에서 해당 메시지가 나타나면 "발행된 게시물에 접근하려고 했지만, 몇 가지 문제

때문에 접근할 수가 없네"라는 의미입니다. 다행히도 구글 서치콘솔은 문제를 해결할 수 있는

상세한오류 코드를 제공합니다.

 

그때 상황에 맞는 해결책으로 대응하면 됩니다. 토끼곰댁은 문제의 URL 뒤에 /reaction이라는

사유였는데, 이것은 '구글에서 내 게시물의 반응을 잡기 힘듦'이라는 의미입니다. 이때 발행된

게시물을블로그에서 정상적으로 읽을 수 있다면, 블로그의 문제가 아닌 구글의 일시적인 오류로

인한 문제이므로,마음의 여유를 가지고 기다리면 됩니다.

구글 서치 콘솔 보고서는 항상 챙겨 보자

초기에 블로그 운영을 시작할 때 서치콘솔에 대해 함께 공부하고 알아간다면, 블로그를

모니터링하고,문제를 해결하는 과정에서 더욱더 성장하는 데 도움이 될 것입니다.

 

여러분도 토끼곰댁과 함께 같이 성장할 수 있는 블로그가 되길 기원합니다!