Search Console에서 sitemap 가져올 수 없음이 뜰 때 확인한 것
Google Search Console에 sitemap을 제출했는데 “가져올 수 없음”이 뜨면 당황스럽습니다.
Daejin Lab에서도 처음 sitemap을 제출했을 때 같은 상태가 나왔습니다.
이번 글은 그때 실제로 확인한 항목을 정리한 기록입니다.
처음 의심한 것
처음에는 sitemap 파일 자체가 없는 줄 알았습니다. 그래서 공개 주소에서 직접 열어봤습니다.
https://daejin-lab-blog.pages.dev/sitemap-index.xml
파일은 열렸지만, 안쪽에 들어 있는 주소가 문제였습니다. 초기 설정에 남아 있던 도메인 후보 때문에 sitemap이 아래 주소를 가리키고 있었습니다.
https://daejinlab.com/sitemap-0.xml
Search Console에 등록한 속성은 pages.dev 주소였기 때문에, 다른 도메인을 가리키는 sitemap을 제대로 가져오지 못한 것입니다.
수정한 파일
이 문제를 고치기 위해 URL 기준값을 현재 공개 주소로 맞췄습니다.
astro.config.mjs
src/consts.ts
public/robots.txt
수정 기준은 아래처럼 통일했습니다.
https://daejin-lab-blog.pages.dev
그 뒤 다시 빌드했습니다.
npm run build
확인한 항목
수정 후에는 아래를 확인했습니다.
robots.txt 상태: 200 OK
sitemap-index.xml 상태: 200 OK
sitemap-0.xml 상태: 200 OK
sitemap 안 URL 개수
예전 daejinlab.com 주소가 남아 있는지
신규 글 URL이 sitemap에 들어갔는지
최종적으로 sitemap에는 현재 공개 주소만 남았습니다.
https://daejin-lab-blog.pages.dev/...
그래도 바로 성공하지 않을 수 있다
사이트 쪽 문제가 해결되어도 Search Console 화면에서는 한동안 “가져올 수 없음”이 남아 있을 수 있습니다. 이 경우에는 구글 쪽 재처리 시간이 필요할 수 있습니다.
그래도 사이트 기준으로 아래가 정상이면 우선 큰 문제는 아니라고 봤습니다.
robots.txt에서 차단하지 않음
sitemap 파일이 200으로 열림
canonical이 현재 도메인을 가리킴
noindex가 없음
x-robots-tag가 없음
결론
Search Console의 sitemap 오류는 무조건 Google 문제라고 보기 전에, 먼저 sitemap 내부 URL을 확인해야 합니다.
Daejin Lab의 경우 원인은 sitemap 파일 부재가 아니라 현재 등록한 사이트 주소와 sitemap 내부 주소가 달랐던 것이었습니다. 정적 블로그에서는 도메인 변경 전후로 site 설정을 꼭 확인해야 합니다.