eruLabo

Web Dev. erusya's Blog

등록하는 포스팅의 날짜 기록에 대해 이리저리 알아 보고 있었습니다.



구글검색을 해보면 일부는 날짜기록이 표시되는데 비해 안되는 페이지도 많죠.

예전엔 단순히 메타태그에 last-modified 값으로 날짜기록을 남기는 줄 알았는데 구글 검색엔진이나 대부분의 검색엔진또한 날짜에 관련된 메타태그는 수집하지 않는다고 하더군요.



그럼 당연히 생기는 의문점 중 하나가 검색엔진은 도대체 어떻게 저 날짜를 특정하냐? 입니다.


관련내용에 대해서 검색해봐도 이렇다할 가이드자료는 전혀 나오지 않았습니다. 출처에 여러가지 글을 보고 추측성으로 정보를 남겨봅니다.




1. 크롤러가 수집하는 그 날짜가 웹페이지의 날짜가 된다?

이 경우는 거의 아닐듯 싶습니다. 최초에 수집된 날짜가 수집일이라고 치면 이후에 갱신되는 페이지 내용에 따라 날짜관리를 크롤러와 엔진 서버가 한다는 이야긴데, 너무 과도한 작업이겠죠...


2. 검색엔진이 이해하는 추가 코드를 작성하고 검색엔진은 그 정보를 읽는다?

제일 가능성 높은 방안이긴 합니다. 보통 이런정보를 의 메타 태그를 통해 전달하는데, 지금 그런 표준안이 없단말이죠... HTML5로 판올림되면서 http-equiv 방식의 메타태그는 다 사장됬고 심지어 구글엔진도 효과적인 페이지로 인식 안 한다고 발표했고요.

이 부분에 관련해서 좀 자세히 구글링해보니 구글 엔진이 인식하는 Article 페이지 전용 메타/스크립트 기록방식인 AMP 라는 템플릿이 있던데요. 제가 찾는 명쾌한 답변은 아닌듯 싶습니다.


3. 그냥 그런거 없다. 페이지 크롤링도중에 날짜같이 생긴걸 인식한다.

제일 비논리적이지만 현 상황에서 제일 잘 부합하는 경우가 되어버렸습니다. 일단 구글검색에 날짜정보가 보이는 페이지와 안보이는 페이지를 몇개 들어가봐서 HTML 코드를 봤는데, 날짜가 노출되는 페이지의 경우 어딘가에 날짜정보만 태그로 이쁘게 감싸져있는 경우가 많더군요. 좀 더 섬세한 페이지는 그 태그에 "date"라던지 이 날짜가 퍼블리싱된 날짜인지 업데이트된 날짜인지 까지도요. 근데 또 그게 표준 규격이 있는게 아니고 사이트마다 다 독자적인 기준인데, 검색엔진은 그걸 이해합니다.

거참 이상합니다. 결과론적으로 접근하자면 검색엔진이 날짜를 이해할 수 있도록 태그를 정리해서 작성해야하는 방법이 제일 베스트 인것 같습니다... 만 뭔가 깔끔하지가 않네요.

이 부분에 대해서는 며칠간 검색을 통해 정보를 알아보았는데, 아직까지 명쾌한 답은 못찾고 있습니다.




혹시 이 부분에 대해서 정확히 명시된 자료가 있다면 코멘트나 이메일로 정보공유 부탁드립니다!



SEO와 관련된 구글의 평가 가이드 -Ref.1

UTC 와 표기법, 그리고 ISO 8601, RFC 3339 표준 -Ref.2

Meta tags that Google understands -Ref.3

What date formats does Google Sheets recognize? -Ref.4

The Effect of Showing Last Updated Date Stamps on Blog Traffic -Ref.5

구글 google 검색엔진 최적화(SEO) 초보자 가이드 -Ref.6

126 Views | 0 Comment
Profile Image
erusya

안녕하세요, erusya 입니다.
현직 풀스택 개발자로 일하는 중이고 요즘은 기획업무도 경험을 쌓고있습니다.
방문해주셔서 고마워요!


Recently Comments

Visitors