구글(Google) 검색 원리와 검색이 잘 되게 하는 방법

⏱ 4 분

구글 검색 잘 되는 방법

구글 검색 상위 노출을 결정 짓는 200가지 요소 (2018)

지난 포스트에서 구글 검색이 잘 되게 하기 위한 몇가지 방법을 알아봤습니다. 사이트맵과 RSS feed 도 제출하고, 메타 태그도 수정했었죠. 그게 구글 검색 결과에 어떤 영향을 미칠까요? 이 수 많은 웹의 자료들 중에서 과연 구글은 대체 어떻게 검색을 할까요?

우리가 아주 두꺼운 전공책에서 어떤 키워드에 해당하는 페이지를 찾는다고 해보죠. 처음에는 목차를 볼 수 있겠지만 해당 내용을 어느정도 알고 있지 않는 한 해당 키워드가 어디에 나올지 예측하기가 어렵습니다. 그럴 때 사용하는 것이 바로 찾아보기 입니다.

찾아보기 페이지를 보면, 책에서 중요하다고 생각하는 키워드들을 모아서 가나다 순 혹은 중요도 순으로 정렬을 해놓고, 해당 내용이 몇 페이지에 있는지 쭉 나열되어 있죠. 이런걸 색인 이라고 합니다. 구글도 바로 색인을 통해서 키워드를 검색합니다.

다음 세 가지 키워드를 통해서 자세하게 살펴보겠습니다.

  • 크롤링: 일단 구글이 정보를 수집하고,
  • 색인: 정보를 가지고 색인 (찾아보기)를 만들고,
  • 검색 결과 선택: 그 중에서 가장 유용한 페이지를 선택.

크롤링

크롤링은 이전 포스트에서도 계속 나와서 익숙하실 겁니다. 웹 상에 새롭게 생성된 페이지나 업데이트된 페이지를 찾아서 가져오는 작업을 말합니다. 사용자가 원하는 결과를 찾아주기 위해서 일단 많은 웹 페이지를 방문해서 정보를 수집하는 거죠. 이런 작업을 수행하는 프로그램을 크롤러라고 하고 구글에서는 Googlebot 이라고 합니다.

지난 포스트에서 검색이 잘 되게 하기 위해서 Search Console 이라는 구글 웹 마스터 도구를 이용해서 사이트맵을 제출하고, RSS feed 를 제출하는 과정을 함께 했습니다. 이러한 작업은 내 사이트의 웹 페이지 정보를 제출하는 것인데요, Googlebot은 이렇게 우리가 제출한 자료를 가지고 이 사이트에 새로운 자료가 있는지, 업데이트 된 자료가 있는지, 삭제된 자료가 있는지 확인하고 실제로 방문할지 말지를 결정합니다.

또한 방문했을 때는 페이지의 메타 태그를 통해서 해당 페이지의 정보를 파악합니다. 그래서 유효한 메타 태그를 잘 작성해놓아야 크롤러가 내 페이지의 정보를 잘 수집하가게 됩니다.

색인 생성

Googlebot 은 크롤링을 통해 수집한 정보를 바탕으로 색인을 작성합니다. 예를 들어 ‘Hexo 에 대한 내용이 필요하면 이 블로그를 보여준다.’ 이런 식으로 말이죠. 하지만 이런 페이지가 한 두개가 아닐겁니다. 그 중에서 어떤 순서로 페이지를 보여줄 것인지 선택을 해야 합니다.

검색 결과 선택

이제 실제로 사용자가 검색어를 입력했을 때, 구글 검색엔진은 만들어놓은 색인에서 일치하는 페이지를 검색해서 사용자에게 제일 유용하다고 판단되는 결과를 표시합니다. 이러한 판단은 무엇을 기준으로 할까요? 여기서 사용되는 것이 구글 고유의 검색 기술인 PageRank 입니다.

PageRank 는 다른 페이지에서 이 페이지를 인용(링크)하는 횟수를 가지고 이 페이지가 얼마나 유용하고 중요한지 판단하는 기술입니다. 다른 사람들이 많이 링크를 걸고 글을 쓸 때 인용을 한다면 그만큼 그 페이지의 내용이 좋고 중요하다는 뜻이겠죠. 이렇게 유용성을 판단하는데는 PageRank 외에도 200가지 이상의 요인이 있다고 하네요. 구글 자동완성 기능도 이런 중요도를 바탕으로 했기 떄문에 검색어를 예상해서 보여줄 수 있습니다.

검색 결과 사이트 순위를 올리는 방법

그렇다면 검색이 잘 되게 하려면 어떻게 해야 할까요? 수많은 웹 페이지 중에서 내 사이트를 검색 결과 상위에 노출시키려면 어떻게 해야 할까요? 힌트는 위에서 모두 나왔습니다. 다시 한번 정리하면서 살펴보겠습니다.

Search Console 사용

Search Console 을 통해서 사이트를 등록하고, 사이트맵을 제출합니다. 그래야 크롤러가 내 사이트의 정보를 잘 수집할 수 있습니다. 사실 등록을 하는 사람이 많기 때문에 등록을 해도 본전이긴 하겠네요.

또한 Search Console 에서 제공하는 Fetch as Google 기능을 사용합니다. 이걸 사용하면 크롤러가 내 페이지에 방문했을 때 어떻게 보이고 어떤 정보를 가져가는지 확인할 수 있습니다. 크롤러가 차단당해서 가져가지 못하는 자원이 있는지 확인할 수 있으니 그에 맞게 조치를 취할 수 있습니다.

구글과 방문자가 좋아하는 페이지 만들기

  • 정확한 주제에 맞는 키워드를 이용해서 제목과 본문을 작성합니다.
  • 이런 키워드는 사람들이 검색어로 사용할만한 키워드여야 합니다.
  • 페이지 계층 구조가 명확하도록 글을 작성합니다.
  • 반응형 페이지로 제작해 모바일이나 태블릿에서도 잘 보이도록 합니다.
  • 여러 브라우저에서 잘 보이는지 확인합니다.
  • 가능한 경우 암호화된 통신인 HTTPS 를 이용합니다.
  • 웹 페이지의 속도를 측정하고 향상시켜야 합니다. 해당 정보는 구글의 Pagespeed Insight 를 활용하면 좋습니다. 사용법은 다음에 포스팅하겠습니다.

역시 콘텐츠

무엇보다도 중요한 것은 내용입니다. 정말 유용한 사이트는 즐겨찾기를 하고 자주 방문하게 됩니다. 너무나 뻔한 이야기죠? 그래도 콘텐츠가 가장 중요합니다. 사이트의 전문 분야에서 다른 경쟁 사이트들과 차별화되도록 해야 합니다. 내용도 내용이고, 디자인이나 사용자 환경도 신경을 많이 써야겠죠.

저도 블로그를 시작한 지 얼마 안됬지만 앞으로 좋은 콘텐츠를 많이 쌓아야겠습니다. 다음 번에는 Pagespeed Insight 사용해서 페이지 속도를 개선하는 방법을 알아보겠습니다.