2026년 6월 15일, Google Search Relations 팀의 Search Off the Record에서 “Should I use markdown for my site?”라는 주제로 로 팟케스트를 진행했습니다.
핵심은 “LLM이나 AI 검색을 위해 웹사이트를 Markdown으로 따로 바꿀 필요는 거의 없고, 검색과 크롤링의 기본은 여전히 정상적인 HTML 웹페이지“라는 내용이었습니다.
저는 이 영상을 보면서 이전에 다뤘던 llms.txt와 md.txt에 대한 관점을 다시 한 번 정리할 필요가 있다고 느꼈습니다.
특히 Google 개발자 문서에는 실제로 HTML 페이지와 별도로 .md.txt 형태의 텍스트 버전을 제공하는 경우가 있습니다. 예를 들어 Google Developers 문서에서는 일부 페이지에 대해 URL 뒤에 .md.txt를 붙이면 Markdown 형태의 텍스트 버전을 볼 수 있다고 안내합니다.
그런데 중요한 건 이겁니다. md.txt 파일이 존재한다고 해서, 일반 검색이나 AI 검색 경쟁 환경에서 HTML 페이지보다 우위를 가진다고 보기는 어렵다는 점입니다. 그 전조 증상은 이미 구글 검색결과 내에서 보이고 있다가 제 생각인데 이제 차근차근 하나씩 살펴보도록 하겠습니다.
1. Google이 말한 핵심은 “HTML을 버릴 필요 없다”에 가깝다
영상에서 나온 핵심 주장은 명확합니다. 크롤러와 검색엔진은 이미 HTML을 읽고 처리하도록 오랫동안 발전해왔습니다. HTML은 웹의 기본 구조이고, 검색엔진은 그 안에서 본문, 링크, 제목, 내비게이션, 내부 연결 구조를 파악합니다.
반대로, Markdown은 사람이 읽는 것이 아닌 콘텐츠를 쓰기 편한 포맷입니다. 제목, 목록, 링크, 코드 블록 등을 간단하게 하고정적 사이트 생성기를 통해 HTML 페이지를 만들거나 코드의 정확성이나 작성이 상대적으로 더 중요한 개발자 문서에서는 매우 유용합니다.
하지만 이것이 곧 “AI 검색을 위해 Markdown 페이지를 따로 만들어야 한다”라고 고민이 된다면 존 뮬러는 그건 아니라고 답을 합니다. Markdown은 작성 포맷으로는 좋지만, 웹에서 검색되고 평가되는 기본 단위는 여전히 HTML 페이지에 가깝습니다.
2. md.txt는 읽기 보조 자료이지, 경쟁 우위 신호로 보기 어렵다
여전히 제가 보는 md.txt의 역할은 “선택받기 위한 신호”라기보다 “선택된 뒤 더 쉽게 읽히는 보조 자료”에 가깝습니다.
예를 들어 AI가 이미 특정 페이지를 답변 후보로 선택했고, 그 페이지에 md.txt 버전이 있다면 AI가 본문을 더 깔끔하게 읽는 데 도움이 될 수 있습니다. HTML에는 메뉴, 푸터, 버튼, 관련 글, 반복 UI가 섞여 있기 때문에 Markdown 버전이 본문만 정리된 형태라면 처리 효율은 좋아질 수 있습니다.
종종 md.txt를 LLM이 가져와서 인용을 한다는 말이 있는데, 일반적인 프롬프트 테스트가 아닌 사용자가 특정 URL을 직접 지정하거나, 의도적으로 md.txt 파일을 긁히게 만드는 프롬프트를 넣는다면 md.txt는 물론 인용될 수 있습니다.
하지만 일반적인 검색 질문에서 여러 경쟁 문서 중 하나로 선택되는 과정이라면 md.txt가 HTML 페이지보다 우위에 있다고 보기 어렵습니다.
즉, md.txt는 “AI가 읽기 편한 보조본”일 수는 있지만, “AI가 먼저 선택하게 만드는 핵심 신호”라고 단정하기는 어렵습니다.
3. HTML 페이지와 md.txt 페이지가 함께 있다면 보통 HTML이 이길 가능성이 높다
한 가지 주제에 대해 md.txt만 따로 만들어두면 색인될 가능성 자체는 있을 수 있습니다. Google은 HTML 외에도 다양한 텍스트 기반 파일을 크롤링하고 색인할 수 있기 때문입니다.
하지만 같은 내용의 HTML 페이지와 md.txt 페이지가 함께 있다면, 일반적인 검색 경쟁에서는 HTML 페이지가 선택될 가능성이 훨씬 높다고 봅니다.
이유는 단순합니다.
- HTML 페이지는 사용자에게 실제로 제공되는 대표 문서입니다.
- 내부링크, 내비게이션, 구조화 데이터, 이미지, UX 맥락이 함께 존재합니다.
- 검색엔진은 오랫동안 HTML 페이지를 기준으로 품질과 관련성을 판단해왔습니다.
- md.txt는 보통 원문 페이지의 대체 보기 또는 읽기용 텍스트 버전에 가깝습니다.
따라서 HTML과 md.txt가 같은 주제를 다룬다면, 둘 중 검색 결과나 AI 답변 후보로 더 강하게 평가받을 가능성이 높은 쪽은 대부분 HTML일 확률이 높습니다.
이 부분은 구글 공식 GEO 가이드에서 말하는 SEO의 중요성과도 연결됩니다. GEO라고 해서 기존 검색의 크롤링, 색인, 품질 평가, 콘텐츠 구조가 사라지는 것이 아닙니다.
4. 개발자 문서에서는 Markdown이 의미 있을 수 있다
다만 모든 상황에서 Markdown이 의미 없다는 뜻은 아닙니다.
개발자 문서, API 문서, 코드 샘플, 기술 가이드처럼 원래 Markdown으로 작성되고 관리되는 콘텐츠라면 md.txt나 Markdown 원본이 유용할 수 있습니다. 실제로 개발자 문서는 사람이 보기에도 코드와 텍스트 구조가 중요하고, AI가 API 사용법을 이해할 때도 Markdown 형태가 도움이 될 수 있습니다.
하지만 일반적인 브랜드 사이트, 병의원 사이트, 이커머스 상품 페이지, 서비스 소개 페이지라면 이야기가 다릅니다. 이런 사이트에서 md.txt를 따로 만든다고 해서 SEO나 GEO 성과가 바로 좋아진다고 보기는 어렵고 그 작업보다 더 우선순위로 중요한 요소들이 많죠.
오히려 우선순위는 HTML 페이지의 콘텐츠 품질, 제목 구조, 내부링크, 정보 설계, 사용자 경험, 신뢰 신호를 정리하는 데 있어야 합니다.
5. 직접 Google 개발자 문서의 md.txt 색인을 확인해보자
이 부분은 직접 검색해보면 더 감이 옵니다.
Google 개발자 문서 중에는 실제로 “이 페이지의 텍스트 버전은 URL 뒤에 .md.txt를 붙이면 볼 수 있다”고 안내하는 페이지가 있습니다. 예를 들어 Google Health API의 AI assistance and developer tools 문서에서도 페이지의 텍스트 버전을 .md.txt로 제공한다고 설명합니다.
그렇다면 위 문서를 Google에서 직접 검색해보면 어떨까요?
site:developers.google.com inurl:.md.txt- 특정 Google 개발자 문서의 HTML URL과
.md.txtURL을 각각 검색
그리고 실제로 어떤 페이지가 더 많이 보이는지, HTML 페이지와 md.txt 페이지 중 무엇이 더 대표적으로 노출되는지 확인해보시면 됩니다.
일부 md.txt URL이 검색 결과에 잡히는 경우가 있을 수는 있습니다. (우선 구글 개발자 문서는 없었습니다.)
단, 중요한 것은 단순 색인 여부가 아니라, 일반적인 검색 질의와 프롬프트 경쟁 상황에서 어느 문서가 더 강하게 선택되는가입니다. 이 기준으로 보면 md.txt가 HTML 페이지를 대체하거나 압도한다고 보기는 어렵죠.
6. GEO에서 중요한 건 파일을 추가하는 것이 아니라 선택될 만한 원문을 만드는 것이다
GEO에서 자주 나오는 오해 중 하나는 “AI가 읽기 쉬운 파일을 하나 추가하면 인용 가능성이 높아질 것”이라는 생각입니다.
하지만 AI 검색의 흐름을 보면 먼저 후보 문서로 선택되어야 합니다. 쿼리 팬아웃을 통해 여러 하위 질문이 만들어지고, 그 질문에 맞는 문서들이 후보로 올라온 뒤, 그중 일부가 답변 근거로 사용됩니다.
이때 중요한 것은 원문 페이지가 해당 질문에 충분히 답하고 있는지입니다. md.txt가 있느냐보다, HTML 페이지 자체가 검색 의도와 프롬프트에 맞는 정보를 가지고 있는지가 먼저입니다.
정리하면 순서는 이렇게 보는 것이 맞습니다.
- 먼저 HTML 페이지가 검색엔진과 사용자가 이해할 수 있는 구조여야 합니다.
- 그 페이지가 특정 질문과 쿼리 팬아웃에 답할 수 있어야 합니다.
- 내부링크와 콘텐츠 허브를 통해 관련 정보를 연결해야 합니다.
- 필요하다면 md.txt는 보조 레이어로 실험해볼 수 있습니다.
제가 생각하는 이상적인 순서인 만큼, 순서를 바꾸지 않는 것을 추천합니다.
md.txt나 llms.txt를 먼저 만들고, 원문 콘텐츠 품질과 사이트 구조를 뒤로 미루면 GEO 전략이 아니라 파일 추가 작업에 가까워집니다.
우리 사이트는 HTML만으로도 AI가 이해할 수 있을까?
이번 Google Search Off the Record 영상에서 가장 현실적으로 받아들여야 할 핵심 메시지는 “AI 때문에 웹사이트를 Markdown으로 갈아엎을 필요는 없다”입니다.
물론, Markdown은 좋은 작성 도구입니다. md.txt도 특정 상황에서는 AI가 문서를 읽는 데 도움을 줄 수 있습니다. 하지만 일반적인 SEO/GEO 경쟁 환경에서는 HTML 페이지가 여전히 중심입니다.
실제로 Google 개발자 문서의 md.txt 페이지를 검색해보면, 단순히 md.txt가 존재한다고 해서 HTML 페이지보다 더 강하게 선택된다고 말하기 어렵다는 점을 앞선 목차들에서 확인할 수 있었죠.
그래서 GEO를 준비할 때는 “llms.txt를 넣을까?”, “md.txt를 만들까?”보다 먼저 우리 사이트의 HTML 페이지가 충분히 읽히는지 봐야 합니다. 제목 구조, 본문 정보, 내부링크, 콘텐츠 허브, 도메인 지식, 실제 경험이 먼저입니다.
서치나인은 이런 부분을 단순한 이론으로만 보지 않습니다. 실제 검색 결과, AI 인용 여부, md.txt와 HTML 페이지의 노출 상태, GSC와 GA4 데이터, GEO 모니터링 데이터를 함께 보면서 어떤 작업이 우선인지 판단합니다.
우리 사이트가 AI 검색에서 어떤 질문에 선택될 수 있는지, HTML 구조와 콘텐츠가 충분한지, md.txt나 llms.txt 같은 보조 실험이 필요한 단계인지 점검하고 싶다면 서치나인에 문의해 함께 살펴보셔도 좋습니다. 실제 테스트를 해보고 만들어낸 인사이트를 바탕으로, 사이트별로 필요한 SEO/GEO 우선순위를 정리해드릴 수 있습니다.

