페이지의 색인 생성 날짜를 찾는 방법. Yandex.Xml의 modtime 매개변수입니다. Yandex는 실제로 SEO에 대한 우려로 페이지의 나이를 표시합니까? Yandex에서 페이지의 색인을 생성한 날짜를 확인하세요.

사이트 색인 생성 검색 엔진모든 웹마스터에게 중요합니다. 결국, 프로젝트를 고품질로 홍보하려면 인덱싱을 모니터링해야 합니다. Yandex에서 인덱싱을 확인하는 과정을 설명하겠습니다.

Yandex의 인덱싱

Yandex 로봇은 "맛있는" 것을 찾기 위해 매일 사이트를 검색합니다. 그의 의견으로는 가장 가치가 있다고 생각되는 사이트와 페이지를 상위 결과에 수집합니다. 글쎄, 아니면 Yandex가 그렇게 원했는지 누가 알겠습니까 :)

우리는 실제 웹마스터로서 사이트가 좋을수록 사이트의 위치가 높아지고 트래픽이 많아진다는 이론을 고수할 것입니다.

Yandex에서 사이트 색인 생성을 확인하는 방법에는 여러 가지가 있습니다.

  • Yandex 웹마스터 사용
  • 검색 엔진 연산자 사용
  • 확장 기능 및 플러그인 사용
  • 온라인 서비스 이용.

Yandex 웹마스터에서 웹사이트 페이지 색인 생성

검색 엔진이 우리 사이트에서 무엇을 파헤쳤는지 이해하려면 "인덱싱" 섹션에서 우리가 사랑하는 Yandex 웹마스터에게 가야 합니다.

Yandex 웹마스터의 통계 우회

먼저 “Bypass Statistics” 항목으로 가보겠습니다. 이 섹션에서는 로봇이 사이트의 어떤 페이지를 크롤링하는지 확인할 수 있습니다. 사이트가 위치한 서버를 사용할 수 없거나 페이지 내용 자체의 오류로 인해 로봇이 로드할 수 없는 주소를 식별할 수 있습니다.

섹션에는 페이지에 대한 정보가 포함되어 있습니다.

  • 신규 - 최근 사이트에 나타난 페이지이거나 로봇이 방금 크롤링한 페이지입니다.
  • 변경됨 - 이전에 Yandex 검색 엔진에서 보았지만 변경된 페이지입니다.
  • 크롤링 기록 - 서버 응답 코드(200, 301, 404 등)를 고려하여 Yandex가 크롤링한 페이지 수입니다.

그래프에는 새 페이지(녹색)와 변경된 페이지(파란색)가 표시됩니다.

그리고 이것은 크롤링 기록의 그래프입니다.

이 항목은 Yandex가 찾은 페이지를 표시합니다.

해당 없음 — 로봇이 URL을 알 수 없습니다. 즉, 로봇은 이전에 그녀를 만난 적이 없었습니다.

스크린샷에서 어떤 결론을 도출할 수 있습니까?

  1. Yandex는 실제로 논리적인 /xenforo/xenforostyles/ 주소를 찾지 못했습니다. 이 페이지는 더 이상 존재하지 않습니다.
  2. Yandex는 /bystrye-ssylki-v-yandex-webmaster/ 주소를 찾았는데, 이는 또한 매우 논리적입니다. 새 페이지.

따라서 제 경우에는 Yandex 웹마스터가 제가 예상했던 내용을 반영합니다. 즉, 필요하지 않은 것은 Yandex에서 제거하고 필요한 것은 Yandex에서 추가했습니다. 이는 우회로 모든 것이 잘되고 막힘이 없음을 의미합니다.

검색된 페이지

검색 결과는 지속적으로 변경됩니다. 새 사이트가 추가되고, 이전 사이트가 삭제되고, 검색 결과의 위치가 조정되는 등의 작업이 수행됩니다.

'검색 페이지' 섹션의 정보를 사용할 수 있습니다.

  • Yandex의 페이지 수 변경 사항을 추적합니다.
  • 추가 및 제외된 페이지를 추적합니다.
  • 검색 결과에서 사이트를 제외하는 이유를 알아내기 위해
  • 검색 엔진이 사이트를 방문한 날짜에 대한 정보를 얻기 위해
  • 검색결과 변경사항에 대한 정보를 수신합니다.

이 섹션은 페이지 색인을 확인하는 데 필요합니다. 여기 Yandex 웹마스터는 검색 결과에 추가된 페이지를 보여줍니다. 모든 페이지가 섹션에 추가되면(새 페이지는 일주일 이내에 추가됩니다) 모든 것이 페이지와 순서대로 정렬됩니다.

연산자를 사용하여 Yandex 색인의 페이지 수 확인

Yandex 웹마스터 외에도 검색 자체에서 직접 연산자를 사용하여 페이지 색인을 확인할 수 있습니다.

우리는 두 개의 연산자를 사용합니다:

  • "사이트" - 지정된 사이트의 모든 하위 도메인과 페이지를 검색합니다.
  • "호스트" - 특정 호스트에서 호스팅되는 페이지를 검색합니다.

"사이트" 연산자를 사용해 보겠습니다. 운영자와 사이트 사이에는 공백이 없습니다. Yandex 검색에는 18페이지가 있습니다.

"호스트" 연산자를 사용해 보겠습니다. Yandex에서 색인을 생성한 19페이지.

플러그인 및 확장 기능을 사용하여 인덱싱 확인

서비스를 사용하여 사이트 색인 생성 확인

그런 서비스가 많이 있습니다. 두 가지를 보여드리겠습니다.

서펀트

Serphunt는 웹사이트 분석을 위한 온라인 서비스입니다. 페이지 색인을 확인하는 데 유용한 도구가 있습니다.

Yandex와 Google이라는 두 가지 검색 엔진을 사용하여 최대 100개의 웹사이트 페이지를 동시에 확인할 수 있습니다.

페이지 색인을 확인하려면 목록에 추가하세요.

"스캔 시작"을 클릭하면 몇 초 후에 결과가 나타납니다.

다양한 SEO 분석 작업의 경우 검색 엔진이 언제부터 SEO 존재에 대해 "알고" 있는지 확인하는 것이 필요합니다. 특정 페이지. Yandex에서 문서의 연대를 알아내는 일반적인 방법 중 하나는 Yandex.Xml을 사용하여 URL을 검색하여 modtime 매개변수를 얻는 것입니다. "&how=tm" 매개변수의 분석으로 인해 이 방법은 더욱 인기를 얻었습니다.

편리하고 빠른 것으로 나타났습니다. 다행스럽게도 https://xml.yandex.ru/test/에 시각적 인터페이스가 있습니다. 하지만 나는 큰 의심으로나는 이 방법에 공감한다.

모드타임에 무슨 문제가 있나요?

첫째, 서비스 문서에는 다음 사항만 명시되어 있습니다.

따라서 태그가 첫 번째 색인 생성 날짜를 표시한다는 생각은 전적으로 SEO 사람들의 몫입니다.

둘째, Yandex.Xml 사용자는 검색 엔진에서 가장 중요한 클라이언트는 아닙니다. 액세스는 무료로 제공되며 광고가 없습니다. Yandex LLC가 xml 매개변수의 정확성, 관련성 및 신뢰성에 특히 관심을 두는 이유는 무엇입니까? 여전히 이것을 믿을 수 있지만, 좋은 프로그래머는 모든 일을 잘합니다. 그런데 왜 제공하는가? 문서화되지 않은 기능-완전히 불분명합니다.

그러나 이 모든 것은 가사이고 나의 추측이다. 사실을 살펴 보겠습니다.

"Yandex의 관점에서 본 문서 시대"란 무엇입니까?

로직과 구글이 알려준 대로 첫 번째 인덱싱 이후 경과한 시간입니다. 대부분의 경우 우리는 페이지가 트래픽을 유치하기 시작한 날짜, 연령 누적 등 정확히 이것에 관심이 있습니다.

실제로는 다양합니다. 예를 찾기 위해 멀리서 찾을 필요는 없습니다.

내 오래된 취미 프로젝트 smmup.ru의 여러 페이지에 대한 모드타임을 확인해 보겠습니다.

주소 Modtime의 날짜
/ 20140916T170528 2014-09-16
/activity.php 20150422T103533 2015-04-22
/target.php 20150208T173922 2015-02-08
/kogda.php 20141112T210047 2014-11-12

나는 이미 기사에서 리소스의 역사에 대해 썼습니다. 오랫동안 Yandex에서 제대로 색인화되지 않았습니다. 나는 2015년 4월 20일자 플라톤과의 서신을 보관해 두었습니다. 현재 검색에는 기본 페이지가 하나만 있습니다.

즉, 적어도 두 개의 URL에 대한 수정 시간은 색인에 전혀 등장한 날짜가 아닌 것으로 나타났습니다. /kogda.php의 경우 이 매개변수의 값과 최종 인덱싱 시간 간의 차이는 다음과 같습니다. 거의 6개월! 문서는 색인에 없지만 modtime은 이미 경험이 있습니다(군인이 자고 있습니다-서비스가 진행 중입니다).

이것은 무엇을 의미 하는가? 조금 과장하자면, 우리는 요청에 대한 경쟁사를 분석하고 거기에서 오래된 페이지를 많이 보았고 겁이 나서 앞으로 나아가지 않았습니다. 그리고 경쟁자 중 절반은 실제로 오랫동안 엄격한 필터링을 받았기 때문에 이를 극복하는 것이 그리 어렵지 않습니다.

상황은 이론적이며 간단히 설명하면 다음과 같습니다. 명확한 예, 왜 modtime에 의존하는 것은 매우 주의해서 수행되어야 합니다.

그러나 이것들은 여전히 ​​​​꽃입니다.

Modtime에는 실제 인덱싱보다 이후의 날짜가 포함될 수 있습니다.

smmup.ru의 경우 적어도 modtime을 로봇이 처음 방문한 시간으로 해석할 수 있습니다. 날짜는 사이트의 실제 페이지 모양과 잘 연관되어 있습니다.

또 다른 예가 있습니다. 여기서 나는 모든 것이 어디서 오는지에 대한 가설을 감히 제시할 수 없습니다.

  • 내 블로그에는 색인 생성에 문제가 없습니다(특히 해당 기사가 여러 인기 그룹에 다시 게시되었기 때문에).
  • 리디렉션이나 주소 변경 등은 없었습니다.

마지막 의심을 없애려면:

즉, modtime은 페이지의 수명을 상당히 과소평가했습니다.

이 예는 정확히 2분 만에 발견되었으며(추가 트릭 없이 블로그 페이지의 매개변수만 살펴봤습니다), 이는 그러한 결과의 높은 보급률을 나타냅니다. 또한 제가 감사한 사이트에서 유사한 사례를 많이 보았으며(명백한 이유로 표시하지 않음) 때로는 오류가 몇 년이 되는 경우도 있었습니다.

결과

  1. Modtime은 항상 올바른 색인 날짜를 표시하지는 않습니다(사실 Yandex의 어느 누구도 이를 약속하지 않았습니다).
  2. 페이지 연령을 결정할 때 이 매개변수에만 의존하십시오. 그것은 금지되어 있다. 결과는 신뢰할 수 없습니다.
  3. 따라서 경쟁사의 웹사이트를 분석하는 데 활용하는 것은 큰 문제입니다. 제어할 수 있는 다른 데이터가 있으므로 자신의 프로젝트를 작업할 때 이를 사용할 수 있습니다. 그러나 이 방법으로 해결할 수 있는 문제의 범위는 상당히 좁다.

추가적인 해석과 흥미로운 사례를 받아보게 되어 기쁩니다!

추신. FB에서는 이 주제에 관해 길고 특별히 생산적이지 않은 토론이 있었습니다. 어쩌면 내가 기사의 메시지를 충분히 제대로 표현하지 못했을 수도 있습니다. 요점은 modtime에 몇 가지 결함이 있다는 것이 아닙니다. 어떤 이유로든 Yandex가 페이지의 "연령"을 재설정할 수 있다는 것은 분명합니다. 가장 중요한 점은 다음 예가 설명한다는 것입니다. a) modtime을 첫 번째 색인 생성 날짜로 사용할 수 없습니다. b) modtime에 따른 연령 "재설정"이 페이지에 직접적으로 축적된 요소를 완전히 지운다는 의미라는 확신이 없습니다. 또는 나이와 간접적으로 관련되어 있습니다.

페이지의 색인이 처음 생성된 날짜를 확인하는 두 가지 방법이 작동을 멈췄습니다.

  • 날짜 연산자가 올바르게 작동하지 않습니다.
  • &how=tm 매개변수를 쿼리 문자열에 추가하면 더 이상 인덱싱 날짜가 표시되지 않습니다.

하지만 이 정보는 Yandex XML을 통해 얻을 수 있습니다. 이렇게 하려면 https://xml.yandex.ru/test/ 링크를 따라가서 "&query" 필드에 url:%page%와 같은 쿼리를 입력해야 합니다. 여기서 %page%는 페이지 주소입니다. 다음으로 "찾기"를 클릭하면 결과 결과에서 페이지가 처음 색인된 날짜를 나타내는 태그를 찾습니다.


검색 로봇별 크롤링 날짜 및 검색 데이터베이스의 상태

페이지의 마지막 크롤링 날짜와 검색 결과를 작성할 때 어떤 버전이 있는지에 대한 정보를 확인하려면 "인덱싱" 섹션의 Yandex.Webmaster 서비스에서 "URL 상태 확인"을 선택해야 합니다. 다음으로 필요한 주소를 지정하고 데이터를 수신합니다. 이 방법은 검증된 사이트에서만 작동합니다.


저장된 사본의 생성 날짜

저장된 사본이 생성된 날짜를 확인하려면 검색 결과에서 드롭다운 메뉴(페이지 주소 이름 옆)를 클릭해야 합니다.






Bing 및 Mail 검색 엔진에서 저장된 사본을 보면 Yandex 및 Google 검색 로봇보다 페이지 색인을 다시 생성하는 속도가 느리기 때문에 이전 버전의 페이지가 표시됩니다.

결론

  1. 위의 예에서 볼 수 있듯이 페이지의 저장된 복사본이 항상 인덱스 기반을 구축하는 데 사용되는 것은 아닙니다. 그러나 종종 이것은 사실입니다.
  2. 또한 페이지를 변경하고 이러한 변경 사항이 다시 색인화되기를 기다리고 있는 경우 검색 로봇이 마지막으로 크롤링한 날짜를 기준으로 변경 사항이 고려되었다고 결론을 내려서는 안 됩니다.

페이지의 색인이 처음 생성된 날짜를 확인하는 두 가지 방법이 작동을 멈췄습니다.

  • 날짜 연산자가 올바르게 작동하지 않습니다.
  • &how=tm 매개변수를 쿼리 문자열에 추가하면 더 이상 인덱싱 날짜가 표시되지 않습니다.

하지만 이 정보는 Yandex XML을 통해 얻을 수 있습니다. 이렇게 하려면 https://xml.yandex.ru/test/ 링크를 따라가서 "&query" 필드에 url:%page%와 같은 쿼리를 입력해야 합니다. 여기서 %page%는 페이지 주소입니다. 다음으로 "찾기"를 클릭하면 결과 결과에서 페이지가 처음 색인된 날짜를 나타내는 태그를 찾습니다.


검색 로봇별 크롤링 날짜 및 검색 데이터베이스의 상태

페이지의 마지막 크롤링 날짜와 검색 결과를 작성할 때 어떤 버전이 있는지에 대한 정보를 확인하려면 "인덱싱" 섹션의 Yandex.Webmaster 서비스에서 "URL 상태 확인"을 선택해야 합니다. 다음으로 필요한 주소를 지정하고 데이터를 수신합니다. 이 방법은 검증된 사이트에서만 작동합니다.


저장된 사본의 생성 날짜

저장된 사본이 생성된 날짜를 확인하려면 검색 결과에서 드롭다운 메뉴(페이지 주소 이름 옆)를 클릭해야 합니다.






Bing 및 Mail 검색 엔진에서 저장된 사본을 보면 Yandex 및 Google 검색 로봇보다 페이지 색인을 다시 생성하는 속도가 느리기 때문에 이전 버전의 페이지가 표시됩니다.

결론

  1. 위의 예에서 볼 수 있듯이 페이지의 저장된 복사본이 항상 인덱스 기반을 구축하는 데 사용되는 것은 아닙니다. 그러나 종종 이것은 사실입니다.
  2. 또한 페이지를 변경하고 이러한 변경 사항이 다시 색인화되기를 기다리고 있는 경우 검색 로봇이 마지막으로 크롤링한 날짜를 기준으로 변경 사항이 고려되었다고 결론을 내려서는 안 됩니다.