Semalt : Google 웹 로그 분석에서 리퍼러 스팸 차단을위한 유용한 가이드

Semalt 의 전문가 인 Nik Chaykovskiy는 추천 스팸이 웹 마스터가 현재 겪고있는 문제 중 하나라고 확신합니다. 수년에 걸쳐 상황이 악화되고 있으며 이는 누군가가 추천 스팸을 만들어 많은 돈을 벌고 있음을 의미합니다.

유령 및 추천 스팸

스팸은 이제 Google 웹 로그 분석 보고서로 향했습니다. 스패머는 시스템에서 웹 사이트의 데이터 보고서에 나타날 수있는 취약점을 찾습니다. 웹 마스터가 자신의 웹 사이트를 방문하여 보고서에 포함 된 이유를 알기까지 충분한 호기심을 유발할 수 있기를 희망합니다. 문제는 트래픽을 늘리지 않는다는 것입니다. 그들은 봇이기 때문에 심지어 그것을 만들지 않습니다. Google Analytics에서 사용하는 JavaScrip 추적 코드를 사용하여 방문이 있었다는 알림을 생성합니다. 이탈률 및 참여를 분석하는 데 사용되는 기타 요소와 같은 중요한 통계가 왜곡됩니다. 마케팅 결정을 내릴 때 특히 정확한 데이터가 필요한 경우 추천 스팸을 차단해야합니다.

스패머가 매우 빠르게 작동하여 소스뿐만 아니라 스팸 적중률도 높아지기 때문에 특히 추천 스팸을 차단하기가 어렵습니다. 즉, 웹 마스터는 이러한 소스를 제거하고 블랙리스트에 올리는 노력을 개선해야합니다. 합법적 인 트래픽을 많이받지 않는 새로운 사이트를 가진 사람들에게는 특히 문제가됩니다. 이러한 사이트에서 스팸 비율이 증가하면 더 많은 왜곡이 발생하여 매일 발생하는 공격보다 더 많을 수 있습니다.

얼마나 쉬운가요?

한 번의 페이지로드는 한 번의 방문으로 기록됩니다. 고스트 스패머는 Google 웹 로그 분석 추적 코드를 사용하여 트래픽 데이터를 보고서로 바로 전송하여 방문을 유도합니다. 서버에 단일 페이지를로드하는 데 0.001 초가 걸릴 수 있습니다. 그러나이 사이트를 통해 다른 많은 사이트의 Google 계정을 100 번 이상 방문했을 수 있습니다. 단일 호스트를 구입하는 것은 매우 쉽습니다. 스패머가 ROI를 확신 할 수 있으면 스패머가 수행 할 수있는 많은 손상이 있습니다.

부족한 솔루션

일부 기술은 때때로 너무 발전되어 추천 스팸을 차단하는 데 사용 된 솔루션이 작동하지 않습니다. 그들 중 하나는 Darodar라는 신비한 온라인 서비스입니다. 다음 방법은 GA에서 삭제하지 않았습니다.

  • .htaccess 파일 고스트 스팸이 사이트를 건드리지 않기 때문에 작동하지 않습니다
  • 추천 제외 목록. 업데이트가 없습니다.
  • 제외 필터. 향후 스팸에만 초점을 맞추고 과거 스팸 데이터베이스에는 소급 적용되지 않기 때문에 오래된 방법입니다.

제외 필터는 Darodar 추천 스팸을 거의 제거했습니다. 유일한 제한은 지속적이고 지속적으로 업데이트되는 추천 스패머 목록이 없다는 것입니다.

누락 된 퍼즐 조각

조회 및 고스트 데이터를 식별하고 차단하는 실행 가능한 솔루션은 매우 업데이트되고, 더 넓은 데이터베이스에서 제공되며, 과거 정보로 소급 적용되어야합니다. 최적의 솔루션을위한 세 가지 요소를 바탕으로 다음 중 하나가 작동합니다.

1 단계 : 세그먼트를 사용하여 스팸 제외

세그먼트는 데이터를 영구적으로 변경하지 않으므로 세그먼트를 사용하는 것이 좋습니다. 필터를 사용하는 동안 실수로 실제 리퍼러를 걸러 내면 다시 가져올 수있는 방법이 없습니다. 시간이 오래 걸리더라도 세그먼트를 사용하여 오래된 데이터를 구축 할 수 있습니다. 그것들을 소급 적용 할 수도 있습니다.

2 단계 : 제외 목록 유지

슬랙은 웹 마스터가 추천 소스를 모니터링하는 데 사용할 수있는 도구입니다. 새로운 추천에 대해 사용자에게 알리고 의심스러운 추천 소스를 허용 목록에 포함할지 블랙리스트에 추가할지 묻습니다.

1. 슬랙은 모든 추천을 받고

2. PHP를 사용하여 모든 결과를 카운트 순서로 정렬 한 다음 최종 목록을 웹 마스터에게 반복하여 친숙한 지 확인합니다. 그렇지 않은 경우

3. 의심되는 모든 스팸을 사용자에게 허용 목록 또는 차단 목록 중에서 선택할 수있는 여유 채널로 전달합니다. 어떤 옵션을 선택하든 4 단계로 이어집니다.

4. 판정을 선택 확인으로 확인하는 페이지로 리디렉션됩니다.

5. 슬랙은 데이터베이스에 식별 된 모든 스패머를 저장하고 잠급니다.

6. 클린 데이터의 최종 표시는 정규식 형식입니다. Google 웹 로그 분석에 복사하여 붙여 넣기

웹 마스터는 슬랙을 사용하여 하루에 5 번 이상 제외 목록을 업데이트 할 수 있습니다.

실제로 여러 솔루션이 작동 할 수 있습니다.

이것은 입증 된 방법 임에도 불구하고 웹 마스터가 다른 기반을 보완하여 모든 기반을 다룰 수 있도록하는 것이 훨씬 효과적입니다. 상기 솔루션 외에 :

  • 알려진 봇과 스파이더를 제외하도록 Google 웹 로그 분석을 표시하는 확인란을 클릭합니다.
  • "호스트 이름 필터 포함"을 적용하십시오.
  • 쿠키 사용

위에서 언급 한 포괄적 인 필터는 때때로 효율적이지만 다음과 같은 이유로 장기적으로 최상의 솔루션은 아닙니다.

  • 호스트 이름 스푸핑은 어렵지 않으며 분석 스패머는이를 취약성으로 사용하고 있습니다.
  • 설정이 잘못되면 실제 참조자를 필터링 할 수 있습니다.

mass gmail