컴퓨터 배우기
스파이더 쫓아 버리기
rndjr
2010. 7. 12. 07:27
1. 스파이더 로봇이 못오게 robots.txt 이용
파일명을 'robots.txt' 로 해서 웹사이트 루트(root) 디렉토리에 저장합니다.
모든 스파이더(*)가 모든 파일을 읽지 못하게 하는 경우
User-Agent: *
Disallow: /
* User-Agent : 스파이더 로봇 이름, Disallow : 제한할 파일 이름
모든스파이더가 특정디렉토리 및 파일을 읽지 못하게 하는 경우
User-Agent: *
Disallow: /intra/
Disallow: /secret.html
2. META 태그를 이용하여 못오게 하기
위의 두가지 방법을 사용하면 검색엔진 스파이더가 자료를 수집하지 않습니다. 이것이 검색엔진의 표준적인 '약속'이지만 이 약속을 무시하는 검색엔진도 간혹 있다는 것을 염두에 두십시요. 해당 태그를 잘못 사용하면 검색엔진에서 운영하는 사이트 검색이 되지 않을수도 있으니 조심해서 사용하십시요.
3. 참고사이트
http://www.robotstxt.org/wc/norobots.html
http://www.robotstxt.org/wc/exclusion.html