首页 ┆ 网站地图 ┆ 在线留言 ┆ 游戏资讯 ┆ 资源下载 
设为首页
加入收藏
联系我们
热门关键字: .net应用  操作系统  Dreamweaver  WinRAR  网络推广
高级搜索
您当前的位置: 主页>网站推广>搜索优化>如何避免网站被搜索引擎蜘蛛访问
如何避免网站被搜索引擎蜘蛛访问
来源: 发布时间:2008-05-29 发布人: 浏览: 人次   字体: [ ]  
         搜索引擎是把互联网上的网页内容存到自己的服务器上,当用户搜索某个词的时候,搜索引擎就会在自己的服务器上找相关的内容,这样就是说,只有保存在搜索引擎服务器上的网页才会被搜索到。哪些网页才能被保存到搜索引擎的服务器上呢?只有搜索引擎的网页抓取程序抓到的网页才会保存到搜索引擎的服务器上,这个网页抓取程序就是搜索引擎的蜘蛛
          每个主流的搜索引擎都有自己的蜘蛛爬虫,例如: Googlebot(Google蜘蛛)、baiduspider(百度蜘蛛)、Yahoo Slurp(Yahoo蜘蛛)、Msnbot(MSN蜘蛛)、Scooter(Altavista蜘蛛)、Lycos_Spider_(T-Rex) 、FAST-WebCrawler(Alltheweb蜘蛛)、ia_archiver(alexa蜘蛛)Slurp(INKTOMI蜘蛛)等,如何避免网站被搜索引擎蜘蛛访问呢?可通过以下方法实现:

1、robots.txt
只需在你的网站根目录下建一个robots.txt文件,文件中输入:Disallow: 字符串即可,例如:Disallow:newsunday.html 意思是要求蜘蛛爬虫不要下载该文件,不收录,不索引。Disallow:/newsunday/ 意思是对newsunday文件夹中的所有文件不收录,不索引,不下载。如果你想看一个具体的例子,可以看一下Google robots.txt是什么样的。

2、rel=nofollow
这种不识别链接的搜索标签,可以告诉搜索引擎蜘蛛直接跳过而不索引。具体的介绍请见“如何做付费链接而不被Google惩罚”,对Google 、Yahoo 、MSN(Live search)有效,对百度无效。

3、利用代码来实现
这是本文重点介绍的,但首先声明不要将此种用法用于对搜索引擎作弊方面,不能将其用于违返搜索引擎相关规则、欺骗搜索引擎的用途上。代码实现的效果是,用户在浏览经过代码定义过的内容,正常显示,而搜索引擎蜘蛛抓取时会不显示用户浏览的内容,本文以百度蜘蛛为例:
ASP$userAgent = Server.GetVariables("HTTP_USER_AGENT");
If Not InStr(LCASE($userAgent), "baiduspider") Then  
 ‘用户正常浏览时所能见到的内容代码
Else   
 ‘搜索引擎蜘蛛能看到的代码及链接
End If

PHP
$userAgent = $_SERVER['HTTP_USER_AGENT'];
if(stristr(strtolower($userAgent), 'baiduspider') === FALSE)
{  
 //用户正常浏览时所能见到的内容   
//<!– 你的展示代码–>
}
else
{    //搜索引擎蜘蛛能看到的代码及链接}

JSP
<%String userAgent = request.getHeader( "User-Agent" );
if(userAgent.toLowerCase().indexOf("baiduspider") != -1)
{    //用户正常浏览时所能见到的内容代码}
else
{    //搜索引擎蜘蛛能看到的代码及链接}%>

JAVASCRIPT
if(navigator.userAgent.toLowerCase().indexOf("baiduspider") <= -1)
{    //用户正常浏览时所能见到的内容}
else
{    //搜索引擎蜘蛛能看到的代码及链接}


相 关 文 章   发布商链接
·seo优化对比一下google和百度的更新...
·哪些行为会被百度搜索引擎认为是作弊
·百度不收录站,我们应采取什么网站推...
·网站优化之信息内容优化的技巧
·网站被搜索引擎屏蔽,简单的解决办法
·如何对网站进行高效优化小解
·用网站地图帮助搜索引擎索引你的网站
·小经验:关键字如何更好选择的小方法
·怎样为网站更好地建设出高质量的链接
·面对搜索引擎降权时应采取的对策!<...
 §最新评论:(评论内容只代表网友观点,与本站立场无关!)
网名: 验证码:  【所有评论】【↑返回顶部
评 分: 12 345
评论内容:(不能超过500字,请自觉遵守互联网相关政策法规。[按 Ctrl+Enter 可直接提交]
注意:请勿在本站发布政治话题、色情及违反法律的内容。
IT知道网 声明:刊登此文章是为了传递更多信息,文章内容仅供参考,转载请注明出处。
推 荐 文 章
·seo优化对比一下google和百度
·百度和Google就SEO作弊公开他
·robots.txt基本介绍及其实例...
·图解利用Google高级搜索功能...
·google蜘蛛机器人新技术自动...
·如何做好网站关键词,标题和网
·网站seo优化及其误区分析
·了解并使用robots.txt和robot...
·面对搜索引擎降权时应采取的...
·怎样为网站更好地建设出高质...
·小经验:关键字如何更好选择的
·用网站地图帮助搜索引擎索引...
·如何对网站进行高效优化小解
热 门 文 章
·面对搜索引擎降权时应采取的...
·百度和Google就SEO作弊公开他...
·google蜘蛛机器人新技术自动...
·如何做好网站关键词,标题和网...
·网站被搜索引擎屏蔽,简单的解...
·百度不收录站,我们应采取什么...
·网站优化之信息内容优化的技...
·如何对网站进行高效优化小解
·小经验:关键字如何更好选择的...
·图解利用Google高级搜索功能...
·怎样为网站更好地建设出高质...
·了解并使用robots.txt和robot...
·哪些行为会被百度搜索引擎认...
·用网站地图帮助搜索引擎索引...
·网站seo优化及其误区分析
网站首页 - 关于本站 - 加入收藏 - 网站地图 - 友情连接 - 在线留言 - 联系我们 - 返回顶部
Copyright © 2007 IT知道网.[冀ICP备07026896号]. All Rights Reserved .