建站百科Website News

当前位置:首页 »跟大家分享下平利县网站建设中的robots.txt协议

跟大家分享下平利县网站建设中的robots.txt协议

至成科技2017-08-09访问量(1368)评论(0)
摘要:跟大家分享下佛山网站建设中的robots.txt协议,具体内容如下: 1.语法:robots.txt 文件规则: Disallow: 禁止的页面 User-Agent: 允许访问的搜索引擎蜘蛛 可以屏蔽搜索引擎重复收录网页,有的网站配置了静态规则,同一个网页,可以用静态网址又可以用动态网址打开,如果搜索引擎都把两种不同形式的网址的同一个网页内容收录,
跟大家分享下佛山网站建设中的robots.txt协议,具体内容如下:

1.语法:robots.txt 文件规则:

Disallow: 禁止的页面

User-Agent: 允许访问的搜索引擎蜘蛛

可以屏蔽搜索引擎重复收录网页,有的网站配置了静态规则,同一个网页,可以用静态网址又可以用动态网址打开,如果搜索引擎都把两种不同形式的网址的同一个网页内容收录,搜索引擎可能认为你的网站作弊,给予降权甚至拔毛。robot.txt恰好可以解决这个问题。

robots.txt文件里还可以直接包括在sitemap文件的链接。

百度蜘蛛每次来寻找没有robots.txt文件时或者用户访问你不存在的页面时,服务器也将在日志中记录一条404错误,所以网站根目录下添加一个robots.txt文件是有一定必要的。

Robots协议可以屏蔽网站中如:图片,音乐,视频等,节省服务器带宽;可以屏蔽站点的一些死链接。

2.robots.txt是搜索引擎的一种协议,机器人协议或者爬虫协议,可以通过robots.txt协议告诉搜索引擎那些页面可以抓取,那些禁止抓取。用户指定爬虫(spider)在网站中爬行的范围,是百度搜索引擎进入网站后爬行的先进个文件。

3.什么时候使用robots.txt文件,既然搜索引擎有这个协议,百度官方建议;当你网站中不想被搜索引擎抓取的内容,如不想被抓取的后台,完整模板,不想被抓取的特定路径。

4.如果希望百度搜索引擎抓取网站的全部内容,建议不要做robots.txt文件,百度搜索蜘蛛来到网站访问的先进个文件就是根目录下的是否存在robots.txt,蜘蛛就会按照该文件中的内容抓取访问的范围,如果不存在此文件,所以的搜索引擎蜘蛛就会访问全网站的全部页面。robots.txt必须放置在一个站点的根目录下,而且文件名必须全部小写。

扫描左侧二维码
关注至成微信公众号

西安至成信息科技有限公司  Copyright 2012-2024  xazcit.com  All rights reserved.

Email:zcit@zcit.net     邮政编码:710016     《中华人民共和国增值电信业务经营许可证》陕B1.B2-20140011     陕ICP备12008874号-1

联系地址:西安市经开区凤城四路西安国际企业中心B座23层06-10室    售前咨询热线:02989390727    售后服务电话:02989390727

西安网站建设、网站设计制作公司-至成科技,已为众多企业提供网站建设网站制作响应式网站设计手机网站建设虚拟主机云主机服务器租用等建站解决方案。

域名合作伙伴:新网互联软件服务有限公司 陕公网安备 61019102000393号

网络警察12321垃圾信息举报不良信息举报中国文明网西安工商高新技术企业证书