建站百科Website News

当前位置:首页 »百度蜘蛛抓取不喜欢哪几类内容?

百度蜘蛛抓取不喜欢哪几类内容?

至成科技2015-03-10访问量(1874)评论(0)
摘要:
至成科技(西安网站设计)和您讨论一下搜索引擎不喜欢哪几类内容也是很有意义。

    例如,虽然搜索引擎能检测到你在显示一张图片,但是就像前面讨论的,它不知道这张图片显示的到底是什么,除非你用ALT属性提供信息。不过,搜索引擎可以识别像素颜色,很多时候可以根据JPGE图片中肉色的多少确定图片是否含有色情内容。所以搜索引擎无法分辨一张图片中描述的是辛普森还是一条路,是一幢房子还是龙卷风。另外,搜索引擎也无法辩认图片中的文字。目前,搜索引擎在尝试使用光学字符识别技术从图片中提取文字,但是这项技术还没有在搜索引擎中广泛使用。

    另外,常规SEO观念一直认为,搜索引擎不能读取FLASH文字,这个有点过时了。搜索引擎正开始从FLASH中提取信息。当然,搜索引擎要确认FLASH里有什么并非易事。较大的一个问题是,就算搜索引擎查看FLASH文件内部,它们还是在寻找文字性内容,但是FLASH是以图像为主的媒介,对一个设计师来说,在FLASH里放文字并没有什么好处。就算HTML和FLASH一起使用,在HTML文件中能够出现的语言提示也都不见了。

    第三种搜索引擎看不到的内容是FLASH包含的任何图像性质的东西,FLASH中的这类内容与图片有效一样。例如当文字被转化为向量轮廓线时,搜索引擎能读取的文字性信息就丢失了。

    音频和视频文件也不容易被搜索引擎读取。和图片一样,这种数据难以解析。有几种例外情况搜索引擎能提取一些很有限的数据,比如MP3文件中AD3标签,使用AAC格式内嵌文字性说明的图片和章节标记的增强型播客。不过归根结底,某视频文件是关于足球比赛还是关于森林大火,搜索引擎是分辨不出来的。

    搜索引擎也不能读取程序里面的内容。搜索引擎寻找的是人能够在页面源代码中看到的文字。你能在浏览器显示的页面上看到的内容,搜索引擎不一定能看到——只有页面源代码中可见可读取的信息搜索引擎才能看到。

    一个明显的,人能看到但搜索引擎不能看到的内容是AJAX。AJAX是一种基于JavaScript的方法,从数据库获取数据后,直接在页面动态显示内容,而不需要刷新整个页面。这种技术经常见于线上工具,用户输入一些信息,AJAX工具获取并显示正确的内容。

    在用户输入信息后运行于客户端计算机的脚本才能获得的内容,这种情况可以导致很多不同的输出。另外,在用户输入信息之前,内容在页面HTML代码中并不存在,所以搜索引擎也看不到。

    一些其他形式的JavaScript脚本也有相似问题,在用户采取某种行动之前,HTML中并没有相关内容。

    在HTML5标准中,一种称为嵌入标签EMBED的结构允许在页面中放入插件。插件是安装在用户计算机中的软件,不是安装在网站中服务器上。这个标签经常用来在页面上放入视频或音频文件。EMBED标签告诉插件应该在哪里寻找要用的数据文件。插件中包含的内容,搜索引擎有效看不见。

    FRAME和IFRAME是从其他网页调用内容的方法。IFRAME比FRAME更常用于从其他网站调用内容。

以上内容由至成科技(西安网站设计,西安网站制作)为您提供,更多精彩内容:http://www.xazcit.com/

关注“至成科技”微信公众号,快速获取互联网较新资讯


扫描左侧二维码
关注至成微信公众号

西安至成信息科技有限公司  Copyright 2012-2024  xazcit.com  All rights reserved.

Email:zcit@zcit.net     邮政编码:710016     《中华人民共和国增值电信业务经营许可证》陕B1.B2-20140011     陕ICP备12008874号-1

联系地址:西安市经开区凤城四路西安国际企业中心B座23层06-10室    售前咨询热线:02989390727    售后服务电话:02989390727

西安网站建设、网站设计制作公司-至成科技,已为众多企业提供网站建设网站制作响应式网站设计手机网站建设虚拟主机云主机服务器租用等建站解决方案。

域名合作伙伴:新网互联软件服务有限公司 陕公网安备 61019102000393号

网络警察12321垃圾信息举报不良信息举报中国文明网西安工商高新技术企业证书