我们在发博客的时肯能会提到搜索引擎算法的工作原理,搜索引擎预处理的第一步就是提取文字内容,最好降低搜索引擎提取文字内容的难度,也就是我们所说的精简HTML代码,让真正的文字内容比例提高,减少HTML格式代码,格式代码对关键词来说就是分贝,而精准代码就是降低分贝的比例。但是精准代码不能随便删除,后果大家也知道的。下面介绍几个常见的精简代码:
第一:使用CSS定义文字字体、颜色、尺寸。有的网站即使用CSS,有使用style或font再定义一遍字体,尺寸等,这完全是多余的。
第二:使用外部文件,将CSS和JavaScript放在外部文件中,页面HTML中只放一个代码即可。一些网页HTML代码中有CSS样式和JavaScript语句,这都不是搜索引擎喜欢的,主要原因是因为文字前面放了太多代码,蜘蛛需要先经过代码然后再到达文字,这样会影响蜘蛛抓取的心情。
第三:减少或删除注释,代码中的注释是给程序员或者是页面设计人员提示作用,而对于搜索引擎或者用户是没有任何意义的。
第四:减少表格,特别是嵌套表格。现在很多页面都是使用CSS排版,对表格的使用有所减少,但有时也需要使用表格,只要不出现多层表格嵌套,产生无用代码是没有什么问题的。
网页瘦身需要对整体文件作规格限制,Google技术指南曾建议,HTML文件最好限制在100KB一下,因为要考虑到搜索引擎索引方面,同时也有考虑打开速度方面,页面上
链接数在100个以下。这个没有严格限制,百度建议HTML文件不要超过128KB。
其实搜索引擎是可以抓取很多文件,不过最好使用越小越好的文件。虽然搜索引擎能够抓取大文件,但不可能搜索整个文件,只能索引其中一部分内容,一般情况下内容应该集中统一,索引前半部分能够代表了文件内容主题,当文件过大时,就没有必要索引整个文件浪费时间,一定会造成大量冗余格式代码。
网站题目:从四个方面精简网站的CSS代码
本文URL:
http://www.cdkjz.cn/article/sjdpcc.html