SEO规则学习

目的:提升搜索引擎对网站的关注度及排名。

URL优化

  • 三层结构:域名+分类+资源名,比如:http://www.domain.com/seo/tt
  • URL过长、带有查询参数,对Spider都是不友好的;
  • 直接生成静态文件or使用伪静态;
    • Apache + mod_rewrite
    • IIS + ISAPI Rewrite
    • 两者写法基本相同,都是通过在.htaccess中加入伪静态正则表达式规则,来实现URL重写;
    • 还有防盗链作用:防止服务器上的图片、Flash、视频等资源被盗链,而造成服务器过载;原理:判断Referer是否来自本地域名or信任列表(一般都包含常用搜索引擎)中的域名,如不是,就产生一个URL重写,重定向到某个警示页面;
  • 域名
    • 尽量包含关键词,比如:flash-game.net,中间加个连字号,在如今域名亏缺时代是蛮好的;
    • 注册时,要查询下域名是否被搜索引擎惩罚过;
  • 二级域名:对于中小型网站,不要使用二级域名来划分内容;使用路径来划分即可,否则会分散spider的精力;大型网站内容多,1个频道对应1个二级域名是完全没问题的;
  • 路径(目录)
    • 以关键词(中文全拼or英文单词、词组)命名;
  • 资源(内容)
    • 以数字or关键词命名,分隔符采用连字号-;比如:chanpin-yanshi.html
    • 可以采用文章日期+文章id的方式来命名;
  • 注:域名中包含关键词的话,要注意网页整体关键词的密度,密度过高,会遭受惩罚;网页整体关键词做好的情况下,URL的关键词就不需要做了;
  • 只用1个URL,其余的URL做redirect,否则会减小搜索引擎对URL的权重;
    • 原理:IIS接收到请求后,会发送包:301 Moved Permanently Location,让浏览器重新访问Location指定的地址;
    • 做伪静态的网站,1个网页对应2个URL,一定要仔细检查是否有外露的动态链接URL,如有,要处理掉;
  • URL只用小写字母;
  • 后缀名:可以没有,搜索引擎会当静态资源看待,不要跟查询参数即可;
  • 死链:无法访问的页面;测试:http://tool.chinaz.com/links/

Title优化

  • 蜘蛛第一个获取到的文字信息;
  • 要直观反映网页的中心内容(思想);
  • 网站中的网页title不要重复,否则会被蜘蛛认为相同内容,而跳过抓取;
  • title不要太长,长了,在搜索引擎中也只给你显示一部分,其余…隐藏掉的;
  • title中存放所有关键词的做法,存在争议,有堆积关键词作弊的嫌疑;
  • keywords指定的关键词在title中出现一次即可(不出现也不好,因为keywords是人眼不可视的),否则网页关键词密度过高,有堆积关键词的嫌疑;
  • 词汇分隔符:下划线or连字号?国内百度、腾讯使用下划线;国外Google使用连字号;建议使用下划线,不建议使用竖线 | ;
  • 字符数:最多255个;反应标题、关键词、网站名称即可;
  • 作弊
    • 关键词过多、重复(包括title前十几个字相同的情况);
    • 关键词跟网页主题内容无关;
    • 频繁修改title;一般对于已生成静态文件就不再优化title,而对新页面进行优化;对于伪静态页面,一般对标题做一次性的小改动,不要频繁修改;
  • 格式:文章title_频道名称_分类名称_网站名称,其中还可以增加一些与页面内容相关的热门长尾关键词;
  • 比如
    • 我国个税起征点年内或调至2500元_即时报道_财经_腾讯网
    • 帮助中心_中小企业在线国际

Keywords关键词优化

  • 相关关键词,可以是原始关键词的近义词、长尾词;
  • 企业网站关键词选择可以突出地域性、产品服务特性等;
  • 关键词不要太宽泛,例如:轴承,因为带有此关键词的网页太多了,竞争压力太大,还不如使用更精准的长尾关键词,比如:北京FAG轴承;
  • 站在用户的角度,想想,用户会以什么关键词来搜索;
  • 使用百度、搜狗、Google等关键词工具来选择竞争小、关注度高的关键词;
  • 关键词和网站一定要有关系,否则在轴承网上写“小沈阳”关键字,会被当做作弊行为而受到惩罚;
  • 网站每个页面的内容是不同的,那么每个页面的关键词也应该是不同的,切忌一个网站所有页面只选择1-2个关键词;
  • 每个页面的关键词2-3个就可以了;多个话反而效果不好,因为百度给网页关键词的总分是不变的,比如是100分,那么1个关键词会得100分,2个关键词每个关键词各得50分;
  • 如果页面要表达的关键词确实很多
    • 关键词可以放入title、description、h1/h2/h3、content等中;
    • 关键词放入其他分页中;
    • 制作关键词专题页面;
  • 关键词,而不是关键句,关键句写在description中;
  • 分隔符:英文逗号,不能是空格(多个关键词用空格分隔,会被当做是1个关键词)、竖线;
  • 比如:轴承, 轴承网, 进口轴承
  • 组合关键词
    • 比如:keywords中是:天津轴承销售;
    • title中放天津、轴承;title中不需要放关键词:天津轴承销售;而采用组合关键词的方法;
    • 文章正文标题h1/h2中放销售;
    • 页眉、页脚中放销售;
  • 分词、组合词
    • 尽管“天津轴承”这个精准关键词没有直接出现,但是页面title、页面内容,出现天津、轴承,这样的分词、组合词,依然可以在搜索结果中占到很好的位置;

Description

  • description写的好的话,搜索结果中显示的是description的内容,写得不好or没写,搜索结果中显示的是网页中的前面一些文字;
  • 用简洁的话语总结页面的核心内容,句子,可以使用标点符号,但使用英文标点(逗号、句号等)符号。
  • 最多255个字符;
  • 可以放入关键词;
  • 最大作用:一旦网页body中没有跟用户搜索的关键词匹配的词,那就以description的内容作为显示的索引内容
  • 每个网页的内容是不一样的,那么description也必须是不一样的;
  • 工具:Google的网页内容分析

h1~h6

  • h1正文标题 h2副标题 h3-h6段落标题 h3页脚关键字
  • h1-h6 搜索引擎给予的关注也逐渐降低 — Google SEO手册;
  • 在HTML规范中,网页的正文标题需要用h1,Spider也非常重视此标签;
  • H1一般同title的内容一样,但也可不一样;1个页面1个H1即可,多了会降低权重;
  • H2一般是对H1的加强解释,可以放置一些长尾关键词;1个页面不要超过3个H2;
  • 对页眉页脚使用H3-H6有作弊的风险;

Content 文章内容

  • 对关键词加重(b/strong/u/i等标签)、加链接;css的b/strong/u/i等标签,对搜索引擎是无效的;
  • 只对第一次出现的关键词加重、加链接,否则会被认为作弊;
  • 文章正文内部链接建设
  • 不重要的注释需要删除,以免影响Spider的爬行;
  • 最重要的是保持content的原创性,且质量高,有价值;
  • 伪原创:对文章前后255个字符进行原创,其他的内容可以拷贝修改原创;
  • 内容勤更新,每天2-3篇文章;至少每周更新一次;

网页底部(页脚footer)信息

  • 一般放置版权、ICP备案信息、联系方式、网站地图链接、关键词等;
  • 实际上这个位置是spider格外关注的区域;
  • 可以放置关键词、短语等,以提高页面和关键词之间的相关度;
  • 可以使用h3-h6标签、b加粗标签;一般使用h3

多媒体JS、Flash、Image、Video

  • Spider对这些资源不怎么感兴趣;
  • 需要针对这些资源做相应的文字资源;
    • 针对Flash导航,在页面底部做文字导航、SiteMap;
    • 图片加上ALT标签;
  • 网站导航、链接、内容尽量不使用Flash;

图片搜索优化

  1. 图片内容分析
    • 链向图片的URL的锚文字:<a href=”/img.jpg”>锚文字</a>
    • 图片所在网页的外链锚文字;
    • 图片所在网页的title、meta、h1、content等;
    • 图片alt属性;
    • url中的路径(目录)名
    • url中的图片文件名
    • 环绕图片的前后各255个字符;
  2. 图片归类、生成缩略图、入库;
  3. 图片排序:当用户进行关键词搜索时,以图片的内容与关键词的相关度进行排序;
  4. 如可能,可以在图片上加网址、标题等水印,用户看到图片,感兴趣的话,可以点击图片进入网页;

百度图片搜索优化

  • 百度图片搜索引擎中,图片排序是横向的,跟纵向网页排序不一样;
  • 百度图片格式优先级:jpg>jpeg>gif>png>bmp
    • jpg 24bit色种、不支持透明;
    • gif 8bit色种、支持1bit(2级)透明(要么全透明、要么不透明)、适合大块相同颜色区域的图像;
    • png 24bit色种/8bit色种、支持8bit(255级)透明;
  • 百度图片像素优先级:像素大>像素小

超链优化

内部链接优化、外部链接优化。

导航链接

  • 尽量使用文本作为链接的锚文字;
  • 如采用图片、JS、Flash形式作为导航,那么需要增加额外的文本导航,如:文字链接导航、Sitemap等;

面包屑

  • 来源童话故事:为了防止迷路,他们在沿途走过的敌方都撒下了面包屑;
  • SEO作用:提高内部链接的紧密性;每个路径名都是关键词,且链接向对应资源;

其他相关页面链接

  • 文章左侧or右侧放入【热门文章】、【最新文章】、【推荐文章】、【标签tag】等;
  • 文章下方放入【相关文章】、上一篇:标题、下一篇:标题等;
  • 文章中放入相关文章的引用链接;
  • 排名规则(按照关键词与页面的相关度排序),当spider发现页面有很多关于某个关键词的链接时,会根据相关度原则给予网页一定的分值;
  • 比如网页关键词“FAG轴承”,那么相关新闻标题可以是:天津市FAG轴承销售名录;国内FAG轴承销售量超越进口产品;

链接、专题优化

  • 专题策略,提高单个关键词排名的普遍做法;Spider也喜欢专一主题的页面;
  • 主题唯一性,比如:“高压接触器”主题,那么页面上只能放有关“高压接触器”的文章、图片、产品介绍、厂家名称等;
  • 权重:专题网站 > 专题网页 > 栏目列表网页;
  • 专题页面的内链策略
    • 网站中只要出现专题页面关键词,那么就做链接,指向专题页面;

比如:对关键词“轴承”做链接、专题优化

  • 做专题目录资源:把轴承相关的文章都归类到zhoucheng目录资源下;
  • 给专题目录导入流量
    • 所有页面内容中的轴承上都加入指向zhoucheng目录资源链接;
    • 在轴承相关的文章页面里,加上相关文章区域,区域中的文章出自zhoucheng目录资源;

网站地图

格式

  • HTML:给Human看,让Spider收入整站;
  • XML:手动提交sitemap给搜索引擎;

Google sitemap:可以诊断SEO情况、链接问题、robots.txt问题等;

HTML网站地图(SiteMap.html)

  • 小型网站:在sitemap页面上放所有网站链接资源;
  • 中型网站:在sitemap页面上放所有网站链接资源,并自动分页,每页链接数目不超过50个;
  • 大型网站
    • 在sitemap页面上只放置栏目、频道页的链接;
    • 做多个小的sitemap页面,再把小的网站地图链接放置到一个总的网站地图上;

外部链接优化

  • 李彦宏先生超链接分析专利核心:A网站上的1个页面,被B网站的1各页面引用or作为友情链接,那么B网站就给予了A网站一个喜欢、信任度的投票;网站被喜欢、信任的投票数越多,那么网站的排名也越高;Google的PageRank原则也是如此;
  • 专业SEOer把外部链接优化作为一种必杀技,在对网站进行简单seo后,就马上进行大规模的外部链接优化;
  • 同行业网站外链价值大于不同行业网站外链;
  • 被惩罚过的网站外链,如果你也链上它,那么会被为“共业”;
  • PR为6以上的网站,可以毫不犹豫地和对方交换友情链接;
  • 定期检链接到外部的网站是否出现空链接;
  • 不建议跟新站交换链接;
  • 如何查询网站是否被惩罚过
    • whois 查询网站年龄等信息,如果域名年龄没超过3个月,那说明是新站;
    • site:domain查询网站被收入情况;
    • 查询网站PR值
    • 查询网站是否黑帽SEO(SEO作弊)
  • 网站对外的链接数越少,对网站自身越好;链向网站的链接数越多,对网站越好;
  • 一定要避免的4中获取外部链接的方法
    • 在留言本、论坛、百度贴吧、百度知道等地方群发链接;
    • 花钱买链接;
    • 通过黑客 手段获得链接;
    • 同一个服务器上网站互换友情链接;

如何获取高质量的导入链接?

  1. 将网页加入高质量分类目录种,如:DMOZ, 265, hao123, Yahoo!等分类目录种;
    • DMOZ 编辑人员都是志愿者,这个目录最大优势是公平、公正;还有就是其与Google是合作关系,有这样的说法:Google的所有蜘蛛都是先到达ODP(Open Directory Project)采取信息,然后再顺着这些索引页到达其他网页;
    • hao123会给首页链接网站带去每天10万IP的流量;厉害;
  2. 通过软文获取链接
    • 硬广告:电视、杂志、网站横幅广告、弹出窗口广告等;
    • 软广告:隐藏在某个非广告内容中的广告,比如:在《天下无贼》电影种嵌入的广告;
    • 软文:隐藏在网页内容种得广告(关键词链接)
    • 比如:寻找有价值的文章,及文章中的关键词,给关键词做链接(做广告),链接指向网站;
    • 比如:写软文,软件介绍网站及产品等信息,并做关键词链接到网站;
    • 注意:只给软文中第一个出现的关键词做链接;
  3. 跟同行、PR值高、非营利性网站、行业协会的网站交换友情链接;
  4. 创建Blog,在Blog中适当增加网站链接,即在Blog文章种植入广告;
  5. 通过策划活动获取友情链接,比如:Q币换友情链接活动;
  6. 通过工具分析对手网站的外链(反向链接),争取也能获取同样的外链;

网页减肥

  • HTML代码过于繁杂、冗余,会影响蜘蛛对内容的爬行;(HTML、CSS、JS代码不会被蜘蛛抓取索引;)
  • 使用DIV+CSS布局美化(最好不要超过3层),不要使用Table布局;
  • CSS、JS作为单独文件被引用,否则会阻碍Spider的爬行;
  • 是在要在网页中嵌入JS代码,可把JS放在网页最后,body之前,也就不会阻碍Spider的爬行了;
  • 要符合W3C标准,验证地址:http://jigsaw.w3.org/css-validator/;
  • 内容过长,影响用户体验(加载速度、不可做标签,下次得重头看起),从而影响网页排名,可分页,不超过3屏为1页;
  • 图片太大,影响用户体验(加载速度),考验Spider的耐心,没耐心就干脆不收录你了,或给你一个差评;
  • 尽量少用Flash;

新网站被快速收录的办法

Spider的自动爬取新网站的周期为1个星期or1个月,对于新网站来说,只能手动提交sitemap给搜索引擎;

外部友情链接

  • 使用新网站的关键词(比如:中小企业在线国际)作为友情链接的锚文字;
  • 数量不需要多,否则会被Search认为【友情链接作弊】;
  • 让同行业、同性质的老牌网站做链接;
  • 避免在同一IP服务器上做友情链接交换;
  • 友情链接交换渠道:直接交换;发含有网站关键字锚链接的软文;
  • 不要在留言本、论坛、百度贴吧、百度知道等地方群发链接;

Google网站管理员工具 – 提交SiteMap

准备sitemap文件

包含网站所有URL地址的文本文件sitemap.txt;

XML格式的网站地图sitemap.xml;

  • 向Google提交RSS或Atom源;
  • 如果网站没有RSS或Atom源,那么需要用第三方工具来生成XML Sitemap;
    • Google自带的Pyhton脚本Sitemap生成工具;
    • 第三方生成工具 www.xml-sitemaps.com,可以生成给Spider的XML sitemap(本质:站点URL地址列表)、给Human的HTML sitemap等;免费版,最多可以索引500 pages;输入站点网址,把生成的XML sitemap上传到网站空间根目录;

网站接入Google网站管理员工具

  • 登录https://www.google.com/webmasters
  • Add Site
  • 输入网站域名
  • 接入验证:下载Google针对网站域名生成的ID文件,把ID文件上传至网站根目录,来验证;

提交Sitemap

  • Crawl — Sitemaps — Add/Test Sitemap
  • 输入XML sitemap的URI

百度站长平台 – 提交SiteMap

  1. 准备sitemap文件
  2. 网站接入Baidu网站站长平台
  3. 提交Sitemap,不是随便可以提交的,需要有权限,baidu会主动邀请你提交;

百度站长平台 – 抓取诊断

  • 网站分析 — 抓取诊断,此工具可以让站长从百度蜘蛛的视角查看抓取内容,自助诊断百度蜘蛛看到的内容,和预期是否一致。
  • 每个站点每月可使用300次,抓取结果只展现百度蜘蛛可见的前200KB内容。
  • 输入URL,即让百度蜘蛛抓取、收录网页;
  • 如果网站有新页面或页面内容有更新,百度蜘蛛较长时间没来访问,可以通过此工具邀请它快速来抓取。

英文网站的SEO

  • 目的:利用Google带来海外流量;
  • 版权:尽量原创,引用的话要注明出处;否则对方网站会来信警告、会投诉到主机供应商、会投诉到Google、会起诉你;
  • 翻译:语言差异、关键词翻译、Meta种信息翻译等;
  • 域名、主机提供商:GoDaddy,任何搜索引擎在进行网页排序时,都会把本国语言的网站排在前面;
  • 开源CMS:wordpress、joomla、drupal、vBulletin
  • 网页编码UTF-8、字体Arial、文字大小12-16px
  • 网页设计:国内注重外观、国外注重内容;
  • 一定要有About US、Private & Copyright、Contact US
  • robots.txt、sitemap.html/sitemap.xml、RSS
  • 外链
    • 社会化书签(Social bookmarking),比如:http://www.socialmarker.com
    • 网址分类目录、黄页,比如:DMOZ
    • 内容聚合网站,把带有网站链接的文章(软文)推荐到一些内容聚合网站上,如文章审核通过,可带来流量;
    • Blog:在社交网络中推广自己的网站,要注意适量,否则会受到惩罚;
    • 邮件订阅:网站提供邮件订阅功能,内容好的话,订阅着会病毒式传播给他们的好友;
  • 内链:主导航、网站地图、面包屑、专题页面等;
  • 内容至少每周更新一次;
  • Google比Baidu更注重URL上的关键字,域名、路径、文件名等;
  • Google沙盒效应:新网站上线,虽然被收入了,但是不会有排名,因为Google对网站有6个月的观察期;
  • 链接广泛度(Link Popularity):入链多少、质量如何;即Sogou Rank、Google Page Rank
  • 大多数国外搜索引擎,对description的重视程度要远远大于keywords;
  • google外链查询:link:www.smeoi.com
  • PDF:带有非常有效的专业知识,因为搜索引擎非常重视PDF文件,大部分搜索引擎都能识别PDF文件内容;

Google广告平台

  • Google AdSense
    • 站长使用
    • 广告联盟提供代码,站长把代码嵌入网站,代码会根据网站特点自动生成不同广告,网站浏览者点击广告,站长获得佣金(CPC,每次点击1美分);
    • 一般半年以上的网站,才有资格挂Google AdSense;
  • Google AdWords
    • 产品厂商、产品经销商、服务商使用
    • 预付现金、确定关键词、用户搜索关键词网站会排在前列、用户点击网站链接(CPC)、Google扣钱;
  • Google的PageRank系统分11个级别:0最低 – 10最高,目前只有少数网站达到10,6以上的网站,可以毫不犹豫的跟其交换友情链接;
  • Google的PageRank系统的更新周期是2.5-3个月;

robots.txt

  • 定义蜘蛛行为准则方法
    • 网页meta name=”robots” content=”” 可以针对单个网页规定蜘蛛行为;
    • 网站根目录可以放robots.txt,来定义约定,可以针对某目录、某子域名来定义约定;
  • 不管是否在robots.txt(全部小写)中定义规则,网站根目录下都要有这个文件,哪怕是空文件,目的:避免spider对网站生成1个404信息(网页不存在,会降低网站权重),因为spider访问网站的第一步就是访问robots.txt文件
  • 知名蜘蛛
    • Google蜘蛛名:Googlebot/Googlebot-Mobile/Googlebot-Image/Mediapartners-Google/Adsbot-Google
    • Baiduspider
    • Yahoo! Slurp/Yahoo!-AdCrawler
    • YodaoBot 网页有道蜘蛛
    • Sosospider 腾讯SoSo蜘蛛
    • sogou spider
    • MSNBot
  • 语法
    • Disallow: /images/ 可用来禁止spider访问网站图片资源目录,节省服务器资源;
  • 比如
    • 网站后台登陆页面,可用NOINDEX来告诉spider不要收录;
    • 网站留言页面,可用NOFOLLOW来告诉spider不要跟踪此页面的URL,因为某些网友的留言中会含有不良信息、不良URL;
    • 为了节省服务器资源,让蜘蛛不索引服务器上的数据库文件、模板文件、CSS、JS、图片等资源;
    • 为了防止某些垃圾spider,可以指定只能让某些spider来抓取网站资源;
    • 使用伪静态的网站,1个网页对应有2个URL,可以规定值让抓取静态URL;
  • 案例
    • 淘宝网:User-agent: Baiduspider Disallow: / 禁止百度蜘蛛抓取网站的任何部分;

SEO实战

  • url
    • 三层结构:域名+分类+资源名
    • http://www.domain.com/seo/tt
  • title
    • <=80个字符
    • 帮助中心_中小企业在线国际
  • keywords
    • <=100个字符
    • 为您提供跨国商机, 电子商务解决方案, 中小型企业的在线首选平台
  • description
    • <=200个字符
    • SMEsOI是中小企业寻找全球商机的领先在线平台。
  • 正文
    • 优质内容
    • 文章更新
    • 根据利用好h1-h6/b/strong/u/i等标签
    • 做好内部链接
  • 页脚
    • h3-h6标签、b加粗标签
  • 页面布局、代码
  • 多媒体
    • 添加辅助文字信息
  • 超链(友情链接)
    • 内部链接优化、交换链接
    • 链接通畅性
    • 对外(outbound)链接:http://link.chinaz.com/,可查询网站对外链接,及反向链接等信息;
    • 对内(inbound)链接: http://moz.com/researchtools/ose,可查询链接向网站的网页(即反向链接);原先数据最准的yahoo查询工具2011年已取消、google和baidu的听说不准确;
  • 网站地图
  • 别忘了robots.txt
  • 利用好Google、Baidu站长工具
  • 收录情况
    • 语法:site:domain google、baidu等通用;
    • 比如:site:smeoi.com 不要加www,因为这样可以查询到所有二级域名被收录情况;
  • 排名情况
    • 工具:http://tool.chinaz.com/keywords/default.aspx
    • 输入关键词、网址,可得知排名位置、收录条数;
  • 关键词密度
    • 工具:http://tool.chinaz.com/Tools/Density.aspx,可查询页面文本总长度,关键词出现频率,关键词密度,建议密度等;
    • 关键词密度 = (网页关键词的字符数 / 网页所有有效字符数) * 100%
  • 变动准备
    • SEO不可避免会有URL变动失效、文件移动等情况;
    • 要做好页面重定向,或者404页面(http://www.qq.com/404);
    • 要维护好最新的网站地图MapSite.html
    • SEO后,百度快照更新1周–1个月;
    • title/keywords/description一定要一次更新完成,且短时间内不能再做第二次修改;否则会被认为作弊;
    • SEO过程种,网站很可能会被搜索引擎惩罚,因此为了能更稳固进行优化,在SEO期间,我们需要逐步地为网站添加友情链接,来平衡网站的权重;

参考引用

  • 《SEO魔法书》

发表评论

电子邮件地址不会被公开。 必填项已用*标注