本博客连续迭代11天带来的功能性变化


本博客搭建以来,然后开始迭代,从开始迭代到今天已经11天了,具体的迭代记录(非常详细),都记录在seo站群迭代记录里面..,几乎每天都在更新,而且计划每天都在调整...,最近的迭代速度还出现了加速的情况..

目前来说主要实现了以下几个核心功能:

1. 关键词排名,收录全自动监控

用的是django的celery,实现的全自动排名和收录监控定时监控..,这个如果只是监控,那其实没什么意义,关键是要对未收录的页面进行操作,所以就衍生了以下功能:

2. 未收录页面的地图

比如我把未收录页面全部放在这个页面 : http://www.zhangte.org/sitemap_w.html , 定期的这个页面也会去提交给百度...,目前效果如下: -w821 本站的收录率有83%,其中tag页全收录,文章几乎也是秒收(一般1-2天内),同时把这个查询的url也做了一条url(只有在登录的时候才可以访问),所以我只要访问一下这条url,就会对全站未收录的页面进行全自动收录查询...

3. 文章底部的推荐

也就是这块,其实亮点没什么,主要是本文关键词,在站群上已经实现自动提取关键词,而且用的方法也会比普通的jieba分词自动tag,甚至比百度的NLP效果还要好... -w672 其二,就是本底部,会自动的推荐一些未收录的页面...这样只要每次更新文章,未收录页面全自动就全站都被推荐了,自然也就加强了收录率

4. 锚文本功能效率提升

做好自动锚文本这个看似简单,实则不容易....因为要考虑到效率的问题,如果是1万个词要怎么办?这次在朋友的推荐下,用了dfa算法,发现效率大大的提升,我认为优秀锚文本替换主要符合以下:

  1. 关键词只替换一次
  2. 如果短词(如seo)和长词(如厦门seo)都出现的话,只替换一次即可
  3. 如果关键词包含在url里面,则不替换
  4. 文章重复提交,不会一直重复替换,既:保证seo这个词,只被始终只有一次被替换..

5. 图片url重写

这个具体的做法大致的效果记录在这里:http://www.zhangte.org/python/14.html, 具体对优化的效果还有待研究..,不过这个功能我个人感觉还不错

接下去的规划

  1. 先实现docker集群部署,没错,就这么一个屌站每天几个ip,我要做分布式集群了,为什么?因为我在复制一个站的时候,确实被吐血到了...,所以我要把环境这块的问题彻底的解决掉!
  2. 文章自动发布功能,当然是结合了上述的处理,这个功能看似简单,实则要开放太多api...而且目前发布一篇文章流程较为繁琐,且不说对文章进行排版,转md格式,还要
    1. 图片重写
    2. 自动加内链
    3. 关键词自动提取
    4. ...
  3. 搭建统一管理后台,计划会把上述发文章的流程和处理文章的流程分开,做成异步分布式,由统一的后台来统一管理


本文关键词: | 连续迭代 | 功能性变化
转载请注明链接 : http://www.zhangte.org/za-tan/31.html
度娘请收录下列优质文章:
  • 反思,以及重新规划时间的安排