主要是之前的模块4与模块5
模块四 : 每日工作清单 ( 3件以内,从模块三拿任务 )
第一轮大冲刺详细日程记录
2021年01月25日
- [x] 精品站大量蜘蛛池测试
- [x] 写文章发布模块,开始发布文章测试
2021年01月24日
- [x] 多域名缓存的坑,踩了一大圈下来
- [x] 网站批量导入,全部搭建起来
2021年01月23日
- [x] 完善好站群的模板,可以正常使用
- 砍掉Rss,搜索,未收录,评论等不重要的功能
- [x] 写一个批量导入网站的功能 ( 本次计划导入30个站 )
- [x] 测试的域名,站群发布上线,可用!
- [x] 文章准备
- [x] 精品站的异步相关文章计算授权
- [x] 研究新的文章来源方式 ( 没用 )
2021年01月22日
- [x] 整理好需要搭建的站群,对应的TDK以及准备好域名
2021年01月21日
- [x] 给之前新做的hpv站引入蜘蛛池,并且跟踪收录效果
- [x] 改写构建绝对url的方法 ( 改成根据绑定域名的方式的展示出来 )
- [x] 在未收录地图里面写一个方法根据url来进行展示
2021年01月20日
未更新任何功能
2021年01月19日
- [x] 改用Nginx来做反向代理 ( 更好更方便 )
2021年01月18日
- [x] 不同域名,不同分类查看
- [x] 给本博客部署了https,但是还没有学会如何批量部署!
- [x] 修复了本博客不带www跳转的小BUG
2021年01月17日
未更新任何功能
2021年01月16日
- [x] 升级文章排版的功能
- [x] 给本博客加了一个robots.txt的页面
2021年01月15日
- [x] 解决站群主程序sitemap和robots.txt的功能
2021年01月14日
- [x] 实现通过反向代理管理站群
- [x] 把锚文本管理和排名监控的板块给区分开
2021年01月13日
未做任何贡献 ( 蛋疼.....,居然断了一天.. )
2021年01月12日
- [x] 统一镜像站的首页视图处理
- [x] DFA算法升级
- [x] 用自建的api来查询百度的收录量
- [x] 采集图片问题处理
2021年01月11日
- [x] 搭建统一站群镜像测试站的功能
2021年01月10日
- [x] 文章关键词一键导入,并且可以自动设置锚文本 ( 站群及其有用 )
- [x] 站群数据查询任务完成
- [x] 随机文章全站显示 ( 用最粗暴的方法 )
- [x] 把查排名也封装到统一监控里面
- [x] 上下页,相关文章,侧边栏新增摘要显示 ( 摘要的显示方式 ) ##### 2021年01月09日
- [x] 统一管理后台处理,并且投入生产
- [x] 查收录脚本api化
- [x] 循环push功能新增
- 具体说明 : http://www.zhangte.org/python/38.html
2021年01月08日
- [x] 复制站的站长工具,独立统计代码处理
- [x] 远程链接ssh动态更新代码的脚本处理
- [x] 用cnzz测试代码的安装情况
- [x] 百度推送,统计代码,站长验证等信息可直接在后台进行配置
- [x] DFA算法效率升级
2021年01月07日
- 上词率和上词情况的更新到看板里面 ( 在未收录地图里面 )
- HPV-文章自动定时发布集成到站群配置文件里面,可以正常发布文章
- [x] 文章处理层
- [x] dfa自动替换结合api处理
- [x] 图片链接自动转换用api处理
- [x] 自动生成md格式
- [x] API修改层
- [x] 自动摘要的功能投入到站群自动发文api里面
- [x] C算法提取关键词 ( 根据标题 )
- [x] 站群发布文章段落新增过滤字段
- [x] 封装成方法,文章定时随机分布式发布..
- [x] 文章处理层
2021年01月06日
- 普通正文一键转md格式转换,优化,数字分段自动加入一个小标题 ( ### ) 然后再进行分行处理 @授权
- 新增了一个全量更新收录的功能
- 研究如何结合git,区分文件来更新代码,测试hpv的更新 ( 统一代码管理 ) , 把代码托管到git
2021年01月05日
- 通过C算法来实现给文章自定义添加关键词的功能
- 用dfa来提升替换锚文本的效率(大大提升)
- 如果出现相关关键词的锚文本可以随机取一个进行替换
- 改用docker部署hpv,单价docker-compose的方式
2021年01月04日
- html转md格式的脚本处理, [[210124 html转md的实现]]
- 文章发布的api功能集成
2021年01月03日
- 开放完毕所有的核心API,并且带有验证,支持增删改查,包装成函数
- 自动锚文本功能修复完成,还需要优化
- Django-celery的笔记复习
- 调整面包屑导航 ( 去掉原有的 ),上下页位置优化
2021年01月02日
- 完成了RDF的增删改查,用户验证的api基本使用功能
2021年01月01日
- Celery分布式部署,开启自动查询功能,现在排名监控
- 排名监控自动push未收录百度的功能实现了
- 去掉全站缓存,改成了对不同页面设置不同的缓存时间
- 给定时任务写了一个脚本,支持一键启动和暂停,方便后期维护
- 文章页展示未收录url,( tag 分类 文章页 )的锚文本出来
2020年12月31日
- 核心api增加登录访问权限
- 全站Celery分布式收录监控
- 修复锚文本的BUG( 添加多次的问题 , 还未能完全解决)
2020年12月30日
- 搭建好Celery环境
- 完成核心关键词的排名监控功能,详情参加 : http://www.zhangte.org/python/16.html
2020年12月29日
- 优化
- 文章的模板,加入keywords和des的设置功能,详情: http://www.zhangte.org/seo-sem/13.html
- 摘要的显示,不用NLP的方式
- 文章详情页对本文关键词部分加了锚文本处理
- 新增
- 图片链接重写功能,参考地址: http://www.zhangte.org/python/14.html
- 配置ubuntu的memcached环境,目前整站有3小时缓存
- 修复
- 自动锚文本-网址也当做锚文本来添加的BUG
2020年12月28日
- 新增了网站未收录地图的功能,并且加了一些简单的统计,详情:http://www.zhangte.org/seo-sem/12.html (主要统计收录率)
2020年12月27日
- 新增内页[百度收录]查询的api的功能,详情:http://www.zhangte.org/seo-sem/10.html ( 此意义非常重要 , 开始走向定制化系统的第一步!)
2020年12月26日
- 优化了栏目页面的url,目前是
域名/分类别名/文章id
这样的格式,会更利于优化 - 区分了线上和线下的DEBUG模式
- 给文章新增自定义关键词的字段,为后续锚文本做准备
- 旧站的文章页,分类页,和tag页直接简单粗暴的301到了首页
- 加了一个自动化锚文本的功能(但是没有异步化),大致的功能是:
- 修复了SiteMap.xml的问题,需要在站点里面和settings设置好对应的域名.
- 对分类和首页的title进行了优化,更加适合SEO
模块五: 当前主要成就 ( 月回顾用 )
把每个小冲刺完成的成就放在这里,作为月复盘 当前已经解决的小问题 ( 主要成就 )
序号 | 日期 | 功能 | 分类 |
---|---|---|---|
1 | 2020-12-27 | 核心页面百度收录监控 (自动查询 ) | 收录优化 |
2 | 2020-12-28 | 未收录地图及收录量数据监控看板 | 收录优化 |
3 | 2020-12-29 | 图片重写,外链自动图片自动转站内 | 收录优化 |
4 | 2020-12-29 | 全站缓存memcached配置 | 收录优化 |
5 | 2020-12-30 | 全站核心关键词监控+锚文本管理 | 效率优化 |
6 | 2020-12-31 | 全站分布式收录监控 | 收录优化 |
7 | 2021-01-01 | 全自动定时任务功能发布,后台配置 | 效率优化 |
8 | 2021-01-02 | 开放出全套的api | 效率优化 |
9 | 2021-01-03 | 统一后台授权,锚文本功能完善 | BUG调整 |
10 | 2021-01-04 | html转md的格式脚本处理,文章发布的api处理完成 | 效率优化 |
11 | 2021-01-05 | C算法,dfa算法集成到文章发布 | 收录优化 |
12 | 2021-01-06 | 用docker和git配合,部署一个站上线 | 效率优化 |
13 | 2021-01-07 | 文章处理api化,复制一个站点成功,且全自动化定时发布 | 效率优化 |
14 | 2021-01-08 | 本地脚本更新效率优化,支持docker一键更新代码 | 效率优化 |
15 | 2021-01-09 | 统一管理后台初步搭建 ,百度循环收录功能开发 | 效率优化 |
16 | 2021-01-10 | 统一后台排名分析功能完善,文章摘要模板中显示,随机文章显示,自动锚文本导入 | 效率优化 |
17 | 2021-01-11 | 只要一文件,就可以实现站群搭建,雏形出来 | 效率优化 |
18 | 2021-01-12 | 统一站群的后台调整,可直接配置域名,自动式生成 | 效率优化 |
19 | 2021-01-13 | 计划:给统一后台的站,搭建好首页 | 效率优化 |
20 | 2021-01-14 | 把锚文本和排名监控功能拆开 | 数据分析 |
21 | 2021-01-15 | sitemap和robots.txt支持多站显示 | 收录优化 |
22 | 2021-01-16 | 优化文章排版的小功能 | |
23 | 2021-01-18 | 不同分类不同域名的显示 | 效率优化 |
24 | 2021-01-19 | 用nginx来做反向代理,修改少量代码 | 收录优化 |
25 | 2021-01-21 | 引入蜘蛛池,优化绝对路径的展示,和未收录页面的显示 | 效率优化 |
26 | 2021-01-22 | 整理需要搭建的站群,TDK和域名的准备 | 效率优化 |
27 | 2021-01-23 | 正式搭建网站,内容准备 | 效率优化 |
28 | 2021-01-24 | 修复缓存显示的BUG,网站搭建完毕 | 效率优化 |
29 | 2021-01-25 | 文章发布配置,30批量站群里程碑完成! | 里程碑 |
起因
起因 : 因为网站被黑,现在改成了Django 加上公司需求需要开发一套完全符合SEO定制的系统,所以在此记录博客优化的进程. 因为较为熟悉python,所以这一切应该理论上可行的
临时想法记录
- 多模板多用户模式,可以尝试重写Django的sites框架来实现
- 用api发布文章文章的时候,自动添加Tags标签,如果没有的话,则自动创建Tags标签 ( 完成 )
- 考虑把C算法融入到目前的站群系统里面,用来根据标题自动判断关键词 ( 完成 )
思路整理
站群获取所有的标签的域名 ( 通过域名 )
from django.urls import reverse
from django.db.models import Count
#已知文章列表
domain = '127.0.0.1:8002'
a = Article.objects.filter(sites__domain=domain)
domain_urls_list = []
for tag_slug in set(a.annotate(Count('tags')).values_list('tags__slug',flat=True)):
tag_url = reverse('blog:tag_detail', kwargs={'tag_name': tag_slug})
tag_url = domain + tag_url
domain_url_list.append(tag_url)
在非django的项目中,使用django的ORM : https://www.cnblogs.com/sriba/p/13815176.html
什么样的功能是核心的? 以有办法复制50个站未基础的功能,需要完成什么
本文关键词: | 站群第一轮归档
转载请注明链接 : http://www.zhangte.org/python/67.html
度娘请收录下列优质文章: