专题:Python

不要随意重写代码


我虽然不是专业写程序的,但是经常会用程序来解决一些工作的问题,尤其是自动化方面的.. 在这个过程中,一般会遇到一个项目,写到最后,感觉维护起来特别累...所以就抱着干脆重写的想法..

就是因为这样动不动重写,让我很多东西一直在原地踏步...,最近才意识到,我应该是重构...而不是重写!

重写和重构的区别?

  • 重写指的是直接另起一个项目,代码和结构全部重新设计
  • 而重构一般在现有的代码上,一点点往上重新抽象,逐步调整结构的一个过程

我的理解是,如果你不知不觉把代码写得很烂,而不明白其中的原因 (

......

点击阅读更多...

通过百度搜索源代码可以做哪些功能?


最近在思考一些东西,越发觉得解耦的重要性,而解耦的最佳方式,目前看,就是把各个功能做API,通过API来调用,这里突然延伸到一个问题 : 如果只是查排名?那么如何规划好API?

传统的查排名方式

一般的接口都是直接输入关键词,然后返回排名,这种对于关键词数量少来说没问题,比如chinaz开放的api就可以干这个事情...但是5118相对自由一点,会把搜索整个搜索结果的url都返回给你,这样你就可以做更多事情(后面会讲).

回到上面的问题,如果直接输入关键词返回排名,这样做成一个接口,那么我假如需

......

点击阅读更多...

Pyhton和Go结合的分布式任务


Go的效率毫无疑问,直接秒杀Python百倍...最近在摸索的时候,感觉越发强大... 同时go会比python有几个好处

  1. 写代码会更加规范,因为都要定义好才能写,这样后期维护起来难度会比较低(难怪大家说,动态一时爽,重构火葬场....)
  2. 静态,如果代码写错了,是运行不起来的..,所以在写的时候,会避免很多使用中的坑...
  3. go可以直接编译成二进制,也就是说,用Go当Worker的话,甚至连Worker的环境都不用部署...,这样简直完美...
  4. 效率,这个效率是高得不止一点点...传说Go的效
......

点击阅读更多...

在改站群系统中,因缓存踩的坑,记录一下..


在之前的这篇文章里面,有提到了这个高手写的这个博客程序, 我觉得很好用,然后拿来用...

在正式环境的时候,发现因为缓存踩的坑还真是不少.... 找了好久,才发现...原来高手就是高手....,因为他是针对不同区域分别设置缓存....

比如说 :

  1. 把网站的设置 ( 如TDK,备案信息,底部链接 ) 这些设置一个缓存,而且时间比较久
  2. 把侧边栏文章列表模块设置一个缓存...
  3. 把导航也单独设置缓存....

简单来说,就是针对不同区块设置不同的缓存,来达到效率最大化! 真的是学习了...,比如在模

......

点击阅读更多...

较为理想的一个站群方案


当前凌晨2:30分,达芬奇睡眠法继续奋战中.. 目前思路有限,先大致整理的站群思路的思维导图,还未变成具体的计划...不要看功能很多,其实没有一个是很复杂的,有的也就几分钟可能就能做好... 当前第一版,后续可以的话,直接在导图上迭代...,比如 监控的时候,要把流量也监控进来,但是第一版里面没写!

大致的效果如下:

统一后台

-w729 我理想中的情况是,网站管理,就只负责管理,不负责任何其他的设置...甚至包括文章库,以及数据分析等.... 用程序员的专业说法,这叫解耦..因为后期我还想搞一个站群一键

......

点击阅读更多...

站群文章已经实现不同域名不同内容的展示


其实整个实现的逻辑非常简单...,大致的效果如下 -w1031

-w741

-w984

这样只要在批量发布文章的时候,把需要发布的网站的域名传进去就可以进行统一更新了....实在是很方便...,文章分类和标签也不同单独绑定,全部通过文章串联起来,不得不说,Mysql在这点上做得确实比mongodb要好...

其实具体的实现代码,大致是这个文章写的:https://www.zhangte.org/python/52.html 到目前,仅剩一些SEO功能还未做区分(但是不影响正常优化)..站群的基础功能,包含:

  1. 广告页独立配置,
......

点击阅读更多...

设置通过反向代理,实现多ip站群系统管理(站群连文件都不需要上传的那种)


昨天受到zero大神的指点,感觉有了思路 ( 其实主要是技术认知不行.... ) , 本来我在写这个镜像站的时候 最早的思路是这样:

用户访问站群(多ip多分布) → 镜像站带上域名参数,然后用requests请求主程序 → 主程序通过域名判断返回的内容和模板...

基本的思路,就和爬虫一样...自己镜像自己.....但是这个过程中,多使用了一次requests,感觉有点消耗资源...,Z大的建议是:

用户访问站群(多ip多分布) → apahce直接反向代理到主程序 → 主程序通过reques

......

点击阅读更多...

66行的单文件django SEO镜像站群代码以及实现思路


有的人说Django很重...其实说这句话的人主要也是不会用Django才会这样说... 比如有人给你一把瑞士军刀....你当然可以只用来剪指甲... 下面这个代码,不足70行代码,就可以实现一个简单的镜像站功能... 非常灵活,非常方便...,直接把代码保存为main.py , 然后运行python main.py runserver 8000 ,连数据库都不用装!,模板也不需要 ( 全部是抄的... )

题外话

为什么突然想起这个功能...,因为有一个强大的思路: 目前在搞的一套站群程序,最

......

点击阅读更多...