高估短期,低估长期价值,以及一些反思


高估短期能力

个人很容易犯的一个错误,就是及其的高估自己的短期能创造的东西,经常会表现在:

  1. 这玩意比较简单,应该能很快出来
  2. 这个应该1小时能搞定
  3. ......

最近掉进这种循环坑里面,确实一个东西要做出来,很容易,但是要让他能稳定,长期不出BUG的运行下去,并且有好的体验~,这个确实难度很大~

比如link114,如果稍微懂点爬虫的人,可能都觉得这玩意不就是一个爬数据然后返回的东西吗?但是实际上,真要做的时候,发现没那么简单...可能就1个简单的查询服务,都可能会经常出问题...

这就是,容

......

点击阅读更多...

v20210718 - 如何让词库活起来?


什么是"活"?

活,就是有新陈代谢 , 就像人,动物,植物,就是活的,会吸收新的,排除旧的,而很多固体是死的...因为没有新的进入,没有旧的排除..

就像热力学里面的熵增,系统只要是封闭的 ( 无新陈代谢 ) , 那么这个系统自然就会走向灭亡.. 只是个时间问题...

什么是"活"词库?

大部分的SEO,在建立词库的时候,直接一次性建立,一年都没去改...这样的词库,我认为就是一个的词库!

  1. 首先,如果你直接进入一个行业就能瞄准,按照市面上的通用方法去挖掘 ( 比如爱站, 5118, 竞价 )

......

点击阅读更多...

v20210717-简洁,极简思维的感想


关于简洁思维的感想

我非常喜欢爱因斯坦说过的一句话:

在学习上应该把复杂的东西变得更简单,而不是较为简单

后来看到了哲学里面有一个奥卡姆剃须刀的原则,讲的就是

如无必要,勿增实体

这2个原则讲的都是简洁思维,这种思维异常强大,强大的到什么程度?就是能摧毁一切所谓的玄学的东西...

比如说 , 某到 , 就是喜欢搞什么年终知识大会,然后天天讲一些互联网黑话,比如什么躬身入局 , 你亲力亲为不直接说,非要造出一个词,来迷惑...这就是典型的把简单的事情搞复杂!

同样,利用这个思维,就可以识别出哪

......

点击阅读更多...

关于休息的本质,以及我是如何休息的,另类的思考


市面上关于休息,精力管理,类似的书籍,课程,一堆堆,很多都有报名而且去学习...学了越多越想吐槽现在的培训机构,这些机构,往往会把一个很简单的问题,变得异常的复杂!

然后再把这个复杂的概念传输给你,让你越学越玄乎...整到最后直接开始怀疑人生... 在这里,我直接以我的理解,来探讨一下休息的本质,以最简洁的方式来阐述..

精力管理的本质是什么? 以及如何休息

我的理解,精力管理 -> 让大脑休息 -> 切换大脑活动区域 或 放空大脑! 就是这么简单....也就是说,你只要能适当的放

......

点击阅读更多...

在会一门编程语言的情况下,如何学习一门的新的语言


这里记录的仅是我个人的思考,不一定对,但是起码目前在我身上的反应比较好...,正好可以呼应之前写的关于编程学习心法的文章,再做一下补充..

其实大致的方法分下面几部

一 找到一个已经实现过的场景,然后想办法复现它

比如你用Pyhton的selenium,或是Django,Flask什么的实现过一个东西,并且一直在用,那么首先就是要找到这样一个场景,然后就是想办法把它复现出来,主要原因有:

  1. 因为这个场景你一直在用,所以逻辑需求你非常清晰,这样的一个好处,是方便你规划迭代,你清楚什么样的功能是简单
......

点击阅读更多...

Python中Mongodb的复杂查询方式


在之前的文章中,提到关于百度的搜索源码可以做哪些事情: http://www.zhangte.org/python/125.html

这里实践一下这个完整的过程

首先,爬虫部分不说,各种实现方式都可以,核心就在于,要把百度的搜索结果完整的保存下来! 我这里暂时以百度Json版的结果为例,比如这样: -w955 这里圈起来的核心数据:

  1. 一个是搜索量
  2. 一个是排名结果(一条一行,共50条)

其实这样保存,爬虫也方便,查询也方便,何乐不为,而且想干嘛就干嘛,自由灵活度又高...,而且不需要频繁请求百度,对ip

......

点击阅读更多...

docker swarm 结合阿里云自动构建镜像 ( 乞丐版 )


一. 构建镜像发布到阿里云

这个版本之所以叫乞丐版,是因为不需要掌握复杂的jenkins,k8s等,但是又想体验一下全自动部署,分布式的快感...

所以就选择了这种方案...网上搜集来看,对于1000台服务器以下,docker swarm似乎完全够用...我很难想象,那些大厂是怎么维护服务器的.. 听说谷歌的服务器就是以千万来算的......这感觉完全不是一个世界的...

1. 编写简单的dockerfile

FROM centos:7
COPY . /PROJECT_ROOT
WORKDIR 
......

点击阅读更多...

通过百度搜索源代码可以做哪些功能?


最近在思考一些东西,越发觉得解耦的重要性,而解耦的最佳方式,目前看,就是把各个功能做API,通过API来调用,这里突然延伸到一个问题 : 如果只是查排名?那么如何规划好API?

传统的查排名方式

一般的接口都是直接输入关键词,然后返回排名,这种对于关键词数量少来说没问题,比如chinaz开放的api就可以干这个事情...但是5118相对自由一点,会把搜索整个搜索结果的url都返回给你,这样你就可以做更多事情(后面会讲).

回到上面的问题,如果直接输入关键词返回排名,这样做成一个接口,那么我假如需

......

点击阅读更多...

应用型编程的最佳学习心法


这里说的是应用型编程,和科班的不太一样..就像我前天说的,我会写很多小工具,包含Web站(比如这个博客),但是在之前的博客中,我提到过,我连二进制都不会算

但是只要了解我的人都知道,如果把我招进去,肯定会比一些刚毕业的,但是二进制十六进制转换算得很6的人,会好用很多...这核心在于:我会应用!换句话说,我更了解业务


学习的2个派别

第一派就是基础理论派,他们认为,学任何东西,基础要非常牢,所谓基础不牢地动山摇...

第二派就是实战派,他们认为,编程还是学习,甚至是英语,都只是工具...最佳的学

......

点击阅读更多...

Pyhton和Go结合的分布式任务


Go的效率毫无疑问,直接秒杀Python百倍...最近在摸索的时候,感觉越发强大... 同时go会比python有几个好处

  1. 写代码会更加规范,因为都要定义好才能写,这样后期维护起来难度会比较低(难怪大家说,动态一时爽,重构火葬场....)
  2. 静态,如果代码写错了,是运行不起来的..,所以在写的时候,会避免很多使用中的坑...
  3. go可以直接编译成二进制,也就是说,用Go当Worker的话,甚至连Worker的环境都不用部署...,这样简直完美...
  4. 效率,这个效率是高得不止一点点...传说Go的效
......

点击阅读更多...