作者文章归档:tuya

Python中Mongodb的复杂查询方式


在之前的文章中,提到关于百度的搜索源码可以做哪些事情: http://www.zhangte.org/python/125.html,这里实践一下这个完整的过程

首先,爬虫部分不说,各种实现方式都可以,核心就在于,要把百度的搜索结果完整的保存下来! 我这里暂时以百度Json版的结果为例,比如这样: -w955 这里圈起来的核心数据:

  1. 一个是搜索量
  2. 一个是排名结果(一条一行,共50条)

其实这样保存,爬虫也方便,查询也方便,何乐不为,而且想干嘛就干嘛,自由灵活度又高...,而且不需要频繁请求百度,对ip

......

点击阅读更多...

docker swarm 结合阿里云自动构建镜像 ( 乞丐版 )


一. 构建镜像发布到阿里云

这个版本之所以叫乞丐版,是因为不需要掌握复杂的jenkins,k8s等,但是又想体验一下全自动部署,分布式的快感...

所以就选择了这种方案...网上搜集来看,对于1000台服务器以下,docker swarm似乎完全够用...我很难想象,那些大厂是怎么维护服务器的.. 听说谷歌的服务器就是以千万来算的......这感觉完全不是一个世界的...

1. 编写简单的dockerfile

FROM centos:7
COPY . /PROJECT_ROOT
WORKDIR 
......

点击阅读更多...

通过百度搜索源代码可以做哪些功能?


最近在思考一些东西,越发觉得解耦的重要性,而解耦的最佳方式,目前看,就是把各个功能做API,通过API来调用,这里突然延伸到一个问题 : 如果只是查排名?那么如何规划好API?

传统的查排名方式

一般的接口都是直接输入关键词,然后返回排名,这种对于关键词数量少来说没问题,比如chinaz开放的api就可以干这个事情...但是5118相对自由一点,会把搜索整个搜索结果的url都返回给你,这样你就可以做更多事情(后面会讲).

回到上面的问题,如果直接输入关键词返回排名,这样做成一个接口,那么我假如需

......

点击阅读更多...

应用型编程的最佳学习心法


这里说的是应用型编程,和科班的不太一样..就像我前天说的,我会写很多小工具,包含Web站(比如这个博客),但是在之前的博客中,我提到过,我连二进制都不会算

但是只要了解我的人都知道,如果把我招进去,肯定会比一些刚毕业的,但是二进制十六进制转换算得很6的人,会好用很多...这核心在于:我会应用!换句话说,我更了解业务


学习的2个派别

第一派就是基础理论派,他们认为,学任何东西,基础要非常牢,所谓基础不牢地动山摇...

第二派就是实战派,他们认为,编程还是学习,甚至是英语,都只是工具...最佳的学

......

点击阅读更多...

Pyhton和Go结合的分布式任务


Go的效率毫无疑问,直接秒杀Python百倍...最近在摸索的时候,感觉越发强大... 同时go会比python有几个好处

  1. 写代码会更加规范,因为都要定义好才能写,这样后期维护起来难度会比较低(难怪大家说,动态一时爽,重构火葬场....)
  2. 静态,如果代码写错了,是运行不起来的..,所以在写的时候,会避免很多使用中的坑...
  3. go可以直接编译成二进制,也就是说,用Go当Worker的话,甚至连Worker的环境都不用部署...,这样简直完美...
  4. 效率,这个效率是高得不止一点点...传说Go的效
......

点击阅读更多...

v20210505-学习的方法更新


最后还是回归到anki上,这里推荐几个插件: -w544 在官网上可以找到...

不管是用obsidan还是thebrain,以及印象笔记,搜索体检(速度和精准度)都没有Anki好....

因为anki经常会主动回顾,所以你很容易知道怎么搜索,其实搜索最大的问题并不是软件,而是有的知识你明明知道了,但是就是找不出来,有的坑你明明踩过了,却还是想不起以前是怎么解决的...

在这里,只有anki可以做到...每日晚上回去睡前只需要回顾10分钟,上午起来回顾10分钟..这样在学习新东西的时候,就可以起到意想不到

......

点击阅读更多...

v20210504-感觉还是要重启复盘日志


最近的工作状态和效率极低,可以说几乎完全不在状态的那种,记得去年10月份的时候,因为一时兴起写起了博客,每日持续更新一直到今年4月份...然后开始中断了..

去年10月份的时候,正好别人在放假,然后我每天给自己规划学习任务,在4天的时间里面掌握了很多新的知识,其中最有用的就是Mongodb的集群部署..一直用到现在,

然后在12月份的时候,开始写了站群程序,一直持续迭代了一个月...当时让我感触最深的就是:一个不起眼的东西,只要每天保持一定量的迭代,在持续一小段时间后,变化是惊人的!


有这个感

......

点击阅读更多...

v20210427-有需求一定要写下来,模拟跑一遍,再去做


现在感觉,如果有一个需求,前期的需求讨论和产品讨论一定要多花时间,这些时间在有的时候看似在浪费时间..但是比起需求理解错误而产生的返工...在前期的研究时间上根本微乎其微...

比如,你有一个想法,想开始写代码了,或是想找人帮你写,那么不妨把这个想法先写下来,比较好的方法是自己先组织一下思维导图,因为思维导图在整理这些逻辑顺序的时候,天然很有优势,这里如果是Mac推荐ithoughts,windows或是考虑到后期共享,推荐Xmind

其实在写,在组织的时候,就是在那种过一遍想法,等于模拟做实验

......

点击阅读更多...

v20210424-真正的学习是什么?有点迷...


今天在群里探讨了一个计算机行业是基础到不能基础的知识...就是什么二进制,16进制...十进制...

然后戳中痛点...我二进制怎么算都不知道,还有啥是十进制,16进制完全不知道...我有点蛋疼...

写代码写那么久...也写了很多程序...所以有的时候,我也在一度怀疑?真正的学习是什么?

是像我这样,缺什么学什么,直接去用,直接做...在这过程中修修补补...还是,把基础打牢,步步为营? 有的时候也比较迷...

我在带徒弟的时候,我提倡第一种方式,因为我就是这样一路走过来的...可能你们还在看

......

点击阅读更多...