知识星球周报总结是对未闻 Code·知识星球上的每周内容进行汇总,完全干货!
一、常识科普
常识1.在非对称加密讲解中提及交换私钥,99.99%是个乱说的装逼货。
理由:在非对称加密里面,公钥可以随便乱传,随便给别人看,随便泄漏。但是私钥只能你自己知道。一旦某个操作需要你把私钥从你的一个电脑传到另外一台电脑,那一定是你某个地方搞错了。
常识2. 不是全职写程序却要格式化Windows,然后用Linux做日常办公的人,立刻停止你的浪费时间的行为。
理由:Windows几乎可以解决日常办公所有事情,而Linux擅长的领域是服务器领域。而服务器领域,你使用终端命令,ssh连远程服务器就足够了。对Linux图形界面再熟练也不等于对Linux熟练。你要熟悉Linux的命令,才是熟悉Linux。用电脑就是用软件,熟悉Linux本质上是熟练掌握Linux上面功能强大的软件。而Linux功能强大的软件基本都是命令行下的软件。安卓手机也是基于Linux的图形界面操作系统,难道你天天用安卓手机就等于天天用Linux了?
有些人说什么因为Linux是自由软件,用Linux做什么事情都是用户的自由。但我要说的是,电脑是工具,是用它来帮助你,而不是你去适应他。Linux图形界面很多功能就是比不上Windows,折腾Linux图形界面就是浪费时间。
如果你的主要工作是写程序,主要做软件开发,那么你用Linux没有问题。Linux下面软件开发的生态确实比Windows好不少。你格式化Windows以后安装Linux没有问题。但日常你只是一个学生,你并不是主要在Linux下面做开发,那么即使你要尝试Linux,也应该用Windows+Linux,你应该结合两个系统,而不是为了用Linux而格式化了Windows。
二、问题解答
把RFC变成代码实现考验的是哪方面的能力呢?感觉编程水平进入了瓶颈,看人家的代码都看得懂,还能发现不足,发现bug并知道怎么改,但是自己对着正真的RFC文档确有些头大,不知道如何下手,用asyncio实现bitorrent协议,只完成了一部分,但对于复杂部分还是有些力不从心。那么如何提高这方面的能力呢?
点击空白处查看答案
请问该如何选择爬取数据的存储方式?比如说根据数量的不同选择不同方式?还是说最好都用数据库,只不过选择不同的数据库?
点击空白处查看答案
使用selenium(chrome/firefox)请求网页,代理使用隧道代理,如何在不新开session的情况下,更改ip?
点击空白处查看答案
请教下对于爬虫系统中的数据监控(请求量、成功失败数量、入库数量、项目特有的监测内容等)有什么好的方案?我现在是使用了influxdb+grafana 然后在代码中埋点 但项目数量一起来 维护就很麻烦了 每个项目都有不同的监测内容。
点击空白处查看答案
请教一下,如何高效阅读框架源码(比如scrapy的源码)?有什么窍门或者方法建议吗?
点击空白处查看答案
我想在pipelines异步保存成功后的回调里使用awaitasyncio.sleep(30)异步等待,群友帮助下在success_callback方法上使用了@deferred_f_from_coro_f 发现在本地是有效果的,但是打包到scrapyd里面就会报异常,不知道什么原因。
点击空白处查看答案
如何在scrapy中间件中做请求异常处理呢,如状态码异常需要重新请求、请求网站后返回需要进行人机验证的判断?
点击空白处查看答案
对于爬取不规整的网页表单(每个详情页都有网络表格,要爬取表单中一些重要字段但是表格样式多样化),有没有什么好的建议,或者好用的库推荐一下。
点击空白处查看答案
知识1.在Python开发的过程中,一定要坚决禁止使用 from xxx import *
知识2. GIL作用在哪里。说Python有GIL,所以在Python里面使用多线程不需要加锁的人,其认识是浅薄和无知的。
知识3.使用隧道代理不需要手动更换ip,可以大幅度降低开发负担。但是隧道代理的费用较高。如何使用普通代理自己搭建隧道代理,大大降低成本。
知识4. 有时候,为了让开发者对程序有更多的掌控,我们需要人为降低程序的运行速度。爬虫速度极快,但出了问题你都不知道是谁的锅。为了清楚地划分责任范围,不得不让数据经过很多次中转。
四、星球专属
专属1.Python 使用 import 导入其他模块的时候,其内部的缓存机制,以及这个机制可能会导致的弊端以及应用。
专属2.使用 PyCharm,会看到出问题的代码被标记了红色波浪线。但不一定是你代码写错了,可能有其他原因。
专属3.Python 代码在 PyCharm 里面可以正常运行,但是在终端里面却运行不了,出现这个问题的原因。
专属4.不要在Python里面大量使用try…except/exception…
“星球专属”模块的详解,扫码加入未闻Code.知识星球即可查看。
END

未闻 Code·知识星球开放啦!
一对一答疑爬虫相关问题
职业生涯咨询
面试经验分享
每周直播分享
......
未闻 Code·知识星球期待与你相见~

一二线大厂在职员工
十多年码龄的编程老鸟
国内外高校在读学生
中小学刚刚入门的新人
在“未闻 Code技术交流群”等你来!
入群方式:添“mekingname”,备注“粉丝群”(谢绝广告党,非诚勿扰!)




