知识星球周报总结是对未闻Code·知识星球上的每周内容进行汇总,完全干货!
一、知识科普
之前知识星球成员中有人询问了个关于pandas导出日期到Excel相关的问题,比如说设置的日期是今天(datetime.date.today()),导出之后是字符串格式,需要每天点一下分列才能变成正常的日期格式,如果是用pd.DatetimeIndex或者pd.to_datetime转换格式,又发现格式没错,但是后面还有一段00:00:00,这种情况如何解决呢?
方法1:excel替换功能,把所有00:00:00替换成空。
方法2:日期格式设置可以使用pd.ExcelWrite(),日期格式没显示全主要是Excel表默认的宽度不够,可以参考如下:
with pd.ExcelWriter(
"path_to_file.xlsx",
date_format="YYYY-MM-DD",
datetime_format="YYYY-MM-DD HH:MM:SS"
) as writer:
workbook = writer.book
df.to_excel(writer, sheet_name='Sheet1')
sheet = writer.sheets['Sheet1']
# 设置A-E宽度
sheet.set_column('A:E', width=50)
二、问题解答
请教个关于asyncio限制并发数的问题,在aiohttp中有一个方法TCPConnector,跟Semaphore的效果是不是一样的呢?
点击空白处查看答案
星主,有通用的捕获程序异常并提醒的工具或软件或方法推荐吗?简单而言,在Linux服务器上部署了不少程序,没有精力为每个程序都加入监测并提醒的功能,有没有一些通用的工具、软件、方法可以监测到程序运行出错并发送提醒。
点击空白处查看答案
最近知道了逻辑外键的概念,请问是不是就是说在程序中进行约束呢?查了一下似乎是要在ORM(fastapi+sqlalchemy)中指定`db_constraint=False`,但这样的话怎么能保证性能和约束呢?翻了文章似乎都没有详细说这块的
点击空白处查看答案
请教一下,在pytest里面使用了sqlalchemy操作数据库,但是有个痛点就是每次连接都要create_engine,session一次,有没有什么方法可以在某个地方一次创建后就都可以使用不用每次都创建。想过在前置后置条件中把这个事情干了,但是有些封装的逻辑不是在用例里面没有前置后置条件,是一个公共函数。这种情况怎么搞呢,谢谢。
点击空白处查看答案
有个问题想请教一下,目前在给公司写一个派单程序(类似爬虫的)。现在需要对日志进行转存,想法是利用kafka跟ELK。想请问一下是不是将原本保存在本地的日志传递给kafka后,再让kafka推送到Logstash集群处理就可以
点击空白处查看答案
接问题5,数据量应该不大,目前一天下来一个log文件大概5m左右。
点击空白处查看答案
我想问下,如果想实现一个转发socket的,需要用到哪些技术,比如跟代理隧道一样的,或者有什么现成的软件吗?
点击空白处查看答案
请教一下,怎么实现控制scrapy 每秒的并发数 例如:1秒钟5个并发
点击空白处查看答案
fastapi部署一般怎么操作?谢谢
点击空白处查看答案
这个网站点击上面查询需要JS加密的,只能pyppeteer点击查询后返回数据如果 用pyppeteer怎么能拿到这个接口响应返回的JSON呢,页面显示出来的数据没有我需要的,只有这个返回的JSON里有,并且这个接口是在其中一个frame页面里
点击空白处查看答案
END

未闻 Code·知识星球开放啦!
一对一答疑爬虫相关问题
职业生涯咨询
面试经验分享
每周直播分享
......
未闻 Code·知识星球期待与你相见~

一二线大厂在职员工
十多年码龄的编程老鸟
国内外高校在读学生
中小学刚刚入门的新人
在“未闻 Code技术交流群”等你来!
入群方式:添“mekingname”,备注“粉丝群”(谢绝广告党,非诚勿扰!)




