暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

微博签到数据代码

原创 公众号@李桥桉 2023-05-13
947

1、获取新浪微博签到数据的源码

今天分享抓取新浪微博签到数据的源码,属性字段包含:

【微博ID】【用户昵称】【用户主页链接】【UID】【微博链接】【发布时间】【微博正文】

【图片链接】【转发数】【评论数】【点赞数】【手机类型】【IP属地】【关注数】【粉丝数】等等。

 

2、本demo源码适用人群:

我需要演示说明签到数据抓取的代码

我有足够的时间用来采集数据;

我对数据量的要求不高(10w条以下);

我需要采集某个景点或公园的签到数据(非常适合);

我只想点击就能出结果,不想管太多参数代码。


3、代码使用方式

①运行环境:Python3.6+

②运行代码前,只需要手动更改第166行代码 单引号中的【签到点名称】即可(例如input_location_name = '东方明珠'】)

4、以‘上海外滩’为例,爬取结果。

我是5月13号晚上19:40左右爬取的,可以看到有些IP属地不在上海,也就是白天打卡外滩后就离开上海了,通过判断"IP≠签到点所在地",能够识别出该用户可能是游客。


4、注意点

作者本着实事求是的态度,来说一下本代码需要注意的问题。

①爬取的每条数据都含微博链接,可验证数据来源及真实性。

②可以采集全球任意签到点的数据。

③签到点无限制。

④单个签到点单次抓取的数据量有限。

⑤数据是实时的,无法采集历史数据

5、更多数据

如需获取的数据量极高,或者需要获取历史签到数据请关注公众号【李桥桉】,后台回复【wb】获取。

最后修改时间:2023-05-14 00:46:51
「喜欢这篇文章,您的关注和赞赏是给作者最好的鼓励」
关注作者
【版权声明】本文为墨天轮用户原创内容,转载时必须标注文章的来源(墨天轮),文章链接,文章作者等基本信息,否则作者和墨天轮有权追究责任。如果您发现墨天轮中有涉嫌抄袭或者侵权的内容,欢迎发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论