1、获取新浪微博签到数据的源码
今天分享抓取新浪微博签到数据的源码,属性字段包含:
【微博ID】【用户昵称】【用户主页链接】【UID】【微博链接】【发布时间】【微博正文】
【图片链接】【转发数】【评论数】【点赞数】【手机类型】【IP属地】【关注数】【粉丝数】等等。
2、本demo源码适用人群:
我需要演示说明签到数据抓取的代码;
我有足够的时间用来采集数据;
我对数据量的要求不高(10w条以下);
我需要采集某个景点或公园的签到数据(非常适合);
我只想点击就能出结果,不想管太多参数代码。
3、代码使用方式
①运行环境:Python3.6+
②运行代码前,只需要手动更改第166行代码 单引号中的【签到点名称】即可(例如input_location_name = '东方明珠'】)

4、以‘上海外滩’为例,爬取结果。
我是5月13号晚上19:40左右爬取的,可以看到有些IP属地不在上海,也就是白天打卡外滩后就离开上海了,通过判断"IP≠签到点所在地",能够识别出该用户可能是游客。
4、注意点
作者本着实事求是的态度,来说一下本代码需要注意的问题。
①爬取的每条数据都含微博链接,可验证数据来源及真实性。
②可以采集全球任意签到点的数据。
③签到点无限制。
④单个签到点单次抓取的数据量有限。
⑤数据是实时的,无法采集历史数据
5、更多数据
如需获取的数据量极高,或者需要获取历史签到数据请关注公众号【李桥桉】,后台回复【wb】获取。
最后修改时间:2023-05-14 00:46:51
「喜欢这篇文章,您的关注和赞赏是给作者最好的鼓励」
关注作者
【版权声明】本文为墨天轮用户原创内容,转载时必须标注文章的来源(墨天轮),文章链接,文章作者等基本信息,否则作者和墨天轮有权追究责任。如果您发现墨天轮中有涉嫌抄袭或者侵权的内容,欢迎发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。




