小红书数据采集:
1、爬取小红书某用户主页全部作品;
2、爬取小红书某用户发布的所有笔记;
3、爬取小红书某博主收藏的所有笔记;
4、爬取小红书某博主点赞的所有笔记。
注意,只采集用户公开的内容,设置为【私密】的帖子爬不到哦。
假如想分析某个小红书大 v 的数据,即,主要分析它主页发布过的笔记、点赞过和收藏过的笔记,来一瞥流量之门;
首先就需要将这些数据全部抓取保存到本地。
或者,不习惯小红书的社区调性,单纯想把自己发布的内容备份下来,再也不想打开这个 app 了。
今天分享的小红书爬虫系列之小红书主页备份计划,解决诸如此类的需求。
以华为在小红书的官方账号「华为终端」为例,
我们导出它主页的发布和收藏过的帖子(这个账号没有点赞过别人的帖子,也没有设置不可见的内容)

一、发布过的所有笔记
首先是「华为终端」发布过的笔记,导出到 csv 一共 1300 余条。
每一条笔记都有笔记链接、笔记标题、笔记时间、笔记内容、ip 属地、话题 tag 列表、艾特用户列表、无水印封面图、无水印笔记内图、视频链接、转发数、点赞数、评论数、收藏数、作者链接、作者昵称等几十个字段,具体可以参见下图。

高清封面和内容原图片可以无损下载到本地。
文本内容可以用来交给 GPT 训练小红书文案生成器。
也可以按照转发数、点赞数、评论数、收藏数排序选中几篇爆款笔记分析~
ip 属地几乎都在北京,标题都是华为的新品简介,没啥好分析的。
评论也可以全部下载下来,进行文本分析。
二、收藏的全部笔记
收藏过的笔记导出结果如下,一共 100 来条,字段信息和上面发布的笔记一样。

本质也是笔记,也可以进行图片下载、视频下载、评论导出等等 action 和文本分析可视化。
三、点赞过的笔记
点赞过的笔记也能导出,「华为终端」没有点赞过笔记,也没有设置不可见的内容,咱就不展示了
如果你对这个有对服务和工具的需求,扫描并关注下方公众号二维码,回复【小红书主页采集】咨询采集业务。

欢迎添加技术员微信 「qiao_an_li 」或者直接扫码下方二维码,咨询「小红书主页采集 」业务。
伸手党勿扰~
「喜欢这篇文章,您的关注和赞赏是给作者最好的鼓励」
关注作者
【版权声明】本文为墨天轮用户原创内容,转载时必须标注文章的来源(墨天轮),文章链接,文章作者等基本信息,否则作者和墨天轮有权追究责任。如果您发现墨天轮中有涉嫌抄袭或者侵权的内容,欢迎发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。





