返回搜索GitHub

AI 编程 / MCP / 工作流自动化 / 视频 / 音频 AI

MediaCrawler

面向小红书、抖音、快手、B 站、微博、贴吧、知乎等平台的数据采集项目。

质量分68
53,342 Stars
unknown
hard

中文速读

MediaCrawler 是一个 Python 媒体平台爬虫项目,覆盖笔记、视频、帖子、问答及评论等内容采集场景。它适合需要研究公开内容采集、舆情分析或数据管道原型的开发者,但这类项目天然涉及平台规则、账号风控和合规边界。当前队列没有 README、安装、许可证和运行限制信息,使用前必须自行核验目标平台条款和采集范围。

快速试用

暂未发现稳定的 Demo 或视频入口。

适合

  • 做公开内容研究和数据采集原型的开发者
  • 需要评估中文社媒数据源的团队
  • 具备合规审查和反爬风险判断能力的人

不适合

  • 不熟悉平台服务条款和数据合规的人
  • 需要稳定商业生产采集服务的团队
  • 希望无需配置即可安全使用的用户

选型答案

MediaCrawler 适合什么场景?做公开内容研究和数据采集原型的开发者;需要评估中文社媒数据源的团队;具备合规审查和反爬风险判断能力的人
MediaCrawler 的试用和部署门槛如何?暂未发现稳定的 Demo、视频或文档入口,适合先从 GitHub README 和 issues 判断成熟度。 当前难度标记为“需要经验”,许可证记录为“unknown”。
选择 MediaCrawler 时要注意什么?不熟悉平台服务条款和数据合规的人;需要稳定商业生产采集服务的团队;希望无需配置即可安全使用的用户
数据来源和更新时间GitHub 仓库 NanmiCoder/MediaCrawler,最近记录的推送时间为

标签

爬虫社交媒体数据评论采集Python中文平台GitHub Trending