该项目主要用于对微博进行数据采集,包括微博详细页内容、微博评论内容、微博转发量、微博点赞量,微博评论量等信息,方便做学术研究时采集数据。
- 简单: 快速上手,只需几行代码即可完成数据采集。
- 高效: 采用异步请求和异步存储的方式,大大提高数据采集效率。
- 可视化: 利用 streamlit 编写了一个可视化界面,方便用户进行数据采集和数据查询。
- 数据库: 将 tinydb 改为 SQL 数据库,可以连接自定义数据库。
- Cookies: 不需要手动输入 cookies,扫码自动获取 cookies。
在指定目录下使用 git 命令克隆本项目 或 下载本项目的 zip 包然后解压。
git clone https://github.com/zhouyi207/WeiBoCrawler.git
在项目根目录下使用 pip 命令安装依赖,注意这里的 Python 版本是 3.10 版本。
pip install -r requirements.txt
在项目根目录下使用 streamlit 命令运行程序。
streamlit run web/main.py
本项目仅用于学术研究,请勿用于商业用途。