本项目为 OI-Archive 的题库爬虫。
项目分为一个主服务和若干组件,每个组件负责一个题库。主服务和组件间使用 grpc 连接。
首先安装 protoc 和 protoc-gen-go
然后执行
sudo apt install golang-go libgit2-dev
git clone https://github.com/oi-archive/crawler
cd crawler
make
- 启动主服务
./crawler
- 分别运行
plugin
目录中的所有组件
主服务提供的 API 见 rpc/api.proto
(相信大家都能看懂 protobuf 文件,即使看不懂也没关系,可以看下面的各语言示例)
把 plugin/example-go
复制一份,然后在标记了 TODO:
的位置编写你的代码。
环境准备:
pip3 install grpcio grpcio-tools apscheduler
把 plugin/example-python
复制一份,进入新的目录
python3 -m grpc_tools.protoc -I../../rpc/ --python_out=. --grpc_python_out=. ../../rpc/api.proto
然后在标记了 TODO:
的位置编写你的代码。
如果需要用其他语言开发爬虫,请联系 @WAAutoMaton 获取技术支持。