一些小小的建议

尝试在本机运行了，好棒的工作，一些改进的建议：

1、增加一些爬虫，分析论文的分区或者影响因子，优先选择高水平论文来分析；

2、增加新论文的循环次数，例如当最新年份（如2024年）的论文累积到一定数量时才停止循环；

3、is_azure : False 似乎不起作用，可能改成数字的判断会更好？

4、pdf下载容易报错（特别是IEEE），但是实际上浏览器能够打开，或许考虑在这部分加入代理，或者使用selenium来下载？