尝试在本机运行了,好棒的工作,一些改进的建议: 1、增加一些爬虫,分析论文的分区或者影响因子,优先选择高水平论文来分析; 2、增加新论文的循环次数,例如当最新年份(如2024年)的论文累积到一定数量时才停止循环; 3、is_azure : False 似乎不起作用,可能改成数字的判断会更好? 4、pdf下载容易报错(特别是IEEE),但是实际上浏览器能够打开,或许考虑在这部分加入代理,或者使用selenium来下载?