一个基于 arXiv 的论文解读与知识整理助手。支持 Model Context Protocol (MCP) 标准,将学术论文一键转为通俗中文解读和微信公众号文章,适合自用或自动化工具集成。
- 🔍 arXiv 论文智能搜索:关键词检索,快速定位你关心的论文
- 📥 一键下载 PDF:自动获取并保存原始论文
- 📝 中英文智能转换:将 PDF 英文内容解析为高质量的中文 Markdown,方便笔记、归档与复用
- 📱 微信文章生成:自动生成适配微信阅读体验的爆款文章草稿
- 🗑️ 一键清理文件:支持一键清空所有历史处理文件,避免空间积压
- 🤖 AI 内容理解与重写:依托 SiliconFlow 大模型服务,内容处理高效、自然
每个文件处理工具都会返回实际保存的文件名,方便你集成到任何自动化流程!
npx @langgpt/arxiv-mcp-server
npm install -g @langgpt/arxiv-mcp-server
arxiv-mcp-server
在使用前,请设置以下环境变量:
# 必需:SiliconFlow API Key
export SILICONFLOW_API_KEY="your_api_key_here"
# 必需:工作目录
export WORK_DIR="/path/to/your/data/directory"
请通过以下链接获取 SiliconFlow API Key: https://cloud.siliconflow.cn/i/TxUlXG3u
在 Claude Desktop 的配置文件中添加:
{
"mcpServers": {
"arxiv-mcp-server": {
"command": "npx",
"args": ["-y", "@langgpt/arxiv-mcp-server@latest"],
"env": {
"SILICONFLOW_API_KEY": "your_api_key_here",
"WORK_DIR": "/path/to/your/data/directory"
}
}
}
}
配置文件位置:
- macOS:
~/Library/Application Support/Claude/claude_desktop_config.json
- Windows:
%APPDATA%\Claude\claude_desktop_config.json
对于其他支持 MCP 的客户端,请参考其文档配置 stdio 传输方式。
每个工具处理后都会返回保存的文件名,便于后续追踪或下载。
-
工具名:
search_arxiv
-
参数:
query
:关键词maxResults
:返回论文数(可选,默认 5)
-
工具名:
download_arxiv_pdf
-
参数:
input
:arXiv 论文 URL 或 arXiv ID(如:2403.15137v1)
-
工具名:
parse_pdf_to_markdown
-
参数:
arxivId
:arXiv 论文 IDpaperInfo
:论文元信息(可选,含标题/作者/摘要等)
-
工具名:
convert_to_wechat_article
-
参数:
arxivId
:arXiv 论文 ID
-
工具名:
process_arxiv_paper
-
参数:
arxivId
:arXiv 论文 IDincludeWechat
:是否生成微信文章(可选,默认 true)
- 工具名:
clear_workdir
- 参数: 无
所有生成文件均保存至工作目录,文件名规则如下:
{arxivId}.pdf
- 原始 PDF{arxivId}_text.txt
- 英文原文解析文本{arxivId}_md_zh.md
- 中文 Markdown 解读{arxivId}_wechat.md
- 微信公众号文章- (你可以用工具返回值直接获取这些文件名)
执行 clear_workdir
会一键删除工作区全部文件,务必谨慎操作!
- 搜索论文
使用
search_arxiv
工具搜索相关论文 - 下载 PDF
用
download_arxiv_pdf
工具拉取 PDF - 智能解析转中文 Markdown
用
parse_pdf_to_markdown
工具生成带格式的中文文档 - 生成微信文章
用
convert_to_wechat_article
工具自动排版生成公众号文章 - 清理历史文件
用
clear_workdir
工具一键清空所有产出文件
# 克隆项目
git clone https://github.com/yzfly/arxiv-mcp-server.git
cd arxiv-mcp-server
# 安装依赖
npm install
# 设置环境变量
export SILICONFLOW_API_KEY="your_api_key"
# 开发模式运行
npm run dev
# 构建
npm run build
# 运行构建版本
npm start
arxiv-mcp-server/
├── src/
│ └── index.ts # 主服务器文件
├── build/ # 编译输出目录
├── package.json # 项目配置
├── tsconfig.json # TypeScript 配置
├── README.md # 项目说明
└── DATA_DIR/ # 默认工作目录
├── {arxivId}.pdf # 下载的PDF文件
├── {arxivId}.md # 中文解读
├── {arxivId}_wechat.md # 微信文章
└── {arxivId}_speech.txt # 语音脚本
您可以根据需要扩展以下功能:
- PDF解析器:集成更强大的PDF解析库(如 pdf-parse)
- 语音合成:集成真实的TTS服务API
- 更多格式:支持导出为其他格式(如HTML、Word等)
- 批量处理:支持批量处理多篇论文
- 缓存机制:添加智能缓存以提高性能
- Node.js >= 18.0.0
- TypeScript - 类型安全的JavaScript
- Model Context Protocol - 标准化的AI上下文协议
- SiliconFlow API - AI内容理解和生成
- arXiv API - 学术论文数据源
-
API Key 错误
错误:请设置 SILICONFLOW_API_KEY 环境变量 解决:确保正确设置了 SiliconFlow API Key
-
论文下载失败
错误:下载失败: Request failed with status code 404 解决:检查 arXiv ID 是否正确,确保网络连接正常
-
工作目录权限问题
错误:EACCES: permission denied 解决:确保工作目录有写入权限,或设置 WORK_DIR 到有权限的目录
启用详细日志:
DEBUG=arxiv-mcp-server npx @langgpt/arxiv-mcp-server
欢迎贡献代码!请遵循以下步骤:
- Fork 本项目
- 创建特性分支:
git checkout -b feature/amazing-feature
- 提交更改:
git commit -m 'Add amazing feature'
- 推送分支:
git push origin feature/amazing-feature
- 创建 Pull Request
- 使用 TypeScript 进行类型安全开发
- 遵循 ESLint 代码规范
- 添加适当的错误处理
- 编写清晰的注释和文档
本项目采用 MIT 许可证。详情请见 LICENSE 文件。
- 作者: yzfly
- 邮箱: [email protected]
- GitHub: https://github.com/yzfly
- 微信公众号: 云中江树
- ✨ 初始版本发布
- 🔍 支持 arXiv 论文搜索
- 📥 支持 PDF 下载
- 📝 支持智能中文解读
- 📱 支持微信文章格式转换
- 🤖 集成 SiliconFlow AI 服务
如果您觉得这个项目有用,请给它一个 ⭐!
如有问题或建议,请通过以下方式联系:
- 📧 邮箱:[email protected]
- 🐛 GitHub Issues:项目问题追踪
- 💬 GitHub Discussions:项目讨论区