Bilibili AI 直播主播 Demo

基于 B 站直播接口、大语言模型 (LLM) 和语音合成 (TTS) 的 AI 主播演示项目，支持本地化部署与自定义角色设定。

📌 项目简介

本项目旨在构建一个功能强大的 B 站 AI 主播演示系统。通过无缝集成大语言模型（LLM）和语音合成（TTS）技术，它能够实现实时的弹幕交互、灵活的角色扮演以及逼真的语音播报。该系统支持主流 LLM API（如 OpenAI、DeepSeek）和本地化部署方案（如 GPT-SoVITS 模型），并且无需依赖第三方框架（如酒馆系统），大大简化了部署流程。

✨ 核心功能

实时弹幕互动：自动抓取 B 站直播间弹幕，智能解析用户输入，实现即时、流畅的互动体验。
多 LLM 模型支持：灵活兼容 OpenAI、DeepSeek 等主流 LLM API，同时支持集成自定义的本地大语言模型，满足不同需求。
模块化 TTS 架构：无缝集成 GPT-SoVITS 本地语音合成模型，或选择调用在线 TTS 服务，提供多样化的语音输出选项。
高度可定制角色：通过简洁的 Prompt 配置，轻松实现个性化的主播角色设定（例如：元气虚拟偶像、专业知识问答助手等）。
轻量级无依赖部署：直接对接 B 站直播接口，无需额外安装酒馆系统等第三方框架，部署更便捷。
📸 智能截图辅助：动态判断直播画面内容，在需要时自动截取当前屏幕，为 AI 决策提供视觉辅助（截图文件存储于 ./img 目录）。

🧠 技术架构概览

B 站直播接口 ←(弹幕输入)→ AI 主播系统 →(语音输出)→ VTS/VirtualYou  
                    ↑(LLM 调用1) 小模型验证   ↑(TTS 调用)  
                    └─ OpenAI/DeepSeek      └─ GPT-SoVITS/在线 TTS  
                    ↑（LLM 调用2） 大模型输出
                    └─ OpenAI/DeepSeek

🛠️ 安装与配置指南

1. 依赖项安装

首先，请安装项目所需的 Python 依赖：

pip install -r requirements.txt
# 如果计划使用 GPT-SoVITS 本地模型，请根据其官方文档额外安装相应的依赖。

2. 配置文件说明

请根据您的环境修改 config.json 文件：

{
  "statue": 1,
  "msg_filte": ["互关", "关注", "回关"], // 用于过滤直播弹幕中的敏感或无意义关键词
  "api-key-tts": "sk-",  // TTS 服务 API 密钥（例如 SiliconFlow）如果使用本地推理（如gptsovits等）可以不填
  "api-url-tts": "https://api.siliconflow.cn/v1/audio/speech",  // TTS 服务请求地址，其他同上
  "api-key-llm-1": "",  // 主 LLM API 密钥（主要用于生成主播回复）
  "api-key-llm-2": "sk-",  // 次 LLM API 密钥（用于过滤无意义消息和辅助判断是否需要截屏）
  "api-url-1": "",   // 主 LLM 服务请求地址
  "api-url-2": "https://api.siliconflow.cn/v1/chat/completions",   // 次 LLM 服务请求地址
  "live_url": "https://api.live.bilibili.com/xlive/web-room/v1/dM/gethistory?roomid=YOURID&room_type=0",  // 将 YOURID 替换为你的 B 站直播间 ID
  "ws_host": "ws://localhost:8088",  // VTuber Studio (VTS) WebSocket 地址
  "vts_authenticationToken": "",  // VTS 认证令牌（可选，留空则首次启动时自动获取）
  "streamer_name":"your name",  // 你的 B 站直播间昵称，有助于 LLM 区分主播和观众
  "danmu_context":4,       //直播间上下文弹幕条数
  "use_text_align":false, // 强制文本-语音对齐功能，开启后可实现字幕与语音同步显示（需额外安装 torch 和 whisperx）
  "use_screen_shot":true, //是否启用小模型来辅助判断启用截图功能
  "use_stream":true //是否开启流式输出并生成语音，可能有助于减少AI主播的反应时间
}

注意：启用 use_text_align 功能需要额外安装 PyTorch 相关库和 whisperx，这相对复杂。因此，该选项默认是关闭的。

▶️ 如何运行

1. 启动服务

在项目根目录下运行主程序：

python main.py

2. 关键配置步骤

修改直播间地址：在 main.py 文件中，将 live_url 变量替换为你的 B 站直播间真实地址：
```
live_url = "https://live.bilibili.com/your_room_id"  # 请替换为你的直播间地址
```
配置 TTS 模式：
- 使用在线 API：确保 config.json 中已正确填写有效的 TTS API 地址和密钥。
- 使用本地模型：如果你希望使用本地部署的 TTS 模型，请部署 GPT-SoVITS 并相应地修改 main.py 中的 TTS 调用逻辑。
自定义主播角色（可选）：在 main.py 文件的 Prompt 变量中，可以自定义你的 AI 主播角色设定。例如：
```
你是一个活泼的虚拟偶像，用元气满满的日语和观众互动！
```
文件输出：
- 生成的语音文件将统一保存在 ./voices 文件夹中。
- 实时处理的文本输出会保存在 ./text/realtime_chars.txt 文件中。

📺 效果展示

演示视频：点击观看 B 站直播演示
界面截图：

🧪 版本更新日志

Version 0.1 (2025-07-11)

重构 API 调用方式，不再依赖酒馆系统，实现更轻量级的部署。
新增本地 TTS 支持（集成 GPT-SoVITS 模型）。
实现 TTS 响应的持久化存储功能。
优化弹幕过滤逻辑，提高互动质量。

Version 0.1.1 (2025-07-12)

增加智能截屏功能，并与小模型联合判断回复是否需要截屏操作，增强 AI 决策能力。

Version 0.1.2 (2025-07-13)

新增强制文本-语音对齐功能，提升直播字幕与语音的同步体验（输出文件位于 ./text 目录）。
更新了主播人格 Prompt，使 AI 主播的性格更贴合直播场景，并生成更具相关性的弹幕回复。
优化vtuber studio api调用逻辑，使其更加活灵活现。

Version 0.1.15 (2025-07-15)

增加流式输出

Version 0.1.18(2025-7-29)

增加HTML网页字体，能够自动读取生成的文本并应用相应字体。使用方法请参考OBS等软件的添加浏览器网页。启动服务路径在.\customer_font\fast_backend.py
对弹幕获取方式进行了更新，现在能接受最多4条弹幕的上下文以提供更多信息给LLM，具体上下文条数可以参考config.json中的danmu_context。如果其值为1，则为旧版获取弹幕方式。
增加logger样式命令行输出。
优化了对LLM的提示词

Version 0.1.19(2025-9-2)

更改LLM提示词，使其更加偏向neuro风格，具体参考 ./config.py

📜 许可证

本项目采用 MIT License。你可以自由地进行商业使用和修改，但请务必保留原作者信息。

如果觉得这个项目对你有帮助，可以点点 star！⭐⭐

Name		Name	Last commit message	Last commit date
Latest commit History 18 Commits
__pycache__		__pycache__
customer_font		customer_font
gpt_sovits_ref		gpt_sovits_ref
img		img
quick_start		quick_start
text		text
README.md		README.md
Vtuber_api.py		Vtuber_api.py
audio_handle.py		audio_handle.py
config.json		config.json
config.py		config.py
danmu.py		danmu.py
image-1.png		image-1.png
main.py		main.py
requirements.txt		requirements.txt
test.py		test.py
text_align.py		text_align.py
tts.py		tts.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

Bilibili AI 直播主播 Demo

📌 项目简介

✨ 核心功能

🧠 技术架构概览

🛠️ 安装与配置指南

1. 依赖项安装

2. 配置文件说明

▶️ 如何运行

1. 启动服务

2. 关键配置步骤

📺 效果展示

🧪 版本更新日志

Version 0.1 (2025-07-11)

Version 0.1.1 (2025-07-12)

Version 0.1.2 (2025-07-13)

Version 0.1.15 (2025-07-15)

Version 0.1.18(2025-7-29)

Version 0.1.19(2025-9-2)

📜 许可证

About

Uh oh!

Releases

Packages

Uh oh!

Languages

Light-yzc/BiliBili_AI_Vtuber_Streamer

Folders and files

Latest commit

History

Repository files navigation

Bilibili AI 直播主播 Demo

📌 项目简介

✨ 核心功能

🧠 技术架构概览

🛠️ 安装与配置指南

1. 依赖项安装

2. 配置文件说明

▶️ 如何运行

1. 启动服务

2. 关键配置步骤

📺 效果展示

🧪 版本更新日志

Version 0.1 (2025-07-11)

Version 0.1.1 (2025-07-12)

Version 0.1.2 (2025-07-13)

Version 0.1.15 (2025-07-15)

Version 0.1.18(2025-7-29)

Version 0.1.19(2025-9-2)

📜 许可证

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Languages

Packages