Skip to content

简单的whisper语音转文字(STT)快捷语音输入Windows系统悬浮窗。录音自动复制到剪切板。本地部署模型版,数据更安全

License

Notifications You must be signed in to change notification settings

starsidin/Whisper-bubble-transcriber

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

13 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

🎙️ Whisper 悬浮窗语音输入助手

Whisper Floating Speech Input Assistant

一个简单易用的 Whisper模型语音转文字(Speech-to-Text, STT)桌面悬浮窗程序,支持本地部署(Windows),数据更安全,适用于快捷语音输入场景。
A lightweight, local-first floating window tool for voice-to-text using OpenAI Whisper — optimized for quick voice input on Windows.

录音识别后文字自动复制到剪贴板,并以聊天气泡形式显示在界面上。 基于 OpenAI Whisper it records your voice, transcribes it locally, auto-copies the result, and shows it in a chat-bubble style window.


🚀 推荐模型 | Recommended Model

建议使用 turbolarge-v3 模型以获得更高准确率,特别适用于中英文混合语音输入。
It is highly recommended to use turbo or large-v3 for better accuracy, especially for mixed Chinese-English input.

  • turbo 最低配置要求:显存 VRAM ≥ 6GB
    Minimum for turbo: VRAM ≥ 6GB

  • ✅ 推荐配置:VRAM ≥ 8GB
    Recommended: VRAM ≥ 8GB

如果配置较低,可切换使用较小模型,或考虑接入国内免费大模型(开发中)。
Lower-end devices can use smaller models, or consider future integration of local Chinese large models (WIP).


🎯 功能特性 | Features 0.0.2

image

  • 🎤 一键悬浮录音:支持麦克风或者虚拟音频输入

  • 🧠 支持 Whisper 本地模型 (base, large-v3, turbo)

  • 🌐 中英文自动识别

  • 📋 自动复制识别文字到剪贴板,增加在右键菜单中取消自动复制的功能

  • 💬 右键菜单中历史记录自动保存查看

  • 🧩 右键切换模型

  • 🌈 无边框、圆角、可拖动、置顶悬浮窗

image


📦 安装依赖 | Install Requirements

确保你的系统安装了 Python ≥ 3.8
Make sure Python 3.8 or higher is installed.

安装依赖:

pip install -r requirements.txt

注意: 如果安装失败whisper的安装方法详见官方文档:https://github.com/openai/whisper whisper必须依赖ffmpeg,在官网下载压缩包后,解压缩并添加到系统PATH中才能正常使用, 安装后在命令行输入ffmpeg弹出版本信息就是安装完成了

✅ 使用方法

注意:如果系统没有音频输入设备(麦克风、虚拟音频输入)可能会无法打开

  1. 运行后,会出现一个小型悬浮窗
  2. 点击按钮 🎙️ 开始录音 开始说话
  3. 再次点击 🛑 停止录音 结束录音
  4. 识别结果会显示在界面,并自动复制到剪贴板
  5. 右键弹出菜单,可选择模型、选择麦克风、查看历史记录、选择是否自动复制或关闭程序 

💡 注意事项

• 默认使用 GPU(若可用),否则回退到 CPU • 模型将自动下载缓存到本地(首次运行可能稍慢) • 若需更高准确率,可切换为 large-v3 模型(需要较高显存) • 如果需要录制屏幕音,需要虚拟声卡,我用的是https://vb-audio.com/Cable/,在屏幕右下方喇叭选择相应名称扬声器即可捕获声音。 • 中文标点符号可能无法正确添加

✅ 即将添加的功能 | Coming Soon

🧠 支持其他模型

⌨️ 添加快捷键支持(如 F9 开始/停止)

📌 支持翻译到目标语言

☁️ 模型 API 模式(轻量版,无需本地模型)

流式识别、断句、一键翻译。

欢迎大家开发想要的功能,或对需要的功能进行留言

About

简单的whisper语音转文字(STT)快捷语音输入Windows系统悬浮窗。录音自动复制到剪切板。本地部署模型版,数据更安全

Topics

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages