核心功能与产品特性详解
VoiceX 的设计哲学旨在消弭人机交互的物理边界,将大模型与语音识别的强悍算力以最轻盈、隐匿的方式嵌入到日常桌面生产力中。
1. 随打随开:极速语音键入模式
这是针对日常高频短句录入打造的核心模式。VoiceX 基于 HotkeyV2 内核,实现物理级按键侦测,无需切出当前应用。
🎹 极致的物理响应
- 物理级 Hook:在全域任何输入框,只需长按 Option 键 (macOS) 或 Right Control 键 (Windows),程序立即启动拾音。
- CoreGraphics / WinAPI 驱动:macOS 采用 CoreGraphics FFI 轮询,Windows 采用原生 WinAPI 捕获,确保毫秒级唤醒,避开系统级按键拦截。
- 自动上屏 (Auto Paste):转写完成后,智能模拟系统底层击键事件,文字直接落入光标位置,彻底消除“复制-粘贴”的繁琐流程。
IMPORTANT
500ms 动态防抖:底层驱动内置 500ms 释放防抖保护(RELEASE_DEBOUNCE_MS),完美适配 macOS 的 HID 状态刷新机制,防止由于系统抖动导致的误断录。
2. 独立全能:本地化会议记录面板
专为长篇访谈、深度会议或灵感归档场景打造。
🎙️ 沉浸式伴写体验
- 一键唤起:按下
Option + Space随时隐藏或弹出置顶的会议控制台。 - Meeting Manager 段落化存储:音频流按 30 秒分段(Segment)保存至本地
~/Library/Application Support/.../meetings/。 - 本地索引持久化:所有会议元数据均通过本地
index.json管理,不依赖云端存储,确保隐私绝对安全。
3. 伴生思考:智能助手模式 (Shift+Space)
不仅是文字转换工具,更是您的桌面 AI 伴侣。
- 快速对话:按下
Shift + Space唤起 AI 助手侧边栏。 - 多模型自由调度:深度集成智谱 (Zhipu)、火山方舟 (Ark)、Minimax 等大语言模型引擎,支持对录得文本进行深度润色、摘要提取或逻辑重构。
4. 工业级基石:SmartRouter 智能路由链
VoiceX 独创的 SmartRouter 机制,彻底解决了单一 ASR 供应商不稳定的痛点:
mermaid
graph TD
A[音频流就绪] --> B{SmartRouter 调度}
B -->|动态评分最高者| C[Tencent / Doubao / Aliyun]
C -->|5s 超时或业务错误| D[自动降级至备选通道]
D --> E[10s 总链路预算内最终转写]
E --> F[结果自动上屏]- EMA (指数移动平均) 动态评分:后台实时计算各供应商的延迟与成功率,动态调整调用权重。
- 5s 超时熔断:单供应商响应超过 5 秒立即执行无感降级,确保整体转写体验丝般顺滑。
