Skip to content

核心功能与产品特性详解

VoiceX 的设计哲学旨在消弭人机交互的物理边界,将大模型与语音识别的强悍算力以最轻盈、隐匿的方式嵌入到日常桌面生产力中。


1. 随打随开:极速语音键入模式

这是针对日常高频短句录入打造的核心模式。VoiceX 基于 HotkeyV2 内核,实现物理级按键侦测,无需切出当前应用。

🎹 极致的物理响应

  • 物理级 Hook:在全域任何输入框,只需长按 Option 键 (macOS)Right Control 键 (Windows),程序立即启动拾音。
  • CoreGraphics / WinAPI 驱动:macOS 采用 CoreGraphics FFI 轮询,Windows 采用原生 WinAPI 捕获,确保毫秒级唤醒,避开系统级按键拦截。
  • 自动上屏 (Auto Paste):转写完成后,智能模拟系统底层击键事件,文字直接落入光标位置,彻底消除“复制-粘贴”的繁琐流程。

IMPORTANT

500ms 动态防抖:底层驱动内置 500ms 释放防抖保护(RELEASE_DEBOUNCE_MS),完美适配 macOS 的 HID 状态刷新机制,防止由于系统抖动导致的误断录。


2. 独立全能:本地化会议记录面板

专为长篇访谈、深度会议或灵感归档场景打造。

🎙️ 沉浸式伴写体验

  • 一键唤起:按下 Option + Space 随时隐藏或弹出置顶的会议控制台。
  • Meeting Manager 段落化存储:音频流按 30 秒分段(Segment)保存至本地 ~/Library/Application Support/.../meetings/
  • 本地索引持久化:所有会议元数据均通过本地 index.json 管理,不依赖云端存储,确保隐私绝对安全。

3. 伴生思考:智能助手模式 (Shift+Space)

不仅是文字转换工具,更是您的桌面 AI 伴侣。

  • 快速对话:按下 Shift + Space 唤起 AI 助手侧边栏。
  • 多模型自由调度:深度集成智谱 (Zhipu)、火山方舟 (Ark)、Minimax 等大语言模型引擎,支持对录得文本进行深度润色、摘要提取或逻辑重构。

4. 工业级基石:SmartRouter 智能路由链

VoiceX 独创的 SmartRouter 机制,彻底解决了单一 ASR 供应商不稳定的痛点:

mermaid
graph TD
    A[音频流就绪] --> B{SmartRouter 调度}
    B -->|动态评分最高者| C[Tencent / Doubao / Aliyun]
    C -->|5s 超时或业务错误| D[自动降级至备选通道]
    D --> E[10s 总链路预算内最终转写]
    E --> F[结果自动上屏]
  • EMA (指数移动平均) 动态评分:后台实时计算各供应商的延迟与成功率,动态调整调用权重。
  • 5s 超时熔断:单供应商响应超过 5 秒立即执行无感降级,确保整体转写体验丝般顺滑。

遵循 MIT 开源协议发布 | Crafted with Premium UI Aesthetics