聲憶是什麼
聲憶是專爲 macOS 打造的語音輸入法,主打”說得比打字快”。按住右 Option 說話,鬆開後僅需 1.4 秒即可將語音轉爲文字並自動插入光標處,支持中英混輸與本地 ASR 離線識別。內置可搜索、可導出的記憶層,讓每句話自動歸檔;提供 AI 智能整理與中文排版引擎,在本地毫秒級修正標點、空格和品牌名大小寫。所有數據留存本機,隱私優先,基礎功能永久免費,Pro 版解鎖雲端無限識別。

聲憶的主要功能
-
快捷語音輸入(L1 / SPEAK):按住右 Option(或 Fn / 右 ⌘)說話,鬆開後 1.4 秒成文並自動插入當前光標位置。支持中英混輸、同音字和口頭禪後台處理,無需切換窗口。
-
AI 智能整理:可選接入豆包 / DeepSeek / Kimi / OpenAI 等 LLM,僅修復同音字、刪口頭禪、加標點,不篡改原意;confidence < 0.5 時保留原文。雙擊右 Option 可臨時跳過 AI。
-
記憶與回顧(L2 / RECALL):每句話自動歸檔到本地,記錄應用來源、時間、標籤,支持全文搜索、過濾和導出(Markdown / JSON / CSV)。
-
智能層洞察(L3 / REFLECT):基於 Big5 等模型生成周畫像、MBTI 分析和金句提取,7 個視角點評你的一週。
-
中文排版引擎:本地規則處理空格、標點、大小寫、品牌名自動修正(如”Cursor”不再變”苦色”),參照 pangu.js、GB/T 15834-2011 等標準,全部 < 5 ms 完成,零網絡調用。
-
AI 翻譯 + 對照:支持 50+ 語言,菜單欄一鍵切換「整理 / 翻譯 / 對照」模式。
-
學習閉環:你每次編輯 AI 的修正,自動提取爲候選規則,菜單欄一鍵採納。
-
目標窗口鎖定:錄音時鎖定當前 App,切窗口不插錯,fallback 到剪貼板 + toast。
如何使用聲憶
- 下載安裝:前往聲憶的官網 https://voiceinput.app/zh/,下載 DMG(22.6 MB),支持 macOS 14.0+ 的 Apple Silicon 與 Intel Mac,非 App Store 分發,Sparkle 自動更新。
-
首次授權:首次啓動時按引導頁一次性授予麥克風、輸入監控、輔助功能三項權限,授權後點擊一鍵重啓即可立即生效。
-
語音輸入:按住右 Option(或 Fn / 右 ⌘)開始說話,鬆開後 1.4 秒內文字自動插入當前光標位置,中英混輸、同音字和口頭禪由後台自動處理。
-
配置 AI 整理(可選):在設置中填入 OpenAI 兼容 API Key(支持 DeepSeek / Kimi / OpenAI / 本地服務),即可啓用智能糾錯、刪口頭禪和加標點功能,月費約 ¥5–20。
-
使用翻譯/對照模式:在菜單欄一鍵切換「整理 / 翻譯 / 對照」模式,支持 50+ 語言實時翻譯或原文譯文並排輸出。
-
查看記憶與回顧:每句話自動歸檔到本地記憶層,按 App、時間、標籤分類,支持全文搜索、過濾,以及 Markdown / JSON / CSV 一鍵導出。
-
獲取智能洞察:智能層基於 Big5 模型自動生成周畫像、MBTI 分析和金句提取,幫你回顧一週的表達與思考。
-
訓練個人規則:編輯 AI 修正結果後,系統會自動提取爲候選規則,在菜單欄一鍵採納,形成越用越準的學習閉環。
-
臨時跳過 AI:雙擊右 Option 可臨時跳過 AI 整理,直接輸出原始語音識別結果。
-
數據遷移:將數據庫文件拷貝到新 Mac 的相同路徑,即可完整遷移所有歷史記錄與配置。
聲憶的核心優勢
-
中文場景速度領先:1.4 秒成文,對比 TypeLess / Wispr Flow 等競品的 3–10 秒優勢明顯
-
不只是輸入法:每句話沉澱爲可搜索的記憶層,具備數據回顧和智能洞察能力
-
隱私優先:所有語音和文字寫入 App 專屬本地目錄,啓動前自動備份;API Key 存系統 Keychain,卸載即可帶走全部數據
-
輕量無負擔:DMG 僅 22.6 MB,macOS 14.0+ 即可運行,Apple Silicon 與 Intel 通用
聲憶的同類競品對比
| 對比維度 | 聲憶(VoiceInput) | TypeLess | Wispr Flow |
|---|---|---|---|
| 產品定位 | macOS 語音輸入法 + 本地記憶層 | 跨平台 AI 語音聽寫工具 | 跨平台 AI 語音輸入層 |
| 支持平台 | macOS 14.0+(Apple / Intel) | macOS、Windows、iOS、Android | macOS、Windows、iOS、Android |
| 中文速度 | 1.4 秒成文,中文場景優化 | 約 220 wpm,雲端處理 | 約 184 wpm,雲端 AI 重寫 |
| 定價模式 | 免費本地版 / 自帶 Key $0 / Pro $9/月或$49一次性 | 免費 2,000–8,000 詞/周 / Pro $12/月(年付)或$30/月 | 免費 2,000 詞/周 / Pro $15/月 / Team $12/人/月 |
| 離線能力 | ✅ 三套本地 ASR 完全離線 | ❌ 雲端處理,無離線模式 | ❌ 雲端 AI,需聯網 |
| 記憶回顧 | ✅ L2 數據層歸檔 + L3 智能洞察(MBTI/周畫像) | ⚠️ 本地歷史記錄,無智能分析 | ⚠️ 儀表盤統計 + 語音筆記 |
| 隱私策略 | 100% 本地,數據不離機,Keychain 存密鑰 | 零數據保留,本地歷史,不上傳訓練 | 隱私模式,內容雲端處理後不留存 |
| 中文排版 | ✅ 本地引擎 <5ms,pangu.js/GB/T 15834 標準 | ❌ 通用 AI 清理,無中文排版專項 | ❌ 通用 AI 重寫,無中文排版專項 |
| 核心差異 | 每句話沉澱爲可搜索記憶層,不只是輸入 | 跨平台最廣,AI 自動編輯 + 語調適配 | 實時編輯( mid-sentence 改口),長會話支持 |
聲憶的應用場景
-
日常高效文字輸入:在聊天軟件、郵件、社交媒體中按住快捷鍵說話,1.4 秒成文自動插入,比鍵盤打字更快,尤其適合長句表達和快速回覆。
-
寫作與內容創作:撰寫文章、博客、筆記時語音輸入靈感,AI 自動清理口頭禪和修正同音字,中文排版引擎自動處理標點空格,讓創作者專注于思路而非格式。
-
編程與開發工作:快速輸入代碼註釋、技術文檔、API 設計說明,內置 200+ 開發熱詞(如 Cursor、Kimi、DeepSeek)自動識別,避免專有名詞被誤轉。
-
會議與訪談記錄:實時語音轉文字記錄會議內容,每句話自動歸檔到本地記憶層,支持按應用和時間搜索回顧,方便後續整理會議紀要。
-
翻譯與跨語言溝通:開啓翻譯或對照模式,說話直接輸出 50+ 語言的譯文,或原文與譯文並排顯示,適合跨國協作和多語言內容生產。
-
個人知識管理與日記:用記憶層沉澱日常表達,通過全文搜索找回曾經的想法,智能層自動生成周畫像和金句提取,幫助回顧個人成長軌跡。
© 版權聲明
文章版权归作者所有,未经允许请勿转载。
相關文章
暫無評論...