豆包输入法Mac版正式上线,所有人都该试试AI语音输入了。
豆包输入法的Mac版终于正式上线了。我自己已经内测使用了快1个月了但是我等这一天也真的等了好久好久。因为这篇文章我想写很久了但是一直没写就是因为对于大众用户来说之前还一直没有一个比较好的产品能让大家去随便的体验语音输入法所以一直在等豆包输入法上线然后再发这样其实所有人就都可以开始把这种方式用起来了。所以我今天也终于可以推荐大家都使用豆包输入法的语音输入来在电脑上跟你的AI进行对话了。不只是在手机上。在电脑上也是。我给大家看看我现在每天在Mac上vibe coding的装备。一台Mac Mini一个触屏的屏幕一个麦一个自定义的6键宏键盘配合Mac上的豆包输入法直接搞定一切。我之前写过一篇文章叫AI时代为什么我极力推荐你开始写日记那篇文章里我就提到了记日记最好的方法是口述不要写打开备忘录用豆包输入法按住语音键想到什么说什么两三分钟说完语音自动转成文字。那篇文章发出去之后很多读者留言说试了真好用回不去了。但那篇聊的是日记场景但今天我想把这个观点往前再推一步我想说不光是记日记其实你跟AI的很多对话你日常工作中的大量文字输入都可以尝试使用语音输入来完成。因为如今语音输入法开始逐渐变得成熟在AI加持之下识别准确度还有纠错能力、去口水词之类的能力都还有蛮大的提升的我觉得已经到了一个从极客圈开始向外普及的过程。我不知道大家但是很多老读者可能都知道我是一个非常典型的I人I的浓度占比高达96%的INTJ。过去这么多年我一直是能打字就绝对不张嘴跟朋友聊天打字跟同事沟通打字跟AI对话还是打字。所以在很长一段时间里语音输入这四个字对我来说约等于社恐禁区。。。但是大概从去年下半年开始我开始大量的进行vibe coding还有一些高强度任务之后发现了一个让我很难受的问题。就是我跟Claude对话的时候我打字的速度严重拖慢了我跟AI进行交互的速度甚至可能还会影响输出的质量。正常人说话的速度中文大概是每分钟200到300字快的时候能到350。而打字呢普通人大概是每分钟40到60字熟练的能到80或者90。也就是说语音输入的速度是打字的3到5倍。而很多时候我们如果都想给AI更多的的信息纯靠打字的话让你写500字可能真的是种折磨很多人其实就是提笔忘字一篇空白。但是如果你让他说500字那可能瞬间就滔滔不绝了这其实是大脑推理机制的问题。我之前几乎不会给AI一个上百字的输入我当然知道给的上下文越多输出越精准但我是真的懒啊你让我敲一个上百字的小作文我是真的累啊。我第一次真正意识到这个差距是去年12月份有一次晚上躺在床上用语音给Claude描述一个我正在做的项目的需求我当时真的懒得打字了于是那是我第一次克服了我的社恐障碍反正我家里就我一个人。那时候豆包输入法手机版应该上线没多久我第一次打开了它然后说了大概三分钟这一说就一发不可收拾说了项目背景、目前遇到的问题、我试过的几种方案、每种方案分别卡在哪里、我理想中的解决思路是什么样的。我一边说豆包输入法一遍流式出文字最后差不多将800字左右。我当时都懵了我我居然心流式的输出了3分钟居然输出了800字这是我可能打字给AI永远都写不出来的长度。Claude那一轮给的回复质量比我平时打字对话好太多了因为它拿到了足够多的输入给了我几乎最准确最棒的回答。那一刻我就明白了一件事在如今大模型智力程度已经飞跃到今天这个是简单你跟AI对话你输入的信息量远比精准度和结构化程度重要。因为AI的强项就是从一堆杂乱的信息里提取关键信息、梳理逻辑、找到你真正要的东西。这就好像你去看医生你跟医生说我肚子疼医生能做的很有限。但你跟医生说“我昨天吃了顿火锅晚上12点开始肚子疼一开始是左边疼后来变成整个肚子都疼今天早上拉了两次还有点发烧之前也偶尔会这样但没这次严重”医生就能判断个八九不离十了。跟AI对话其实是一个道理。而语音输入天然就能帮你做到这一点因为你来不及编辑。我之前那篇日记的文章里就说过这个观点。就是打字的时候你的大脑里有一个编辑在实时工作它会帮你润色、修剪、美化、克制这个编辑在你写公众号文章的时候很有用但在你跟AI对话的时候它就是你最大的敌人。回到今天的主角豆包输入法。我先说一下前情提要我从去年就开始在手机上用豆包输入法的语音功能了当时就觉得很惊艳。但手机端的语音输入其实大家选择还挺多的坦率的讲微信输入法、讯飞、搜狗都还行。但电脑端那真的就难受的飞起了。电脑端的比较好用的语音输入坦率地讲长期以来就是一片荒漠。我当然知道有些付费的语音输入法产品但说实话虽然我已经在AI上花了很多很多钱了但是在AI时代要付费的东西实在太多了我真的不太想为了一个输入法再多一笔订阅。然后之前我常用的微信输入法也上了AI语音识别但坦率的讲识别率不太稳定。我试过好几次尤其是你离Mac的麦克风稍微远一点或者白天办公室有点环境音错别字就开始冒出来了。所以在豆包输入法Mac版出来之前我在电脑上其实一直还是比较割裂的状态毕竟我的大部分工作场景还是电脑啊。然后今年3月底的时候豆包输入法Mac版的内测版悄悄出来了我当时也第一时间申请了内测装上了安装包。在用了一个月之后我想说它不仅免费而且跟很多付费的产品相比体验更是一样好。而现在大家也终于全都可以用上了而且不止语音输入拼音双拼啥的全都有非常的完整。网址在此https://shurufa.doubao.com/pc你下载打开以后直接安装。然后就会提示你安装完成了。你就可以在你的顶部输入法那个栏目这点开就可以看到豆包输入法了。我们先点进去上面的豆包输入法的设置界面。所有的东西基本都不太需要动。唯独有一个东西就是快捷键那你可以随便预设一个你喜欢的键。我个人习惯问题我直接设成了右边的Option键。我那个宏键盘其中一个按键也是映射的这个键这就是标准的豆包输入法说话键。使用起来也究极简单就两种输入方式。第一种就是长按你的快捷键比如我是右Option键。你就按住就行了这时候你的屏幕下方就会出现一个小条代表正在输入中了。按住就是语音输入松开就是输入完毕这个逻辑很好理解对吧。然后还有另一种模式就是有些朋友可能嫌一直按着太累那也有办法。你直接双击快捷键就会变成这样。这个时候你就不需要按着了你就可以直接开始口喷输出当你觉得说完了的时候直接再次双击结束。然后豆包的流式输出做的非常的好就是你按住快捷键开始说话文字是实时往外吐的你一边说一边就能感觉到文字好像在输入框里哗哗地流淌出来。我直接给你做个示例看看这个延时你就懂了。丝滑无敌丝滑。而且识别精准度极高几乎不需要我改任何字和词完全可以直接用。我开始使用的时候其实还有点不放心在想着要不要确认一遍再发后面发现中文场景下几乎都是对的所以后来就再也没确认过了。Codex其实前段时间也上线了自己的语音输入类似于一个输入法你直接设好快捷键按住一样可以用语音输入。但是Codex它的输入体验就真的不是特别好了我给大家录个屏实际看看这个输入的条其实跟豆包输入法的有点像。讲真的当你习惯丝滑无比源远流淌、说完即输入完的体验之后你肯定再接受不了这种录音然后转文字的感觉慢慢的输入法了。然后还有一个细节是你在输入的时候它也会自动的去优化一些你的输入比如你说这个项目的预算大概是...不对应该是三十万他会实时识别到你的在纠正自己他也会帮你直接改成正确的这个很牛逼你脑子里的想法和屏幕上的文字之间的延迟几乎消失了。然后还有一个对我很重要的能力就是中英混说。因为AI行业没有办法就是有很多很多的你很难用中文表达的英文比如ChatGPT、Claude、Skill、OpenAI、Harness、Promtp之类的。但是我的英文又极烂但是在我如此之烂的口语情况下绝大多数的英文居然还是可以识别对。里面所有的英文单词都没有错误甚至seedance还自动缩写成了SD。对于我这种英文苦手来说真的非常非常友好。而且有的时候skill这个发音我确实就发不准但是你也可以通过都自动纠正功能给它改了就是你错一次以后你手动改一下你后面再动就不会错了。比如这是我的母公司名叫虚实空际你如果是第一次输入或者其他的输入法正常去打是百分百会错的。但是因为我之前纠正过所以我现在去说这个单词豆包输入法就会自动的帮我改成虚实空际。这是AI自己帮我改的可不是我人改的正是因为我以前纠正过所以就不会再错了。还有skill这个单词也是我一生之敌经常念不对但是你纠正过一次以后也就不会有问题了。真的很强你会发现当你用的越久这个输入法就会越用越准越用越懂你你的语音输入也会越来越准越来越不需要修改。因为每个人的高频词汇表其实是不一样的AI输入法如果不能学习你的用词习惯用久了依然会有一堆需要手动改的地方的话那体验就真的差太多了。而且豆包输入法有个点做的很好在手机上体验就不错就是轻声抗噪。这个其实解决了I人很重要的顾虑就是我在办公室不好意思出声怎么办。豆包输入法有轻声模式你就小声嘟囔它也能识别我在办公室试过压着嗓子说话离电脑大概半米远识别率也基本没怎么掉。同事在旁边根本听不清我在说啥但屏幕上的字还是哗哗出来另外就是抗噪咖啡馆的背景音乐、键盘敲击声、偶尔路过的同事聊天声这些杂音它都能过滤掉专注识别你的声音这个还是蛮香的。以上这些点叠在一起我也觉得可以给你推荐转向使用语音跟AI交互的时机了而豆包输入法确实就是现在最合适大家更适合如你我一般的普通用户的。我上一篇日记的那篇文章的结尾说从今天开始记日记吧。那今天这篇文章的结尾我想说。从今天开始张嘴说话吧。相信我别再跟你的键盘较劲了。以上既然看到这里了如果觉得不错随手点个赞、在看、转发三连吧如果想第一时间收到推送也可以给我个星标⭐谢谢你看我的文章我们下次再见。/ 作者卡兹克/ 投稿或爆料请联系邮箱wzglyayvirxact.com