当前位置:首页 > 日常学习 > 正文内容

MacOS下高效记录会议纪要以及实时音频转文字解决方案

UzJu10个月前 (06-27)日常学习1014

一、前言

本文解决了1个问题

1、如何同时带着耳机,并且能够音频识别电脑播放/会议声音转文字,还能够接收麦克风。

首先为什么会有这样一篇文章,其实大家不管是甲方还是乙方,特别是甲方,大部分时间其实都是被各种会议占满,需求评审,安全评估,安全培训等等等,那么乙方,更多的是与客户开会,或与甲方一样,公司内部开会,那么此时少不了的是会议纪要,可能有些会议比较枯燥,根本不会有人认真去听,但作为打工人来说 :)!

领导:小高啊,那个会议纪要你整理一下然后发给我/客户

我目前基本一周的会议特别多,不管是内部会议,还是外部会议,这时候就会有一个痛点,会议纪要怎么处理?
如果是旁听状态下还好,可以边听边记。
那么如果是主讲人呢?针对会上的问题,会上的内容无法汇总,也无法记录。

当然目前针对腾讯会议,飞书会议等会议办公软件,其实都提供这样的解决方案,会议录制可直接转换成文字,但这相对来说比较繁琐。

内部会议还好,外部会议总开个录屏,给人感觉不是特别好:)

那么有没有一款软件,可以让我在开会时,自动帮我记录会议内容?

华为MetaBook X Pro 就解决这样的问题,但是华为独占,做的也非常好,遥遥领先!

尊贵的水果用户能否拥有这样的体验?

本文会带来作为个人用户的解决方案(本文以水果人用户角度出发)

二、前期调研与产品体验

产品试用体验上,目前体验了以下几款产品

产品名 下载地址 产品形态
Noted MACOS APP Store 客户端/多形态
语音备忘录日记本 MACOS APP Store 客户端
讯飞听见 在线录音转文字-录音整理-录音转写工具-讯飞听见会记 (iflyrec.com) 客户端/多形态
通义听悟(阿里) 通义听悟 - 你的工作学习AI助手 (aliyun.com) 浏览器/浏览器插件

先说实际体验

1、Noted

总体感觉比较轻量化,并且没有账号体系,macos原生使用Icloud进行同步

image-20230627005250476

image-20230627005308039

付费,价格如下图

image-20230627005516656

1.1、优点

  • 轻量化
  • 编写
  • 简单易用

1.2、缺点

  • 语音转文字并不是特别准

见下图

image-20230627005830726

这是来自我在一场面试时记录的内容,这里是求职者在介绍学校,但可以发现,错别字非常严重,另外完整记录下来,可读性基本为0。

2、通义听悟(阿里)

由于没有客户端,所以跳过

3、讯飞听见

image-20230627005923027

科大讯飞目前是体验下来针对会议纪要最好的一个产品,毕竟做语音识别这么多年的大厂了。

来看看语音识别的能力

image-20230627010408520

总体来说,转文字的识别率还是很高的,并且准确率也还行。

实际会议使用上发现也不错

image-20230627010530917

缺点呢就是,加钱!

4、总结

目前会继续体验《讯飞听见》和《Noted》这两款产品,想看看一款好的产品能做到什么程度。

当然,一款好的产品,能够解决用户的痛点,帮助提升效率等,我觉得是值得付费的。

今年也是大大小小购买了很多正版的产品,比如Macos下的超级右键,自动切换输入法等,虽然这些产品都有公开的破解版可供下载,但如果在允许的条件下,也可以对开发者进行支持。

5、遇到的问题

其实在体验的过程中发现1个很严重的问题,如果不带耳机的情况下,外放进行电脑声音以及麦克风转文字的方案是可行的,但是如果使用耳机,那么常规的方案就不行了,至少我在macos的尝试下以及,阿里的听悟,科大讯飞,都没有见到能解决这个场景的,这也是本文带来的解决方案。

场景举例

1、现在需要使用腾讯会议开会,带着耳机

需要实现的内容

  • 戴耳机的情况下需要能够识别电脑腾讯会议音频输出并且转文字
  • 戴耳机的情况下能够接受耳机的麦克风音频输入并且转文字

三、如何在使用耳机的情况下同时录制电脑的声音以及耳机的麦克风

1、LoopBack

这个问题的解决方案是使用LoopBack创建一个虚拟的音频设备,来解决该问题。

image-20230627011057975

再安装完成后Macos下会多出一个虚拟的音频驱动,打开LoopBack开始配置

2、LoopBack配置

点击下方的New Virtual Device来新建一个设备

image-20230627011213155

配置如下

image-20230627011142056

sources默认即可,再output中新增一个输出,监听中新增并选择耳机,我这里是AirPods Pro,所以选择自己的耳机名字。

随后在讯飞听见配置如下

image-20230627011449964

这样配置后的效果

  • 能够同时将电脑的音频输出与耳机的麦克风同时音频转文字,解决了上述的痛点。

3、最终效果

录制电脑音频

image-20230627011511871

耳机语音输入

image-20230627011537526

扫描二维码推送至手机访问。

版权声明:本文由UzJu的安全屋发布,如需转载请注明出处。

SQL ERROR: ERROR 1105 (HY000): XPATH syntax error: '~root@localhost'

本文链接:https://uzzju.com/post/80.java

分享给朋友:

相关文章

用Digispark制作BadUSB+msf植入病毒木马

用Digispark制作BadUSB+msf植入病毒木马

用Digispark制作BadUSB+msf植入病毒木马 0x001-简介 概述 在2014年美国黑帽大会上,安全研究人员JakobLell和独立安全研究人员Karsten Nohl展示了他们称为“BadUSB”的攻击方法,这种...

博客同步腾讯云

我的博客即将同步至腾讯云+社区,邀请大家一同入驻:https://cloud.tencent.com/developer/support-plan?invite_code=3oa4dnff6cqog...

打算在博客开个专栏写写逻辑漏洞的思考:)

做漏洞审核也有快1年,大大小小的逻辑漏洞,也见的差不多, 接触到很多,想总结总结,并思考其中存在的问题和修复方式。...

等了1个月的CVE编号终于下来了,看来CNVD审核更快

等了1个月的CVE编号终于下来了,看来CNVD审核更快

我都快忘了什么时候申请的了。。。今晚看着电脑突然收到邮件,回复了我2个CVE编号给了两个编号,还不错,我都忘了我交了俩,一个前台洞,一个后台。。。。还是cnvd审核快...

ipad远程MacBookPro远程办公的终极解决方案

ipad远程MacBookPro远程办公的终极解决方案

吐槽作为安全技术人员来说,用ipad远程控制MacBook Pro,在我看来是一件很酷的事情!:) 首先吐槽一下自己为什么会有这个奇怪的想法,原因是因为,目前我有一个16寸的mac,我每天下班的第一个动作就是先把扩展坞拔掉,随后从扩展坞上...

 Windows11 LogonUI.exe 系统在应用程序中检测到基于堆栈都缓冲区溢出,溢出允许恶意用户获得此应用程序都控制。

Windows11 LogonUI.exe 系统在应用程序中检测到基于堆栈都缓冲区溢出,溢出允许恶意用户获得此应用程序都控制。

问题LogonUI.exe系统错误 系统在应用程序中检测到基于堆栈都缓冲区溢出,溢出允许恶意用户获得此应用程序都控制。 事情线:2023年6月3日一整天直至次日凌晨2点,我都不在家,次日凌晨2点(6月4日)回到家中发现一直运行中都电脑出...

发表评论

访客

◎欢迎参与讨论,请在这里发表您的看法和观点。