Questions tagged «speech-recognition»

语音识别软件将语音记录转换为文本。

3
使用ffmpeg减少背景噪音并优化音频剪辑中的语音
我从视频文件中提取音频片段以进行语音识别。这些视频来自移动/其他手工设备,因此包含很多噪音。我想减少音频的背景噪音,以便清晰传达给语音识别引擎的语音。我正在使用ffmpeg来完成所有这些工作,但仍停留在降噪阶段。 到目前为止,我已经尝试过以下过滤器: ffmpeg-20140324-git-63dbba6-win64-static\bin>ffmpeg -i i nput.wav -filter_complex "highpass=f=400,lowpass=f=1800" out2.wav ffmpeg -i i nput.wav -af "equalizer=f=1000:width_type=h:width=900:g=-10" output.wav ffmpeg -i i nput.wav -af "bandreject=f=1200:width_type=h:width=900:g=-10" output.wav 但是结果非常令人失望。我的理由是,由于语音低于300-3000 Hz的范围,我可以过滤掉所有其他频率以抑制任何背景噪声。我想念什么? 另外,我了解了可用于语音增强的weiner过滤器,发现了这一点,但不确定如何使用。

6
语音识别-MP3转文本软件
关闭。这个问题是题外话。它当前不接受答案。 想改善这个问题吗? 更新问题,以使它成为超级用户的话题。 3年前关闭。 我正在寻找一个独立于扬声器的程序(商业或免费),使我能够将包含语音记录(尤其是播客)的MP3文件转录为文本。我想尝试“ Dragon Naturally Speaking”,但似乎它仅支持录制我自己的语音记录。那么还有哪些选择呢?

3
如何在不将视频上传到YouTube的情况下使用Google的YouTube语音识别?
我有很多演讲视频内容,我想为其添加字幕。YouTube在特定条件下会自动为视频生成字幕(这些条件对我来说还是个谜)。 我希望能够在YouTube之外使用此语音识别技术。我不想上传每个视频只是为了获取成绩单(太耗时),而且,我不认为YouTube会为超过30分钟(大多数是30分钟)的视频使用该视频。不要以为它会在非公开列出的视频中使用(这是个问题,因为它是要出售的优质内容)。 完美的场景:有一个程序可以在我的桌面上运行,以从这些视频中获取抄本,并且其质量与YouTube相同或更好,并且其时间代码类似于YouTube生成的SRT或XML [ 如何获得YouTube字幕 ]。 可以接受的情况:我可以采取一些技巧来迫使YouTube抄录视频,无论是公开的还是公开的,尽管长度不限。 可行的方案:有一个库或我可以用来编写自己的程序的东西。我对C#很好,对C ++很好(但是我真的更喜欢C#)。

1
谷歌语音识别离线Linux
当我对语音识别进行一些研究时,我看到一些有关android上的Google语音识别服务的文章可以在android上离线下载和使用。我还看到了一些有关在计算机上使用google语音服务的信息,但这涉及查询google服务器。所以这是我的问题:有没有办法通过计算机(尤其是在Linux上)离线使用Google语音识别服务?

2
Windows 8语音识别语言
我已经安装了Windows 8 Pro(来自MSDN的RTM版本)。对于我使用的应用程序,我需要将语音识别语言设置为英语-美国。我唯一的选择是英语-英国。我尝试过进入“控制面板”中的“语言”并将唯一的语言设置为英语-美国,但是英语-英国仍然是语音属性中的唯一选择。 如何为语音属性添加语言?

1
Win10一直在尝试安装“英语(美国)语音识别”并失败
几天以来,Windows 10不断地向我提出错误消息“发生了一些事情,我们无法安装功能”。 通过单击我带到管理可选功能的错误消息。历史记录列出了几个失败的安装尝试English (US) Speech Recognition。安装失败,错误0x80070422(像往常一样简洁,感谢Microsoft)。 因此问题: 为什么Windows 10会尝试安装此组件?我没有要求它,它对我没用。 错误意味着什么(即安装失败的原因)? 我怎么告诉Windows放弃?

0
Excel 2010 - 用于选择单元格的语音命令?
我使用的是Windows 8,但我想知道所提供的解决方案是否也适用于Windows 7。 我使用的是Excel 2010.我想要的是一种在打开的Excel工作表中选择单元格的方法,使用单个单词表示特定单元格(之前已编辑过命令)。这可能是通过Windows自己的语音识别,或任何其他可用的语音识别程序?

1
英特尔爱迪生语音控制 - 如何配置alsa
我想用英特尔爱迪生实现一个语音控制的轮椅。基本上我会说前进,左,右和停止通过连接到爱迪生板的麦克风 声音适配器 。 对于初始原型,我只想将语音识别的输出显示给CLI。 我跟着 这个 在线教程。一切都很好,直到声音配置部分。 接下来是教程中使用的命令的CLI输出。 的lsusb: root@edison:/home/speech_to_text# lsusb Bus 002 Device 001: ID 1d6b:0003 Linux Foundation 3.0 root hub Bus 001 Device 002: ID 0d8c:000c C-Media Electronics, Inc. Audio Adapter Bus 001 Device 001: ID 1d6b:0002 Linux Foundation 2.0 root hub ALSA-utils的: root@edison:/home/speech_to_text# opkg install alsa-utils libportaudio2 …

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.