鱼C论坛

 找回密码
 立即注册
查看: 1643|回复: 5

谁能比较下faster-whisper, whisper-jax, distil-whisper 这3者识别英语mp3的速度

[复制链接]
发表于 2023-12-31 19:56:19 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
谁用过 faster-whisper, whisper-jax, distil-whisper
请比较下faster-whisper, whisper-jax, distil-whisper 这3者识别英语mp3的速度

本帖被以下淘专辑推荐:

想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2023-12-31 19:56:33 | 显示全部楼层
我来解答你的问题,这三个工具在识别英语mp3的速度方面有一些区别。

faster-whisper是一个音频识别模型,它的特点是速度比较快,适合于实时或近实时的音频流识别。由于速度较快,但模型相对简单,可能在较复杂的语音环境中识别准确率会稍微下降。

whisper-jax是一个基于JAX框架实现的音频识别模型,相比于faster-whisper,它使用了更加复杂的神经网络结构,可以提高识别准确率,但也会导致一定的识别延迟。

distil-whisper是另一个音频识别模型,它的设计目标是在保持高准确率的同时降低模型的大小和计算资源消耗。因此,distil-whisper通常会比较节省系统资源,但相应地会牺牲一定的识别速度。

综上所述,如果你对实时性要求比较高,可以选择faster-whisper;如果你更关注准确率,则可以选择whisper-jax;而如果你希望在保持较高准确率的同时减少资源的消耗,可以选择distil-whisper。

请注意,以上是就速度进行的概括,不同的场景和需求可能会有不同的选择。此外,由于涉及到具体的模型和实现细节,建议你查阅相关文档或参考示例代码以获取更准确的信息。

以上回复来自 FishC AI 小助理,如未能正确解答您的问题,请继续追问。
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2023-12-31 20:00:15 | 显示全部楼层
请给出实际的速度测试结果
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2023-12-31 20:00:24 | 显示全部楼层
blackantt 发表于 2023-12-31 20:00
请给出实际的速度测试结果


非常抱歉,由于我是一个计算机程序无法直接进行实际速度测试。而且不同的音频识别模型在不同的硬件环境中可能会有不同的速度表现。因此,我无法给出具体的速度测试结果。

不过,你可以通过自己在特定硬件环境中运行这些模型来进行速度测试。可以使用相同的英语mp3文件来分别使用faster-whisper、whisper-jax和distil-whisper进行识别,并记录下每个模型所花费的时间。这样就可以得到它们在你的环境中的相对速度。

另外,你还可以在相关的论坛或社区上咨询其他用户的经验,了解他们在使用这些模型时的速度表现。这样可以更全面地了解它们的性能特点。

希望这些信息对你有帮助!

以上回复来自 FishC AI 小助理,如未能正确解答您的问题,请继续追问。
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2024-1-1 13:18:58 | 显示全部楼层
补:  whisper-jax 可能不适合普通gpu, faster-whisper 400s的mp3, whisper-jax 在容器里运行不出来,并且有很多重复词出现
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2024-1-1 13:19:15 | 显示全部楼层
blackantt 发表于 2024-01-01 13:18
补:  whisper-jax 可能不适合普通gpu, faster-whispe ...


感谢补充信息。确实,whisper-jax可能不适合在一般的GPU上运行,因为它使用了较复杂的神经网络结构,需要更强大的计算资源才能正常工作。如果你在容器中无法运行whisper-jax,可能是由于容器环境和依赖项配置的问题。你可以尝试检查并解决这些配置问题,或者考虑使用另外的部署方式来运行whisper-jax。

关于faster-whisper在处理400秒的mp3文件时所花费的时间,400秒的音频文件可能会较长,因此处理时间可能会相应增加。具体的处理时间还会受到硬件性能、系统负载和模型参数等因素的影响。要准确评估处理时间,最好在特定的硬件环境上运行具体的测试。

至于重复词的出现,这可能与训练数据、模型设置以及音频样本的特点有关。可以尝试更换不同的音频样本进行测试,或者调整模型参数(如语言模型)以改善结果。此外,也可以参考相关文档或向开发者社区寻求帮助,了解针对重复词的处理策略和建议。

总之,每个模型都有自己的特点和适用场景,在使用过程中可能会遇到不同的问题和挑战。探索和实践是获取更好结果的关键。祝你成功!

以上回复来自 FishC AI 小助理,如未能正确解答您的问题,请继续追问。
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2024-9-21 22:04

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表