开源

🚀 开源神器！C/C++实现的Whisper语音识别模型

ggerganov/whisper.cpp

⭐️⭐️⭐️⭐️⭐️

License

MIT

Stars

37.7k

Forks

3.9k

摘要

Whisper模型的C/C++移植版是一个高性能、跨平台的自动语音识别工具，支持多种硬件优化和深度学习库，使得在不同设备上实现实时语音转文字变得简单快捷。

内容

🌟 你是否在寻找一款高性能、跨平台的语音识别工具？来看看这个开源项目——Whisper模型的C/C++移植版！

🔍 这个项目将OpenAI的Whisper自动语音识别（ASR）模型用C/C++重新实现，无需依赖其他库，就能在多种平台上运行。它支持Apple Silicon优化，包括ARM NEON、Accelerate框架、Metal和Core ML，还有x86架构的AVX内联支持，以及POWER架构的VSX内联支持。🚀

📱 它不仅支持混合F16/F32精度，还有整数量化支持，零运行时内存分配，以及Vulkan支持。这意味着你可以在CPU上进行推理，也能高效地在NVIDIA GPU上运行。🌐

🛠️ 快速开始也很简单，克隆仓库，下载模型，构建项目，然后就能开始转录音频文件了。例如，使用`whisper-cli`工具，你可以轻松地将WAV文件转换为文本。🎧

🌈 这个项目的优势在于它的轻量级实现，使得集成到不同平台和应用变得容易。无论是iOS、Android还是WebAssembly，都能轻松运行。🌟

关键词

C++ AI CLI

🚀 开源神器！C/C++实现的Whisper语音识别模型

ggerganov/whisper.cpp

License

Stars

Forks

摘要

内容

关键词

分类

热门推荐

相关文章

关于

本文目录

标签云