跳转到主要内容

【大语言模型】如何在Python中使用开源Whisper ASR

Whisper是最先进的自动语音识别(ASR)系统,是OpenAI的创意。它的目的是将口语转录成书面形式,这一过程有多种用途,包括从转录服务到语音控制助理的所有内容。这个答案将阐明如何使用Whisper ASR系统的开源版本,特别是在Python中。

设置环境

在理解代码之前,确保一个最佳的环境是很重要的。这需要在您的系统上安装Python,以及Whisper Python包。后者可以使用pip安装:

pip install -U openai-whisper

安装Whisper

此外,有必要安装FFMPEG,这是一个命令行实用程序,旨在处理包括音频和视频在内的多媒体文件。根据您系统的操作系统,可以使用相应的软件包管理器进行下载和安装。