基于VMware虚拟机的SenseVoice-Small开发环境搭建教程
最近在折腾语音识别项目,发现很多模型对环境依赖要求挺高,直接在主力机上安装容易把系统搞乱。

于是想到了用虚拟机来搭建一个独立的开发沙盒,这样既能保证环境纯净,又方便随时备份和重置。
SenseVoice-Small这个模型在中文语音识别上表现不错,而且对硬件要求相对友好,很适合在虚拟机里跑起来试试水。
如果你也想在本地快速搭建一个隔离的语音识别开发环境,但又不想折腾双系统或者担心污染现有环境,那么跟着这篇教程走,应该能在半小时内搞定。
整个过程我会尽量用大白话讲清楚,从虚拟机软件安装到模型成功运行,一步步带你走完。
1.
准备工作:软件与镜像下载
在开始动手之前,我们需要准备好两样核心的东西:虚拟机软件和要安装的操作系统。
首先,是虚拟机软件。
这里我们选择VMware
Workstation
Player,它的个人版是免费的,对于学习和开发来说完全够用。
你可以去VMware官网找到下载链接,根据你的电脑系统(Windows或Linux)选择对应的版本。
下载完成后,就像安装普通软件一样,一路“下一步”安装好就行。
其次,是操作系统的镜像文件。
为了获得最好的兼容性和社区支持,我们选用Ubuntu
22.04
LTS这个长期支持版。
你可以访问Ubuntu官网,下载它的桌面版ISO镜像。
LTS版本意味着它有长达五年的官方支持,比较稳定,不容易出现一些稀奇古怪的问题。
最后,别忘了我们今天的主角——SenseVoice-Small模型。
你可以去其官方的GitHub仓库,把代码和预训练权重下载下来。
或者更简单点,等我们系统环境装好后,直接用git命令克隆到虚拟机里。
把这些文件都下载到你的电脑本地,找个好记的文件夹放好,我们接下来就要开始创建虚拟机了。
2.
创建并配置你的第一个虚拟机
打开安装好的VMware
Workstation
Player,你会看到一个清爽的界面。
点击“创建新虚拟机”,我们的搭建之旅就正式开始了。
2.1
新建虚拟机向导
第一步,安装程序来源。
选择“安装程序光盘映像文件(iso)”,然后点击“浏览”,找到你刚才下载的Ubuntu
22.04的ISO文件。
VMware会自动检测到这是Ubuntu系统,很方便。
第二步,设置用户名和密码。
这里的信息就是你将来登录Ubuntu系统时要用的,简单好记就行,比如用户名叫“developer”,密码设一个你常用的。
第三步,给虚拟机命名并选择安装位置。
名字可以叫“SenseVoice-Dev”,安装位置我强烈建议选一个剩余空间比较大的磁盘分区,至少预留40GB以上的空间。
因为后续安装各种开发包和模型数据,空间消耗不小。
第四步,指定磁盘容量。
虚拟机本质上是一个大文件,这个步骤就是决定这个文件最大能长到多大。
对于我们的开发环境,建议设置为40GB到50GB。
选择“将虚拟磁盘存储为单个文件”,这样性能会好一些。
第五步,硬件自定义。
先别急着点完成,点击“自定义硬件”按钮,我们需要调整一些关键设置,这对后续流畅运行模型很重要。
2.2
关键硬件参数调整
在弹出的硬件设置窗口里,有几项需要重点关注:
- 内存:这是影响虚拟机流畅度的最关键因素。
SenseVoice-Small模型推理时对内存有一定需求。
如果你的宿主机(就是你真实的电脑)有16GB内存,可以分给虚拟机6GB到8GB;如果有32GB,可以大方地分12GB。
总之,在保证宿主机本身不卡顿的前提下,尽可能多分一些。
- 处理器:核心数很重要。
建议将“处理器数量”设置为2,每个处理器的“核心数量”也设置为2(即总共4个逻辑核心)。
这样能充分利用多核性能,加快模型加载和推理速度。
- 网络适配器:默认的“NAT模式”就行。
这种模式下,虚拟机会共享你宿主机的网络连接,可以正常上网下载软件包,是最省心的选择。
- 显示器:如果你不需要在虚拟机里进行复杂的图形界面操作,可以将“3D图形”的显存适当调低,比如256MB,把更多内存留给系统和模型用。
调整完毕后,点击“关闭”,然后回到主向导点击“完成”。
VMware就会开始创建你的虚拟磁盘文件,并自动启动虚拟机,加载Ubuntu安装程序。
3.
安装Ubuntu操作系统
虚拟机启动后,会自动从我们指定的ISO镜像引导,进入Ubuntu的安装界面。
这个过程和在一台真实电脑上安装系统几乎一模一样。
首先,选择语言“中文(简体)”,然后点击“安装Ubuntu”。
在安装类型页面,直接选择“清除整个磁盘并安装Ubuntu”,不用担心,这里清除的是虚拟机的虚拟磁盘,不会影响到你真实的电脑硬盘。
接下来,设置时区,地图上点选“Shanghai”即可。
键盘布局选择“Chinese”。
然后就是等待安装过程,期间会让你输入之前创建虚拟机时设置的用户名和密码。
安装完成后,系统会提示你重启。
点击“现在重启”,虚拟机可能会提示你“请移除安装介质,然后按ENTER键”。
这时候,我们需要在VMware窗口顶部的菜单栏里操作:点击“虚拟机”
->
“设置”,然后在弹出的窗口里,将连接状态从“使用ISO映像文件”改为“使用物理驱动器”或者直接“断开连接”。
这样虚拟机就会从虚拟硬盘启动了。
按回车键,等待一会儿,你就能看到Ubuntu的登录界面了。
输入密码,进入桌面,一个全新的、干净的系统就准备好了。
4.
搭建Python与CUDA开发环境
进入Ubuntu桌面后,第一件事是打开“终端”(可以在程序列表里找,或者按Ctrl+Alt+T快捷键)。
我们所有接下来的操作,基本都在这个黑框框里完成。
4.1
系统更新与基础工具
首先,更新一下系统的软件包列表,并升级已有的软件。
在终端里逐行输入以下命令:
sudoapt
-y
输入密码后,系统会开始更新,这可能需要几分钟。
完成后,安装一些我们后续会用到的编译工具和基础软件:
sudoapt
software-properties-common
4.2
3.10,这已经足够了。
我们需要的是安装Python的包管理工具pip,以及一个管理Python版本的好工具venv(虚拟环境)。
sudoapt
python3-venv
安装完成后,可以检查一下版本:
python3--version
配置Python虚拟环境
强烈建议为SenseVoice项目创建一个独立的虚拟环境,这样它的所有依赖包都不会干扰到系统级的Python环境。
找一个你喜欢的位置,比如在家下一个合适的文件夹里,比如checkpoints/。
6.
运行你的第一个语音识别测试
万事俱备,我们来跑一个最简单的例子,验证环境是否成功。
首先,准备一个测试用的音频文件(WAV格式,单声道,16kHz采样率是比较通用的要求)。
你可以自己录一段,或者从网上下载一个样例。
假设文件名叫test_audio.wav,把它放到项目,然后运行你的测试脚本:
python3your_test_script.py
如果一切顺利,你将在终端里看到模型输出的识别文字。
恭喜你,SenseVoice-Small开发环境已经成功在VMware虚拟机中跑起来了!
7.
总结与后续优化建议
走完这一遍,你应该已经拥有了一个完全独立的、可以安全折腾的语音识别开发环境。
用虚拟机的最大好处就是“隔离”和“可复用”,这个环境玩坏了,直接删掉虚拟机文件,从头再来一遍也就半小时,完全不影响你电脑上的其他工作。
不过,在虚拟机里跑AI模型,性能毕竟会受到一些限制,尤其是纯CPU模式。
如果你后续想获得更快的推理速度,有两个方向可以考虑:
一是调整虚拟机资源。
在虚拟机设置里,可以尝试进一步增加内存和CPU核心的分配,这能带来最直接的提升。
前提是你的宿主机硬件足够强大。
二是探索GPU加速的可能性。
这需要你的宿主机有NVIDIA显卡,并且VMware版本支持。
你需要先在宿主机安装正确的NVIDIA驱动,然后在VMware中安装VMware
Tools,并尝试配置GPU直通(如vGPU或PCIe直通)。
这一步配置相对复杂,且对硬件和软件版本有特定要求,但一旦成功,就能让虚拟机内的PyTorch直接调用物理GPU,速度会有质的飞跃。
这可以作为你环境搭建熟练后的进阶挑战。
最后,这个虚拟环境就像你的一个数字工作间,你不仅可以用来跑SenseVoice,以后任何需要隔离环境的Python项目、机器学习实验,都可以在这里进行。
希望这个教程能帮你省去一些摸索的时间,更快地开始你的语音识别项目实践。
/>
获取更多AI镜像
想探索更多AI镜像和应用场景?访问
CSDN星图镜像广场,提供丰富的预置镜像,覆盖大模型推理、图像生成、视频生成、模型微调等多个领域,支持一键部署。


