千问3.5-2B VMware虚拟机开发环境部署全流程
千问3.5-2B VMware虚拟机开发环境部署全流程1. 引言如果你是一名习惯使用VMware虚拟机的开发者想要搭建一个隔离的AI开发测试环境来运行千问3.5-2B模型这篇教程就是为你准备的。我们将从零开始一步步指导你完成整个部署流程。为什么选择VMware虚拟机首先它能提供完全隔离的环境不会影响你的主机系统其次通过虚拟GPU直通技术如果你的硬件支持可以获得接近原生性能的GPU加速最后VMware的成熟稳定性能确保开发环境的可靠性。2. 准备工作2.1 硬件要求在开始之前请确保你的主机满足以下硬件要求CPU至少4核建议8核或以上内存主机至少16GB建议32GB为虚拟机分配至少12GB存储SSD硬盘至少50GB可用空间GPU可选支持直通的NVIDIA显卡如RTX 3060及以上2.2 软件准备你需要下载以下软件VMware Workstation Pro最新版本17.xUbuntu Server镜像建议22.04 LTS版本VMware Tools用于增强虚拟机性能3. 创建Ubuntu虚拟机3.1 新建虚拟机打开VMware Workstation按照以下步骤操作点击创建新的虚拟机选择自定义(高级)配置硬件兼容性选择最新版本选择稍后安装操作系统客户机操作系统选择Linux版本选择Ubuntu 64位为虚拟机命名如Qwen-3.5-2B-Dev处理器配置至少2核建议4核内存分配至少8GB建议12GB网络类型建议使用NATI/O控制器类型保持默认磁盘类型SCSI选择创建新虚拟磁盘磁盘大小至少40GB选择将虚拟磁盘拆分成多个文件指定磁盘文件位置完成创建3.2 安装Ubuntu Server右键新建的虚拟机选择设置在CD/DVD选项中选择使用ISO镜像文件浏览并选择下载的Ubuntu Server ISO启动虚拟机开始安装Ubuntu Server安装过程中语言选择英文后续可配置中文环境网络配置保持默认磁盘分区选择使用整个磁盘设置用户名和密码建议使用强密码不安装额外软件我们后续手动安装所需组件安装完成后重启4. 安装VMware ToolsVMware Tools能显著提升虚拟机性能特别是图形和文件共享功能。4.1 安装步骤在VMware菜单中选择虚拟机→安装VMware Tools在Ubuntu虚拟机中挂载CD-ROMsudo mkdir /mnt/cdrom sudo mount /dev/cdrom /mnt/cdrom解压安装包cd /tmp tar zxpf /mnt/cdrom/VMwareTools-*.tar.gz运行安装脚本cd vmware-tools-distrib sudo ./vmware-install.pl安装过程中对所有提示按回车选择默认选项安装完成后重启虚拟机sudo reboot4.2 验证安装安装成功后你应该能观察到鼠标可以在主机和虚拟机间无缝移动屏幕分辨率自动适应窗口大小剪贴板共享功能正常工作5. 配置虚拟GPU直通可选如果你的主机有NVIDIA显卡并且支持PCI直通可以配置GPU直通以获得更好的AI模型运行性能。5.1 检查硬件支持在主机上检查IOMMU支持dmesg | grep -i iommu如果看到IOMMU enabled则表示支持检查显卡是否支持直通lspci -nn | grep -i nvidia记下显卡的设备ID格式为[xxxx:xxxx]5.2 配置VMware直通关闭虚拟机右键虚拟机→设置→添加→PCI设备选择你的NVIDIA显卡启动虚拟机5.3 安装NVIDIA驱动在Ubuntu虚拟机中添加官方NVIDIA仓库sudo add-apt-repository ppa:graphics-drivers/ppa sudo apt update查找推荐驱动版本ubuntu-drivers devices安装推荐驱动sudo apt install nvidia-driver-XXX # 替换XXX为推荐版本号重启后验证nvidia-smi应该能看到显卡信息6. 部署千问3.5-2B模型6.1 安装基础依赖更新系统sudo apt update sudo apt upgrade -y安装Python和pipsudo apt install python3 python3-pip -y安装CUDA Toolkit如果使用GPUsudo apt install nvidia-cuda-toolkit -y安装其他依赖sudo apt install git wget curl -y6.2 通过星图GPU平台部署注册并登录CSDN星图GPU平台在控制台找到千问3.5-2B镜像获取部署命令类似docker pull registry.cn-hangzhou.aliyuncs.com/csdn/qwen-3.5-2b:latest在虚拟机中运行部署命令等待镜像下载完成6.3 运行模型启动容器docker run -it --gpus all -p 7860:7860 registry.cn-hangzhou.aliyuncs.com/csdn/qwen-3.5-2b:latest模型会自动下载所需权重文件确保网络畅通启动完成后你可以在虚拟机内部通过命令行与模型交互或者通过端口映射在主机浏览器访问http://localhost:78607. 常见问题解决7.1 虚拟机性能问题如果感觉虚拟机运行缓慢检查是否分配了足够的内存和CPU核心确保已安装VMware Tools关闭不必要的虚拟机服务7.2 GPU直通失败如果GPU直通不工作确认主机BIOS中已启用VT-d/AMD-Vi检查显卡是否被其他进程占用尝试不同的NVIDIA驱动版本7.3 模型部署问题如果模型无法正常运行检查docker日志docker logs container_id确保网络连接正常能访问镜像仓库验证CUDA是否正常工作nvcc --version8. 总结通过这篇教程我们完成了从零开始在VMware虚拟机中部署千问3.5-2B模型的完整流程。整个过程虽然步骤较多但每一步都是可控的。使用虚拟机的最大优势是环境隔离你可以放心地进行各种实验而不用担心影响主机系统。实际使用下来VMware虚拟机的性能表现相当不错特别是配合GPU直通后模型推理速度接近原生环境。当然如果遇到性能瓶颈也可以考虑直接在物理机上部署或者使用云GPU服务。建议初次接触的开发者按照教程一步步操作遇到问题时参考常见问题解决部分。熟悉之后你可以尝试优化配置比如调整虚拟机资源分配、尝试不同的Ubuntu版本等找到最适合自己开发需求的配置方案。获取更多AI镜像想探索更多AI镜像和应用场景访问 CSDN星图镜像广场提供丰富的预置镜像覆盖大模型推理、图像生成、视频生成、模型微调等多个领域支持一键部署。