Phi-3.5-mini-instruct部署教程：vLLM服务启动+Chainlit前端访问详解

张

张建站

2026/4/24 15:09:06

10分钟阅读

Phi-3.5-mini-instruct部署教程vLLM服务启动Chainlit前端访问详解1. 模型简介Phi-3.5-mini-instruct 是一个轻量级但功能强大的开源文本生成模型属于Phi-3模型家族。这个模型基于高质量的训练数据构建特别注重推理能力和指令遵循能力。核心特点支持128K超长上下文经过监督微调、近端策略优化和直接偏好优化具备强大的安全措施轻量级设计适合快速部署2. 环境准备2.1 系统要求在开始部署前请确保您的系统满足以下要求操作系统Linux (推荐Ubuntu 20.04或更高版本)Python版本3.8或更高GPU至少16GB显存 (推荐NVIDIA A10G或更高)内存32GB或更高存储空间至少50GB可用空间2.2 依赖安装运行以下命令安装必要依赖pip install vllm chainlit torch transformers3. 使用vLLM部署模型3.1 启动vLLM服务使用以下命令启动vLLM服务python -m vllm.entrypoints.api_server \ --model Phi-3.5-mini-instruct \ --tensor-parallel-size 1 \ --gpu-memory-utilization 0.9参数说明--model指定要加载的模型--tensor-parallel-sizeGPU并行数量--gpu-memory-utilizationGPU内存利用率3.2 验证服务状态服务启动后可以通过以下命令检查日志cat /root/workspace/llm.log如果看到类似以下输出表示服务已成功启动INFO 07-10 15:30:12 llm_engine.py:72] Initializing an LLM engine... INFO 07-10 15:30:15 llm_engine.py:89] Engine created successfully.4. 使用Chainlit创建前端界面4.1 创建Chainlit应用创建一个名为app.py的文件内容如下import chainlit as cl from vllm import LLM, SamplingParams cl.on_chat_start async def on_chat_start(): # 初始化vLLM客户端 llm LLM(modelPhi-3.5-mini-instruct) cl.user_session.set(llm, llm) # 设置默认采样参数 sampling_params SamplingParams(temperature0.7, top_p0.9) cl.user_session.set(sampling_params, sampling_params) await cl.Message(contentPhi-3.5-mini-instruct已准备好请问您有什么问题).send() cl.on_message async def on_message(message: cl.Message): llm cl.user_session.get(llm) sampling_params cl.user_session.get(sampling_params) # 生成响应 output llm.generate([message.content], sampling_params) response output[0].outputs[0].text await cl.Message(contentresponse).send()4.2 启动Chainlit服务运行以下命令启动Chainlit前端chainlit run app.py -w服务启动后默认会在http://localhost:8000提供Web界面。5. 使用指南5.1 访问前端界面打开浏览器访问http://localhost:8000您将看到Chainlit的聊天界面。5.2 与模型交互在输入框中输入您的问题或指令例如请用简单的语言解释量子计算写一篇关于人工智能未来发展的短文帮我总结这篇文章的主要内容模型会生成响应并显示在界面上。5.3 调整生成参数如果需要调整生成参数可以修改app.py中的SamplingParamssampling_params SamplingParams( temperature0.7, # 控制随机性 (0-1) top_p0.9, # 核采样参数 max_tokens512, # 最大生成token数 frequency_penalty0.5 # 频率惩罚 )6. 常见问题解决6.1 模型加载失败问题现象服务启动时报错无法加载模型解决方案检查模型路径是否正确确保有足够的GPU内存尝试降低--gpu-memory-utilization参数值6.2 生成速度慢问题现象响应时间过长解决方案检查GPU利用率减少max_tokens参数值考虑使用更强大的GPU6.3 前端无法访问问题现象浏览器无法打开Chainlit界面解决方案检查服务是否正常运行确认端口未被占用检查防火墙设置7. 总结本教程详细介绍了如何使用vLLM部署Phi-3.5-mini-instruct模型并通过Chainlit创建用户友好的前端界面。这套方案具有以下优势高效推理vLLM提供高性能的模型服务易用界面Chainlit简化了交互过程灵活配置可根据需求调整生成参数通过本教程您应该能够快速搭建起一个功能完整的文本生成服务并开始探索Phi-3.5-mini-instruct的强大能力。获取更多AI镜像想探索更多AI镜像和应用场景访问 CSDN星图镜像广场提供丰富的预置镜像覆盖大模型推理、图像生成、视频生成、模型微调等多个领域支持一键部署。

你还在手动改launch.json？这3行JSON Schema声明让VSCode自动识别容器服务端口并智能映射断点——企业级DevEx提效最后1公里

更多请点击： https://intelliparadigm.com 第一章：VSCode 容器化调试配置的演进与挑战随着云原生开发范式普及，VSCode 通过 Remote-Containers 扩展实现了本地 IDE 与容器运行时的深度集成。早期开发者需手动构建镜像、挂载源码、配置端口转…...

2026/4/24 15:04:22 阅读更多 →

如何10分钟快速搭建Django+React项目：Django React Boilerplate入门教程

如何10分钟快速搭建DjangoReact项目：Django React Boilerplate入门教程【免费下载链接】django-react-boilerplate Django 5, React, Tailwind 4 with Python 3 and Webpack project boilerplate 项目地址: https://gitcode.com/gh_mirrors/dj/django-react-boil…...

2026/4/24 15:04:19 阅读更多 →

让旧款Mac焕发新生：OpenCore Legacy Patcher完全使用指南

让旧款Mac焕发新生：OpenCore Legacy Patcher完全使用指南【免费下载链接】OpenCore-Legacy-Patcher Experience macOS just like before 项目地址: https://gitcode.com/GitHub_Trending/op/OpenCore-Legacy-Patcher 你是否有一台被苹果官方抛弃的老款Mac&a…...

2026/4/24 15:02:20 阅读更多 →

前端三剑客 vs Vue.js：核心区别解析

好的，这是一个关于前端技术的常见问题。我们来理清 HTML CSS JavaScript（通常称为“前端三剑客”）与 Vue.js（一个流行的 JavaScript 框架）之间的区别：核心概念不同HTML CSS JavaScript： 这是…...

2026/4/20 15:14:20 阅读更多 →

【SAP Basis】从SU01出发：深入解析SAP用户账号管理的核心配置与实战

1. SU01入门：SAP用户管理的核心入口第一次接触SAP Basis管理时，我被满屏的事务码搞得晕头转向。直到导师指着SU01说："这是你未来每天都要打交道的老朋友"，我才意识到用户管理的重要性。SU01就像SAP系统的门禁控制台&am…...

2026/4/23 4:18:42 阅读更多 →

AI代码配额管理实战指南：7大行业真实配额模型+3类超限预警SOP（附2026大会未发布白皮书节选）

第一章：AI代码配额管理的范式跃迁与大会使命 2026奇点智能技术大会(https://ml-summit.org) 传统资源配额模型正面临根本性挑战：当大语言模型驱动的代码生成器每秒产出数百行可执行逻辑，静态CPU/内存阈值已无法表征真实开发意图与语义负载。…...

2026/4/20 13:56:02 阅读更多 →

7-Zip终极指南：免费开源的文件压缩神器如何改变你的文件管理方式

7-Zip终极指南：免费开源的文件压缩神器如何改变你的文件管理方式【免费下载链接】7z 7-Zip Official Chinese Simplified Repository (Homepage and 7z Extra package) 项目地址: https://gitcode.com/gh_mirrors/7z1/7z 你是否曾为电脑空间不足而烦恼&…...

2026/4/23 2:47:31 阅读更多 →