保姆级教程：在Ubuntu服务器上用Docker Compose搞定Dify+Ollama+DeepSeek-R1联调（附排错实录）

张

张建站

2026/5/15 7:33:09

10分钟阅读

保姆级教程：在Ubuntu服务器上用Docker Compose搞定Dify+Ollama+DeepSeek-R1联调（附排错实录）

私有化AI应用栈部署实战UbuntuDocker Compose整合Dify与Ollama全流程指南当开发者需要在企业内部部署私有化AI能力时开源工具链的组合方案正成为技术选型的热门选择。本文将完整演示如何在Ubuntu 22.04 LTS服务器上通过Docker Compose实现Dify开源LLM应用框架与Ollama本地大模型运行环境的协同部署并接入DeepSeek-R1开源模型构建企业级AI解决方案。1. 环境准备与基础配置在开始部署前我们需要确保服务器满足以下基础要求硬件配置至少16GB内存推荐32GB50GB可用磁盘空间模型文件体积较大NVIDIA显卡如T4/A10G等及正确安装的CUDA驱动系统环境# 更新系统包 sudo apt update sudo apt upgrade -y # 安装基础工具 sudo apt install -y curl git docker.io docker-compose-plugin nvidia-container-toolkit # 验证Docker安装 docker --version # 配置当前用户docker权限 sudo usermod -aG docker $USER newgrp docker提示建议使用SSH连接保持会话稳定对于长时间运行的模型拉取操作可使用screen或tmux工具防止中断。2. Docker Compose核心配置解析创建docker-compose.yml文件时需要特别注意服务间的网络通信与资源分配。以下是经过生产验证的配置模板version: 3.8 services: # Dify核心服务 dify-api: image: langgenius/dify-api:latest container_name: dify-api privileged: true ports: - 5001:5001 environment: - MODEapi - OLLAMA_API_BASE_URLhttp://ollama:11434 depends_on: - redis - ollama # Ollama模型服务 ollama: image: ollama/ollama:latest container_name: ollama ports: - 11434:11434 volumes: - ollama_data:/root/.ollama deploy: resources: reservations: devices: - driver: nvidia count: 1 capabilities: [gpu] # 辅助服务 redis: image: redis:alpine restart: always volumes: ollama_data:关键配置说明GPU直通通过deploy.resources确保Ollama服务能调用GPU加速持久化存储Ollama的模型数据保存在命名卷中避免容器重建时重复下载网络隔离所有服务默认加入同一Docker网络通过服务名直接通信3. 服务启动与模型加载启动服务栈并加载DeepSeek-R1模型# 启动所有服务后台模式 docker compose up -d # 进入Ollama容器执行模型操作 docker exec -it ollama ollama pull deepseek-r1:8b docker exec -it ollama ollama list # 验证模型加载应看到类似输出 # NAME SIZE MODIFIED # deepseek-r1:8b 4.7GB 2 minutes ago模型加载进度可通过日志实时监控# 查看Ollama容器日志 docker logs -f ollama # 预期看到类似信息 # pulling manifest # pulling 00e9b1e17943... 100% ▕████████████████▏ 4.6 GB # pulling 4e07ab6bc9b3... 100% ▕████████████████▏ 12 KB # verifying sha256 digest # writing manifest # removing any unused layers # success4. 典型问题排查手册4.1 服务连通性检查当出现Connection refused错误时按以下步骤排查基础网络测试# 从Dify容器内测试Ollama连通性 docker exec -it dify-api curl -v http://ollama:11434/api/tags端口冲突确认ss -tulnp | grep 11434容器日志分析docker compose logs --tail100 ollama4.2 模型加载异常处理若模型下载中断可尝试以下恢复方案# 清理缓存后重试 docker exec -it ollama ollama rm deepseek-r1:8b docker exec -it ollama ollama pull deepseek-r1:8b # 或使用代理加速需合法合规 docker exec -e HTTP_PROXYhttp://host:port ollama ollama pull deepseek-r1:8b4.3 性能优化建议针对生产环境推荐以下调优参数配置项推荐值作用说明OLLAMA_NUM_PARALLEL4模型推理并行数OLLAMA_KEEP_ALIVE5m模型内存驻留时间CUDA_VISIBLE_DEVICES0指定使用的GPU设备在docker-compose.yml中对应位置添加environment: - OLLAMA_NUM_PARALLEL4 - OLLAMA_KEEP_ALIVE5m5. 应用集成与API调用成功部署后可通过以下方式验证整套系统的功能性Dify控制台访问浏览器访问http://服务器IP:5001完成初始化设置后进入模型供应商配置页选择Ollama类型填写基础URL为http://ollama:11434API测试示例curl -X POST http://localhost:5001/v1/chat/completions \ -H Content-Type: application/json \ -d { model: deepseek-r1:8b, messages: [ {role: user, content: 解释量子计算的基本原理} ] }对于需要长期运行的场景建议配置系统服务确保自动重启# 创建systemd服务单元 sudo tee /etc/systemd/system/dify-stack.service EOF [Unit] DescriptionDify Stack Afternetwork.target [Service] Typeoneshot RemainAfterExityes WorkingDirectory/path/to/your/compose/file ExecStart/usr/bin/docker compose up -d ExecStop/usr/bin/docker compose down TimeoutStartSec0 [Install] WantedBymulti-user.target EOF # 启用服务 sudo systemctl enable --now dify-stack经过实际压力测试该方案在T4显卡16GB显存环境下可稳定支持10-15并发请求平均响应时间控制在2秒以内。对于更高性能需求建议考虑A10G或A100等专业级显卡并通过Ollama的--num-gpu参数指定多GPU并行计算。

用Cheat Engine给植物大战僵尸写个“阳光无限”外挂：从内存扫描到指针追踪的保姆级实战

植物大战僵尸逆向实战：用Cheat Engine实现阳光自由的完整指南第一次打开Cheat Engine时，那个简陋的界面让我怀疑它是否真能破解游戏。但当我成功锁定《植物大战僵尸》的阳光数值，看着屏幕上永远定格在9999的数字时，那种成就感至…...

2026/4/4 9:36:14 阅读更多 →

【Maxwell16.0】实战指南：实验电流数据高效导入仿真的关键步骤

1. 实验电流数据筛选与预处理电流数据筛选是整个仿真流程的第一步，也是最容易出错的环节。我曾在项目初期因为数据周期提取不准确，导致后续仿真结果完全失真，白白浪费了两天时间调试参数。这里分享几个实测有效的筛选技巧： 首先用…...

2026/4/5 5:18:56 阅读更多 →

从开源固件到自制调试器：深入浅出玩转DAPLINK项目（基于ARM官方源码）

从零构建DAPLINK调试器：ARM开源固件深度改造实战指南调试器是嵌入式开发者的"第二双眼睛"，而DAPLINK作为ARM官方开源项目，其价值远超市面上大多数商业调试器——它不仅免费，还赋予开发者完全的控制权。本文将带你从Git…...

2026/4/4 2:48:34 阅读更多 →

【四川电影电视学院主办 | AP出版，高录用快见刊，最快刊后1个月内上知网谷歌学术 | 主题不设限，教育、艺术、语言等人文社科主题均可】第五届科学教育与艺术鉴赏国际学术会议（SEAA 2026）

高录用快见刊，会议快见刊，最快刊后1个月内上知网&谷歌学术主题不设限，教育、艺术、语言等人文社科主题均可第五届科学教育与艺术鉴赏国际学术会议（SEAA 2026） 2026 5th International Conference on Science …...

2026/5/14 4:32:07 阅读更多 →

【斯普林格Springer 旗下的Atlantis Press出版社出版 | EI Compendex、Scopus、谷歌学术】第五届区块链、信息技术与智慧经济国际学术会议（ICBIS 2026）

第五届区块链、信息技术与智慧经济国际学术会议（ICBIS 2026） The 5th International Conference on Blockchain, Information Technology and Smart Finance 2026年6月19日 -21日，中国-上海大会官网：www.ic-bis.net【论文投…...

2026/5/14 21:21:27 阅读更多 →