一、实验背景1. 实验目的本次实验我将通过助睿平台完成订单利润分流的 ETL 流程主要目标是掌握 ETL抽取、转换、加载的完整流程与核心概念学会使用助睿平台的零代码组件完成数据关联、计算与分流实现订单明细表与产品信息表的关联计算订单利润并按盈利 / 亏损分流导出2. 实验环境本次实验使用助睿数智平台完成登录地址为 https://lab.guilian.cn/。实验数据为平台提供的公共数据源订单明细表business_anaylsis.order_detail产品信息表business_anaylsis.product3. 整体处理流程本次实验的处理逻辑为读取两张表数据 → 通过产品 ID 关联数据 → 计算订单利润 → 按利润正负分流 → 导出盈利与亏损订单 Excel 文件。二、实验步骤Step 1登录平台并创建项目本次实验我首先登录了助睿平台在个人空间新建了名为 “订单利润分流分析” 的项目为后续数据源同步和转换创建做准备。Step 2同步实验数据源在项目的元数据管理模块我右键添加了平台的公共数据源同步了实验所需的两张数据表business_anaylsis.order_detail和business_anaylsis.product并确认两张表的字段完整、数据可正常预览。Step 3新建转换并搭建组件骨架我在项目资源库中新建了名为 “订单利润分流处理” 的转换即 ETL 任务并从左侧组件面板拖拽了以下组件到画布中2 个表输入组件1 个记录集连接组件1 个字段选择组件1 个过滤记录组件2 个 Excel 输出组件我按照数据流向连接了组件整体链路为表输入订单明细表表输入产品信息表→记录集连接→字段选择→过滤记录→Excel输出盈利订单、Excel输出亏损订单Step 4逐个配置核心组件4.1 表输入组件配置我双击 “订单明细表_表输入” 组件选择了已同步的business_anaylsis.order_detail数据源点击 “获取 SQL 查询语句” 自动生成读取语句同理配置了 “产品信息表_表输入” 组件读取business_anaylsis.product表确保两张表的数据读取路径正确。4.2 记录集连接组件配置这一步我配置了两张表的关联规则第一步选择 “订单明细表_表输入”第二步选择 “产品信息表_表输入”连接类型选择LEFT OUTER JOIN以确保所有订单数据不丢失连接条件点击 “获取连接字段”自动匹配product_id字段删除其他冗余连接字段仅保留订单表的product_id与产品表的id字段作为关联键在配置过程中我发现左外连接可以有效避免因产品信息缺失导致的订单数据丢失这和 SQL 中的 JOIN 逻辑是一致的。4.3 字段选择组件配置关联后两张表的product_id字段出现了重复我使用字段选择组件的 “移除字段” 模式删除了产品表中重复的product_id字段同时去除了其他无用字段简化了后续数据处理。4.4 过滤记录组件配置在数据中生成利润字段后我配置了过滤记录组件的分流规则过滤条件设置为利润 0满足条件的数据流向 “盈利订单_Excel 输出” 组件不满足条件的数据流向 “亏损订单_Excel 输出” 组