1. 项目概述一个为商业分析量身定制的AI提示词库如果你正在商业分析、数据科学或者财务建模的领域里工作最近肯定没少跟各种AI助手打交道。无论是ChatGPT、Claude还是国内的文心一言、通义千问它们确实能帮我们快速生成代码、解释概念甚至写报告。但问题也随之而来当你问出一个泛泛的问题比如“帮我分析一下销售数据”得到的回答往往也是泛泛而谈离真正能用的、专业的商业洞察还差得远。你需要不断地追问、调整、细化你的问题这个过程本身就很耗时而且结果还不一定稳定。这正是“business-science/free-ai-tips”这个开源项目试图解决的问题。它不是一个软件工具而是一个精心整理的、针对商业科学Business Science领域的提示词Prompt集合。简单来说它就像一本为商业分析师、数据科学家和财务人员编写的“AI对话秘籍”。项目作者将他们在实际工作中验证过的高效、精准的提示词模板开源出来涵盖了从数据清洗、探索性分析EDA、时间序列预测、机器学习建模到结果可视化和商业报告撰写的全流程。这个项目的核心价值在于“提效”和“标准化”。它把那些需要反复琢磨、试错才能得到的“完美提问方式”固化下来让你可以直接“抄作业”。无论是新手想快速上手AI辅助分析还是老手希望优化自己的工作流这个提示词库都能提供一个坚实的起点。它背后的逻辑是在AI时代提问的能力即编写提示词的能力可能和解决问题本身的能力同等重要。这个项目正是在降低“有效提问”的门槛。2. 项目核心设计思路如何构建一个高效的商业AI提示词体系2.1 从“任务驱动”到“角色扮演”的范式转换传统的AI使用方式是任务驱动用户提出一个任务AI尝试完成。但在商业分析这种专业领域这种模式效率低下。free-ai-tips项目采用了一种更高级的范式角色扮演Role-Playing和上下文构建Context Building。项目中的绝大多数提示词模板第一步都是为AI定义一个明确的、专业的角色。例如不是直接说“分析数据”而是说“你现在是一名拥有10年经验的高级数据分析师专注于零售行业的销售预测。你的客户是一家跨国快消品公司他们提供了过去5年的周度销售数据。” 这个简单的步骤瞬间将AI从一个通用的文本生成器转变为一个具有领域知识和特定目标的“虚拟同事”。这种设计的背后有深刻的道理。大型语言模型LLM本质上是一个基于概率的文本续写引擎它的输出质量极度依赖于输入上下文Prompt的质量和丰富度。通过赋予其一个具体的角色我们实际上是在“激活”模型参数中与该角色相关的知识图谱和行为模式。一个被设定为“财务分析师”的AI会更倾向于使用财务术语、关注利润率、现金流等指标而被设定为“市场营销专家”的AI则会更关注转化率、客户细分和渠道效果。2.2 结构化提示词Structured Prompt的四大核心模块浏览free-ai-tips仓库你会发现高质量的提示词并非随意的一段话而是遵循一个清晰的结构。这个结构通常包含以下四个模块这也是我们自己编写专业提示词时可以借鉴的框架角色与背景Role Context如上所述这是定向的“启动器”。它设定了对话的基调和边界。任务目标Objective清晰、具体、可衡量的任务描述。避免使用“分析一下”、“看看有什么问题”这种模糊表述。应使用类似“识别出导致2023年Q4华东地区销售额环比下降15%的三个最主要因素并按重要性排序”这样的SMART原则描述。约束与要求Constraints Requirements这是确保输出符合专业规范的关键。包括输出格式要求以Markdown表格、JSON、特定结构的报告等形式输出。操作步骤要求AI逐步思考Chain-of-Thought或先列出计划再执行。内容禁忌明确说明不需要哪些内容例如“不需要解释基础统计概念”。工具与库指定使用的编程语言和库如“使用Python的pandas和plotly”。输入信息Input提供必要的“燃料”。这可能是粘贴的数据片段、数据的描述列名、数据类型、相关业务背景等。对于代码生成类提示这部分尤其重要。注意在实际与AI对话时我们往往是在一个连续的会话中。free-ai-tips中的许多模板是“一次性”的完美提示。但在真实场景中更有效的策略是“渐进式上下文构建”先发送一个包含角色和背景的提示建立对话基础再逐步提供数据和具体任务。项目中的模板可以拆解使用作为每一次交互的“高质量输入块”。2.3 领域垂直化为什么通用的提示词不够用市面上有很多“100个顶级ChatGPT提示词”之类的合集但free-ai-tips专注于“商业科学”这个垂直化选择是其成功的关键。商业分析有自己的行话、固定流程如CRISP-DM、关键指标KPI、ROI、CAC和常用模型线性回归、随机森林、ARIMA。一个通用的“数据清洗”提示词可能只会让AI生成一些df.dropna()这样的基础代码。而一个垂直领域的提示词会这样写“假设你是一名数据工程师正在处理电商交易数据。数据包含order_id,user_id,product_id,quantity,price,order_date字段。已知price字段中存在负数和零的异常值user_id有少量重复。请生成Python代码使用pandas完成以下清洗步骤1. 将负数和零的price替换为该product_id的历史中位数2. 基于order_id和user_id删除完全重复的记录3. 将order_date转换为datetime类型并设为索引。请为每一步添加简要注释。”后者产生的代码直接可用且考虑了业务逻辑用产品历史中位数替代异常值而不是简单删除。这种深度源于提示词编写者对领域问题的深刻理解。3. 核心内容解析五大商业分析场景的提示词实战free-ai-tips项目的内容通常按场景分类。我们来深入拆解几个最核心的商业分析场景看看一个优秀的提示词是如何构成的以及我们在使用时该如何调整。3.1 场景一探索性数据分析与自动化报告这是商业分析的起点。一个典型的EDA提示词模板可能如下你是一位擅长数据可视化与洞察提炼的数据分析师。我将给你一份数据集的基本描述。你的任务是执行一次探索性数据分析EDA并生成一份简洁的摘要报告。 数据集描述 - 名称月度销售业绩 - 列month (YYYY-MM), region (字符串North, South, East, West), sales_rep (销售代表姓名), product_category (字符串A, B, C), revenue (浮点数单位万元), cost (浮点数单位万元), new_customer_count (整数) - 时间范围2022-01 至 2023-12 - 已知问题cost列在2022年部分月份有缺失。 请按以下步骤操作 1. 首先提出5个你认为针对此数据集最重要的业务问题例如哪个区域利润增长最快哪个产品类别贡献了主要收入。 2. 然后模拟进行数据分析无需真实计算描述你将如何做针对每个业务问题说明你会使用哪种可视化图表如折线图、堆叠柱状图、热力图和关键计算指标如环比增长率、毛利率、客户获取成本。 3. 最后基于你的分析思路生成一个虚构的、结构化的分析结果摘要用Markdown表格呈现包含“关键发现”、“支持数据/图表”、“业务建议”三列。 请确保你的思考过程专业并直接给出最终的报告摘要表格。使用心得与调整技巧数据脱敏与模拟这个提示词的巧妙之处在于它不要求你提供真实数据而是基于数据描述进行“模拟分析”。这在数据敏感或尚未获取完整数据时非常有用可以提前规划分析思路。从问题出发强制AI先思考“业务问题”确保了分析的目的性避免陷入无意义的统计计算。为我所用在实际工作中我们可以将AI生成的这个“分析计划”作为我们自己真实EDA的蓝图。我们可以用真实数据去执行它建议的计算和图表效率大大提升。3.2 场景二时间序列预测与异常检测对于销售预测、需求计划等工作时间序列分析是核心。一个预测类提示词可能这样设计角色你是一名经验丰富的需求预测专家。 任务基于提供的历史周度销售额数据构建一个预测模型预测未来8周的销售额并识别历史数据中的异常点。 数据示例格式 df pd.DataFrame({ week: [2023-01-02, 2023-01-09, ...], # 周一开始的日期 sales: [120.5, 135.2, ...] # 销售额单位千 }) 约束与要求 1. 使用Python主要库为pandas, statsmodels, scikit-learn。 2. 代码必须包含完整流程数据准备处理日期索引、检查平稳性、模型选择与理由例如为什么选择SARIMA而非简单指数平滑、模型训练、未来8周预测。 3. 输出必须包括 a) 清晰的代码块包含必要的注释。 b) 对历史数据异常点的描述如使用滚动标准差法检测到的异常周及其销售额。 c) 未来8周的预测值表格以及预测图可描述图表要素。 d) 用一两句话说明模型的主要假设和局限性。 4. 请逐步思考先列出你的分析步骤再生成代码。实操要点指定库与流程明确要求使用statsmodels等专业库并规定流程这能防止AI生成过于简陋或学术化的代码。它通常会生成包含ADF检验平稳性、auto_arima自动参数搜索等专业步骤的代码。索取解释要求AI说明模型选择理由和局限性这不仅能帮助我们理解其输出更能让我们学习到模型选型的考据点。例如它可能会指出“由于数据表现出明显的年度季节性因此选择了包含季节性分量的SARIMA模型”。异常检测集成将预测与异常检测结合在一个提示中非常符合实际业务场景。我们既关心未来会怎样也关心过去哪些点不正常。3.3 场景三客户细分与聚类分析市场营销和客户运营中客户细分是基础。一个聚类分析的提示词模板假设你是客户数据分析团队的科学家。现有客户数据集包含以下特征recency最近一次购买距今周数 frequency过去一年购买次数 monetary过去一年总消费金额 age_group年龄段 channel主要购买渠道App/Web/Store。 你的目标是使用无监督学习对客户进行分群以支持精准营销。 请完成 1. 数据预处理计划针对RFMRecency, Frequency, Monetary数据你会进行何种标准化或缩放处理为什么例如由于monetary量纲远大于frequency必须使用StandardScaler。 2. 聚类算法选择对比K-Means、DBSCAN和层次聚类在此场景下的优缺点并给出你的选择建议及理由。 3. 确定最佳簇数描述你将如何使用手肘法Elbow Method和轮廓系数Silhouette Score来确定最佳的K值。 4. 生成Python代码框架写出从数据加载、预处理、到应用你所选算法并进行评估的完整代码框架。用注释占位符# TODO代替实际的数据加载部分。 5. 分群业务解读假设最终得到4个簇请为每个簇拟一个业务名称如“高价值活跃用户”、“沉睡流失用户”并描述其典型特征。 请以专业报告的形式组织你的回答。避坑指南强调预处理RFM分析中不同指标的量纲和分布差异巨大预处理是关键。提示词明确要求AI讨论这一点避免了直接使用原始数据导致聚类结果被monetary主导的问题。框架而非成品要求生成“代码框架”并用# TODO标注这是一种非常实用的做法。AI擅长提供结构和逻辑但具体的数据路径、参数微调需要分析师根据实际情况完成。这实现了人机协作的最佳平衡。业务落地最后一步的“业务解读”是点睛之笔迫使分析结论与商业动作挂钩避免了“为聚类而聚类”。3.4 场景四A/B测试结果分析与解读产品、运营和营销团队经常进行A/B测试。如何正确解读结果至关重要。一个A/B测试分析的提示词你是一名数据科学家负责评估一次网站登录页改版Version B对比旧版Version A的A/B测试结果。测试目标是提升注册转化率。 测试数据摘要 - 对照组A访问量 10,000 注册数 500 - 实验组B访问量 10,200 注册数 550 - 测试周期两周 请执行以下分析 1. 计算两组的基础转化率。 2. 执行双样本比例假设检验Z检验。计算Z统计量和P值。 3. 在95%置信水平下判断改版B是否带来了统计上显著的提升。 4. 计算提升幅度绝对提升和相对提升百分比。 5. **进阶**考虑到测试周期只有两周可能存在哪些未被观察到的混杂变量例如季节性波动、同期其他营销活动这些因素会如何影响你对结果的信心 6. 给出你的结论和建议是否应该全量发布B版本下一步应该做什么 请分步骤展示计算过程可写公式并给出最终结论。使用scipy.stats进行检验。核心价值标准化分析流程这个提示词模板确保每次分析A/B测试都遵循严谨的统计流程防止团队仅凭“感觉”或“绝对数”下结论。引入统计思维要求计算P值、置信区间这是数据驱动决策的核心。AI生成的回答会清晰地展示计算过程如使用scipy.stats.norm.ppf计算Z临界值scipy.stats.proportions_ztest执行检验这对于不常做统计分析的同事是很好的教育材料。考虑业务复杂性第5点要求思考“混杂变量”这是资深分析师和初级分析师的差距所在。AI能基于常见模式给出提醒如“新奇效应”、“季节性”促使我们更审慎地看待结果。3.5 场景五自动化商业报告撰写将分析结果转化为高层能看懂的报告是最后一公里。一个报告生成提示词角色你是战略分析部的负责人需要向公司CEO和CFO汇报季度业务表现。 输入以下是一组关键业务指标KPI的摘要数据虚构。 任务撰写一份不超过一页的Executive Summary执行摘要。 KPI数据 - 总收入Q1为1.2亿元Q2为1.35亿元。 - 毛利率Q1为45%Q2为48%。 - 新客户获取数Q1为1.2万Q2为1.5万。 - 客户留存率Q1为75%Q2为78%。 - 主要增长驱动力根据内部分析Q2增长主要来自华东地区线上渠道和新产品线X的推出。 - 主要风险点原材料成本在Q2末有上升趋势市场竞争加剧。 要求 1. 结构清晰包含本期亮点、核心指标趋势、增长驱动因素分析、关键风险与挑战、下季度重点建议。 2. 语言精炼、专业、积极但客观。避免技术术语使用商业语言。 3. 重点突出将最重要的成就如毛利率提升和最需关注的风险放在前面。 4. 在“下季度重点建议”部分提出的建议必须与前面分析的风险和驱动因素直接相关。 5. 以纯文本形式输出无需Markdown格式。经验之谈定义读者明确报告是给“CEO和CFO”看的这决定了语言的层次和内容的侧重点关注财务指标、战略风险和高层建议。数据到叙事提示词不仅要求罗列数据更要求构建“叙事”——分析驱动因素、识别风险、提出建议。这引导AI进行逻辑串联而不是简单复述。模板化与灵活性它提供了一个坚固的报告结构模板但具体内容由输入的KPI数据驱动。我们可以每次替换数据部分快速生成不同周期、不同业务单元的报告草稿极大提升效率。4. 如何高效使用与贡献超越“复制粘贴”4.1 本地化与个性化调整直接复制项目中的提示词使用效果可能只有60%。剩下的40%在于本地化调整。替换领域术语如果项目中的例子是“零售销售”而你是“SaaS订阅”需要把revenue收入换成MRR月度经常性收入把product_category产品类别换成plan_tier套餐等级。调整输出格式项目可能要求输出Markdown但你的公司习惯用Google Slides或PPT。可以在提示词末尾加上“请将以上分析结论组织成5页PPT的演讲要点每页一个主题”。集成内部上下文将你公司的特定业务逻辑、数据字典、常用指标计算公式作为“输入信息”的一部分喂给AI。例如“请注意我司定义的‘活跃用户’是指过去30天内登录次数≥3次的用户。”迭代优化将AI的第一次输出作为下一次提问的起点。如果它对某个指标的计算方式不符合你的要求直接指出“你刚才计算毛利率的方式是(revenue-cost)/revenue但我司成本中不包含营销费用。请根据‘毛利润营收-直接产品成本’重新计算。”4.2 构建你自己的提示词库free-ai-tips是一个绝佳的起点和灵感来源。我强烈建议你在工作中开始建立自己的、个性化的提示词库。具体做法工具选择可以用简单的文本文件、Notion数据库、Obsidian笔记或者专门的提示词管理工具如Anthropic的Claude Desktop自带提示词库功能。分类标准可以按流程分数据获取、清洗、分析、可视化、报告也可以按业务场景分销售分析、用户增长、财务预测、风险监控还可以按AI工具分ChatGPT代码解释器专用、Claude长文档分析专用。记录元信息为每个提示词模板添加描述、适用场景、上次使用时间、效果评分1-5星以及一个“最佳输出示例”。这能帮你快速找到最有效的那个。版本管理像管理代码一样管理你的提示词。当你优化了一个提示词使其效果更好时保留旧版本并注释改进原因。4.3 向开源项目贡献如果你在使用过程中针对某个特定场景比如“用机器学习预测客户流失”或“分析社交媒体情感与股价关联”打磨出了一个效果极佳的提示词模板可以考虑向原项目提交Pull RequestPR。贡献时请注意格式规范遵循项目已有的文件结构和命名约定。提供示例除了提示词本身最好能提供一个简短的输入示例和预期的输出示例方便他人理解。清晰描述在提交信息中说明这个提示词解决什么问题适用于什么场景。通用性尽量让提示词具有一定的通用性而不是绑定在你公司特有的数据格式上。5. 常见陷阱与进阶技巧5.1 使用提示词库时的三个常见陷阱盲目信任缺乏校验这是最大的风险。AI可能生成看似合理但完全错误的代码或分析。例如在时间序列预测中它可能错误地处理了日期索引导致预测偏移。务必对AI生成的代码先用小样本数据或你知道结果的示例数据测试。对AI得出的结论用你的业务常识和基础统计知识进行交叉验证。提示词过长焦点丢失为了追求全面把角色、任务、约束、示例、数据全塞进一个提示词可能导致AI无法抓住重点或者因超过上下文窗口而遗忘前半部分。策略拆分成多轮对话。第一轮设定角色和背景第二轮提供数据第三轮提出具体任务。利用好AI的“记忆”功能。忽视AI的“幻觉”与不确定性AI会自信地给出它不确定的答案。它可能“编造”一个不存在的统计方法或引用一个错误的数据源。应对在提示词中明确要求“如果你不确定请说明”或“请只基于我提供的信息进行分析不要引入外部假设”。对于关键结论可以要求AI提供其推理的引用来源在代码中就是注释在分析中就是逻辑步骤。5.2 让AI成为“思考伙伴”的进阶技巧当你熟练使用基础提示词后可以尝试以下进阶模式让AI从“执行者”变为“协作者”“给我三个选项”模式当面临方案选择时不要问“该怎么做”而是问“针对XXX问题请给我三种不同的解决方案并列出每种方案的优缺点和适用条件”。这能拓宽你的思路。“挑战我”模式在让AI执行分析前先问“如果我要分析XXX我的分析计划是1…2…3…。请你以资深专家的身份审视我的计划指出其中的漏洞、潜在偏见或遗漏的关键步骤。”这能帮你完善分析框架。“解释给我听”模式当AI生成一段复杂的代码或一个复杂的结论时追加提问“请用通俗易懂的语言向一个非技术背景的业务经理解释第X行代码的作用/这个结论意味着什么”。这不仅能加深你的理解还能直接获得向他人汇报的素材。business-science/free-ai-tips这个项目其价值远不止于那几百个提示词文本。它更像一个路标指向了一种新的工作范式将人类的领域知识、批判性思维和AI的快速生成、模式识别能力深度融合。真正的效率提升不在于找到了一个“万能提示词”而在于你通过学习和实践这些范例内化了与AI高效协作的思维模式。最终最强大的提示词库是你自己经过无数次迭代、充满你个人经验和业务理解的那一个。从这个开源项目出发开始构建属于你自己的“第二大脑”工作流吧。