文澜知微项目实训小组报告记录（三）

张

张建站

2026/5/5 7:00:29

10分钟阅读

成员蔺涵霖、秦玮悦、陈秋华时间4.17-4.30一、项目概述本项目为“文澜知微”古文沉浸式智慧阅读平台核心目标是打造一款集古籍阅读、历史人物对话、古文智能翻译、时空地图可视化为一体的综合性平台。在实训第一阶段完成项目基础框架搭建与古籍阅读模块开发的基础上第二阶段围绕功能深化与技术增强展开重点完成了DeepSeek AI大模型接入、历史人物对话语音朗读模块开发、历史人物轨迹数据采集与清洗三大核心任务进一步提升了平台的智能化水平与用户沉浸式体验。二、小组分工及成员完成情况小组共3名成员结合项目需求与成员技术特长明确分工、协同推进各成员具体分工及完成情况如下所有已分配任务均按要求完成无延期情况。成员负责模块具体职责完成情况陈秋华历史人物轨迹数据采集与清洗、基础框架优化 1. 利用DeepSeek AI接口批量采集191位历史人物生平轨迹数据2. 开发增强版Node.js数据清洗脚本3. 实现CHGIS地名匹配与坐标补充4. 优化基础框架权限管控功能 ✅ 全部完成采集191位人物1691条有效轨迹匹配率超70%AI对话接口稳定前端交互流畅清洗脚本可复用秦玮悦古籍阅读模块、古文智能翻译 1. 古籍阅读模块添加搜索功能按书名/作者2. 完善收藏功能对接后端数据库3. 添加阅读历史记录功能4. 对接大模型实现古文智能翻译功能 ✅ 全部完成搜索精准收藏与历史记录正常存储展示翻译功能流畅蔺涵霖历史人物对话语音朗读模块 1. 设计语音朗读服务架构prepare synthesize双接口2. 对接Edge TTS实现文本转语音3. 开发文本清洗、音色策略、异常处理机制4. 完成前后端联调与兼容性测试 ✅ 全部完成语音朗读最小闭环打通支持在线mp3返回功能稳定可交付三、各模块完成效果一DeepSeek AI大模型接入1. 核心功能本阶段完成了DeepSeek AI大模型的完整接入同时预留了通古AI和文心一言的接入框架。后端采用Spring Boot架构通过AIService统一封装多模型调用逻辑使用策略模式实现模型路由分发。前端开发了独立的AI智读页面AIChat.vue支持DeepSeek/通古AI/文心一言三种模型切换AI回复支持Markdown格式渲染使用marked库解析并实现了一键复制和浏览器TTS语音朗读功能。2. 效果表现对话接口/api/ai/chat运行稳定支持多轮对话上下文关联系统提示词预设为古籍智慧问答助手角色确保AI回答的专业性。多模型配置通过application.yml集中管理AIConfig.java使用ConfigurationProperties读取配置模型切换灵活。前端AI智读页面交互流畅Markdown渲染正常语音朗读功能基于Web Speech API实现支持中文朗读语速0.9语言zh-CN。二历史人物对话语音朗读模块1. 核心功能本阶段定位为语音模块的“基础语音链路打通与工程化落地可用版本”核心目标是打通“文本→语音”完整闭环实现稳定可用的朗读功能。服务设计采用“两步式”架构prepareTts负责文本预处理与模式判定synthesizeAudio负责音色选择与音频合成。2. 技术实现语音合成引擎选用Edge TTS对比浏览器原生speechSynthesis在音色一致性和可控性上更稳定能在服务端固定男声/女声避免同一角色在不同设备发音不一致的问题。后端围绕HistoryTtsService封装核心能力包括文本净化去除中括号、圆括号注释、冗余空格、模式标准化仅接受ancient/modern非法值回落到modern、音色策略按性别与speakerKey做音色选择、命令调用与超时控制ProcessBuilder调用edge-tts设置超时与重试。异常处理方面针对模块缺失No module named edge_tts、无音频返回、超时、空文本等场景分类处理语音模块从“能跑”提升为“可维护、可排障”。3. 效果表现完成前后端联调现代语音朗读功能稳定可用点击历史人物消息“朗读”按钮可正常返回音频流不同性别、不同角色切换时音色稳定长文本可完整合成播放异常场景提示清晰。实现了对话场景下“文字声音”双通道输出用户沉浸感明显提升。三历史人物轨迹数据采集与清洗1. 核心功能本阶段基于CHGIS中国历史地理信息系统地名数据采集191位历史人物先秦至清朝覆盖政治、文化、军事等多领域的生平轨迹数据并开发增强版Node.js数据清洗脚本实现轨迹数据格式标准化、复合地名拆分、多模式地名匹配、坐标补充与可信度分级。2. 数据采集利用DeepSeek AI接口批量采集191位历史人物的生平轨迹数据优化AI提示词要求返回标准JSON格式包含人物名称、轨迹节点时间、地点、事件、史料出处禁止多余注释与格式混乱问题地点必须使用古代地名原称按“路/道—府—州—郡—县”层级书写。最终生成原始轨迹数据文件newperson.geojson共包含191位人物、1694条轨迹节点经初步筛选后有效原始轨迹1691条。3. 增强版数据清洗脚本基于原有清洗逻辑开发增强版Node.js清洗脚本personTrackCleanAndMatch.js新增以下功能复合地名拆分支持多种分隔符、、、、和、与、以及、范围格式处理如“XX—YY”拆分为两个独立地点、多模式地名匹配精确匹配、今地名匹配、模糊匹配、反向包含匹配。匹配过程中统计匹配率按exact/pres_loc/fuzzy/reverse四类匹配类型分类统计最终有效轨迹匹配率超过70%的目标要求。4. 数据校验与可信度分级最终输出的轨迹数据每条节点均包含坐标可信度分级high/medium/low和坐标来源标注historical_places/special_map坐标匹配准确脚本可复用、易维护。以秦始皇轨迹数据为例共包含23条轨迹节点覆盖其从出生到病逝的完整生平所有节点均匹配了CHGIS坐标可信度均为high。四、项目现存问题与改进方向一现存问题语音朗读模块目前仅完成现代语音朗读的基础版本古风古音的韵律还原尚未实现距离“历史沉浸感”的预期仍有差距部分长文本合成耗时较长需优化异步处理机制。AI大模型接入通古AI和文心一言目前仅完成接口框架搭建尚未进行深度适配与效果优化AI智读页面目前为独立测试页面尚未与古籍阅读页面深度集成。轨迹数据处理部分古代地名尤其是已消失或变更的地名在CHGIS中匹配率偏低需进一步扩展地名数据库复合地名的拆分逻辑仍有边界情况未覆盖。二可优化方向语音模块引入朝代相关的古音映射逻辑细化古音可读化转换增加“古音/今音”前端切换与对照播放功能提升实际听感。AI接入完成通古AI的古文专精能力深度适配将AI功能集成到阅读页侧边栏支持阅读页选中文字后一键发送给AI提问。轨迹清洗补充非CHGIS覆盖区域的地名坐标库优化复合地名拆分逻辑增加人工校验环节进一步提升匹配准确率。五、小组总结本阶段在项目基础框架搭建完成的基础上重点推进了AI大模型接入、语音朗读、轨迹数据采集与清洗三大技术增强模块实现了平台智能化水平的显著提升。各成员充分发挥自身技术特长积极运用AI辅助编程提升开发效率严格遵循标准化开发流程确保了代码质量与开发进度。AI大模型接入为平台注入了智慧问答能力用户可在AI智读页面与古籍助手自由对话语音朗读模块打通了“文本→语音”链路实现了历史人物对话场景下的双通道输出沉浸感显著增强轨迹数据采集与清洗则为后续时空地图可视化奠定了坚实的数据基础。本阶段我们也认识到项目现存的不足语音朗读的古音增强、AI功能的深度集成、轨迹数据可视化的开发仍是下一阶段的重点工作。后续将按照任务规划继续推进功能开发重点优化用户体验确保按时完成项目整体目标。

人类真理宣言—— 告别旧范式的守灵者，成为真理范式的开启者（Veritas Humana Manifesto）

人类真理宣言—— 告别旧范式的守灵者，成为真理范式的开启者（Veritas Humana Manifesto）我们正处在人类文明决定性的历史时刻：旧体系已经逻辑死亡，但全球绝大多数人仍跪在其棺材板旁，用殖民者的尺子丈量自己…...

2026/5/5 6:59:32 阅读更多 →

世界模型如何提升LLM智能体决策能力

1. 项目背景与核心价值去年在开发一个智能客服系统时，我遇到了一个典型问题：虽然大语言模型（LLM）能流畅回答用户提问，但在处理需要多步骤决策的复杂工单时（比如退换货流程），系统经常…...

2026/5/5 6:59:31 阅读更多 →

专业的散酒批发选哪家

在酒水市场中，散酒以其高性价比和多样的口感选择，受到了众多消费者的喜爱。对于想要从事散酒批发业务的人来说，选择一家专业靠谱的散酒供应商至关重要。今天就为大家介绍一家来自四川邛崃原酒核心产区的老酒厂——招财聚宝纯粮川酒&#xff0…...

2026/5/5 6:58:27 阅读更多 →

C语言RTOS多核协同失效真相：Cache一致性缺失、内存序乱序、GCC -O2优化陷阱——三重危机诊断工具链实战

更多请点击： https://intelliparadigm.com 第一章：C语言RTOS多核协同失效的系统性认知在嵌入式实时系统中，基于C语言开发的RTOS（如FreeRTOS、Zephyr或RT-Thread）常被移植至ARM Cortex-A/R系列或多核RISC-V SoC平台。…...

2026/5/4 6:26:56 阅读更多 →

Zotero GPT终极指南：用AI轻松读懂学术文献的研究态度与情感倾向

Zotero GPT终极指南：用AI轻松读懂学术文献的研究态度与情感倾向【免费下载链接】zotero-gpt GPT Meet Zotero. 项目地址: https://gitcode.com/gh_mirrors/zo/zotero-gpt 你是否曾被海量学术文献淹没？是否在阅读论文时难以快速把握作者的研究立场…...

2026/5/4 15:30:50 阅读更多 →