成员蔺涵霖、秦玮悦、陈秋华时间4.17-4.30一、项目概述本项目为“文澜知微”古文沉浸式智慧阅读平台核心目标是打造一款集古籍阅读、历史人物对话、古文智能翻译、时空地图可视化为一体的综合性平台。在实训第一阶段完成项目基础框架搭建与古籍阅读模块开发的基础上第二阶段围绕功能深化与技术增强展开重点完成了DeepSeek AI大模型接入、历史人物对话语音朗读模块开发、历史人物轨迹数据采集与清洗三大核心任务进一步提升了平台的智能化水平与用户沉浸式体验。二、小组分工及成员完成情况小组共3名成员结合项目需求与成员技术特长明确分工、协同推进各成员具体分工及完成情况如下所有已分配任务均按要求完成无延期情况。成员 负责模块 具体职责 完成情况陈秋华 历史人物轨迹数据采集与清洗、基础框架优化 1. 利用DeepSeek AI接口批量采集191位历史人物生平轨迹数据2. 开发增强版Node.js数据清洗脚本3. 实现CHGIS地名匹配与坐标补充4. 优化基础框架权限管控功能 ✅ 全部完成采集191位人物1691条有效轨迹匹配率超70%AI对话接口稳定前端交互流畅清洗脚本可复用秦玮悦 古籍阅读模块、古文智能翻译 1. 古籍阅读模块添加搜索功能按书名/作者2. 完善收藏功能对接后端数据库3. 添加阅读历史记录功能4. 对接大模型实现古文智能翻译功能 ✅ 全部完成搜索精准收藏与历史记录正常存储展示翻译功能流畅蔺涵霖 历史人物对话语音朗读模块 1. 设计语音朗读服务架构prepare synthesize双接口2. 对接Edge TTS实现文本转语音3. 开发文本清洗、音色策略、异常处理机制4. 完成前后端联调与兼容性测试 ✅ 全部完成语音朗读最小闭环打通支持在线mp3返回功能稳定可交付三、各模块完成效果一DeepSeek AI大模型接入1. 核心功能本阶段完成了DeepSeek AI大模型的完整接入同时预留了通古AI和文心一言的接入框架。后端采用Spring Boot架构通过AIService统一封装多模型调用逻辑使用策略模式实现模型路由分发。前端开发了独立的AI智读页面AIChat.vue支持DeepSeek/通古AI/文心一言三种模型切换AI回复支持Markdown格式渲染使用marked库解析并实现了一键复制和浏览器TTS语音朗读功能。2. 效果表现对话接口/api/ai/chat运行稳定支持多轮对话上下文关联系统提示词预设为古籍智慧问答助手角色确保AI回答的专业性。多模型配置通过application.yml集中管理AIConfig.java使用ConfigurationProperties读取配置模型切换灵活。前端AI智读页面交互流畅Markdown渲染正常语音朗读功能基于Web Speech API实现支持中文朗读语速0.9语言zh-CN。二历史人物对话语音朗读模块1. 核心功能本阶段定位为语音模块的“基础语音链路打通与工程化落地可用版本”核心目标是打通“文本→语音”完整闭环实现稳定可用的朗读功能。服务设计采用“两步式”架构prepareTts负责文本预处理与模式判定synthesizeAudio负责音色选择与音频合成。2. 技术实现语音合成引擎选用Edge TTS对比浏览器原生speechSynthesis在音色一致性和可控性上更稳定能在服务端固定男声/女声避免同一角色在不同设备发音不一致的问题。后端围绕HistoryTtsService封装核心能力包括文本净化去除中括号、圆括号注释、冗余空格、模式标准化仅接受ancient/modern非法值回落到modern、音色策略按性别与speakerKey做音色选择、命令调用与超时控制ProcessBuilder调用edge-tts设置超时与重试。异常处理方面针对模块缺失No module named edge_tts、无音频返回、超时、空文本等场景分类处理语音模块从“能跑”提升为“可维护、可排障”。3. 效果表现完成前后端联调现代语音朗读功能稳定可用点击历史人物消息“朗读”按钮可正常返回音频流不同性别、不同角色切换时音色稳定长文本可完整合成播放异常场景提示清晰。实现了对话场景下“文字声音”双通道输出用户沉浸感明显提升。三历史人物轨迹数据采集与清洗1. 核心功能本阶段基于CHGIS中国历史地理信息系统地名数据采集191位历史人物先秦至清朝覆盖政治、文化、军事等多领域的生平轨迹数据并开发增强版Node.js数据清洗脚本实现轨迹数据格式标准化、复合地名拆分、多模式地名匹配、坐标补充与可信度分级。2. 数据采集利用DeepSeek AI接口批量采集191位历史人物的生平轨迹数据优化AI提示词要求返回标准JSON格式包含人物名称、轨迹节点时间、地点、事件、史料出处禁止多余注释与格式混乱问题地点必须使用古代地名原称按“路/道—府—州—郡—县”层级书写。最终生成原始轨迹数据文件newperson.geojson共包含191位人物、1694条轨迹节点经初步筛选后有效原始轨迹1691条。3. 增强版数据清洗脚本基于原有清洗逻辑开发增强版Node.js清洗脚本personTrackCleanAndMatch.js新增以下功能复合地名拆分支持多种分隔符、、、、和、与、以及、范围格式处理如“XX—YY”拆分为两个独立地点、多模式地名匹配精确匹配、今地名匹配、模糊匹配、反向包含匹配。匹配过程中统计匹配率按exact/pres_loc/fuzzy/reverse四类匹配类型分类统计最终有效轨迹匹配率超过70%的目标要求。4. 数据校验与可信度分级最终输出的轨迹数据每条节点均包含坐标可信度分级high/medium/low和坐标来源标注historical_places/special_map坐标匹配准确脚本可复用、易维护。以秦始皇轨迹数据为例共包含23条轨迹节点覆盖其从出生到病逝的完整生平所有节点均匹配了CHGIS坐标可信度均为high。四、项目现存问题与改进方向一现存问题语音朗读模块目前仅完成现代语音朗读的基础版本古风古音的韵律还原尚未实现距离“历史沉浸感”的预期仍有差距部分长文本合成耗时较长需优化异步处理机制。AI大模型接入通古AI和文心一言目前仅完成接口框架搭建尚未进行深度适配与效果优化AI智读页面目前为独立测试页面尚未与古籍阅读页面深度集成。轨迹数据处理部分古代地名尤其是已消失或变更的地名在CHGIS中匹配率偏低需进一步扩展地名数据库复合地名的拆分逻辑仍有边界情况未覆盖。二可优化方向语音模块引入朝代相关的古音映射逻辑细化古音可读化转换增加“古音/今音”前端切换与对照播放功能提升实际听感。AI接入完成通古AI的古文专精能力深度适配将AI功能集成到阅读页侧边栏支持阅读页选中文字后一键发送给AI提问。轨迹清洗补充非CHGIS覆盖区域的地名坐标库优化复合地名拆分逻辑增加人工校验环节进一步提升匹配准确率。五、小组总结本阶段在项目基础框架搭建完成的基础上重点推进了AI大模型接入、语音朗读、轨迹数据采集与清洗三大技术增强模块实现了平台智能化水平的显著提升。各成员充分发挥自身技术特长积极运用AI辅助编程提升开发效率严格遵循标准化开发流程确保了代码质量与开发进度。AI大模型接入为平台注入了智慧问答能力用户可在AI智读页面与古籍助手自由对话语音朗读模块打通了“文本→语音”链路实现了历史人物对话场景下的双通道输出沉浸感显著增强轨迹数据采集与清洗则为后续时空地图可视化奠定了坚实的数据基础。本阶段我们也认识到项目现存的不足语音朗读的古音增强、AI功能的深度集成、轨迹数据可视化的开发仍是下一阶段的重点工作。后续将按照任务规划继续推进功能开发重点优化用户体验确保按时完成项目整体目标。