毕业答辩PPT讲解稿
总时长:约5-8分钟(含2分钟演示视频) 语速建议:适中,清晰,每页停留30-40秒
第1页:封面
各位老师好,我是陈启明。我的毕业设计题目是《多源Web表格自动填写系统的设计与实现》,指导老师是游进国教授。
第2页:目录
今天的汇报主要分为四个部分:首先是研究背景与意义,然后是研究方法及过程,接着是研究结果,最后是总结与展望。
第3页:研究背景与意义
在日常办公中,我们经常遇到这样的问题:数据散落在Excel、数据库或网页表格里,但填写表单时却要一条一条手动复制粘贴。我总结了四个痛点:
- 数据孤岛:多源数据无法统一调用
- 效率瓶颈:人工操作慢、易出错
- 方案断层:国外偏理论,国内偏单源,缺少全流程系统
- 机制缺失:人机协同校验缺失
因此,我的研究目标是构建一个从数据接入到结果导出的全流程自动填写系统。
第4页:系统架构设计
这是系统的整体架构图。采用前后端分离:
- 表现层:Vue.js 负责界面交互
- 业务层:FastAPI 提供三大模块
- 服务层:LangChain 做语义匹配,Selenium 驱动浏览器
- 数据层:Pandas 统一处理多源数据
这样的设计保证了模块低耦合、易扩展。
第5页:用例图与核心流程
系统的主要操作流程分为五步:
- 多源数据接入,标准化为 DataFrame
- 特征同步提取,送入大模型 例如:源数据的列名、数据类型(pandas自动判别)以及该列的前几行示例值;目标字段的字段名(如:"fullname")、显示标签(字段的语义信息,如:"姓名")、控件类型(如:文本框、下拉框)以及选项列表(如果有的话,这是单选框、复选框、下拉列表的选项列表)
- 生成带置信度的映射关系,人工确认
- 按映射规则执行自动填充
- 统计结果并支持导出
用户是所有操作的发起者,也是映射修正的审核者。
第6页:系统活动流程图
这张活动图展示了完整的操作路径。用户可以选择 Excel、SQL 或网页 URL 作为源数据,同时输入目标表单 URL。解析完成后,系统推荐映射,用户确认或修改,然后执行填充,最后导出结果。整个过程是线性的,用户无法跳过必要步骤。
第7页:功能测试结果
功能测试覆盖了所有核心模块。结果显示:多源数据接入在2秒内完成,目标表单解析成功提取全部7个字段,字段映射推荐7个字段全部正确,表单自动填充通过,结果导出数据一致性达到99%以上。特别值得一提的是,系统验证了跨语言匹配能力——SQL文件中的英文列名可以成功匹配中文目标字段。大模型推荐准确率超过90%,用户确认修正后可以提升到95%以上。
第8页至第11页:前端界面展示
接下来,我结合界面截图说明系统的步骤化引导。
- 初始界面:用户可切换数据源类型,系统引导按步骤操作。
- 上传完成界面:预览 Excel 数据,解析目标表单字段,此时映射卡片才出现。
- 智能匹配结果:系统用绿、黄、红三色标注置信度,用户可通过下拉框手动修正映射。
- 填充完成界面:显示成功提示,支持导出 Excel 或 CSV 文件。
每一步的按钮和面板都是根据前置状态动态显示,用户不需要学习,跟着提示点就行。
第12页:系统演示
接下来,请看我录制的系统演示视频,时长约2分钟。视频中我将演示从上传Excel文件、解析目标表单、获取智能映射、手动调整一条映射、执行填充,到最后导出结果的全过程。
(播放视频,约2分钟)
第13页:性能测试结果
性能方面,我对五个环节进行了测试。多源数据接入平均不到2秒;目标表单解析需要约14.6秒,主要耗在Selenium启动浏览器上,但每个任务只解析一次,可以接受;字段匹配推荐在10秒以内;单条记录填充约9.6秒,3条记录约36秒,呈线性增长;结果导出在0.6秒以内。所有环节均在可接受范围内,批量填充可以通过复用浏览器实例进一步优化。
第14页:总结与展望
目前系统已经完成了四大核心创新点:全流程闭环、人机协同校验、跨语言字段匹配、低代码模块化设计,最终准确率达到95%以上。
当然,系统还有改进空间。未来计划:扩展更多数据源(如JSON、API)、优化性能(复用浏览器实例、并行填充)、引入本地化大模型降低云端依赖、支持多表关联填充,以及将核心功能封装为浏览器插件,方便日常使用。
第15页:致谢
最后,感谢游进国老师的悉心指导,感谢各位老师的聆听与批评指正。谢谢!
讲解提示:
- 第12页演示视频前,可简单说“接下来请看演示”,视频播放时保持安静,播放完后快速衔接。
- 每页停留时间控制在30-40秒,总时长控制在6分钟左右为佳。
- 遇到性能数据时,可以稍作解释,但不要陷入细节纠结。
- 语速平稳,与老师保持眼神交流。