金融领域大模型核心技术解析：MoE架构、复杂文档解析与高效参数微调进阶-精品课程-软件研发管理培训、咨询服务-MSUP

课程简介

本课程为期两天，专为期望在企业中落地大模型技术的研发团队设计。课程紧跟AI技术前沿，深度解析DeepSeek R1、Qwen等国产开源大模型的应用逻辑，系统讲授从提示工程到智能体开发，从企业数据工程化处理到模型微调及推理部署的全链路技术。不仅涵盖ReAct、MCP多协议机制、RAG多模态解析等核心原理，更结合Chinese-DeepSeek-R1-Distill-data等开源数据集进行实战演练。课程特别强化了“交付”环节，深入探讨算力资源测算、推理加速、私有化部署及Deep Research专家系统搭建，旨在帮助学员从零构建高可用、可落地的企业级AI解决方案。

目标收益

培训对象

课程内容

第一天-上午
1. 课程开场与AIGC综述（0.5h）
大模型原理概述，介绍课程的目标和预期的学习成果。
介绍人工智能生成创作（AIGC）领域的基本概念、应用和发展趋势，相关场景及算法基础逻辑介绍
2. 面向投研的提示工程（1h）
CoT（思维链）在宏观分析中的应用：如何设计Prompt让模型逐步推导“美联储加息对保险资金运用的影响”。
结构化信息提取：利用Prompt从非结构文本数据中抽取关键信息。
防幻觉策略：大模型集合 “引用溯源”与“置信度打分”等机制，预防模型的幻觉。
3. 主流开源语言大模型介绍与模型选型（1.5h）
从Transformer到MoE（混合专家）：DeepSeek-V3/R1 架构深度解析。
主流开源模型的原理与技术架构：DeepSeek-R1、Qwen-Max、KIMI、MiniMax等开源模型架构解析。
金融开源模型选型：BloombergGPT、FinGPT与通用模型（Qwen2.5-Math, DeepSeek）在投研场景的评测对比与选型策略。
第一天-下午
1、金融类文档的解析与数据清洗（1h）
面向财报/招股书的文档数字化解析的技术原理
基于多模态文档解析：如PDF复杂表格识别、基于图片的直接问答交互等
文档综合拆解、版面分析相关算法推荐与面向RAG场景的段落拆解方法详述
针对金融领域相关文档的“语义完整性”切分算法。
2、进阶RAG：RAG中的检索优化及GraphRAG（1h）
向量表征方法简述：基于BGE、Qwen3-Embedding、Stella等向量表征方法与基础概述
混合检索（Hybrid Search）：结合BM25关键词与向量表征方法的多策略召回方法。
知识图谱增强（GraphRAG）：构建领域知识图谱，结合LLM实现多跳推理检索。
课程实战：基于Ollama的个人知识库搭建（1h）
第二天-上午
1. 领域高质量数据构造与清洗（1h）
梳理大模型训练中的数据收集方法与数据清洗逻辑，去除噪音与隐私脱敏
介绍基于Self-instruct的数据构造方法、介绍面向结构化知识的数据构造方法
高质量数据收集与清洗分享——以参与的开源数据集Chinese-DeepSeek-R1-Distill-data-110k为例
领域数据清洗方法介绍——IFD指标法、MoDS方法等
2. 大语言模中的高效参数调优方法（1h）
常用参数微调方法——Prefix Tuning、P-Tuning、LoRA
微调方法进阶——DyLoRA、AdaLoRA、QLoRA、QALoRA、LongLoRA、VERA、S-LoRA
介绍当前常用的模型分布式计算方法，详细介绍数据并行、向量并行、流式并行的多种并行策略等
大模型微调中的算力需求与时间测算
课程实战：大模型微调实战——基于Qwen的微调实战（0.5h）
3. 大模型交付——模型推理加速与部署（0.5h）
大模型推理中的算力消耗与资源适配
介绍常用的大模型推理框架与原理，如vLLM、SGLang、FastLLM等
介绍常用大模型整体服务框架，llama.cpp、llama-factory、ollama等
大模型中的量化，如AWQ量化、GPTQ、GGUF等
第二天-下午
1. 多模态生成方法与原理介绍（0.5h）
基于于大模型（如Transformer）的图片生成文本技术的核心原理
介绍图生文相关模型概念，如QwenVL系类、Yi-VL等
图片生成文本的落地应用，在企业能知识问答、业务办理与文档综合解析方面的应用
2. Agent原理与应用介绍（1h）
Agent基础概述、主要模块与决策机制
常用Agent核心技术，ReAct vs Plan-and-Solve
主流Agent框架介绍——LlamaIndex框架、AutoGPT框架、AutoGen框架、SuperAGI框架
MCP（Model Context Protocol）实战：如何通过MCP协议标准连接企业内部异构数据源（OA、CRM、投研库）
3. AI Agent应用产品化及交付经验介绍（1h）
介绍AI Agent在智能咨询、智能排故、业务办理与查询、主动营销等行业应用案例
大模型企业落地场景介绍，包括大模型与智能问答系统、大模型与知识库、大模型与智能编排等场景的应用与落地。
介绍基于大模型及领域知识，搭建企业内部Deep Research专家
4. 交流与沟通（0.5h）
课后交流
补充算力相关说明和调配

金融领域大模型核心技术解析：MoE架构、复杂文档解析与高效参数微调进阶

Roy

NLP院算法负责人

课程费用

5800.00 /人

课程时长

2天