课程费用

5800.00 /人

课程时长

2

成为教练

课程简介

本课程为期两天,专为期望在企业中落地大模型技术的研发团队设计。课程紧跟AI技术前沿,深度解析DeepSeek R1、Qwen等国产开源大模型的应用逻辑,系统讲授从提示工程到智能体开发,从企业数据工程化处理到模型微调及推理部署的全链路技术。不仅涵盖ReAct、MCP多协议机制、RAG多模态解析等核心原理,更结合Chinese-DeepSeek-R1-Distill-data等开源数据集进行实战演练。课程特别强化了“交付”环节,深入探讨算力资源测算、推理加速、私有化部署及Deep Research专家系统搭建,旨在帮助学员从零构建高可用、可落地的企业级AI解决方案。

目标收益

培训对象

课程内容

第一天-上午
1. 课程开场与AIGC综述(0.5h)
大模型原理概述,介绍课程的目标和预期的学习成果。
介绍人工智能生成创作(AIGC)领域的基本概念、应用和发展趋势,相关场景及算法基础逻辑介绍
2. 面向投研的提示工程(1h)
CoT(思维链)在宏观分析中的应用:如何设计Prompt让模型逐步推导“美联储加息对保险资金运用的影响”。
结构化信息提取:利用Prompt从非结构文本数据中抽取关键信息。
防幻觉策略:大模型集合 “引用溯源”与“置信度打分”等机制,预防模型的幻觉。
3. 主流开源语言大模型介绍与模型选型(1.5h)
从Transformer到MoE(混合专家):DeepSeek-V3/R1 架构深度解析。
主流开源模型的原理与技术架构:DeepSeek-R1、Qwen-Max、KIMI、MiniMax等开源模型架构解析。
金融开源模型选型:BloombergGPT、FinGPT与通用模型(Qwen2.5-Math, DeepSeek)在投研场景的评测对比与选型策略。
第一天-下午
1、金融类文档的解析与数据清洗(1h)
面向财报/招股书的文档数字化解析的技术原理
基于多模态文档解析:如PDF复杂表格识别、基于图片的直接问答交互等
文档综合拆解、版面分析相关算法推荐与面向RAG场景的段落拆解方法详述
针对金融领域相关文档的“语义完整性”切分算法。
2、进阶RAG:RAG中的检索优化及GraphRAG(1h)
向量表征方法简述:基于BGE、Qwen3-Embedding、Stella等向量表征方法与基础概述
混合检索(Hybrid Search):结合BM25关键词与向量表征方法的多策略召回方法。
知识图谱增强(GraphRAG):构建领域知识图谱,结合LLM实现多跳推理检索。
课程实战:基于Ollama的个人知识库搭建(1h)
第二天-上午
1. 领域高质量数据构造与清洗(1h)
梳理大模型训练中的数据收集方法与数据清洗逻辑,去除噪音与隐私脱敏
介绍基于Self-instruct的数据构造方法、介绍面向结构化知识的数据构造方法
高质量数据收集与清洗分享——以参与的开源数据集Chinese-DeepSeek-R1-Distill-data-110k为例
领域数据清洗方法介绍——IFD指标法、MoDS方法等
2. 大语言模中的高效参数调优方法(1h)
常用参数微调方法——Prefix Tuning、P-Tuning、LoRA
微调方法进阶——DyLoRA、AdaLoRA、QLoRA、QALoRA、LongLoRA、VERA、S-LoRA
介绍当前常用的模型分布式计算方法,详细介绍数据并行、向量并行、流式并行的多种并行策略等
大模型微调中的算力需求与时间测算
课程实战:大模型微调实战——基于Qwen的微调实战(0.5h)
3. 大模型交付——模型推理加速与部署(0.5h)
大模型推理中的算力消耗与资源适配
介绍常用的大模型推理框架与原理,如vLLM、SGLang、FastLLM等
介绍常用大模型整体服务框架,llama.cpp、llama-factory、ollama等
大模型中的量化,如AWQ量化、GPTQ、GGUF等
第二天-下午
1. 多模态生成方法与原理介绍(0.5h)
基于于大模型(如Transformer)的图片生成文本技术的核心原理
介绍图生文相关模型概念,如QwenVL系类、Yi-VL等
图片生成文本的落地应用,在企业能知识问答、业务办理与文档综合解析方面的应用
2. Agent原理与应用介绍(1h)
Agent基础概述、主要模块与决策机制
常用Agent核心技术,ReAct vs Plan-and-Solve
主流Agent框架介绍——LlamaIndex框架、AutoGPT框架、AutoGen框架、SuperAGI框架
MCP(Model Context Protocol)实战:如何通过MCP协议标准连接企业内部异构数据源(OA、CRM、投研库)
3. AI Agent应用产品化及交付经验介绍(1h)
介绍AI Agent在智能咨询、智能排故、业务办理与查询、主动营销等行业应用案例
大模型企业落地场景介绍,包括大模型与智能问答系统、大模型与知识库、大模型与智能编排等场景的应用与落地。
介绍基于大模型及领域知识,搭建企业内部Deep Research专家
4. 交流与沟通(0.5h)
课后交流
补充算力相关说明和调配

活动详情

提交需求