课程简介
本课程专为企业智能化升级需求量身定制,涵盖生成式AI从底层理论到上层应用的全栈技术。课程不仅系统讲解深度学习基础、高阶提示工程与大模型微调技术(如LoRA),更深度聚焦四大前沿方向:处理文本、语音、图像等多种输入的“多模态”实战落地;利用AI进行业务时序推断的“NSP(下一状态预测)”技术;实现多个智能体高效通信与协作的“多Agent协同”架构;以及紧贴国家政策与业界标准的“AI伦理安全与合规”体系。通过密集的理论解析与现场项目实操,全面提升学员的企业级AI应用开发能力。
目标收益
培训对象
课程内容
第一天-上午
1. 课程开场与AIGC综述(0.5h)
大模型原理概述,介绍课程的目标和预期的学习成果。
介绍人工智能生成创作(AIGC)领域的基本概念、应用和发展趋势,相关场景及算法基础逻辑介绍
从单模态到多模态的技术演进:介绍文本、语音、图像、视频等多种类型输入在生成式AI中的应用与发展趋势。
2. 面向工业与企业应用的高阶提示工程(1h)
高级提示词设计方法:多轮交互、角色设定、上下文控制及隐式引导技巧,适配松下制造与办公等专业语境。
多场景高阶提示工程应用:技术文档编制、设备故障诊断报告生成、跨部门信息问答与业务流程自动化。
面向 DeepSeek R1/Qwen 等系列大模型的提示优化策略:思维链(CoT)推理、逐步求解及采样温度调优。
3. 主流多模态大模型技术原理与核心能力(1.5h)
计算机视觉与多模态基础介绍:如何利用生成式AI统一处理文本、音频、图像和视频等多种类型的输入。
图像与文本的双向生成模型剖析:详述当前主流的Diffusion扩散模型(如DALL·E等)以及图生文大模型(如QwenVL系列等)的技术原理。
混合多模态大模型原理,以及视频理解与图像综合应用的技术逻辑。
第一天-下午
1、NSP(Next-State Prediction)预测技术理论与实践(1h)
NSP核心原理:从大模型底层的Next-Token(下一词)预测机制,延伸至工业与业务系统的“下一状态预测”。
利用AI进行序列预测的建模方法:如何将设备运行日志、生产时序数据或用户行为轨迹转化为预测任务。
NSP实践场景分享:设备故障趋势预测、系统负载评估与业务流转预测。
2、业务与系统文档的解析与数据清洗(1h)
面向招投标书/设备台账/系统操作手册的文档数字化解析的技术原理。
基于多模态文档解析:如PDF复杂系统架构图识别、工程图纸与表单的直接问答交互等。
文档综合拆解、版面分析相关算法推荐与面向RAG场景的段落拆解方法详述。
针对行业规程规范及软件需求文档的“语义完整性”切分算法。
3、企业级RAG核心技术与复杂文档处理(1h)
面向RAG的文档处理技术:基于多模态的文档数字化解析,如PDF复杂表格识别、基于图片的直接问答交互及语义段落拆解。
大模型RAG整体框架与检索优化:向量表征方法(BGE、Qwen-embedding等)、向量数据库(Faiss、Milvus等)与混合检索策略。
结合知识图谱的大模型应用方法(GraphRAG)及其在企业问答交互领域的落地。
第二天-上午
1. 领域高质量数据构造与清洗(1h)
梳理大模型训练中的数据收集方法与数据清洗逻辑,去除系统日志噪音与敏感业务数据脱敏。
介绍基于Self-instruct的数据构造方法、介绍面向结构化知识的数据构造方法
高质量数据收集与清洗分享——以参与的开源数据集Chinese-DeepSeek-R1-Distill-data-110k为例
领域数据清洗方法介绍——IFD指标法、MoDS方法等
2. 大语言模中的高效参数调优方法(1h)
常用参数微调方法——Prefix Tuning、P-Tuning、LoRA
微调方法进阶——DyLoRA、AdaLoRA、QLoRA、QALoRA、LongLoRA、VERA、S-LoRA
介绍当前常用的模型分布式计算方法,详细介绍数据并行、向量并行、流式并行的多种并行策略等
大模型微调中的算力需求与时间测算
课程实战:大模型微调实战——基于Qwen的微调实战(0.5h)
3. 大模型交付——模型推理加速与部署(0.5h)
大模型推理中的算力消耗与资源适配
介绍常用的大模型推理框架与原理,如vLLM、SGLang、FastLLM等
介绍常用大模型整体服务框架,llama.cpp、llama-factory、ollama等
大模型中的量化,如AWQ量化、GPTQ、GGUF等
第二天-下午
1. 生成式AI的伦理安全与合规(1h)
分享工信部合规检测及大模型系统备案业务流程及交付模式:梳理《生成式人工智能服务管理暂行办法》等法规,明确企业在算法“双备案”、上线安全评估及数据跨境等方面的合规边界与门槛。
AI内容标识与拟人化新规:介绍生成合成内容标识的国家标准,以及面向AI Agent交互、拟人化应用服务中的告知义务与科技伦理要求。
立体化安全防御与交付体系:探讨如何防范提示词注入(Prompt Injection)等恶意攻击,部署企业级内容安全审核网关,以及面向高保密业务的私有化隔离部署策略。
2. 多智能体(Multi-Agent)协同技术理论(1h)
Agent 的认知架构与模块:Agent 中的记忆(短期/长期)、工具调用(API集成)以及基于 ReAct 等机制的规划与决策拆解。
多Agent协同通信机制:多个Agent之间如何建立通信、分配角色(如规划者、执行者、审查者),并相互配合高效完成复杂任务。
主流多Agent框架架构解析:分析当前业界常用的协作框架设计模式与适用场景。
3. AI Agent应用产品化及交付经验介绍(1h)
介绍AI Agent在智能咨询、智能排故、业务办理与查询、主动营销等行业应用案例
大模型企业落地场景介绍,包括大模型与智能问答系统、大模型与知识库、大模型与智能编排等场景的应用与落地。
介绍基于大模型及领域知识,搭建企业内部Deep Research专家
4. 交流与沟通(0.5h)
课后交流
近期公开课推荐