课程简介
本课程专为企业级软件解决方案与智能化升级设计,全面覆盖从大模型基础应用到系统级交付的全技术生命周期。课程以实战为导向,深入剖析DeepSeek、Qwen等主流开源大模型的选型与应用,系统讲解面向复杂业务场景的高阶提示工程、多模态业务文档解析与数据清洗切分。同时,课程从底层数据发力,涵盖Label Studio标注平台实操、高质量数据构造、高效参数微调(LoRA等)以及推理加速部署,最终进阶至AI Agent架构设计与业务编排,助力学员打通AI技术企业级落地的关键链路。
目标收益
培训对象
课程内容
第一天-上午
1. 课程开场与AIGC综述(0.5h)
大模型原理概述,介绍课程的目标和预期的学习成果。
介绍人工智能生成创作(AIGC)领域的基本概念、应用和发展趋势,相关场景及算法基础逻辑介绍
2. 面向企业级软件解决方案的提示工程(1h)
CoT(思维链)在复杂业务场景中的应用:如何设计Prompt让模型逐步推导“基于海量系统告警日志的故障根因及排查路径”。
结构化信息提取:利用Prompt从非结构化的现场巡检记录或业务工单中精准抽取关键设备状态与处理信息。
防幻觉策略:大模型集合“引用溯源”与“置信度打分”等机制,预防模型在输出系统操作指令时的幻觉。
3. 主流开源语言大模型介绍与模型选型(1.5h)
从Transformer到MoE(混合专家):DeepSeek-V3/R1 架构深度解析。
主流开源模型的原理与技术架构:DeepSeek-R1、Qwen-Max、KIMI、MiniMax等开源模型架构解析。
企业级垂直场景模型选型:通用模型(Qwen2.5-Coder, DeepSeek)在软件研发提效、系统辅助排故及业务规章问答等场景的评测对比与选型策略。
第一天-下午
1、业务与系统文档的解析与数据清洗(1h)
面向招投标书/设备台账/系统操作手册的文档数字化解析的技术原理。
基于多模态文档解析:如PDF复杂系统架构图识别、工程图纸与表单的直接问答交互等。
文档综合拆解、版面分析相关算法推荐与面向RAG场景的段落拆解方法详述。
针对行业规程规范及软件需求文档的“语义完整性”切分算法。
2、数据标注工具选型与简述(1h)
介绍主流开源数据标注工具,详述Label Studio、Doccano、brat等工具的特性、适用场景与选型策略。
演示基于标注平台的任务配置,针对生成、分类、抽取等场景的项目搭建与操作。
介绍Human-in-the-loop(人机协同)标注流程,利用预标注模型提升人工标注效率。
课程实战:基于Label Studio的标注平台任务实战(1h)
第二天-上午
1. 领域高质量数据构造与清洗(1h)
梳理大模型训练中的数据收集方法与数据清洗逻辑,去除系统日志噪音与敏感业务数据脱敏。
介绍基于Self-instruct的数据构造方法、介绍面向结构化知识的数据构造方法
高质量数据收集与清洗分享——以参与的开源数据集Chinese-DeepSeek-R1-Distill-data-110k为例
领域数据清洗方法介绍——IFD指标法、MoDS方法等
2. 大语言模中的高效参数调优方法(1h)
常用参数微调方法——Prefix Tuning、P-Tuning、LoRA
微调方法进阶——DyLoRA、AdaLoRA、QLoRA、QALoRA、LongLoRA、VERA、S-LoRA
介绍当前常用的模型分布式计算方法,详细介绍数据并行、向量并行、流式并行的多种并行策略等
大模型微调中的算力需求与时间测算
课程实战:大模型微调实战——基于Qwen的微调实战(0.5h)
3. 大模型交付——模型推理加速与部署(0.5h)
大模型推理中的算力消耗与资源适配
介绍常用的大模型推理框架与原理,如vLLM、SGLang、FastLLM等
介绍常用大模型整体服务框架,llama.cpp、llama-factory、ollama等
大模型中的量化,如AWQ量化、GPTQ、GGUF等
第二天-下午
1. 多模态生成方法与原理介绍(0.5h)
基于于大模型(如Transformer)的图片生成文本技术的核心原理
介绍图生文相关模型概念,如QwenVL系类、Yi-VL等
图片生成文本的落地应用,在企业能知识问答、业务办理与文档综合解析方面的应用
2. Agent原理与应用介绍(1h)
Agent基础概述、主要模块与决策机制
常用Agent核心技术,ReAct vs Plan-and-Solve
主流Agent框架介绍——LlamaIndex框架、AutoGPT框架、AutoGen框架、SuperAGI框架
MCP(Model Context Protocol)实战:如何通过MCP协议标准连接企业内部异构数据源(OA、CRM、投研库)
3. AI Agent应用产品化及交付经验介绍(1h)
介绍AI Agent在智能咨询、智能排故、业务办理与查询、主动营销等行业应用案例
大模型企业落地场景介绍,包括大模型与智能问答系统、大模型与知识库、大模型与智能编排等场景的应用与落地。
介绍基于大模型及领域知识,搭建企业内部Deep Research专家
4. 交流与沟通(0.5h)
课后交流
补充算力相关说明和调配
近期公开课推荐