本开源项目主要是跟大家一起探讨和学习人工智能、深度学习的系统设计,而整个系统是围绕着在 NVIDIA、ASCEND 等芯片厂商构建算力层面,所用到的、积累、梳理得到 AI 系统全栈的内容。希望跟所有关注 AI 开源项目的好朋友一起探讨研究,共同促进学习讨论。
课程内容大纲
课程主要包括以下六大模块:
第一部分,AI 基础知识和 AI 系统的全栈概述的AI 系统概述,以及深度学习系统的系统性设计和方法论,主要是整体了解 AI 训练和推理全栈的体系结构内容。
第二部分,硬核篇介绍AI 芯片概况,这里就很硬核了,从芯片基础到 AI 芯片的范围都会涉及,芯片设计需要考虑上面 AI 框架的前端、后端编译,而不是停留在天天喊着吊打英伟达,被现实打趴。
第三部分,进阶篇介绍AI 编译器原理,将站在系统设计的角度,思考在设计现代机器学习系统中需要考虑的编译器问题,特别是中间表达乃至后端优化。
第四部分,实际应用推理系统与引擎,讲了太多原理身体太虚容易消化不良,还是得回归到业务本质,让行业、企业能够真正应用起来,而推理系统涉及一些核心算法和注意的事情也分享下。
第五部分,介绍AI 框架核心技术,首先介绍任何一个 AI 框架都离不开的自动微分,通过自动微分功能后就会产生表示神经网络的图和算子,然后介绍 AI 框架前端的优化,还有最近很火的大模型分布式训练在 AI 框架中的关键技术。
第六部分,汇总篇介绍大模型与 AI 系统,大模型是基于 AI 集群的全栈软硬件性能优化,通过最小的每一块 AI 芯片组成的 AI 集群,编译器使能到上层的 AI 框架,训练过程需要分布式并行、集群通信等算法支持,而且在大模型领域最近持续演进如智能体等新技术。
课程设立目的
本课程主要为本科生高年级、硕博研究生、AI 系统从业者设计,帮助大家:
- 完整了解 AI 的计算机系统架构,并通过实际问题和案例,来了解 AI 完整生命周期下的系统设计。
- 介绍前沿系统架构和 AI 相结合的研究工作,了解主流框架、平台和工具来了解 AI 系统。
先修课程: C++/Python,计算机体系结构,人工智能基础
课程目录内容
=== 一. AI 系统概述 ===
- 课程概述(DONE)
=== 二. AI 硬件体系结构 ===
- AI 硬件体系架构概述
- AI 计算体系概述
- AI 芯片基础
- 图形处理器 GPU
- 英伟达 GPU 详解
- 国外 AI 芯片
- 国内 AI 芯片
- AI 芯片黄金十年
=== 三. AI 编程与编译原理 ===
- AI 编译原理概述
- 传统编译器
- AI 编译器
- 前端优化
- 后端优化
- CANN & Ascend C
=== 四. 推理系统&引擎 ===
- 推理系统&引擎概述
- 推理系统
- 模型轻量化
- 模型压缩
- 模型转换
- 模型优化
- Kernel 优化
=== 五. AI 框架核心模块 ===
- AI 框架核心概述
- AI 框架基础
- 自动微分
- 计算图
- 分布式并行
=== 附录内容 ===
- 附录(DONE)
本文内容转载自ZOMI酱的开源文档,原始路径:https://chenzomi12.github.io/index.html.
如有疑问,请联系删除~
暂无评论内容