AI 系统学习指南

AI 系统学习指南

本开源项目主要是跟大家一起探讨和学习人工智能、深度学习的系统设计,而整个系统是围绕着在 NVIDIA、ASCEND 等芯片厂商构建算力层面,所用到的、积累、梳理得到 AI 系统全栈的内容。希望跟所有关注 AI 开源项目的好朋友一起探讨研究,共同促进学习讨论。

03Architecture031

课程内容大纲

课程主要包括以下六大模块:

第一部分,AI 基础知识和 AI 系统的全栈概述的AI 系统概述,以及深度学习系统的系统性设计和方法论,主要是整体了解 AI 训练和推理全栈的体系结构内容。

第二部分,硬核篇介绍AI 芯片概况,这里就很硬核了,从芯片基础到 AI 芯片的范围都会涉及,芯片设计需要考虑上面 AI 框架的前端、后端编译,而不是停留在天天喊着吊打英伟达,被现实打趴。

第三部分,进阶篇介绍AI 编译器原理,将站在系统设计的角度,思考在设计现代机器学习系统中需要考虑的编译器问题,特别是中间表达乃至后端优化。

第四部分,实际应用推理系统与引擎,讲了太多原理身体太虚容易消化不良,还是得回归到业务本质,让行业、企业能够真正应用起来,而推理系统涉及一些核心算法和注意的事情也分享下。

第五部分,介绍AI 框架核心技术,首先介绍任何一个 AI 框架都离不开的自动微分,通过自动微分功能后就会产生表示神经网络的图和算子,然后介绍 AI 框架前端的优化,还有最近很火的大模型分布式训练在 AI 框架中的关键技术。

第六部分,汇总篇介绍大模型与 AI 系统,大模型是基于 AI 集群的全栈软硬件性能优化,通过最小的每一块 AI 芯片组成的 AI 集群,编译器使能到上层的 AI 框架,训练过程需要分布式并行、集群通信等算法支持,而且在大模型领域最近持续演进如智能体等新技术。

课程设立目的

本课程主要为本科生高年级、硕博研究生、AI 系统从业者设计,帮助大家:

  1. 完整了解 AI 的计算机系统架构,并通过实际问题和案例,来了解 AI 完整生命周期下的系统设计。
  2. 介绍前沿系统架构和 AI 相结合的研究工作,了解主流框架、平台和工具来了解 AI 系统。

先修课程: C++/Python,计算机体系结构,人工智能基础

课程目录内容

=== 一. AI 系统概述 ===

  • 课程概述(DONE)

=== 二. AI 硬件体系结构 ===

  • AI 硬件体系架构概述
  • AI 计算体系概述
  • AI 芯片基础
  • 图形处理器 GPU
  • 英伟达 GPU 详解
  • 国外 AI 芯片
  • 国内 AI 芯片
  • AI 芯片黄金十年

=== 三. AI 编程与编译原理 ===

  • AI 编译原理概述
  • 传统编译器
  • AI 编译器
  • 前端优化
  • 后端优化
  • CANN & Ascend C

=== 四. 推理系统&引擎 ===

  • 推理系统&引擎概述
  • 推理系统
  • 模型轻量化
  • 模型压缩
  • 模型转换
  • 模型优化
  • Kernel 优化

=== 五. AI 框架核心模块 ===

  • AI 框架核心概述
  • AI 框架基础
  • 自动微分
  • 计算图
  • 分布式并行

=== 附录内容 ===

  • 附录(DONE)

本文内容转载自ZOMI酱的开源文档,原始路径:https://chenzomi12.github.io/index.html.

如有疑问,请联系删除~

© 版权声明
THE END
喜欢就支持一下吧
点赞8 分享
评论 抢沙发
头像
欢迎您留下宝贵的见解!
提交
头像

昵称

取消
昵称表情代码图片

    暂无评论内容