《手写AI-LLM多模态视觉大模型2024》课程系统讲解视觉与多模态大模型的核心技术,涵盖自监督学习(MoCo、MAE)、视觉基础模型(ViT、DINO)、多模态模型(CLIP、LLaVA)及下游迁移方法(Adapter、视觉Prompt)。课程通过代码实战(MoCo、MAE、CLIP等)和项目案例(PandaGPT微调、VPT下游迁移),帮助学员掌握大模型训练、微调及应用,适合AI开发者深入多模态视觉领域。
手写AI-LLM多模态视觉大模型20241.91GB
文档+资料68MB
资料.zip68MB
7.实战-基于视觉提示的下游迁移559.04MB
code .zip1021.61KB
BCI数据集下载.txt892B
7.6 病理图像下游迁移_ev.mp444.52MB
7.5 模型实现2_ev.mp467.92MB
7.4 模型实现1_ev.mp486.75MB
7.3 模型定义_ev.mp4141.26MB
7.2 数据集加载_ev.mp4100.96MB
7.1 VPT框架通览_ev.mp4116.63MB
6.实战-多模态大模型微调785.29MB
端口映射方法.txt84B
Vicuna模型加载指南.txt382B
code .zip27.63MB
6.7 Demo运行_ev.mp459.58MB
6.6 模型实现_ev.mp4220.91MB
6.5 模型定义_ev.mp4133.72MB
6.4 数据集加载_ev.mp490.95MB
6.3 项目代码通览_ev.mp4106MB
6.2 环境与模型配置_ev.mp4103.96MB
6.1 PandaGPT框架介绍_ev.mp442.55MB
5.下游任务迁移与视觉提示167.42MB
5.7 小结_ev.mp43.66MB
5.6 视觉Prompt代码详解_ev.mp433.13MB
5.5 视觉prompt方法_ev.mp448.91MB
5.4 Adapter代码详解_ev.mp449.03MB
5.3 Adapter方法_ev.mp412.09MB
5.2 线性探测与微调代码详解_ev.mp411.64MB
5.1 线性探测与微调_ev.mp48.96MB
4.多模态视觉大模型161.18MB
4.7 LLaVA模型_ev.mp441.57MB
4.6 Flamingo模型_ev.mp424.2MB
4.5 GLIP模型_ev.mp49.92MB
4.4 CLIP代码详解_ev.mp426.51MB
4.3 CLIP模型_ev.mp417.23MB
4.2 多模态网络的架构_ev.mp419.29MB
4.1 多模态学习的概念_ev.mp422.46MB
3.视觉基础大模型的架构112.68MB
3.7 SAM模型_ev.mp423.64MB
3.6 MAE代码详解_ev.mp426.37MB
3.5 MAE模型_ev.mp49.63MB
3.4 DINO代码详解_ev.mp416.99MB
3.3 DINO模型_ev.mp412.78MB
3.2 MoCo v3自监督骨干网络_ev.mp47.95MB
3.1 ViT与其变种_ev.mp415.32MB
2.自监督学习的原理与方法82.61MB
2.5掩码重建与BEiT_ev.mp410.5MB
2.4MoCo代码详解_ev.mp423.32MB
2.3Moco模型_ev.mp411.95MB
2.2对比学习与SimCLR_ev.mp418.88MB
2.1自监督学习与前置任务_ev.mp417.96MB
1.大模型技术概述21.9MB
1. 视觉大模型技术概述_ev.mp421.9MB

百度网盘
5积分


