全部版块 我的主页
论坛 提问 悬赏 求职 新闻 读书 功能一区 经管文库(原现金交易版)
101 0
2025-03-13
+课程资料            2.6 MB
| GLUVariantsImproveTransformer.pdf             108.0 KB
| inference.py             8.1 KB
| LLaMA.pdf             731.0 KB
| model.py             10.2 KB
| params.json             102 Byte
| RoFormerEnhancedTransformerwithRotaryPositionEmbedding.pdf             585.0 KB
| RootMeanSquareLayerNormalization.pdf             537.0 KB
| Self-AttentionwithRelativePositionRepresentations.pdf             230.0 KB
| test_top_p.ipynb             9.4 KB
| tokenizer.model             488.0 KB
课时01 01_LLaMA概述_ev.mp4            24.6 MB
课时02 02_训练LLaMA使用的数据集_ev.mp4            40.6 MB
课时03 03_LLaMA大模型整体架构_ev.mp4            39.1 MB
课时04 04_InputEmbedding模块_ev.mp4            26.7 MB
课时05 05_为什么要去进行归一化_ev.mp4            26.7 MB
课时06 06_深入理解归一化对于大模型的重要性_ev.mp4            22.5 MB
课时07 07_BatchNorm_ev.mp4            11.1 MB
课时08 08_LayerNorm_ev.mp4            18.8 MB
课时09 09_RMSNorm_ev.mp4            28.2 MB
课时10 10_绝对位置编码_ev.mp4            15.7 MB
课时11 11_相对位置编码_ev.mp4            31.8 MB
课时12 12_RoPE_ev.mp4            43.8 MB
课时13 13_SwiGLU_ev.mp4            34.6 MB
课时14 14_语言模型的本质与MaskedSelfAttention_ev.mp4            22.5 MB
课时15 15_KVcache是如何计算提高效率的_ev.mp4            18.3 MB
课时16 16_MQA和GQA_ev.mp4            26.0 MB
课时17 17_代码实战之ModelArgs_ev.mp4            24.0 MB
课时18 18_代码实战之构建Transformer_ev.mp4            49.9 MB
课时19 19_代码实战之提前计算RoPE需要的mθ_ev.mp4            43.0 MB
课时20 20_代码实战之将x按照2个值一组进行分组_ev.mp4            27.9 MB
课时21 21_代码实战之对token的向量应用旋转矩阵_ev.mp4            37.8 MB
课时22 22_代码实战之RMSNorm_ev.mp4            23.3 MB
课时23 23_代码实战之EncoderBlock_ev.mp4            23.0 MB
课时24 24_代码实战之SelfAttention类的初始化_ev.mp4            27.7 MB
课时25 25_代码实战之SelfAttention中应用RoPE和对KV进行缓存_ev.mp4            25.9 MB
课时26 26_代码实战之应用公式计算SelfAttention_ev.mp4            35.7 MB
课时27 27_代码实战之为了实现GQA需要对KV进行拷贝_ev.mp4            25.5 MB
课时28 28_代码实战之计算FFN中隐藏层节点数量_ev.mp4            25.2 MB
课时29 29_代码实战之FFN中三个矩阵以及SwishGLU的运算实现_ev.mp4            15.0 MB
课时30 30_代码实战之加载checkpoint文件_ev.mp4            36.5 MB
课时31 31_代码实战之加载分词器、model模型及模型参数_ev.mp4            35.6 MB
课时32 32_代码实战之测试模型加载_ev.mp4            20.2 MB
课时33 33_代码实战之模型推理预测_ev.mp4            22.1 MB
课时34 34_代码实战之准备模型推理需要的输入tokens张量_ev.mp4            57.2 MB
课时35 35_代码实战之模型生成与解码得到response文本_ev.mp4            49.6 MB
课时36 36_代码实战之运行结果展示_ev.mp4            22.8 MB
课时37 37_什么是推理的策略_ev.mp4            11.3 MB
课时38 38_GreedySearch_ev.mp4            9.1 MB
课时39 39_BeamSearch_ev.mp4            16.4 MB
课时40 40_Temperature_ev.mp4            13.7 MB
课时41 41_RandomSampling_ev.mp4            4.4 MB
课时42 42_基于TopK的随机采样_ev.mp4            9.2 MB
课时43 43_基于TopP的随机采样_ev.mp4            14.5 MB
课时44 44_代码实战之增加TopP采样策略_ev.mp4            44.0 MB
课时45 45_代码实战之测试TopP采样策略_ev.mp4            41.1 MB



大模型 LLaMA 深度解析.part01.rar
大小:(100 MB)

只需: RMB 29元  马上下载





二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群