linux
43
AI
30
presence_penalty, frequency_penalty以及repetition_penalty
[DeepSeek-V3-技术报告阅读] Complementary Sequence-Wise Auxiliary Loss
nvidia gpu结构简介和cuda编程入门
pytorch各种乘法,mm, matmul, dot, @, *, mul, multiply
激活函数和GLU
优化器:从SGD到Adam到AdamW
似然(likelihood)和NLLLoss
pytorch分布式训练注意事项/踩坑总结 - 持续更新
pytorch调试时CUDA报错,如何精确定位
浅谈位置编码(RoPE)
More...