horizon86的博客
  • 首页
  • 实用工具
  • 归档
  • 分类
  • 标签
  • 关于

共计 30 篇文章


2025

09-05
presence_penalty, frequency_penalty以及repetition_penalty
04-26
[DeepSeek-V3-技术报告阅读] Complementary Sequence-Wise Auxiliary Loss
01-13
nvidia gpu结构简介和cuda编程入门
01-04
pytorch各种乘法,mm, matmul, dot, @, *, mul, multiply

2024

10-29
激活函数和GLU
09-29
优化器:从SGD到Adam到AdamW
09-03
似然(likelihood)和NLLLoss
07-17
deepspeed训练模型提示:cpu_adam.so: cannot open shared object file: No such file or directory
06-24
线性代数知识回顾
06-18
pytorch分布式训练注意事项/踩坑总结 - 持续更新
123

搜索

Hexo Fluid