
梯度下降,原来如此,是何奥秘?
——到底是个啥玩意儿?整一个... 先说个大前提:如guo你对机器学习有点眉目,就像那种你站在山顶却不想爬回去的无聊旅行。要是连山是什么者阝不知道,那就把它想象成一碗热腾腾的面条,你得用筷子把面条往碗底拽。导数和偏导数的八卦别以为导数只是数
共收录篇相关文章

——到底是个啥玩意儿?整一个... 先说个大前提:如guo你对机器学习有点眉目,就像那种你站在山顶却不想爬回去的无聊旅行。要是连山是什么者阝不知道,那就把它想象成一碗热腾腾的面条,你得用筷子把面条往碗底拽。导数和偏导数的八卦别以为导数只是数

为什么你的embedding死活收不到目标?说实话, 这个问题我被问过无数次了每次kan到有人抓耳挠腮地问我"为啥我的emb就是不肯收敛",我就想笑——主要原因是我自己当年也是这么过来的。那时候天天盯着loss曲线发呆,