Tag
哈哈,你是不是也被这个突然跳出来的位置编码搞蒙了?咱就是说论文前面讲得那么顺,突然来个「正弦函数」——这不就是数学课本里的玩意儿吗?那它到底是怎么跑到NLP模型里来的? 咱们先说说为什么需要位置编码 你懂的,Transformer没有RNN或CNN那样的递归和卷积结构。所以它不知道词在序列中的顺序。比如「I love dogs」和「dogs love I」
查看更多 2026-06-16
Demand feedback