语言建模

科技

小模型性能饱和、表现不佳，根源是因为Softmax?

小语言模型的出现是为弥补大语言模型的训练、推理等成本昂贵的缺点，但其自身也存在训练到某个阶段后性能下降的事实 (饱和现象)，那么这个现象的原因是什么？是否可以克服并利用它去提升小语言模型的性能？
语言建模领域的最新进展在于在极大规模的网络文

叮当
2024-05-04
78000

联系我们

在线咨询： QQ交谈

邮件：442814395@qq.com

工作时间：周一至周五，9:30-18:30，节假日休息

关注微信公众号