karpathy
-
Karpathy观点惹争议:RLHF不是真正的强化学习,谷歌、Meta下场反对
rlhf 与 rl 到底能不能归属为一类,看来大家还是有不一样的看法。ai 大牛 karpathy 又来科普人工智能概念了。昨日,他发推表示,「基于人类反馈的强化学习(rlhf)只是勉强算得上是强化学习(rl)。」
Karpathy 的全文 -
Karpathy新教程爆火,网友抢着送他H100:从头复现GPT
大神karpathy已经不满足于用c语言造llama了!
他给自己的最新挑战:复现OpenAI经典成果,从基础版GPT-2开始。
挑战成功本身并不意外,但是只花费20美元、90分钟完成训练,Loss和评测还超越原版,就!有!点!过!分!了! -
开源模型首胜GPT
能打得过gpt-4的开源模型出现了!
大模型竞技场最新战报:
1040亿参数开源模型Command R+攀升至第6位,与GPT-4-0314打成平手,超过了GPT-4-0613。
图片
这也是第一个在大模型竞技场上击败GPT-4的开放权重模