训练
-
数据更多更好还是质量更高更好?这项研究能帮你做出选择
对基础模型进行 scaling 是指使用更多数据、计算和参数进行预训练,简单来说就是「规模扩展」。
虽然直接扩展模型规模看起来简单粗暴,但也确实为机器学习社区带来了不少表现突出的模型。之前不少研究都认可扩大神经经济模型规模的做法,所谓量变引 -
Ilya离职后第一个动作:点赞了这篇论文,网友抢着传看
自ilya sutskever官宣离职openai后,他的下一步动作成了大家关注焦点。
甚至有人密切关注着他的一举一动。
这不,Ilya前脚刚刚点赞❤️了一篇新论文————网友们后脚就抢着都看上了:论文来自MIT,作者提出了一个假说,用一句 -
首个GPU高级语言,大规模并行就像写Python,已获8500 Star
经过近10年的不懈努力,对计算机科学核心的深入研究,人们终于实现了一个梦想:在gpu上运行高级语言。
上周末,一种名为 Bend 的编程语言在开源社区引发了热烈的讨论,GitHub 的 Star 量已经超过了 8500。GitHub:htt -
70B模型秒出1000token,代码重写超越GPT
70b模型,秒出1000token,换算成字符接近4000!
研究人员将Llama3进行了微调并引入加速算法,和原生版本相比,速度足足快出了快了13倍!
不仅是快,在代码重写任务上的表现甚至超越了GPT-4o。
这项成果,来自爆火的AI编程 -
简单通用:视觉基础网络最高3倍无损训练加速,清华EfficientTrain++入选TPAMI 2024
论文链接:https://www.php.cn/link/6e361e90ca5f9bee5b36f3d413c51842
代码和预训练模型已开源:https://www.php.cn/link/154d7da9e669c75ee317d4 -
李飞飞「空间智能」系列新进展,吴佳俊团队新「BVS」套件评估计算机视觉模型
在不久之前的 2024 TED 演讲中,李飞飞详细解读了 空间智能(Spatial Intelligence)概念。她对计算机视觉领域在数年间的快速发展感到欣喜并抱有极大热忱,并为此正在创建初创公司
在此演讲中,曾提到斯坦福团队的一个研究成 -
yolov部署到iPhone或终端实践全过程
期待已久的检测经典又来了一波强袭——yolov5。其中,yolov5没有完整的文件,现在最重要的应该是把yolov4弄清楚,在目标检测领域中受益匪浅,可以在某些场景得到较高的提升。今天我们还是给大家分析yolov4,下一期我们将实践得将yo
-
李飞飞揭秘创业方向“空间智能”:视觉化为洞察,看见成为理解,理解导致行动
斯坦福李飞飞创业后,首次揭秘新概念“空间智能”。
这不仅是她的创业方向,也是指引她的“北极星”,被她认为是“解决人工智能难题的关键拼图”。
视觉化为洞察;看见成为理解;理解导致行动。在李飞飞15分钟TED演讲完整公开的基础上,从数亿年前生命 -
综述170篇「自监督学习」推荐算法,港大发布SSL4Rec:代码、资料库全面开源!
推荐系统对于应对信息过载挑战重要,它们根据用户的个人偏好提供定制化推荐。近年来深度学习技术极大地推动了推荐系统的发展,提升了对用户行为和偏好的洞察力。
然而,由于数据稀疏性的问题,传统的监督学习方法在实际应用中临挑战,这限制了它们有效学习用 -
任天堂闪击GitHub,一夜删光8000多个模拟器代码仓库
任天堂闪击github!一夜之间删除了8535个代码库。
只要包含Yuzu Switch模拟器代码都不放过,称其非法绕过了任天堂的技术保护措施,并运行了非法盗版Switch游戏。GitHub这边也作出了回应。
开发者有时间可对侵权内容进行删