训练相关文章列表 - 叮当号

科技

数据更多更好还是质量更高更好？这项研究能帮你做出选择

对基础模型进行 scaling 是指使用更多数据、计算和参数进行预训练，简单来说就是「规模扩展」。
虽然直接扩展模型规模看起来简单粗暴，但也确实为机器学习社区带来了不少表现突出的模型。之前不少研究都认可扩大神经经济模型规模的做法，所谓量变引

老板不要肥肉

2024-05-24

69000

科技

Ilya离职后第一个动作：点赞了这篇论文，网友抢着传看

自ilya sutskever官宣离职openai后，他的下一步动作成了大家关注焦点。
甚至有人密切关注着他的一举一动。
这不，Ilya前脚刚刚点赞❤️了一篇新论文————网友们后脚就抢着都看上了：论文来自MIT，作者提出了一个假说，用一句

老板不要肥肉

2024-05-24

71000

科技

首个GPU高级语言，大规模并行就像写Python，已获8500 Star

经过近10年的不懈努力，对计算机科学核心的深入研究，人们终于实现了一个梦想：在gpu上运行高级语言。
上周末，一种名为 Bend 的编程语言在开源社区引发了热烈的讨论，GitHub 的 Star 量已经超过了 8500。GitHub：htt

牧草

2024-05-24

60000

科技

70B模型秒出1000token，代码重写超越GPT

70b模型，秒出1000token，换算成字符接近4000！
研究人员将Llama3进行了微调并引入加速算法，和原生版本相比，速度足足快出了快了13倍！
不仅是快，在代码重写任务上的表现甚至超越了GPT-4o。
这项成果，来自爆火的AI编程

木子

2024-05-23

73000

科技

简单通用：视觉基础网络最高3倍无损训练加速，清华EfficientTrain++入选TPAMI 2024

论文链接：https://www.php.cn/link/6e361e90ca5f9bee5b36f3d413c51842
代码和预训练模型已开源：https://www.php.cn/link/154d7da9e669c75ee317d4

老板不要肥肉

2024-05-23

67000

科技

李飞飞「空间智能」系列新进展，吴佳俊团队新「BVS」套件评估计算机视觉模型

在不久之前的 2024 TED 演讲中，李飞飞详细解读了空间智能（Spatial Intelligence）概念。她对计算机视觉领域在数年间的快速发展感到欣喜并抱有极大热忱，并为此正在创建初创公司
在此演讲中，曾提到斯坦福团队的一个研究成

城南北边

2024-05-23

35000

科技

yolov部署到iPhone或终端实践全过程

期待已久的检测经典又来了一波强袭——yolov5。其中，yolov5没有完整的文件，现在最重要的应该是把yolov4弄清楚，在目标检测领域中受益匪浅，可以在某些场景得到较高的提升。今天我们还是给大家分析yolov4，下一期我们将实践得将yo

叮当号

2024-05-23

67000

科技

李飞飞揭秘创业方向“空间智能”：视觉化为洞察，看见成为理解，理解导致行动

斯坦福李飞飞创业后，首次揭秘新概念“空间智能”。
这不仅是她的创业方向，也是指引她的“北极星”，被她认为是“解决人工智能难题的关键拼图”。
视觉化为洞察；看见成为理解；理解导致行动。在李飞飞15分钟TED演讲完整公开的基础上，从数亿年前生命

叮当号

2024-05-16

47000

科技

综述170篇「自监督学习」推荐算法，港大发布SSL4Rec：代码、资料库全面开源！

推荐系统对于应对信息过载挑战重要，它们根据用户的个人偏好提供定制化推荐。近年来深度学习技术极大地推动了推荐系统的发展，提升了对用户行为和偏好的洞察力。
然而，由于数据稀疏性的问题，传统的监督学习方法在实际应用中临挑战，这限制了它们有效学习用

走不完的路

2024-05-09

80000

科技

任天堂闪击GitHub，一夜删光8000多个模拟器代码仓库

任天堂闪击github！一夜之间删除了8535个代码库。
只要包含Yuzu Switch模拟器代码都不放过，称其非法绕过了任天堂的技术保护措施，并运行了非法盗版Switch游戏。GitHub这边也作出了回应。
开发者有时间可对侵权内容进行删

叮当

2024-05-09

98000

训练

联系我们