模型
-
本地运行性能超越 OpenAI Text
ollama 是一款超级实用的工具,让你能够在本地轻松运行 llama 2、mistral、gemma 等开源模型。本文我将介绍如何使用 ollama 实现对文本的向量化处理。如果你本地还没有安装 ollama,可以阅读这篇文章。
本文我们 -
探索智能体的边界:AgentQuest,一个全面衡量和提升大型语言模型智能体性能的模块化基准框架
基于大模型的持续优化,LLM智能体——这些强大的算法实体已经展现出解决复杂多步骤推理任务的潜力。从自然语言处理到深度学习,LLM智能体正逐渐成为研究和工业界的焦点,它们不仅能理解和生成人类语言,还能在多样的环境中制定策略、执行任务,甚至使用
-
全面突围,谷歌昨晚更新了一大波大模型产品
这周二,谷歌在Google的Cloud Next 2024上发布了一系列AI相关的模型更新和产品,其中包括Gemini 1.5 Pro首次提供了本地语音(语音)理解功能、代码生成新模型CodeGemma、首款自研Arm处理器Axion等等。
-
Llama架构比不上GPT2?神奇token提升10倍记忆?
一个 7B 规模的语言模型 LLM 能存储多少人类知识?如何量化这一数值?训练时间、模型架构的不同将如何影响这一数值?浮点数压缩 quantization、混合专家模型 MoE、以及数据质量的差异 (百科知识 vs 网络垃圾) 又将对 LL
-
AI颠覆数学研究!菲尔兹奖得主、华裔数学家领衔11篇顶刊论文|陶哲轩转赞
AI,的确正在改变数学。
最近,一直十分关注这个议题的陶哲轩,转发了最近一期的《美国数学学会通报》(Bulletin of the American Mathematical Society)。
围绕「机器会改变数学吗?」这个话题,众多数学 -
OpenAI发布新的AI微调工具:“绝大多数组织将开发定制模型”
OpenAI宣布了对其微调API的重大增强,以及其定制模型程序的扩展。这些更新将赋予开发者前所未有的控制权,以微调AI模型,并为构建特定业务需求的定制模型提供新途径。自2023年8月推出以来,GPT-3.5的微调API已经成为组合精细化AI
-
10万美元训出Llama
想了解更多aigc的内容,
请访问:51CTO AI.x社区
https://www.51cto.com/aigc/
“只需”10万美元,训练Llama-2级别的大模型。
尺寸更小但性能不减的MoE模型来了:
它叫JetMoE,来自MIT、 -
开源大模型AI代理操作系统:像Windos一样,操控AI代理
本文经AIGC开放社区 授权转载,转载请联系出处。
想了解更多aigc的内容,请访问:51cto ai.x社区
https://www.51cto.com/aigc/
去年,AutoGPT的出现让我们认识到了AI代理强大的自动化能力,并开创 -
更好、更安全、更不依赖OpenAI,微软的AI新动向,推出大模型安全工具Azure AI
编译丨伊风
出品 | 51CTO技术栈(微信号:blog51cto)生成性人工智能(generative AI)的需求正不断增长,而对LLM安全和可靠性的担忧也变得比以往任何时候都更加突出。企业希望能确保为内外部使用而开发的大规模语言模型( -
谷歌狂喜:JAX性能超越Pytorch、TensorFlow!或成GPU推理训练最快选择
谷歌力推的JAX在最近的基准测试中性能已经超过Pytorch和TensorFlow,7项指标排名第一。而且测试并不是在JAX性能表现最好的TPU上完成的。虽然现在在开发者中,Pytorch依然比Tensorflow更受欢迎。但未来,也许有更