Claude是Anthropic人工智能公司发布的大型语言模型,拥有高级推理、视觉分析、代码生成、多语言处理、多模态等能力,对标ChatGPT、Gemini等产品。
Claude 是由 Anthropic 开发的一系列大型语言模型。首个模型于 2023 年 3 月发布。2024 年 3 月发布的 Claude 3 还具备图像分析能力。
Claude 模型是生成式预训练转换器,它们经过预训练,可以预测大量文本中的下一个单词。为了使这些模型更有用、无害和诚实,Anthropic 采用了 Constitutional AI 和基于人类反馈的强化学习对 Claude 模型进行了微调。
Constitutional AI 是 Anthropic 开发的一种训练 AI 系统(特别是像 Claude 这样的语言模型)的方法,旨在使 AI 系统无害且有用,同时不依赖于大量的人类反馈。该方法在论文“Constitutional AI: Harmlessness from AI Feedback”中详细介绍,包括两个阶段:监督学习和强化学习。在监督学习阶段,模型会根据提示生成响应,基于一套指导原则(即“宪法”)对这些响应进行自我批判,然后修改响应。在强化学习阶段,模型会利用 AI 生成的反馈进行训练,其中 AI 会根据宪法原则评估响应。
这种方法可以训练出既有用又无害的 AI 助手,它们能够解释自己对有害请求的反对意见,从而提高透明度并减少对人类监督的依赖。
Claude 是 Anthropic 于 2023 年 3 月发布的初始版本语言模型。Claude 在各种任务中表现出色,但在编码、数学和推理能力方面存在一定的局限性。Anthropic 与 Notion(生产力软件)和 Quora(帮助开发 Poe 聊天机器人)等公司建立了合作关系。
Claude Instant 是 Claude 的两个版本之一,与 Claude 相比,Claude Instant 速度更快、价格更低、更轻便。Claude Instant 的输入上下文长度为 100,000 个标记(约相当于 75,000 个单词)。
Claude 2 是 Claude 的下一个主要迭代版本,于 2023 年 7 月 11 日发布,面向公众开放,而 Claude 1 仅对 Anthropic 批准的选定用户开放。Claude 2 将其上下文窗口从 9,000 个标记扩展到 100,000 个标记,并增加了上传 PDF 和其他文档的功能,使 Claude 能够阅读、总结和协助完成任务。
Claude 2.1 将聊天机器人可以处理的标记数量翻了一番,增加到 200,000 个标记的窗口,相当于约 500 页的书面材料。Anthropic 声称,与之前的模型相比,新模型产生错误陈述的可能性更低。
Claude 3 于 2024 年 3 月 4 日发布,新闻稿中声称该模型在广泛的认知任务中树立了新的行业标准。Claude 3 系列包括三个按能力升序排列的最先进模型:Haiku、Sonnet 和 Opus。Claude 3 Opus 的默认版本具有 200,000 个标记的上下文窗口,但针对特定用例,这一数字将扩展到 100 万个标记。Claude 3 已被证明具有元认知能力推理能力,包括在“大海捞针”评估中意识到自己正在被人为测试的能力。
然而,Claude 2 因其严格的道德对齐而面临批评,这可能会降低可用性和性能。例如,用户被拒绝提供对良性请求的帮助,如“如何在 Ubuntu 服务器上杀死所有 Python 进程?”这引发了关于 AI 开发中“对齐税”(确保 AI 系统对齐的成本)的辩论,讨论集中在平衡道德考虑和实际功能之间。批评者主张用户自主权和有效性,而支持者则强调道德 AI 的重要性。
文章来自互联网,只做分享使用。发布者:老板不要肥肉,转转请注明出处:https://www.dingdanghao.com/article/433406.html