大型语言模型相关文章列表

微调真的能让LLM学到新东西吗:引入新知识可能让模型产生更多的幻觉

大型语言模型（llm）是在巨大的文本数据库上训练的，在那里它们获得了大量的实际知识。这些知识嵌入到它们的参数中，然后可以在需要时使用。这些模型的知识在训练结束时被“具体化”。在预训练结束时，模型实际上停止学习。对模型进行对齐或进行指令调优，

pansz

2024-05-30

79000

科技

从Claude 3中提取数百万特征，首次详细理解大模型的「思维」

刚刚，Anthropic 宣布在理解人工智能模型内部运作机制方面取得重大进展。Anthropic已经确认了如何在Claude Sonnet中表示征函数百万个概念。这是对现代生产级大型语言模型的首次详细理解。这种可解释性将帮助我们提高人工智能

张大嘴

2024-05-23

61000

科技

知识图与大型语言模型的协同作用

从非结构化文本中提取有价值的信息是金融行业的关键应用。然而，这项任务往往超出了简单的数据提取，需要高级推理能力。一个典型的例子是确保信贷协议中的到期日，这通常涉及及时遵守和破译一个复杂的指令，如“到期日应在生效日期三周年之前的最后一个工作日

pansz

2024-05-16

97000

科技

LLM 评估新纪元：Arthur Bench 全方位解读

一、传统文本评估面临的挑战
近年来，随着大型语言模型（LLM）的快速发展和改进，传统的文本评估方法在某些方面可能已经不再适用。在文本评估领域，我们可能已经听说过一些方法，例如基于“单词出现”的评估方法，例如BLEU，以及基于“预训练的自然语

momo

2024-05-10

107000

电脑

Claude是什么

Claude是Anthropic人工智能公司发布的大型语言模型，拥有高级推理、视觉分析、代码生成、多语言处理、多模态等能力，对标ChatGPT、Gemini等产品。 Claude 是由 Anthropic 开发的一系列大型语言模型。首个模型于 2023 年 3 月发布。2024 年 3 月发布的 Claude 3 还具备图像分析能力。 Claude 模型是生…

老板不要肥肉

2024-05-01

81000