目录


就在刚刚Anthropic公司宣布推出 Claude 3模型家族 ,这个家族包括三个顶尖的模型,按能力递增排序:Claude 3 Haiku、Claude 3 Sonnet 和 Claude 3 Opus。每个后续模型都提供越来越强大的性能,允许用户为他们特定的应用选择智能、速度和成本之间的最佳平衡。Opus 和 Sonnet 现在可以在 claude.ai 和 Claude API 中使用,后者现已在 159 个国家/地区普遍可用。

据说这个模型是超越了GPT4,让我看看他到底有什么本事。有需要开通GPT4的朋友可以参考下面这篇文章:ChatGPT4.0升级保姆级教程

Claude 3 模型系列

Opus 是最智能的模型,在大多数常见的 AI 系统评估基准上都优于同行,包括本科水平专家知识 (MMLU)、研究生水平专家推理 (GPQA)、基础数学 (GSM8K) 等。它对复杂任务表现出接近人类的理解力和流利度,引领着通用智能的前沿。所有 Claude 3 模型在分析和预测、细致入微的内容创建、代码生成以及使用西班牙语、日语和法语等非英语语言进行交谈方面都显示出更高的能力。

Claude3与GPT4的比较

以下是 Claude 3与多个模型的比较:

由此可见,Claude3已经超越了GPT4,成为当前最强大的模型!

极快的响应速度

Claude 3 可以支持实时客户交流、自动文本补全和数据提取等任务,这些任务要求响应迅速且即时。Haiku 模型是最快速度和高成本效益的,它能够在短短三秒内处理和解读arXiv上的信息密集研究论文(约10k个字符),包括论文中的图表和图形元素。我们预期Haiku在发布后将进一步优化性能。相比之下,Sonnet 在处理速度上比 Claude 2 和 Claude 2.1 快两倍,并展现出更高的智能水平。它特别适用于需要快速反应的场景,如知识查询或销售流程自动化。至于 Opus,则在保持与 Claude 2 和 2.1 相似的处理速度的同时,提供了更高级别的智能。

超强的视觉能力

Claude 3 模型拥有与其他领先模型相当的复杂视觉能力。它们能够处理包括照片、图表、图形和技术图纸在内的各种视觉格式。

更精准的答案

Claude使用了一套大型的复杂、事实性问题集,这些问题针对当前模型的已知弱点。他们将响应分类为正确答案、错误答案(或幻觉),以及不确定性的承认,即模型表示它不知道答案,而不是提供错误信息。与Claude 2.1相比,Opus在这些具有挑战性的开放式问题上展示了两倍的准确度提升(或正确答案),同时还降低了错误答案的水平。

也就是说模型会告诉你他不懂,而不是乱说从而误导你。(深受GPT4的欺骗)

更长的记忆

Claude提供了长达200k的上下文窗口。为了有效处理长篇的上下文提示,模型需要强大的回忆能力。”大海捞针”(Needle In A Haystack,NIAH)评估衡量模型从大量数据中准确回忆信息的能力。我们通过使用30个随机针/问题对中的一个来增强这一基准测试的健壮性,并在多样化的众包文档库上进行测试。Claude 3 Opus不仅实现了近乎完美的回忆能力,准确率超过99%,而且在某些情况下,它甚至识别出了评估本身的局限性,通过识别“针”句似乎是人为插入到原始文本中的。

价格方面

  • 三个版本能力大小:Haiku < Sonnet < Opus
  • Claude 3 Opus 宣称能力全面超越了 GPT-4
  • 多模态能力:支持输入图片
  • 三个模型均默认支持 200K 的 Context Window,可定制到 1 百万 Context Window
  • API 价格(每百万 Token 的输入/输出)
    • Opus:15 / 75 USD
    • Sonnet:3 / 15 USD
    • Haiku:0.25 / 1.25 USD

有需要使用的可以到Claude官网:Claude \ Anthropic