diff --git a/pages/models/_meta.jp.json b/pages/models/_meta.jp.json index 253eb2d45..c847c221b 100644 --- a/pages/models/_meta.jp.json +++ b/pages/models/_meta.jp.json @@ -1,6 +1,7 @@ { "flan": "Flan", "chatgpt": "ChatGPT", + "claude-3": "Claude 3", "llama": "LLaMA", "gpt-4": "GPT-4", "mistral-7b": "Mistral 7B", diff --git a/pages/models/claude-3.jp.mdx b/pages/models/claude-3.jp.mdx new file mode 100644 index 000000000..b5fa81758 --- /dev/null +++ b/pages/models/claude-3.jp.mdx @@ -0,0 +1,26 @@ +# Claude 3 + +Anthropicは、Claude 3 Haiku、Claude 3 Sonnet、Claude 3 Opusを含む新しいモデル群、Claude 3を発表しました。 + +Claude 3 Opus(最も強力なモデル)は、MMLUやHumanEvalのような一般的なベンチマークにおいて、GPT-4や他のすべてのモデルを凌駕することが報告されています。 + +## Results and Capabilities + +Claude 3は、高度な推論や数学的能力だけでなく、データ分析、予測、コンテンツ作成、コード生成といった幅広いタスクをこなすことができます。さらに、スペイン語、日本語、フランス語など、複数の言語に対応しているのも特徴です。以下の表は、複数のベンチマークにおいて、Claude 3が他のモデルを凌駕していることを示しています。特に、Claude 3 Opusは、比較対象となった全てのモデルにおいて最高のパフォーマンスを発揮しました。 + +!["Claude 3 Benchmarks"](../../img/claude/claude-benchmark.png) + +Claude 3 Haikuは、シリーズの中で最も速く、最もコスト効率が高いモデルです。Claude 3 Sonnetは、以前のClaudeよりも2倍速く、OpusはClaude 2.1と同じ速さで、より優れた性能を持っています。 + +Claude 3モデルは、最大20万トークンのコンテキストウィンドウをサポートし、特定の顧客に対しては100万トークンまで拡張可能な柔軟性を備えています。Claude 3 Opusは、Needle In A Haystack(NIAH)評価において、膨大な量のテキストデータから、特定の情報を探し出す能力が非常に高いことが実証されました。これは、モデルが長いコンテキストのプロンプトを理解し、関連性の高い情報を正確に抽出できることを示しています。 + +また、これらのモデルは、写真、チャート、グラフなどのの画像を理解し、処理する能力を高度に備えています。 + +!["Claude 3 Vision Capabilities"](../../img/claude/claude-vision.png) + +Anthropicは、これらのモデルが、人間の指示に含まれる微妙なニュアンスをより深く理解し、不適切な要求に対しては適切に拒否する能力が向上したと述べています。Opusは、答えが一つに定まらないようなオープンな質問に対しても、正確な事実を基にした回答を生成し、誤った回答やハルシネーションが減少しました。さらに、Claude 3モデルは、JSON形式のような構造化データを生成する能力において、前世代のClaude 2モデルを凌駕しています。 + +## References + +- [Claude 3 Haiku, Claude 3 Sonnet, and Claude 3 Opus](https://www.anthropic.com/news/claude-3-family) +- [The Claude 3 Model Family: Opus, Sonnet, Haiku](https://www-cdn.anthropic.com/de8ba9b01c9ab7cbabf5c33b80b7bbc618857627/Model_Card_Claude_3.pdf) \ No newline at end of file