DeepSeek、高性能かつ低価格な大規模言語モデル「DeepSeek V3」を発表!¶
2024年6月20日、DeepSeekは、最新の大規模言語モデル「DeepSeek V3」を発表しました。MoEアーキテクチャを採用することで、前モデルと比較して推論速度が大幅に向上しています。また、様々なベンチマークにおいてオープンソースモデルの中でトップクラスの性能を誇り、世界最先端のクローズドソースモデルに匹敵する実力を持っています。
DeepSeek V3の特徴¶
DeepSeek V3は、以下のような特徴を持っています。
- MoEアーキテクチャの採用: Mixture of Experts (MoE) アーキテクチャを採用することで、推論速度が大幅に向上しました。
- 高性能: 様々なベンチマークにおいて、オープンソースモデルの中でトップクラスの性能を誇ります。
- 低価格なAPI: APIの価格が非常に低く設定されており、コストパフォーマンスに優れています。
- 中国語に強い: 中国語の性能が非常に高く、百科事典的な知識や長文テキストのパフォーマンスにも優れています。
DeepSeek V3の性能¶
DeepSeek V3は、以下のベンチマークにおいて優れた性能を示しています。
- MMLU (EM): 88.5
- MMLU-Redux (EM): 89.1
- MMLU-Pro (EM): 75.9
- DROP (3-shot F1): 91.6
- HumanEval-Mul (Pass@1): 82.6
- LiveCodeBench (Pass@1-COT): 40.5
- AIME 2024 (Pass@1): 39.2
- MATH-500 (EM): 90.2
- CLUEWSC (EM): 90.9
- C-Eval (EM): 86.5
これらの結果から、DeepSeek V3は、特にコード生成や数学、中国語の能力において優れていることがわかります。
DeepSeek V3のAPI価格¶
DeepSeek V3のAPI価格は、以下の通りです。
- 入力トークン: 100万トークンあたり ¥1 ($0.14)
- 出力トークン: 100万トークンあたり ¥2 ($0.28)
この価格は、他の大規模言語モデルのAPIと比較して非常に低く設定されており、コストパフォーマンスに優れています。
DeepSeek V3の使い方¶
DeepSeek V3は、以下の方法で利用できます。
- DeepSeek Chat: DeepSeekのウェブサイト上で、DeepSeek V3とチャット形式で会話できます。
- DeepSeek Platform: DeepSeekのAPIを利用して、DeepSeek V3をアプリケーションに組み込むことができます。
- DeepSeek App: DeepSeekのモバイルアプリを利用して、DeepSeek V3とチャット形式で会話できます。
まとめ¶
DeepSeek V3は、高性能かつ低価格な大規模言語モデルです。MoEアーキテクチャの採用により推論速度が大幅に向上し、様々なベンチマークにおいてオープンソースモデルの中でトップクラスの性能を誇ります。また、APIの価格が非常に低く設定されており、コストパフォーマンスに優れています。
DeepSeek V3は、研究者や開発者にとって非常に魅力的な大規模言語モデルです。今後のさらなる発展に期待しましょう。
AICUからのお知らせ¶
AICU mediaでは、生成AIに関する最新情報や技術解説などを発信しています。ぜひ、noteのフォローやメールマガジン「週刊AICU通信」の購読をお願いします!
📝noteでのフォロー https://note.com/aicu 📩メールマガジン「週刊AICU通信」購読 https://corp.aicu.ai/ja 📚️Kindle「月刊AICUマガジン」 https://j.aicu.ai/kindle
また、最新情報をキャッチアップしたい方は、ぜひXで @AICUai をフォローしてください!
noteタグ群¶
生成AI #LLM #DeepSeek #DeepSeekV3 #MoE #API #オープンソース #中国語 #AI #機械学習 #自然言語処理 #大規模言語モデル #低価格 #高性能 #チャットボット¶
Stable Diffusion プロンプト例¶
Anime style red-haired 20-year-old kind boyfriend who affirms his girlfriend with all his might, round chin, 1boy, solo, male focus, (streaked hair), red short hair with light highlight, red eyes, hoodie, looking at viewer,short hair, hair between eyes, portrait, simple background, a young man with red hair explaining the structure of the MoE architecture