DeepSeek v3.1がOpenAIのオープンソース復活を静かに圧倒

出典: https://cryptonews.net/news/analytics/31499655/
参考元: decrypt.co
OpenAIがオープンソースに華々しく復帰
OpenAI(@OpenAI)は、8月5日にgpt-oss-20bを発表し、広く注目を集めた。このモデルはAIの民主化を目指し、強力な推論能力とエージェント機能を持ち、一般的なハードウェアで動作できることが特徴である。
DeepSeek AIがDeepSeek v3.1を発表
そして、2週間後の8月21日、中国のスタートアップDeepSeek AI(@deepseek_ai)は、プレスリリースやメディアキャンペーンなしに、DeepSeek v3.1をツイートで発表した。このモデルはハイブリッド思考アーキテクチャを特徴としている。
オープンソースの利点と欠点
オープンソースの大規模言語モデル(LLM)を運営することには、本物のトレードオフ(相互の利益と損失)が伴う。自由に検閲を取り除いたり、特定の分野に特化したりできる一方で、しばしば安全性が低いという欠点がある。低コストで利用できるが、実行環境に依存したり、安定性に欠けたりすることがある。
OpenAIのgpt-oss-20bとDeepSeek v3.1の比較
OpenAIはDeepSeekやMetaのLlama 4に対抗するために、20億パラメータのモデルを発表した。テストにより、1つのモデルは期待通りの結果を出し、もう1つは期待に応えられなかった。
コーディング能力
OpenAIのモデルはコーディング面では期待外れだった。特に、20b版は正常な出力を出せないままタイムアウトした。一方、DeepSeekは複雑なゲームのための機能的でバグのないコードを提供した。
クリエイティブライティングのスキル
新しいモデルは、クリエイティブライティングを重要視していないことが多い。しかし、DeepSeekは期待を裏切り、興味深い物語を作成した。対照的にOpenAIの出力は表面的であった。
カスタマイズ性
OpenAIはgpt-oss-20bの特定分野に特化したバージョンを開発者コミュニティが制作している点で優位に立っている。これに対し、DeepSeekはまだこのようなバリエーションが不足している。
感情的知性の違い
Sensitive topics(敏感な話題)に関して、DeepSeekは状況を総合的に把握し、より有益な回答を提供することができた。OpenAIのモデルは単に「お手伝いできません」と返答するだけであった。
情報検索の観点
オープンソースモデルでは、ユーザーがシステムを制御できるため、情報検索に関するスコアカードは存在しない。そのため、従来のサービスと同じパフォーマンスにはならない。
結論
DeepSeek v3.1は、オープンソースAIが達成しうる新たなレベルを示しており、魅力的なフィクションを書き、敏感な話題にも適切に対処し、効果的に推論し、機能するコードを生成する。OpenAIのgpt-oss-20bは、思考過多に苦しむが、数学的能力には一定の評価がある。
まとめ
OpenAIのgpt-oss-20bとDeepSeek v3.1は、それぞれ異なる強みと弱みを持つ。DeepSeekは特にクリエイティブな能力に優れ、一方でOpenAIは数学的な潜在能力を示している。今後の進展に期待がかかる。
用語説明
- オープンソース: 誰でもソースコードを見たり、変更したりできるソフトウェア。
- 推論: 基本的な情報を元に新たなベクトル(方向性や見解)を導き出すプロセス。
- パラメータ: モデルが持つ調整可能な設定や特性。
- フィクション: 作り上げられたストーリーや物語。
- 感情的知性: 他者の感情や状況を理解し、適切に対応する能力。
想定シナリオ(かんたん解説)
ベースシナリオ
新モデルが登場し、ユーザーから注目を集める。多くのフィードバックが集まることで、機能が改善される。利用者数が増加し、開発が進む。
強気シナリオ
モデルが他の主要な競技者を上回り、専門領域での活用が拡大する。市場の反応が良く、価格が上昇する。利用の拡大に伴い、品質向上の指標が顕著になる。
弱気シナリオ
競争が激化する中で、モデルの不足点が露呈する。ユーザーの離反が始まり、価格が下落し、開発が停滞する。固定ユーザーの指標が悪化することに注目が集まる。
今後の展開がますます注目される。