スキップしてメイン コンテンツに移動

投稿

ラベル(DeepSeek)が付いた投稿を表示しています

ディープシークのAIブレイクスルーは AIにおける中国の "スプートニクの瞬間"になったのか?(19fortyfive)―こちらのほうが理解しやすい内容と思います。

DeepSeek AI. Image Credit: Creative Commons. 人 工知能の進歩がトランプ大統領の二回目の就任早々、大きな話題となっている。先週、トランプ大統領は Stargate と呼ばれる新しいプロジェクトを発表し、 OpenAI 、 オラクル 、 ソフトバンク がホワイトハウスのイベントで、AIインフラに1億ドル(おそらく長期的には5億ドル)を投資すると発表した。  その直後、トランプ大統領の盟友イーロン・マスクがこのプロジェクトを公の場で非難し、「彼らは実際には資金を持っていない」とXで主張した。この投稿は、大統領顧問から通常は見られない類のもので、トランプのホワイトハウス・スタッフを怒らせたと言われている。  そして今、アメリカのハイテク企業にとって最も順調だったAI計画を脅かす、もうひとつの重要なAIの開発があった。 ディープシーク   DeepSeek は中国の人工知能ベンチャー企業で、同社のチャットボット「R1」が米国のアプリストアに今週登場した。TikTokの禁止をめぐる騒動から間もなく、別の中国製アプリがアップルとグーグルのアプリストアのトップに躍り出たわけだ。  「DeepSeek-R1は現在稼働中で、オープンソースであり、OpenAIのModel o1に匹敵する。 ウェブ、アプリ、APIで利用可能」と同社のウェブサイトは述べている。 DeepSeekはアメリカのライバルとどう違うのか? 「米国ハイテク業界が心配しているのは、中国のスタートアップがわずかなコストで生成AIの最前線にいる米国企業に追いついたという考えだ。 もしそれが本当なら、米国のハイテク企業がAIのさらなる進化に必要なデータセンターやコンピューターチップに費やすと言う巨額の資金に疑問を投げかけることになる。 このソフトウェアはオープンソースであり、アメリカのライバル企業よりはるかに安いと言われている。 深い反落 R1の登場は、月曜日にハイテク株を暴落させるのに十分だった。ロイター通信によると、AIチップのリーディング・カンパニーであるエヌビディアは月曜日に17%下落し、1日の時価総額5930億ドルの損失は史上最大規模となった。エヌビディアは火曜日の取引開始早々、その価値の一部を取り戻した。  なぜ大きく売られたのか? ディープシークは、ニューヨーク・タ...

ディープシークはAIの未来をどう変えたか、国家安全保障にとっての意味とは(Defense One)―この記事何回見直しても頭にすっと入ってこないのですが...もっとうまく説明してもらえないものでしょうか

  中国の躍進は、効率的なツールを米国企業が構築する機会となる。米軍にとっても助けとなるだろう 中 国の DeepSeek が、米国の著名なツールで必要とするコンピューティングパワーのほんの一部で済む生成型AIへのアプローチを詳細に説明して数日がたち、国防総省によるAIの購入と利用方法から、外国勢力がプライバシーを含む米国の生活を混乱させる可能性まで、AIと国家安全保障に関する世界的な議論が変化を示している。  DeepSeekによる発表で、ホワイトハウス、ウォール街、シリコンバレーから一斉に悲鳴が出た。ワシントンD.C.では、トランプ大統領がこれを「中国と競争するために、我々の産業がレーザーのように焦点を絞る必要があるという警鐘」と呼んだ。ホワイトハウスの報道官、カロライン・リービットは、国家安全保障会議が現在このアプリを検討中であると述べた。海軍はすでにこれを禁止している。ウォール街では、チップメーカー Nvidia の株価が急落した。DeepSeekの米国における最も近い競合企業である OpenAI は不正を訴え、このアプリは本質的に自社のモデルを蒸留したものと主張している。  もし読者が、米国は「戦略的競争を激化させている中国とのAI競争に勝たなければならない」という、2021年にエリック・シュミット元グーグル会長とロバート・ワーク元国防副長官が書いた内容に同意するなら、DeepSeekは重要な存在となる。  なぜDeepSeekがそれほど重要なのか? 第一に、他のモデルよりもはるかにオープンソースであることが挙げられる。しかし、決定的な技術革新は、巨大モデルから高度な推論能力を抽出して、より小さく効率的なモデルに変換した能力だ。DeepSeekモデルは、より大きなオープンソースの代替モデルより優れた性能を発揮し、コンパクトなAIパフォーマンスの新たな基準(少なくとも非常に公的な基準)を設定している。  DeepSeekは、推論能力の開発に強化学習を大いに活用しており、OpenAIなど競合他社が初期段階で一般的に使用する教師ありの微調整を回避した。このアプローチは、米国を拠点とするAI大手企業が採用するハイブリッドトレーニング戦略から意図的に乖離したものだ。  論文で説明されているベンチマーク結果によると、DeepSeekのモデルは推論を多用するタス...