スキップしてメイン コンテンツに移動

ディープシークはAIの未来をどう変えたか、国家安全保障にとっての意味とは(Defense One)―この記事何回見直しても頭にすっと入ってこないのですが...もっとうまく説明してもらえないものでしょうか

 


中国の躍進は、効率的なツールを米国企業が構築する機会となる。米軍にとっても助けとなるだろう


国のDeepSeekが、米国の著名なツールで必要とするコンピューティングパワーのほんの一部で済む生成型AIへのアプローチを詳細に説明して数日がたち、国防総省によるAIの購入と利用方法から、外国勢力がプライバシーを含む米国の生活を混乱させる可能性まで、AIと国家安全保障に関する世界的な議論が変化を示している。

 DeepSeekによる発表で、ホワイトハウス、ウォール街、シリコンバレーから一斉に悲鳴が出た。ワシントンD.C.では、トランプ大統領がこれを「中国と競争するために、我々の産業がレーザーのように焦点を絞る必要があるという警鐘」と呼んだ。ホワイトハウスの報道官、カロライン・リービットは、国家安全保障会議が現在このアプリを検討中であると述べた。海軍はすでにこれを禁止している。ウォール街では、チップメーカーNvidiaの株価が急落した。DeepSeekの米国における最も近い競合企業であるOpenAIは不正を訴え、このアプリは本質的に自社のモデルを蒸留したものと主張している。

 もし読者が、米国は「戦略的競争を激化させている中国とのAI競争に勝たなければならない」という、2021年にエリック・シュミット元グーグル会長とロバート・ワーク元国防副長官が書いた内容に同意するなら、DeepSeekは重要な存在となる。

 なぜDeepSeekがそれほど重要なのか? 第一に、他のモデルよりもはるかにオープンソースであることが挙げられる。しかし、決定的な技術革新は、巨大モデルから高度な推論能力を抽出して、より小さく効率的なモデルに変換した能力だ。DeepSeekモデルは、より大きなオープンソースの代替モデルより優れた性能を発揮し、コンパクトなAIパフォーマンスの新たな基準(少なくとも非常に公的な基準)を設定している。

 DeepSeekは、推論能力の開発に強化学習を大いに活用しており、OpenAIなど競合他社が初期段階で一般的に使用する教師ありの微調整を回避した。このアプローチは、米国を拠点とするAI大手企業が採用するハイブリッドトレーニング戦略から意図的に乖離したものだ。

 論文で説明されているベンチマーク結果によると、DeepSeekのモデルは推論を多用するタスクにおいて非常に高い競争力を発揮し、数学やコーディングなどの分野で常にトップクラスのパフォーマンスを達成している。しかし、この研究では、推論を多用しないタスクや事実照会精度の面で脆弱性が浮き彫りになっており、この点ではOpenAIの最も進化した製品には及ばない。

 DeepSeekが大規模なコンピューティングリソースを使用せずベンチマーク結果を達成している(または本質的にはOpenAIをコピーしていない)ことを独自に検証した者はまだないが、米国によるマイクロチップの高度な管理により、中国で利用できるリソースは制限されよう。

 AIモデルの評価も行うScale AIのCEOアレックス・ワンは、CNBCのインタビューでDeepSeekをOpenAIと同等と表現した。また、同氏は中国が輸出規制にもかかわらず、NvidiaのH100チップを約5万個入手したと述べた。

 Nvidiaの広報担当者はこの主張に直接言及せず、Defense Oneに対し、「DeepSeekは優れたAIの進歩であり、テスト時間スケーリングの完璧な例です」と述べた。テスト時間スケーリングとは、モデルが新しい結果を生成するためにデータを取得している際に、コンピューティング能力を向上させる技術である。この余剰の演算能力により、モデルはさまざまな選択肢を検討し、回答の改善ができ、その結果、トレーニング(演算)回数を減らしてより良い回答に到達することができる。 モデルはその後、演算エネルギーをより効果的に集中させることができる。 これはある意味、運動に近い。最初は運動でエネルギーが消耗しますが、長期的にはエネルギーを蓄え、より効果的に使用する能力を身体に備えることとなる。

 「DeepSeekの研究は、広く利用可能なモデルと輸出管理に完全に準拠した演算を活用し、その手法を用いて新しいモデルがどのように作成できるかを示しています。推論には膨大な数のNVIDIA製GPUと高性能なネットワーク接続が必要です。現在、私たちは3つのスケーリング法則を持っています。事前トレーニングと事後トレーニング、そして継続する新しいテストタイム・スケーリングです」とNvidiaの広報担当者は語った。

 この開発は、AIの優位性を構築する方法についての議論に根本的な変化をもたらす。OpenAIのような企業が膨大なデータセット、非常に大規模なモデル、そして拡大を続けるコンピューターリソースに基づいて成果を達成する一方で、AIの次の段階では、より少ないコンピューターリソースで済む小規模なモデルが主流になる可能性が高い。

 これは、トランプ大統領の就任式に出席した大手テクノロジー企業を含む大手エンタープライズクラウドプロバイダーにとっては、悪い兆しとなるかもしれない。多くの企業は、リソースを大量消費する生成型AI製品に大きな需要を見込んでおり、代替アプローチを排除してきた。しかし、AIの構築方法に関する議論の変化は、強力なツールを必要とする軍に朗報となる可能性がある。また、国防総省が最高のAI能力を獲得しながら、同時に支出を抑える課題にも役立つ可能性がある。

人工知能が示すより小さな未来

OpenAIや大手クラウドプロバイダーとは全く異なる道を模索していたAI研究者たちは、DeepSeekの画期的な成果に驚いていない。

 データサイエンティストのドリュー・ブルーニグは本誌に対し、「DeepSeekの成功から得られる教訓があるとすれば、それは『進歩への道が単純に支出増である場合には用心すべきだ』ということだ。この道ではイノベーションは育たず、劣る競合他社は創造性を発揮し、制約の範囲内で作業せざるを得なくなり、最終的には...彼らが勝利するでしょう。支出はイノベーションではありません」。

 最近のブログ投稿で、ブルーニグは合成データが高性能モデルの生成に必要となる生データと演算能力を削減できることを説明した。「この戦術は、大規模モデルと同等の効果を小規模モデルにもたらします」と彼は述べた。

 AIスタートアップ企業Useful SensorsのCEOであるPete Wardenは、本誌に対し、「DeepSeekは、より大きなモデルに多くの費用をかけることがAIの改善につながる唯一のアプローチではないことを示しています。TinyMLは、トレーニングにかかる費用がより少ない小さなモデルを使用することで、規模に関わらず大きな影響を与えるアプリケーションを構築できるという考えがベースです」と語った。

 しかし、スタンフォード大学のAI研究者リトウィク・グプタは、同僚数名とともに大きな成果を生み出す小型AIモデルの構築に関する画期的な論文を執筆しており、DeepSeekに関する多くの誇張された報道は、その実態を正しく理解していないと警告している。グプタは、6710億のパラメータを持つ「依然として大きなモデル」と表現している。

 「しかし、DeepSeek-R1チームがファーストパーティの『蒸留』バージョンのモデルを提供していることが注目に値します」と、グプタは本誌に語った。「DeepSeekが行ったのは、15億から70億のパラメータを持つLlamaとQwenの小型バージョンを取り出し、DeepSeek-R1の出力で訓練したことです。これにより、『R1のような』モデルをラップトップやスマートフォンなど小型デバイスで動作させることが可能になります」。

 DeepSeekの性能は、可能性を示す限りにおいて、国防総省が業界との協議で有利な立場を得ることを可能にし、また、国防総省はより多くの競合企業を見つけることが可能になるだろう。

 「国防総省がDeepSeekとQwenのアメリカ製オープンソース版を採用しても驚きません」とグプタは言う。「国防総省は、本来はクラウドのみで提供されるサービスについて、特別なオンプレミス版を要求する権限を常に持っています。彼らがOpenAIとClaudeに同様の要求をしたとしても私は驚きません」。

 AI Now Instituteの主任AI科学者Heidy Khlaafは、兵器システムと国家安全保障におけるAIの安全性に研究の焦点を当てている。フラーフはこの画期的な技術が現実なら、生成型AIの使用が、潜在的には小規模メーカーを含むより小規模なプレイヤーにも開放される可能性があると本誌に述べた。しかし、そのようなモデルは戦闘には適さないという。

 「一般的に、LLMや基礎モデルは、信頼性と正確性が求められるアプリケーションではエラーが発生しやすいことから、安全が重視される作業には適しません。しかし、DeepSeekの規模と能力により、これまでアクセスできなかった小規模事業者でも基礎モデルが利用できるようになります。これには、基礎モデルを安全が重視されない方法で使用することに関心を持つ自動車メーカーも含まれるでしょう」。

 バークレーにある政治におけるセキュリティセンターでテクノロジーとサイバーセキュリティのポートフォリオを統括するアンドリュー・レッディングは、本誌に対し、「DeepSeekの性能は、AI研究者が計算量を減らしながらモデルを開発できるようになった経緯を追っている私たちにとっては、まったく驚くことではありません」と語った。

 米国企業は、この画期的な成果を、異なる方向でのイノベーションを追求する好機と捉えるべきであるとレッディングは述べた。「中国の研究者が直面しているコンピューティング上の課題(NVIDIA GPUの輸出規制)は、コンピューティング能力が制限されている米国の研究者が直面している課題と、それほど違いはありません」。

 米軍はすでに、戦闘員に可能な限り近い場所でコンピューティングパワーを確保するために、エッジ機能に多額の資金を投じている。小型モデルの性能における画期的な進歩は、エッジコンピューティングへの投資が価値を増していることを示すものだと、レディングは述べた。 

 「軍事的な文脈において、クローズドモデルとオープンモデルのどちらを使用するかという点は非常に興味深い問題です」と、述べ、前者の利点は、政府ネットワーク内で簡単に移動でき、政府/軍事データを利用できることだが、敵対国が訓練データやモデルの重み付けなどにアクセスする明白なリスクがあります。

 しかし、DeepSeekの発表から得られる最も重要な教訓は、米国と中国の競争での意味ではなく、個人や公共機関、そしてテクノロジー業界のプレイヤーがますます少数のグループに絞られていくことを懐疑的に見る人々にとっての意味であるのかもしれない。大手企業が提供するツールに頼らず、自分で生成型AIツールを構築し、自分で管理するデータを使用したい人にとっては、これは朗報となる。

 「インターネットは、歴史的に分散型サービスとして発展してきました」とグプタは述べた。「もし、誰もが自分だけの『パーソナルAI』を持ちたいとすれば、小規模モデルを個人のデバイス上で実行する必要が出てくる。プライバシーを最優先するモデルを持つAppleのような企業が、オフラインで非接続mpアルゴリズムを推進し続けることを期待したい」。

 しかし、フラーフは、精製モデルを大規模モデルに置き換えることは、個人情報の公開が民間人と同様に軍にも影響を及ぼし、敵対的な標的設定や強制などで脆弱性を生み出すため、軍隊にもプライバシーリスクをもたらす可能性があると警告している。

 そして、アメリカ人の個人情報の広範な公開は、それ自体が国家の脆弱性であり、軍指導者が指摘しているように、紛争時に敵対者に利用される可能性がある。個人が自身のデータをより適切に保護できる改革を行わない限り、DeepSeekのような強力な小型モデルが蔓延することで、悪い傾向がさらに悪化する可能性がある。 

 「DeepSeekは、大規模モデルが常に高い性能を発揮するという考え方に異議を唱えるものです。AIモデルを大規模に構築することに伴うセキュリティとプライバシーの脆弱性という観点で重要な意味を持ちます」(フラーフ)。

 個人のプライバシーに関しては、「蒸留技術により、より大きなモデルの特性の多くを維持したまま、小さなモデルに圧縮することが可能になります。基礎モデルを訓練するため自らのデータを提供した市民にとっては、DeepSeekの蒸留モデルにもプライバシーの問題がすべて引き継がれることになります。それが、機密データでAIモデルを訓練することが国家安全保障上のリスクをもたらす可能性があると警告している理由です」。


How DeepSeek changed the future of AI—and what that means for national security

China’s breakthrough is an opportunity for American companies to build more efficient tools. That will also help the U.S. military.


BY PATRICK TUCKER

https://www.defenseone.com/technology/2025/01/how-deepseek-changed-future-aiand-what-means-national-security/402594/?oref=d1-featured-river-top


コメント

このブログの人気の投稿

漁船で大挙押し寄せる中国海上民兵は第三の海上武力組織で要注意

目的のため手段を択ばない中国の思考がここにもあらわれていますが、非常に厄介な存在になります。下手に武力行使をすれば民間人への攻撃と騒ぐでしょう。放置すれば乱暴狼藉の限りを尽くすので、手に負えません。国際法の遵守と程遠い中国の姿勢がよく表れています。尖閣諸島への上陸など不測の事態に海上保安庁も準備は万端であるとよいですね。 Pentagon reveals covert Chinese fleet disguised as fishing boats  漁船に偽装する中国軍事組織の存在をペンタゴンが暴露   By Ryan Pickrell Daily Caller News Foundation Jun. 7, 3:30 PM http://www.wearethemighty.com/articles/pentagon-reveals-covert-chinese-fleet-disguised-as-fishing-boats ペンタゴンはこのたび発表した報告書で中国が海洋支配を目指し戦力を増強中であることに警鐘を鳴らしている。 中国海上民兵(CMM)は準軍事組織だが漁民に偽装して侵攻を行う組織として長年にわたり活動中だ。人民解放軍海軍が「灰色」、中国海警が「白」の船体で知られるがCMMは「青」船体として中国の三番目の海上兵力の位置づけだ。 CMMが「低密度海上紛争での実力行使」に関与していると国防総省報告書は指摘する。 ペンタゴン報告書では中国が漁船に偽装した部隊で南シナ海の「灰色領域」で騒乱を起こすと指摘。(US Navy photo) 「中国は法執行機関艦船や海上民兵を使った高圧的な戦術をたびたび行使しており、自国の権益のため武力衝突に発展する前にとどめるという計算づくの方法を海上展開している」と同報告書は説明。例としてヘイグの国際仲裁法廷が中国の南シナ海領有主張を昨年7月に退けたが、北京はCMMを中国が支配を望む地帯に派遣している。 「中国は国家管理で漁船団を整備し海上民兵に南シナ海で使わせるつもりだ」(報告書) 中国はCMMはあくまでも民間漁船団と主張する。「誤解のないように、国家により組織し、整備し、管理する部隊であり軍事指揮命令系統の下で活動している」とアンドリュー・エリク...

海自の次期イージス艦ASEVはここがちがう。中国の055型大型駆逐艦とともに巡洋艦の域に近づく。イージス・アショア導入を阻止した住民の意思がこの新型艦になった。

  Japanese Ministry of Defense 日本が巡洋艦に近いミサイル防衛任務に特化したマルチロール艦を建造する  弾 道ミサイル防衛(BMD)艦2隻を新たに建造する日本の防衛装備整備計画が新たな展開を見せ、関係者はマルチロール指向の巡洋艦に近い設計に焦点を当てている。実現すれば、は第二次世界大戦後で最大の日本の水上戦闘艦となる。 この種の艦船が大型になる傾向は分かっていたが、日本は柔軟性のない、専用BMD艦をこれまで建造しており、今回は船体形状から、揚陸強襲艦とも共通点が多いように見える。 この開示は、本日発表された2024年度最新防衛予算概算要求に含まれている。これはまた、日本の過去最大の529億ドルであり、ライバル、特に中国と歩調を合わせる緊急性を反映している。 防衛予算要求で優先される支出は、イージスシステム搭載艦 ( Aegis system equipped vessel, ASEV) 2隻で、それぞれ26億ドルかかると予想されている。 コンピューター画像では、「まや」級(日本の最新型イージス護衛艦)と全体構成が似ているものの、新型艦はかなり大きくなる。また、レーダーは艦橋上部に格納され、喫水線よりはるか上空に設置されるため、水平線を長く見渡せるようになる。日本は、「まや」、「あたご」、「こんごう」各級のレーダーアレイをできるだけ高い位置に取り付けることを優先してきた。しかし、今回はさらに前進させる大きな特徴となる。 防衛省によると、新型ASEVは全長約620フィート、ビーム82フィート、標準排水量12,000トンになる。これに対し、「まや」クラスの設計は、全長557フィート強、ビーム約73フィート、標準排水量約8,200トンだ。一方、米海軍のタイコンデロガ級巡洋艦は、全長567フィート、ビーム55フィート、標準排水量約9,600トン。 サイズは、タイコンデロガ級が新しいASEV設計に近いが、それでもかなり小さい。Naval News報道によると、新型艦は米海軍アーレイ・バーク級フライトIII駆逐艦の1.7倍の大きさになると指摘している。 武装に関して言えば、新型ASEVは以前の検討よりはるかに幅広い能力を持つように計画されている。 同艦の兵器システムの中心は、さまざまな脅威に対する防空・弾道ミサイル防衛用のSM-3ブロックII...

次期高性能駆逐艦13DDXの概要が明らかになった 今年度に設計開始し、2030年代初頭の就役をめざす

最新の海上安全保障情報が海外メディアを通じて日本国内に入ってくることにイライラしています。今回は新型艦13DDXについての海外会議でのプレゼン内容をNaval Newsが伝えてくれましたが、防衛省防衛装備庁は定期的にブリーフィングを報道機関に開催すべきではないでしょうか。もっとも記事となるかは各社の判断なのですが、普段から防衛問題へのインテリジェンスを上げていく行為が必要でしょう。あわせてこれまでの習慣を捨てて、Destroyerは駆逐艦と呼ぶようにしていったらどうでしょうか。(本ブログでは護衛艦などという間際らしい用語は使っていません) Early rendering of the 13DDX destroyer for the JMSDF. ATLA image. 新型防空駆逐艦13DDXの構想 日本は、2024年度に新型のハイエンド防空駆逐艦13DDXの設計作業を開始する 日 本の防衛省(MoD)高官が最近の会議で語った内容によれば、2030年代初頭に就役開始予定のこの新型艦は、就役中の駆逐艦やフリゲート艦の設計を活用し、変化する脅威に対し重層的な防空を提供するため、異なるコンセプトと能力を統合する予定である。  防衛装備庁(ATLA)の今吉真一海将(海軍システム部長)は、13DDX先進駆逐艦のコンセプトは、「あさひ」/25DD級駆逐艦と「もがみ」/30FFM級フリゲート艦の設計を参考にすると、5月下旬に英国で開催された海軍指導者会議(CNE24)で語った。  この2つの艦級は、それぞれ2018年と2022年に就役を始めている。  13DDX型は、海上自衛隊(JMSDF)が、今吉の言う「新しい戦争方法」を含む、戦略的環境の重大かつ地球規模の変化に対抗できるようにするために必要とされる。防衛省と海上自衛隊は、この戦略的環境を2つの作戦文脈で捉えている。  第一に、中国、北朝鮮、ロシアが、極超音速システムを含むミサイル技術、電子戦(EW)を含むA2/AD能力の強化など、広範な軍事能力を急速に開発している。第二に、ウクライナにおけるロシアの戦争は、弾道ミサイルや巡航ミサイルの大規模な使用、EWやサイバー戦に基づく非対称攻撃、情報空間を含むハイブリッド戦争作戦、無人システムの使用など、新たな作戦実態を露呈したと説明した。  新型駆逐艦は、敵の対接近・領域拒否(A2/A...