で発表された最近の研究 コミュニケーションのフロンティア 人工知能の環境への影響に重大な光を投げかけており、すべてのAIプロンプトが炭素排出に関して等しく作成されているわけではないことを明らかにしています。この研究は、大規模な言語モデル(LLMS)内のより複雑な「推論モデル」が、「簡潔な」カウンターパートよりも大幅に多くのCOを生成できることを強調しており、AIのエネルギー要求に関する研究者や気候擁護者の間で懸念を促しています。

この研究は、多様な主題領域にわたって500の質問の標準化されたセットを使用して14の異なるLLMを細心の注意を払って評価し、クエリごとのモデルによって生成される「思考トークン」の数とそれに関連する共同排出量との間に直接的な相関があることがわかりました。 HochschuleMünchenApplied Sciences大学の博士課程の学生であり、論文の主著者であるMaximilian Daunerは、「訓練されたLLMSに質問することの環境への影響は、推論アプローチによって強く決定され、明示的な推論プロセスがエネルギー消費と炭素排出量を大幅に駆り立てることで強く決定される」と強調しました。

具体的には、調査結果は、より大きなトレーニングセットを持ち、より多くの処理時間を必要とする推論モデルが、大幅に高いCO₂出力を生成することを示しています。場合によっては、これらの洗練されたモデルは、簡潔なモデルの排出量の最大50倍を生成しました。この格差は、提起された質問の複雑さによってさらに悪化します。高度な代数や哲学的概念を含むようなオープンエンドまたは複雑なクエリは、高校の歴史の質問のような単純なプロンプトと比較して、より大きな二酸化炭素排出量をもたらしました。

「思考モデル」と呼ばれることもある推論モデルは、ロジック、ステップバイステップの内訳、または詳細な指示を必要とする複雑なタスクに取り組むために最適化されています。これらのモデルは、OpenaiのGPT-4OやO1/O3-Miniなどのバージョンで例証されており、LLM研究者と「想定チェーン」処理と呼ばれるものを採用しています。これにより、処理時間の増加とその結果、より高いエネルギー消費のトレードオフにもかかわらず、より意図的に応答し、より多くの人間のような反応を生成することができます。逆に、一般化されたモデルは、より簡単なタスクのために速度と明確さを優先します。

研究者は、2つのフェーズでテストを実施しました。最初は複数選択の質問を使用し、その後の自由応答プロンプトが続きます。平均して、推論モデルは、質問ごとに驚くべき543.5トークンを生成しました。これは、簡潔なモデルによって生成されたわずか37.7トークンとはまったく対照的です。たとえば、最も正確な推論モデルとして特定された「Cogito」は、簡潔な応答のために最適化された同様のサイズのモデルの3倍のCo₂を生成しました。この論文は、「環境の観点から、推論モデルは一貫してより高い排出量を示し、主にその高さのトークン生産によって駆動される」と明示的に述べています。

個々のプロンプトあたりの排出量の差はわずかに見える場合がありますが、大規模な累積効果は重要です。この調査では、DeepseekのR1モデル600,000の質問を尋ねると、ロンドンからニューヨークへの往復飛行とほぼ同じ量のCO₂が生成されると予測しています。それに比べて、非合理的なQWEN 2.5モデルは、同等の排出レベルに達する前に3倍の質問に答えることができます。これは、「モデルサイズが増加するにつれて、精度が向上する傾向がある」ため、LLMの精度と環境の持続可能性の間の重要なトレードオフを強調していますが、「このゲインは、排出量と生成されたトークンの数の両方の大幅な成長にもリンクしています」。

これらの発見は、ますます高度なAIモデルを開発するために、ハイテク大手間の激しい世界的な競争の中で現れます。 AI駆動型のインフラストラクチャに対するエスカレート需要は、既存のエネルギーグリッドにかなりの負担をかける態勢が整っています。過去1年間、Appleは今後4年間に5,000億ドルの製造およびデータセンターを投資する計画を発表しました。同様に、Openai、SoftBank、およびOracleを含む共同イニシアチブであるProject Stargateは、AIに焦点を合わせたデータセンターに対して5,000億ドルに相当することを約束しました。 MIT Technology Reviewの最近のレポートは、2017年以来、データセンターが複雑なAI計算用に特別に設計されたエネルギー集約型ハードウェアをますます組み込んでおり、エネルギー消費の急増につながることを示しています。

電力研究所(EPRI)は、高度なAIモデルをサポートするデータセンターが10年末までに米国の総エネルギー需要の最大9.1%を占める可能性があり、今日の約4.4%から大幅に増加したと推定しています。この急成長するエネルギー需要を満たすために、大手ハイテク企業は多様な発電戦略を模索しています。 Meta、Google、Microsoftはすべて、原子力発電所とのパートナーシップをすべて備えています。特に、マイクロソフトは、ペンシルベニア州のスリーマイル島原子力施設からエネルギーを調達するための20年間の契約に署名し、成長するデータセンター艦隊を支援しています。また、メタは地熱技術に多額の投資を行っていますが、Openai CEOのSam Altmanは実験的な核融合に投資していると伝えられており、AIの来る年齢が「エネルギーブレークスルー」を必要とすることを認めています。これらの努力にもかかわらず、最近の研究は、AIの大規模なエネルギー要件を完全に満たすために、より多くの化石燃料、特に天然ガスが必要であることがほぼ確実であることを示唆しています。

しかし、研究者は、彼らの発見が日常のAIユーザーが炭素の影響を緩和する力を与えることができると考えています。推論モデルの大幅に高いエネルギー強度を理解することにより、ユーザーは、Web検索や基本的な質問応答などの一般的な毎日のタスクの簡潔なモデルに依存して、より控えめに使用することを選択できます。 Daunerは、この点を強調し、「ユーザーがアクションフィギュアにさりげなく変えるなど、AIが生成した出力の正確なコストを知っている場合、これらのテクノロジーをいつ、どのように使用するかについて、より選択的かつ思慮深いかもしれません。」エネルギー効率の高いAI設計の進行中の進歩と相まって、このプロアクティブなユーザーの行動は、人工知能の急速な拡大によってもたらされる環境上の課題をナビゲートする上で重要です。

Source: AI推論モデルの二酸化炭素排出量は大きく異なります

  Steam がダウンロードしない (2022): 修正方法は?