Apple は引き続き人工知能の開発に全力で取り組んでいます。 最後に、OpenELM (.
Appleは、クラウドサーバーを必要とせずに人工知能の能力と機能をユーザーに提供することを目指しており、これらのモデルの最も重要な特徴はデバイス上で動作できることであると述べています。
それまでの間、私たちは最近、ブルームバーグのマーク・ガーマン氏の発言と、iOS 18 の AI LLM に関する詳細を皆さんと共有しました。新しい人工知能モデルについて私たちが知っていることはここにすべてあります。
OpenELMとは何ですか?
OpenELM は 8 つのモデルで構成されます。 4 つは事前トレーニングされていますが、他のものは特定の指示と入力でカスタマイズできます。 モデルは比較的小さく (2 億 7,000 万から 30 億のパラメーター)、デバイス上で実行するように最適化されています。
Apple は、レイヤーベースのスケーリング戦略を使用して、モデルの精度と効率を向上させています。
一方、OpenELM モデルの使用には多くの利点があります。:
- オンデバイスAI処理: OpenELM モデルを使用すると、クラウド サーバーを必要とせず、AI 機能をデバイス上で直接実行できます。 これにより、プライバシーとデータ セキュリティの両方が大幅に向上します。
- コストの削減: クラウド サーバーへの依存が軽減されるため、コストが削減されます。
- 応答時間の短縮: オンデバイスのデータ処理により、応答時間が短縮され、ユーザー エクスペリエンスがよりスムーズになります。
- さらなる研究開発: OpenELM モデルはオープンソースであるため、研究者や開発者はモデルを研究し、改善することができます。 これにより、AI技術の進歩と次世代アプリケーションの開発が加速します。
Apple は新しい言語モデルについて次の声明を発表しました。:
大規模な言語モデルの再現性と透明性は、オープンリサーチを推進し、結果の信頼性を確保し、データとモデルのバイアス、および潜在的なリスクの調査を可能にするために非常に重要です。 この目的を達成するために、私たちは最先端のオープン言語モデルである OpenELM をリリースします。 OpenELM は、レイヤーごとのスケーリング戦略を使用して、トランスフォーマー モデルの各レイヤー内でパラメーターを効率的に割り当て、精度の向上につながります。 たとえば、パラメータ バジェットが約 10 億の場合、OpenELM は OLMo と比較して精度が 2.36% 向上し、必要な事前トレーニング トークンの量は 2 倍少なくなります。
モデルの重みと推論コードを提供し、プライベート データセットで事前トレーニングするだけだった従来の実践とは異なり、私たちのリリースには、トレーニング ログ、複数のチェックポイント、事前トレーニングなど、公開されているデータセットで言語モデルをトレーニングおよび評価するための完全なフレームワークが含まれています。構成。 また、Apple デバイスでの推論と微調整のためにモデルを MLX ライブラリに変換するコードもリリースします。 この包括的なリリースは、オープンな研究コミュニティに力を与え、強化し、将来のオープンな研究への道を開くことを目的としています。
また、OpenELM についてさらに詳しく知りたい場合は、この詳細レポートを確認してください。
Apple の計画には、OpenELM モデルを iOS 18 オペレーティング システムで利用できるようにすることが含まれています。 iOS 18 には、AI に重点を置いた大幅な機能強化が含まれ、大規模な言語モデルが実行されることが期待されています (LLM) デバイス上で。
OpenELM モデルは、人工知能の将来にとって重要なステップであると考えられています。 新しいモデルにより、AI はよりプライベートで、安全で、アクセスしやすくなることが期待されています。
Appleの動きは、人工知能を普及させ、日常生活のあらゆる側面に組み込む上で重要となる可能性がある。
注目の画像クレジット: Keming Tan / Unsplash