Meta AI: この記事では、llama 2 とは何か、またその使い方について説明します。 Meta は、最新の Llama 2 大規模言語モデル (LLM) を発表しました。これは、テストでは、有用性や安全性を含むほとんどのベンチマークで他のオープンソース チャット モデル (GPT を含む) を上回っていました。
新しいリリースの一部として 3 つの代替モデル (1 つは 70 億のパラメーターでトレーニングされ、もう 1 つは 130 億のパラメーターでトレーニングされ、最終的には 700 億のバージョン) を公開することに加えて、Meta AI は、より洗練されたバリアントである「Llama 2 Chat」も利用可能にします。会話のユースケース専用に設計されています。
これはそれ自体技術的な成果ですが、さらに興味深いのは、Meta と Microsoft が連携の強化も発表し、Microsoft のツールを使用する開発者が AI エクスペリエンスを作成する際に Meta の Llama モデルと OpenAI の GPT モデルのどちらかを選択できるようになることです。
メタ AI: ラマ 2 とは何ですか?
自己回帰言語モデル Llama 2 のトランスフォーマー アーキテクチャが最適化されました。 Llama 2 は英語での商用および学術的使用を目的としています。 これには、事前トレーニングおよび微調整されたさまざまなバリエーションがあり、パラメーター サイズは 70 億から 700 億の範囲にあります。
Meta 氏によると、調整されたバージョンは、教師あり微調整 (SFT) と人間のフィードバックによる強化学習 (RLHF) を通じて、安全性と有用性に関する人間の好みに適応します。 Llama 2 の事前トレーニングには、公的にアクセス可能なソースからの 2 兆トークンのデータが使用されました。
事前トレーニングされたモデルはさまざまな自然言語生成タスクに合わせて変更できますが、カスタマイズされたモデルはアシスタントのような会話向けに設計されています。 開発者がどのモデルを選択しても、Meta AI の責任ある使用に関するガイダンスは、適切な安全性を緩和してモデルを調整および最適化するために必要となる可能性のあるさらなる微調整を指示するのに役立ちます。
ラマ2の使い方は?
Meta AI の Llama 2 を自分でプレイしたい方に朗報です。 Huggingface にはデモ版があり、簡単に入手できます。 次の簡単な手順に従うだけです。
- このページにアクセスしてください。
- Web サイトにアクセスしたら、「デモ」とマークされたセクションが表示されるまで下にスクロールします。
- そこにチャットボックスがあります。 今すぐメッセージを入力してください。
- メッセージを送信するには、Enter キーを押します。
SageMaker Studio UI の SageMaker JumpStart および SageMaker Python SDK を通じて、基盤モデルにアクセスできます。 このセクションでは、SageMaker Studio でのモデルの検索について説明します。
SageMaker Studio と呼ばれる統合開発環境 (IDE) は、単一の Web ベースのビジュアル インターフェイスを提供し、データの収集から ML モデルの作成、テスト、デプロイに至るまで、すべての ML 開発タスクを実行するために特別に作成されたツールにアクセスできます。 SageMaker Studio のインストールおよびセットアップ方法の詳細については、Amazon SageMaker Studio を参照してください。
SageMaker Studio にアクセスしたら、「事前構築および自動化されたソリューション」をクリックして、事前トレーニングされたモデル、ノートブック、事前構築されたソリューションを含む SageMaker JumpStart にアクセスします。
SageMaker JumpStart ランディング ページからソリューション、モデル、ノートブック、その他のリソースを検索できます。 Foundation Models: Text Generation カルーセルでは、2 つの著名な Llama 2 モデルから選択できます。 Llama 2 モデルが表示されない場合は、SageMaker Studio のバージョンを停止して再開して、バージョンを更新します。 バージョン更新の詳細については、「Studio アプリのシャットダウンと更新」を参照してください。
「すべてのテキスト生成モデルを探索する」を選択するか、検索ボックスに「llama」と入力すると、残りの 4 つのモデル バリエーションを見つけることもできます。
モデルに関する情報 (ライセンス、使用されるトレーニング データ、使用手順など) を読むには、モデル カードを選択します。 「デプロイ」と「ノートブックを開く」は、モデルの使用を支援するさらに 2 つのボタンです。
いずれかのボタンを選択すると、ポップアップに表示されるエンドユーザー使用許諾契約と許容される使用ポリシーを確認する必要があります。
モデルを認識した後、次のフェーズに進み、モデルを活用します。
次の例は、モデルにトレーニング データへのアクセスを許可することにより、少数ショットのコンテキスト内学習で Llama モデルを使用する方法を示しています。 デプロイされたモデルから結論を導き出すだけであり、モデルの重みは全体を通じて一定のままであることに留意してください。
入力: 英語をフランス語に翻訳します:
ラッコ => ルートル・ドゥ・メール
ペパーミント => メンテ・ポワヴレ
キリンのぬいぐるみ => キリンのペルーチェ
チーズ =>出力:
フロマージュ
チョコレート => ショコラ
車 => ヴォイチュール
ハムスター => ハムスター
ビール => ビエール
自転車 => 自転車
バナナ => バナナ
イチゴ => フライズ
ピザ => ピザ
チーズバーガー => チーズバーガー
パイナップル => アナナス
ニンジン => キャロット
スイカ => パスティーク
クジラ => バレイン
ナス => ナス
猫 => チャット
ペンギン => マンチョット
ライオン => ライオン
象 => 象
パンダ => パンダ
タイガー => ティグル
サーモン => サーモン
リス => エキュレイユ
カンガルー => カンゴロウ
亀 => 拷問
タコ => プルペ
カエル => グルヌイユ
豚 => コション
金魚 ⇒ ポワソンルージュ
イタチザメ => レキン・ティグル
ゴリラ => ゴリラ
ドル
メタAI
Azure AI モデル ライブラリでの Llama 2 の利用可能性は、Microsoft の Microsoft Inspire カンファレンスで明らかにされました。 現在、プログラマーはそれを使用して作成することができます。 さらに、AI 開発者のワークフローを簡素化するために、Windows 上でローカルに動作するように設計されています。 AWS の Amazon SageMaker Jumpstart ハブも Llama 2 を提供しており、今後さらに多くのサプライヤーが追随する予定です。
Microsoft と Meta AI の間で交換可能な AI フレームワークを実現するためのオープン エコシステムの立ち上げも明らかにされました。 深層学習モデルの Open Neural Network Exchange (ONNX) 標準は、2017 年に Meta AI (旧 Facebook) によって初めて発表され、開発が始まったのはその時でした。
両氏は、特に世界中のより多くの企業に基本的な AI テクノロジーへのアクセスを許可することによって、オープン AI の開発を促進することを誓いました。
Meta AI によると、Llama 2 モデルはレッドチーム プロセスにかけられ、従業員はモデルのセキュリティ アーキテクチャの弱点を特定し、安全性を確保するという任務を負っていました。 さらに、モデルの微調整を支援する「敵対的プロンプト」を作成するために外部ソースが使用されました。
Llama 2 について詳しく説明した研究記事の透明度図は、このモデルの欠点と、Meta が将来それらにどのように対処する予定であるかを概説しています。 Llama 2 のユーザーは、「許容可能な使用」ポリシーに従う必要があります。このポリシーでは、モデルを使用して有害なコードを作成したり、未成年者への情報やマテリアルの不正な転送を許可したり、テロリズムを促進するコンテンツを作成したりすることを禁止しています。 ここから完全なリストにアクセスできます。
プログラマーが「困難な問題を解決するために」言語モデルを採用することを奨励するために、Meta は Llama Impact Challenge を開始しました。詳細については今後の情報を提供していきます。
出発する前に、記事をお読みください: 会話をより楽しむための 15 のキャラクター AI のアイデア
注目の画像クレジット: スプラッシュを解除します。
Source: メタ AI: ラマ 2 とは何ですか?またその使用方法は何ですか? • TechBrifly