OpenAI ChatGPT のデビューは、今日の AI 技術で最も話題になっているトピックの 1 つです。

Text-davinci-003 は、同社が月曜日に発表した AI 搭載の大規模言語モデルである GPT-3 ファミリーの新しいモデルです。 それは「GPT-3.5 シリーズ」と呼ばれるもののメンバーであり、より複雑な命令を処理し、より高品質でより長い形式のコンテンツを生成することで、その前身よりも優れていると報告されています. このトピックについて、Twitter ユーザーおよびデータ サイエンティスト @ミニマキシル ツイートした:

新しいモデルは、強化学習と人間のフィードバックを統合して、言語モデルと人間からの指示をより厳密に一致させることで、ChatGPT を改善します。 Davinci-003 は、ヒューマン フィードバック (RLHF) モデルを使用した真の強化学習モデルです。davinci-002 とは対照的に、生成品質を向上させるために、人間が作成したデモと高得点のモデル サンプルで教師付き微調整を採用しています。

デモでは、OpenAI ChatGPT は次のような複雑なタスクを完了できます。

  • 質疑応答
  • 文法修正
  • 会話の要約
  • コマンドプロンプト生成へのテキスト
  • 英語から他の言語への翻訳
  • アイテムの分類
  • Phyton を自然言語に翻訳する
  • ツイートの分類
  • テキストからキーワードを抽出する
  • スプレッドシートを作成する
  • 学習メモの作成

OpenAI ChatGPT を自分で試してみたい場合は、こちらのリンクをクリックしてください。

OpenAI ChatGPT の有望なデモ

最近の OpenAI ブログ記事である ChatGPT の調査リリースでは、「ますます安全で有用な AI システムの OpenAI の反復展開における最新のステップ」と述べられています。 このリリースに適用された安全性の軽減策は、GPT-3 や Codex などの以前のモデルの展開を通じて学んだいくつかの教訓に基づいています。これには、人間のフィードバックからの強化学習 (RLHF) の適用によって得られる有害で不正確な出力の大幅な減少が含まれます。 .

OpenAI ChatGPT のデモでは、AI は複雑な入力に対して合理的な回答を生成することができました
OpenAI ChatGPT のデモでは、AI は複雑な入力に対して合理的な回答を生成することができました

ブログでは、OpenAI ChatGPT の大幅な改善について説明しています。 AI は、リメリック (韻を踏んだ aabba を使ったユーモラスな 5 行の詩) と、ユーザーと話している主題の要約を書き留めることができました。

ユーザー:
それについてリメリックを書く

チャットGPT:
かつてフェルマーの定理がありました
多くの人が非常にエレガントだと感じました
それはあなたが取れば言った
素数とmake
それで割り切れない力
結果は一致し、適合します
暗号化では、非常に便利です
暗号化するならダンディ
フェルマーの小定理、ああ、とてもきれい
数論では、これに勝るものはありません!

ユーザー:
今までの会話をまとめる

チャットGPT:
フェルマーの小定理によれば、pp が素数で aa が pp で割り切れない整数の場合、a^pa
(aa の pp 乗) は aa modulo pp に合同です。これは、剰余累乗を効率的に実行し、公開鍵から秘密鍵を生成するために、暗号化でよく使用されます。 また、数論において他の定理を証明するための便利なツールでもあります。 フェルマーの小定理についてリメリックも書きました。

ユーザーと ChatGPT の会話 – OpenAI ブログ投稿より

OpenAI ChatGPT の制限事項

それにもかかわらず、OpenAI はブログ投稿で ChatGPT の「制限」について説明しており、その中には、もっともらしく聞こえても、間違っている、または不合理な回答が時々あるという事実も含まれています。 ChatGPT はまだ初期のデモだと思うと、このような問題が予想されます。 彼らのブログ投稿で、OpenAI は次のように述べています。

「この問題を修正することは困難です。(1) RL トレーニング中、現時点では信頼できる情報源がありません。 (2) モデルをより慎重にトレーニングすると、正しく答えられる質問を拒否するようになります。 (3) 理想的な答えは、人間のデモンストレーターが知っていることではなく、モデルが知っていることに依存するため、教師ありトレーニングはモデルを誤解させます。」

Open AI によると、ChatGPT は「有害な指示に反応したり、偏った行動を示したりすることがあります」。 いくつかの誤検知や誤検知が予想されますが、当面はモデレーション API を利用してユーザーに警告したり、危険なコンテンツの特定のカテゴリを禁止したりしています。 このシステムを改善するための継続的な取り組みを支援するために、ユーザーからの意見を喜んで収集します。

  Getirは5億5000万ドル以上の資金を確保し、米国に拡大

これで、OpenAI ChatGPT デモの現在のすべての更新がカバーされます。 最近、メタギャラクティカのAIで話題になっている、AIと人間の会話の話題がとても面白いです。

AI ツールに興味がありますか? 他の記事をチェックしてください:

  • 無料の MyHeritage Historical AI の代替品
  • インテリア AI: お部屋を簡単に模様替え
  • あなたがバイキングだったら? MyHeritage AI タイムマシンが知っている
  • Meta の Cicero AI は、ボード ゲームの外交で人間レベルのパフォーマンスを達成します
  • AIはどのくらい私たちを助けてきましたか?

良い一日をお過ごしください。 AI ニュースの詳細については、引き続きお読みください。

Source: OpenAI ChatGPT: OpenAI の新しいチャットボットの説明