Miqu 70b と Mistral 70b は、最近の Mistral Medium リークにより、待望のオープンソース AI モデルに光を当て、その機能が披露され、ついに公開されました。
AI の世界は、「Miqu-1-70b」モデルと、ミストラル AI の秘密のミストラル ミディアムとの潜在的な関連性で話題になっています。 1 月 28 日、「Miqu Dev」は不思議なことに「miqu-1-70b」ファイルを Hugging Face にアップロードし、続いて 4chan と X に登場しました。
このモデルは感銘を受け、いくつかの領域では GPT-4 に匹敵しました。 まだ納得していませんか? 見る N8 プログラム‘ 以下の X に投稿してください。
ミクが何であれ、それには何らかの特別なソースがかかっています。 EQ-Bench (ローカルでの評価) では 83.5 を獲得し、*GPT-4 を除く世界中のすべての LLM* を上回っています。 EQ-Bench は MMLU と 0.97 の相関関係があり、Arena Elo と 0.94 の相関関係があります。 第 4_K_M 時点で、ミストラル ミディアムを *上回っています。 私… pic.twitter.com/0gOOPjxjPD
— N8 プログラム (@N8Programs) 2024 年 1 月 30 日
Mistral Medium のリークにより Miqu 70b と Mistral 70b が明らかに
1 月 28 日、「Miqu Dev」という名前のユーザーが、AI 愛好家に人気のプラットフォームである HuggingFace に爆弾発言をしました。 彼らは、AI の世界で大きな話題を呼んでいる Miqu 70B モデルを構成する一連のファイルをアップロードしました。 このモデルは潜在的なゲームチェンジャーとして歓迎されており、GPT-4 に見合った成果をもたらす可能性があると主張する人もいます。
このモデルは、ドイツの 4 つの専門的なデータ保護トレーニング試験を使用してテストされ、従業員に必要な実際の認定試験が反映されました。 Miqu 1 70B の結果は印象的でした。 多肢選択式の質問 18 問中 17 問に正解する、内容に対する確かな理解を示しています。 しかし、情報を確認したら「OK」と応答するという指示を遵守しておらず、指示遵守の不備を示している。
他のモデルと比べてみると、 Miqu 70B は熟練した言語スキルとバイリンガル能力を示しました。 ただし、Mixtral-8x7B-Instruct-v0.1 モデルや、GPT-4、Goliath-120B-GGUF、Tess-XL-v1.0-GGUF などの他の上位モデルを上回るパフォーマンスはありませんでした。両方のテストラウンドで満点を獲得し、「OK」の指示を守りました。
Miqu 70B は本当にミストラル媒体の漏洩ですか?
Miqu-1-70B の起源は依然として謎に包まれており、Mistral-Medium の漏洩バージョンまたは古い実験バージョンであると推測する人もいます。 このモデルのパフォーマンスはテクノロジーコミュニティで議論や議論を巻き起こしており、本物だと主張する人もいれば、懐疑的な人もいる。
アーサー・メンシュミストラルの偉い人がついに噂に言及した。 彼は、早期アクセス群衆の中の熱心なビーバーが少し調子に乗って古いモデルをリークしたことを確認しました。 しかし、メンシュ氏は、それ以来、さらに優れたもの、つまり GPT-4 を上回る可能性のあるモデルを開発していることもほのめかしました。
早期アクセス顧客の 1 社の熱心すぎる従業員が、私たちがトレーニングし、公然と配布していた古いモデルの量子化 (および透かし入り) バージョンを漏洩しました。
少数の選ばれた顧客との作業をすぐに開始するために、私たちは、到着した瞬間にこのモデルを Llama 2 から再トレーニングしました…
— アーサー・メンシュ (@arthurmensch) 2024 年 1 月 31 日
もしミストラルが GPT-4 と同等のオープンソース モデルを公開すれば、AI シーンに衝撃が伝わる可能性があります。 OpenAI は、現状に挑戦する準備ができている新たな競争相手が街に現れているため、その後ろを警戒する必要があるかもしれません。 このリークは、AI のまったく新しい時代を照らす火花となる可能性が非常に高いです。
では、Mistral は ChatGPT よりも優れているのでしょうか?
Mistral が ChatGPT より「優れている」かどうかを判断するのは困難です。それは、LLM に何を求めるか、そして「優れている」をどのように定義するかによって決まるためです。 どちらが自分のニーズに適しているかを判断するのに役立つ、それぞれの長所と短所の内訳を以下に示します。
ミストラル
強み:
- オープンソース: Mistral は、オープンソースのものを含むいくつかのモデルを提供しており、個人や研究目的で利用しやすくなっています。
- 効率: Mixtral-8x7B などの Mistral モデルは効率が高いことで知られており、GPT-4 などの同等のモデルよりも必要な計算能力が少なくなります。
- 透明性: すべてのモデルがオープンソースであるわけではありませんが、ChatGPT を使用した OpenAI のクローズドソース アプローチと比較して、Mistral は開発プロセスと研究について透明性が高い傾向があります。
弱点:
- パフォーマンス: 全体的に、Mistral モデルは、テキスト生成や翻訳などのタスクのベンチマークでは、GPT-4 などのトップ モデルよりもわずかにスコアが低い傾向があります。
- アクセシビリティ: ミストラルの最も強力なモデルの一部 (ミストラル ミディアムなど) は一般公開されていないか、待機リストやアクセス料金が必要です
- 限定されたコミュニティ: ChatGPT と比較して、Mistral はユーザー ベースとコミュニティが小さいため、利用可能なリソースとサポートが制限される可能性があります
チャットGPT
強み:
- パフォーマンス: GPT-4 は現在、多くのベンチマークで最高のパフォーマンスを示しており、特にクリエイティブなテキスト生成や複雑なダイアログなどの分野で優れています。
- アクセシビリティ: OpenAI は、ベータ プログラムと API を通じて ChatGPT への無料アクセスを提供し、個人使用が容易になります。
- 大規模なコミュニティ: 大規模なユーザー ベースとコミュニティにより、ChatGPT を使用するための広範なリソース、ガイド、アプリケーションが作成されます。
弱点:
- クローズドソース: ChatGPT のクローズドソースの性質により、モデル内の透明性と潜在的なバイアスに関する懸念が生じます
- 計算コスト: GPT-4 は大量の計算能力を必要とするため、リソースが限られている個人にとってはアクセスしにくくなっています。
- 倫理的懸念: OpenAI のアクセス制御と限られた透明性により、責任ある開発とテクノロジーの潜在的な悪用に関する懸念が生じます
最終的に、「より良い」選択肢はあなたの優先順位によって決まります。 効率性と透明性の高いオープンソース モデルが必要な場合は、Mistral が適している可能性があります。 最高のパフォーマンスと広範なコミュニティ サポートを優先する場合は、ChatGPT がより良い選択となる可能性があります。
注目の画像クレジット:ミストラルAI。
Source: ミストラル AI が AI コミュニティに爆弾を投下