チームリーダーのトリスタン・ヒューム氏によると、Anthropicのパフォーマンス最適化チームは2024年から求職者を評価しており、AI支援不正行為に対抗するために技術面接試験を改訂したという。 Anthropic は求職者向けに持ち帰りテストを実施しました。 AI コーディング ツールの機能が向上したため、受験者のスキルを評価するために設計されたこのテストを頻繁に改訂する必要がありました。チームリーダーのトリスタン・ヒューム氏は、水曜日のブログ投稿でこれらの課題について詳しく説明した。ヒューム氏は、「新しいクロードモデルが登場するたびに、テストの再設計が必要になった」と述べた。彼は、「同じ制限時間を与えた場合、クロード オーパス 4 はほとんどの人間の応募者を上回った」と述べました。続いて、「クロード オーパス 4.5 はそれらに匹敵するものでした」と、人類最強の候補者について言及しました。この展開により、候補者の評価に重大な問題が生じました。対面での監督がいないため、テスト中の AI の利用を防ぐことができませんでした。ヒューム氏は、「持ち帰りテストの制約の下では、最有力候補者の成果と最も有能なモデルとを区別する方法がなくなった」と説明した。 AI 不正行為の蔓延は、すでに世界中の教育機関で観察されており、現在 AI 研究室にも影響を与えています。しかし、Anthropic は、この特定の問題に対処するための独特のリソースを持っています。ヒュームは最終的に新しいテストを開発しました。この改訂された評価では、ハードウェアの最適化には重点が置かれていないため、現在の AI ツールにとっては困難になっています。投稿の一環として、彼はオリジナルのテストを公開し、読者に代替ソリューションの提案を呼びかけました。その投稿には、「もしあなたがオーパス4.5をベストにできるなら、ぜひご連絡をお待ちしております。」と書かれていました。


注目の画像クレジット

Source: Anthropic が Claude 4.5 後に採用テストを再設計 "エース" 人間インタビュー

  FacebookのイベントをGoogleカレンダーに追加する方法