MIT CSAilの研究者は、大規模な言語モデル(LLM)のマルチステップ計画機能を改善するために設計された命令調整フレームワークであるPDDL-Instructを開発しました。この方法は、論理的なチェーンの推論と外部プランの検証装置を組み合わせて、もっともらしいが誤った出力よりも論理的に有効な計画の生成を増やします。フレームワークは、候補者計画が失敗した理由を認識して説明するためにモデルをトレーニングします。これらの障害には、不満のない前提条件、誤った効果、フレーム違反、または満たされていない目標が含まれます。このプロセスは、LLMが状態およびアクションの移行を段階的に推論するように導く論理的なチェーンプロンプトとペアになっています。これにより、状態→アクション→状態の追跡可能なシーケンスが生成されます。外部検証のために、PDDL-Instructは、生成されたプランの各ステップをチェックするVALプランバリデーターを統合します。バリデーターは、バイナリ(有効/無効)または詳細なフィードバックを提供し、詳細なフィードバックが優れたパフォーマンスをもたらします。システムは、2段階の最適化プロセスを使用します。第1段階は、推論チェーンのエラーをペナルティし、第2段階は最終的な計画の精度を最適化します。このシステムは、BlockSworld、Mystery BlockSworld、LogisticsなどのLLMに挑戦することが知られている計画ドメインを含むPlanbenchベンチマークを使用して評価されました。 BlockSWORLDドメインでは、調整されたLLAMA-3-8Bモデルが有効な計画を生成する94%のレートを達成しました。以前のモデルは、パターンマッチングを防ぐために述語名が難読化されるドメインであるミステリーブロックワールドに対してほぼゼロの妥当性を持っていました。 PDDL-Instructは、このドメインで最大64倍の改善を達成しました。ロジスティクスドメインにも大きなパフォーマンスの向上が記録されました。すべてのテストドメインにわたって、フレームワークは、先読みされたベースラインモデルと比較して、66%の絶対的な改善を提供しました。また、研究者は、フィードバックの予算が長くなり、バリデーターからのより詳細な出力により、パフォーマンスが向上したと述べました。 PDDL-Instructの現在の実装は、古典的なPDDLドメインに適用され、外部オラクルとしてVal Balidatorに依存します。結果は、計画中に検証剤を含めることができるエージェントシステムで使用するための正式なセマンティクスでLLM推論を接地する方法を示しています。長老、時間、数値、およびコストに敏感な計画タスクを処理するためのフレームワークを拡張することは、さらなる作業の領域のままです。

MIT CSAilは、LLM計画のためにPDDL-Instructを発表します
Written by
Starting with coding on Commodore 64 in elementary school moving to web programming in his teenage years, Aytun has been around technology for over 30 years, and he has been a tech journalist for over 20 years now. He worked in many major Turkish outlets (newspapers, magazines, TV channels and websites) and managed some. Besides journalism, he worked as a copywriter and PR manager (for Lenovo, HP and many international brands ) in agencies. He founded his agency, Linkmedya in 2019 to execute his way of producing content. He is recently interested in AI, automation and MarTech.
View all posts →Related Stories
ブルー・オリジンとNASAがニュー・グレン発射台の修理スケジュールをめぐり衝突
この異常は、アマゾンのインターネット衛星48機を地球低軌道に運ぶ定期便の定期的なホットファイアテスト中に、発射施設36で発生した。
ASUS、Computex で新しい Zenbook および ExpertBook ラップトップを発表
刷新された 14 インチ モデルは、Windows 11 の各バージョンにわたって、Intel Core Ultra 9、AMD Ryzen AI 9、Snapdragon X1 構成から選択できるのが特徴です。
未発表のPixel Watch 5がカリブ海でダイバーによって発見されたと報じられている
ランディ・ピッチフォードさんは、友人がカリブ海でスキューバダイビング中に未発表の Google Pixel Watch 5 を発見したと主張し、オンラインでの好奇心を刺激しました。
Spotifyはユーザーにユーザー名の編集とプロフィールのプロフィールの追加を許可する可能性がある
Spotifyはまもなくユーザーがユーザー名を編集したり、プロフィールのプロフィールを追加したりできるようになる可能性があり、音楽ストリーミングプラットフォームの待望の社会的見直しを示唆している。



