2026年01月20日
こんにちは、新入社員のK・Vです。
この記事では、注目を集めているマルチエージェントフレームワーク「ROMA」について、公開されている情報をもとにその特徴や仕組みを紹介します。
近年、大規模言語モデル(LLM)は驚くほどの能力を持つようになりました。しかし、それでもまだ「複雑なタスクを自律的に整理して実行する」ことは苦手です。
たとえば、ビジネスプランの設計や、システム全体の構築など、人間のように段階的に考え、分担して進めることは簡単ではありません。
そんな課題を解決するために登場したのが、ROMA(Recursive Open Meta Agent)です。
ROMAは、複数のエージェント(Agent)を階層的・再帰的に協働させるためのメタエージェント・フレームワークです。つまり、「タスクを理解 → 分割 → 実行 → 統合」する流れを、AIが自律的に行えるように設計されています。
処理の流れは以下のようにシンプルです:
def solve(task):
if is_atomic(task):
return execute(task)
else:
subtasks = plan(task)
results = [solve(subtask) for subtask in subtasks]
return aggregate(results)
ROMAはこの構造を通じて、タスクを細分化し、依存関係を管理し、最終的に統合された結果を生成します。
ROMAは以下の技術を基盤に構築されています:
ROMAの可能性を示すため、開発チームは以下のエージェント例を公開しています:
ROMAは、SEAL-0、FRAMES、SimpleQAといったベンチマークでテストされ、再帰的なタスク分解と検索+推論(reasoning)において優れた性能を発揮しています。
ROMAが目指すのは、AIを「単一のモデル」ではなく、複数の知的エージェントが協働する生態系として再定義することです。
ROMAは、単なるAIフレームワークではなく、AIが自ら構造化し、学び、協働する未来のビジョンを提示しています。
複雑なタスクを扱うプロジェクトや、マルチエージェントの研究を行う方にとって、ROMAはまさに理想的な出発点です。
ご興味があれば、以下の資料をご参照ください。
https://github.com/sentient-agi/ROMA