[Wiki] [一覧]

GUIエージェント

概要

GUIエージェントは、人間が使う グラフィカルユーザーインタフェース(画面) を直接操作してタスクを遂行する AIエージェント です。デスクトップ・モバイル・ブラウザの UI を、スクリーンショット理解とクリック/入力アクションで操作します。マルチモーダルLLM(画面の視覚理解)と ツール利用(操作の実行)を組み合わせます。

特徴と課題

研究テーマ(Daily フィード)

なお、ボットの「検出回避」は、利用規約や悪用の観点から倫理的・法的な配慮が必要なテーマです(AIの倫理)。

関連ページ

参考資料(Daily フィード)