オープンAI、ChatGPTエージェントをリリース
페이지 정보
作成者 匿名ドック コメント 0 観覧数 75 作成日 25-07-19 22:09本文
オープンAI、ChatGPTの汎用エージェント機能をリリース
オープンAIは、ChatGPTに汎用エージェント機能を新たに導入した。この機能は、ウェブブラウザ操作とディープリサーチ(Deep Research)機能を組み合わせたもので、ユーザーに代わってコンピューターを操作し、ブラウザやカレンダーのナビゲート、プレゼンテーションやスライドショーの作成、さらにはコードの実行まで行うことができる。
オープンAIは17日(現地時間)、このChatGPTエージェント機能を正式に発表し、ChatGPT Pro、Plus、Teamなどの有料サブスクリプションユーザーに提供を開始したと明らかにした。
ChatGPTエージェントは、従来の複数の機能を統合したもので、ウェブサイトとインタラクションを行う「オペレーター(Operator)」や、インターネット上で情報を検索し、調査レポートを作成する「ディープリサーチ(Deep Research)」機能などを含んでいる。
ChatGPTエージェント、ユーザーの代理で複雑なタスクを段階的に遂行:操作性と安全性も強化
エージェントはユーザーの要求に応じて、質問を複数のステップに分解し、それぞれのタスクを順番に実行して最終的な目標を達成する。ユーザーはエージェントに作業を任せ、自分は他の業務に集中できる。
OpenAIによれば、「カレンダーを確認して、最新ニュースをもとに次のクライアントミーティングの要点をまとめて」や、「競合3社を分析してスライドショーを作って」などの指示を出すと、ChatGPTはウェブサイトのナビゲーション、日付の選択、検索結果のフィルタリング、ログイン、コード実行、要約、スライドショーやスプレッドシートの作成など一連の作業をこなす。
ChatGPTは重要な操作を行う前に、必ずユーザーに許可を求める。ユーザーはエージェントの作業に介入してブラウザを直接操作したり、作業を中断したりすることもできる。
ChatGPTエージェントは、GUIを用いた視覚的ブラウジング、シンプルな推論に基づくテキストベースのブラウジング、APIアクセスなど、複数のツールを備えている。エージェントは与えられた課題に対して最も適した方法を選択し、タスクを実行する。
また、GitHub、Gmail、カレンダーなどのアプリと接続できる複数のコネクタを通じて、リクエストに関連する情報を収集することが可能だ。
OpenAIは、ChatGPTエージェントがWebブラウジングおよび実作業完了能力を測定する各種学術評価において高いパフォーマンスを記録したと強調した。
専門家レベルの質問に対するAIの能力を測る評価「Humanity’s Last Exam(人類最後の試験)」では、ChatGPTエージェントを動かすモデルが43.1点を記録し、過去最高を更新。データ分析とモデリングなど実際のデータサイエンスタスクで性能を測る「DSBench」でも、従来の最先端モデルを上回る成績を収めた。特にスプレッドシート編集タスクでは、人間の能力を大きく超えた。スプレッドシート編集能力を評価する「SpreadsheetBench」では、ChatGPTエージェントはGPT‑4oの2倍のスコアを記録した。
スプレッドシート編集の権限を与えた際のスコアは45.5%に達し、数学ベンチマークのひとつ「FrontierMath」でも、コード実行用のターミナルなどのツールを使用した際に27.4%を記録。従来最高だったOpenAIの「o4-mini」の6.3%を大きく上回った。
OpenAIは、ChatGPTエージェントにおいてユーザーによる制御と安全機能を最優先に設計したと説明している。モデルが現実世界に影響を及ぼす作業を実行するため、高コストな誤作動を未然に防ぐことを重視した。
ChatGPTはフォーム提出、予約、購入、個人情報入力などのセンシティブな作業を行う前に、ユーザーに明確な許可を求める。こうした作業には段階ごとにユーザーの監督と承認が求められ、金融取引や法的作業などは拒否される可能性がある。
悪意ある操作や不正使用を防ぐ仕組みも導入されている。ChatGPTのメモリ機能は無効化されており、「プロンプトインジェクション」などエージェントを悪用する行為を排除するため、不審な指示は無視される。違法または有害なリクエストは一貫して拒否される。また、ChatGPTはいつでもWebサイトのクッキーを削除できる。
ChatGPTブラウザ使用時には、すべての活動は非公開として処理され、ChatGPTがそれを記録することはできないよう設計されている。
ChatGPTエージェントの安全対策は、ユーザーとモデル間のやり取りをリアルタイムで監視し、すべてのプロンプトに対して分類器を稼働させてリスクを判定している。また、ChatGPTが生成するコンテンツのリスク度もリアルタイムでモニタリングされる。
OpenAIは、今月中にChatGPT Enterprise(企業向け)およびEducation(教育機関向け)利用者に対してもエージェント機能の提供を開始すると発表した。
Proサブスクリプションユーザーは、ほぼ無制限のタスク実行が可能。Plusおよびその他の有料プランでは月50件までのタスクが実行可能で、クレジットベースのオプションにより追加のタスク処理もできる。
オープンAIは、ChatGPTに汎用エージェント機能を新たに導入した。この機能は、ウェブブラウザ操作とディープリサーチ(Deep Research)機能を組み合わせたもので、ユーザーに代わってコンピューターを操作し、ブラウザやカレンダーのナビゲート、プレゼンテーションやスライドショーの作成、さらにはコードの実行まで行うことができる。
オープンAIは17日(現地時間)、このChatGPTエージェント機能を正式に発表し、ChatGPT Pro、Plus、Teamなどの有料サブスクリプションユーザーに提供を開始したと明らかにした。
ChatGPTエージェントは、従来の複数の機能を統合したもので、ウェブサイトとインタラクションを行う「オペレーター(Operator)」や、インターネット上で情報を検索し、調査レポートを作成する「ディープリサーチ(Deep Research)」機能などを含んでいる。
ChatGPTエージェント、ユーザーの代理で複雑なタスクを段階的に遂行:操作性と安全性も強化
エージェントはユーザーの要求に応じて、質問を複数のステップに分解し、それぞれのタスクを順番に実行して最終的な目標を達成する。ユーザーはエージェントに作業を任せ、自分は他の業務に集中できる。
OpenAIによれば、「カレンダーを確認して、最新ニュースをもとに次のクライアントミーティングの要点をまとめて」や、「競合3社を分析してスライドショーを作って」などの指示を出すと、ChatGPTはウェブサイトのナビゲーション、日付の選択、検索結果のフィルタリング、ログイン、コード実行、要約、スライドショーやスプレッドシートの作成など一連の作業をこなす。
ChatGPTは重要な操作を行う前に、必ずユーザーに許可を求める。ユーザーはエージェントの作業に介入してブラウザを直接操作したり、作業を中断したりすることもできる。
ChatGPTエージェントは、GUIを用いた視覚的ブラウジング、シンプルな推論に基づくテキストベースのブラウジング、APIアクセスなど、複数のツールを備えている。エージェントは与えられた課題に対して最も適した方法を選択し、タスクを実行する。
また、GitHub、Gmail、カレンダーなどのアプリと接続できる複数のコネクタを通じて、リクエストに関連する情報を収集することが可能だ。
OpenAIは、ChatGPTエージェントがWebブラウジングおよび実作業完了能力を測定する各種学術評価において高いパフォーマンスを記録したと強調した。
専門家レベルの質問に対するAIの能力を測る評価「Humanity’s Last Exam(人類最後の試験)」では、ChatGPTエージェントを動かすモデルが43.1点を記録し、過去最高を更新。データ分析とモデリングなど実際のデータサイエンスタスクで性能を測る「DSBench」でも、従来の最先端モデルを上回る成績を収めた。特にスプレッドシート編集タスクでは、人間の能力を大きく超えた。スプレッドシート編集能力を評価する「SpreadsheetBench」では、ChatGPTエージェントはGPT‑4oの2倍のスコアを記録した。
スプレッドシート編集の権限を与えた際のスコアは45.5%に達し、数学ベンチマークのひとつ「FrontierMath」でも、コード実行用のターミナルなどのツールを使用した際に27.4%を記録。従来最高だったOpenAIの「o4-mini」の6.3%を大きく上回った。
OpenAIは、ChatGPTエージェントにおいてユーザーによる制御と安全機能を最優先に設計したと説明している。モデルが現実世界に影響を及ぼす作業を実行するため、高コストな誤作動を未然に防ぐことを重視した。
ChatGPTはフォーム提出、予約、購入、個人情報入力などのセンシティブな作業を行う前に、ユーザーに明確な許可を求める。こうした作業には段階ごとにユーザーの監督と承認が求められ、金融取引や法的作業などは拒否される可能性がある。
悪意ある操作や不正使用を防ぐ仕組みも導入されている。ChatGPTのメモリ機能は無効化されており、「プロンプトインジェクション」などエージェントを悪用する行為を排除するため、不審な指示は無視される。違法または有害なリクエストは一貫して拒否される。また、ChatGPTはいつでもWebサイトのクッキーを削除できる。
ChatGPTブラウザ使用時には、すべての活動は非公開として処理され、ChatGPTがそれを記録することはできないよう設計されている。
ChatGPTエージェントの安全対策は、ユーザーとモデル間のやり取りをリアルタイムで監視し、すべてのプロンプトに対して分類器を稼働させてリスクを判定している。また、ChatGPTが生成するコンテンツのリスク度もリアルタイムでモニタリングされる。
OpenAIは、今月中にChatGPT Enterprise(企業向け)およびEducation(教育機関向け)利用者に対してもエージェント機能の提供を開始すると発表した。
Proサブスクリプションユーザーは、ほぼ無制限のタスク実行が可能。Plusおよびその他の有料プランでは月50件までのタスクが実行可能で、クレジットベースのオプションにより追加のタスク処理もできる。
コメントリスト
NO COMMENT