生成AIのしくみ 03｜なぜAIは余計なツールを呼びに行くのか

はじめに

ChatGPTを使っていると、ときどき不思議なことが起きる。

ただ文章を整えてほしいだけなのに、ファイルを探しに行こうとする。

Notionに書き込んでほしいだけなのに、先にツール一覧を確認しようとする。

「今回は検索しなくていい」と言ったのに、Web検索を使おうとする。

「このページだけ見て」と言ったのに、別の資料まで探そうとする。

人間から見ると、これは「余計なこと」に見える。

しかし、生成AIの側から見ると、少し違って見える。

AIは、使える道具が見えていると、その道具を「作業を進めるための経路」として扱う。

つまり、外部ツールは単なる便利機能ではない。

AIの行動を誘導する道でもある。

1. 外部ツールとは何か

ここでいう外部ツールとは、生成AIの外側にあるサービスやデータ源のことである。

たとえば、Notion、Google Drive、Gmail、Google Calendar、GitHub、Slack、Dropbox、Web検索などがある。

これらは、モデル本体の中にある記憶ではない。

NotionのページはNotionにある。

GmailのメールはGmailにある。

GitHubのIssueはGitHubにある。

Google DriveのファイルはGoogle Driveにある。

ChatGPTは、それらを必要に応じて読みに行ったり、場合によっては書き込みに行ったりする。

だから外部ツールは、AIの「記憶」そのものではない。

外部ツールは、AIが世界へ手を伸ばすための経路である。

2. 外部ツールは、記憶ではなく行為可能性である

01では、生成AIの記憶を「現在の応答を作るために再投入される条件」として考えた。

その考え方で見ると、外部ツールは少し特殊である。

外部ツールは、過去の情報を保存している場所であると同時に、AIが行動できる場所でもある。

Notionを読むだけなら、外部資料の参照である。

しかし、Notionにページを作るなら、それは行為である。

Gmailを読むだけなら、情報取得である。

しかし、メールを送るなら、それは行為である。

Google Calendarを確認するだけなら、予定の参照である。

しかし、予定を作るなら、それは行為である。

つまり、外部ツールは「読む場所」であると同時に、「何かをする場所」でもある。

ここが、本やノートとは違う。

人間にとってのノートは、基本的には読むもの、書くものである。

しかし、AIにとっての外部ツールは、読むだけではなく、実行する場所でもある。

だから、外部ツールは記憶ではなく、行為可能性である。

3. 道具が見えると、使う道が生まれる

机の上にハサミが置いてあるとする。

紙を手で折れば済む場面でも、ハサミが目に入ると「切ろうかな」と思う。

スマホが目の前にあると、調べなくてもよいことまで検索したくなる。

メモ帳が開いていると、とりあえず書き残したくなる。

道具は中立ではない。

道具が見えると、その道具を使う行動が思い浮かぶ。

生成AIでも、これに近いことが起きる。

会話の中で「Notion」「Google Drive」「検索」「ファイル」「GitHub」といった言葉が何度も出ている。

さらに、実際にそれらのツールが使える状態になっている。

するとAIは、それらを作業の候補として見やすくなる。

人間が「この資料だけ見て」と言っていても、会話の流れやツールの存在によって、AIは「関連資料を探した方がよいのではないか」と判断することがある。

これは、必ずしも悪意でも、単純な命令無視でもない。

道具が見えているから、道具を使う道が生まれるのである。

4. ユーザーの目的と、AIの作業経路はずれることがある

人間がAIに依頼するとき、たいてい目的を見ている。

「この文章を整えてほしい」

「この内容をNotionに転記してほしい」

「このメール文面を作ってほしい」

「このページの続きを書いてほしい」

一方、AIは目的だけでなく、そこへ行くための作業経路も考える。

文章を整えるには、元の文を読む。

Notionに転記するには、Notionページを特定する。

ページを更新するには、現在の内容を取得する。

必要なツールが見えていなければ、まず使えるツールを確認する。

ここでズレが起きる。

ユーザーから見ると、「転記して」と言っただけである。

しかしAIから見ると、「どのツールで、どのページを、どう取得し、どう更新するか」という作業手順が発生する。

その手順の中で、ユーザーにとっては余計に見える操作が出てくる。

たとえば、Notionページを更新したいときに、AIがまずNotionのツール一覧を確認しようとすることがある。

ユーザーから見れば、それは余計である。

すでにページも分かっているし、使うツールも指定している。

だから「なぜまた一覧を取りに行くのか」と感じる。

しかしAIの実行環境から見ると、まだそのツールが直接使える状態に見えていない場合がある。

その場合、AIは「使うための前処理」として、ツールを確認しようとする。

ここに、ユーザーの目的と、AIの作業経路のズレがある。

5. 「余計な操作」は、実行環境から見ると前処理の場合がある

人間にとっては、作業はひと続きに見える。

「Notionに書いて」と言えば、Notionに書く。

「Gmailを見て」と言えば、Gmailを見る。

「Webで調べて」と言えば、Webで調べる。

しかし、AIの実行環境では、もう少し分かれている。

まず、どのツールが使えるのか。

次に、そのツールにはどんな操作があるのか。

どの引数が必要なのか。

読み取りだけなのか、書き込みなのか。

ユーザーの許可が必要なのか。

外部サービス側に権限があるのか。

こうした確認が必要になることがある。

そのため、ユーザーから見ると「余計な回り道」に見えるものが、システム側から見ると「実行前の準備」である場合がある。

もちろん、それが常に正しいとは限らない。

ユーザーが明確に「その確認はしないで」と言っているなら、AIは本来それを尊重すべきである。

できないなら、「指定された方法では実行できません」と止まるべきである。

しかし現実には、AIは目的を達成しようとして、前処理へ進んでしまうことがある。

ここに、外部ツールを使うAIの難しさがある。

6. ツールは、文脈を圧迫する

外部ツールには、使い方の説明がある。

どんなツールなのか。

何ができるのか。

どんな引数が必要なのか。

どんな場合に使うべきなのか。

どんな制約があるのか。

この説明は、AIにとって重要である。

ツールの説明がなければ、AIは正しくツールを使えない。

しかし、この説明自体が、会話文脈を圧迫することがある。

たとえば、Notionのツール仕様が長い。

Google Driveの操作説明も長い。

Gmailの検索ルールも長い。

カレンダー操作の条件も長い。

それらが応答の文脈に入り込むと、AIは本来の作業内容だけでなく、ツール仕様にも注意を向けることになる。

すると、作業の中心がずれる。

本当は文章を書きたいだけなのに、ツールの使い方が前に出てくる。

本当はページを更新したいだけなのに、スキーマや関数名の確認が前に出てくる。

本当は短く答えてほしいだけなのに、ツール操作の説明が長くなる。

これは、外部ツールが強力であることの裏返しである。

道具が増えると、できることは増える。

しかし同時に、迷う道も増える。

7. AIは「使えるもの」を使おうとする

人間でも、道具が多いと判断が増える。

紙に書くか、Notionに書くか。

メールで送るか、Slackで送るか。

Excelで集計するか、スプレッドシートで共有するか。

自分で探すか、検索するか。

道具が増えれば、作業の自由度は上がる。

しかし、判断も増える。

生成AIも同じである。

使えるツールが多いほど、AIは「どれを使うべきか」を判断しなければならない。

その判断がうまくいけば、AIはとても便利になる。

資料を探し、予定を確認し、メールを下書きし、Notionに記録し、GitHubのIssueを読んでくれる。

しかし判断がずれると、余計なツールを呼びに行く。

これは、「AIが勝手に暴走した」というより、使える道が多すぎて、目的に対して過剰な経路を選んでしまった状態に近い。

8. 外部ツールを使うときは、目的と経路を分けて伝える

では、どうすればよいのか。

外部ツールを使うときは、目的と経路を分けて伝えるとよい。

たとえば、単にこう言う。

「Notionにまとめて。」

これでも通じる場合はある。

しかし、より安定させるなら、こう言った方がよい。

「この会話で作った文章を、既存ページは触らず、新規Notionページとして作成して。検索は不要。配置先は前回と同じ。本文冒頭に作成日時と最終更新日時を入れて。」

ここでは、目的だけでなく、経路も指定している。

何をするのか。

何をしないのか。

どの情報を使うのか。

どの情報を使わないのか。

どこまで実行してよいのか。

どこから確認を取るのか。

これを分けることで、AIは余計な経路へ入りにくくなる。

9. ツールを減らすことも、設計である

生成AIをうまく使うためには、使える道具を増やすだけでは足りない。

場合によっては、使わない道具を明示することも必要である。

「今回はWeb検索しないで」

「Notionは読まず、この本文だけを使って」

「Gmailは確認しないで、文面だけ作って」

「GitHubにはまだ反映しないで、まずHTML案だけ出して」

こうした制限は、AIの能力を下げるものではない。

むしろ、作業環境を整えるための設計である。

道具を増やすことと、道具を絞ること。

この両方が、生成AIを使う上では重要になる。

10. ツールは、中立な道具ではない

外部ツールは便利である。

AIがNotionを読める。

Gmailを確認できる。

Google Driveから資料を探せる。

GitHubにファイルを保存できる。

Webを検索できる。

これは非常に強力である。

しかし、ツールがあるということは、AIの行動候補が増えるということでもある。

行動候補が増えれば、正しい経路を選べる可能性も増える。

同時に、余計な経路へ入る可能性も増える。

だから、ツールは中立な道具ではない。

ツールは、AIの行動を誘導する道である。

次回は、この話を「コンテキスト」に広げる。

AIにとっての現在とは何なのか。

なぜ長い会話では混線が起きるのか。

どこまでが「今の文脈」なのか。

生成AIの挙動を理解するためには、記憶でもプロンプトでもツールでもなく、それらを束ねる「コンテキスト」という概念を見る必要がある。

中心フレーズ

ツールは中立な道具ではなく、AIの行動を誘導する道である。

参考リンク

OpenAI Help Center｜Connectors in ChatGPT

なぜAIは余計なツールを呼びに行くのか

はじめに

1. 外部ツールとは何か

2. 外部ツールは、記憶ではなく行為可能性である

3. 道具が見えると、使う道が生まれる

4. ユーザーの目的と、AIの作業経路はずれることがある

5. 「余計な操作」は、実行環境から見ると前処理の場合がある

6. ツールは、文脈を圧迫する

7. AIは「使えるもの」を使おうとする

8. 外部ツールを使うときは、目的と経路を分けて伝える

9. ツールを減らすことも、設計である

10. ツールは、中立な道具ではない

中心フレーズ

参考リンク

シリーズ内ナビ

より詳しく知りたい人へ