AIエージェントとは?
どういう仕組みになっているか?
生成AIを使って、どういう仕組みで自然文での命令を実行させることができるのでしょうか? 生成AIのエンジンであるLLM(大規模言語モデル)にできることは、自然文を受け取って、その文に最もふさわしい解答を生成するだけです。 入力も出力も自然文のみで、外部に対して何かを実行する機能はありません。 これを用いて、何かの処理を実行するには、LLMの外側にプログラムを作って、そのプログラムが処理を実行する必要があります。
LLMは何をしているかというと、自然文を分析して、それが印刷の指示であることを理解し、更に、ファイル名やそのファイルの格納されているフォルダ名などを探し出して、それを所定の形式に変換して、プログラムに返します。プログラムは定型的な文書であれば理解できるため、その記載に従って、指定のファイルの印刷を実行するわけです。 LLMは指示文を解釈して、プログラムが処理できる形式の定型文に変換して返すという役割を担っているのです。
何ができるのか?
このようにAIエージェントは、処理目的毎に専用のプログラムを作る必要があるため、一つのエージェントで何でもできるのではありません。 しかし、誰もが使うような一連の処理は、事前にエージェントとして用意しておけば、人間側の操作は大幅に簡素化できます。実際には、皆さんが普段お使いのチャットGPTなどもたくさんのAIエージェントが内部で動いています。 去年あたりから広まった、詳細な調査レポートを作成する機能などもAIエージェントで出来ています。 調査に関係する質問をプログラムが繰り返しLLMに入力して、その結果をまた集約することで、質の高いレポートを生成しています。これは、プログラムで決められた処理手順に従って、LLMを何度も使うことで実現されているのです。 このようにLLMに判断の元になる情報を渡して、分析方法を指示し、その結果の解答文を判別して、次の処理を実行すれば、ほとんどの事務的な処理が可能になるのです。 利用に当たっての注意点
このようにAIエージェントは、処理目的毎に専用のプログラムを作る必要があるため、一つのエージェントで何でもできるのではありません。 LLMに判断を依頼した場合、常に正しい判断になるとは限らないため、その結果を、そのまま処理の実行に使うと、大きな問題になることもあり得ます。 これは部下に仕事を依頼する場合でも同じです。重要な処理に関しては、直接実行する前に、人間による確認が必要になります。 |
|
LOADING