【前編】AIが変える世界とこれからの人のあり方 ~AIの技術進化と限界から考える現在地~

2025年、OpenAIが新モデルであるGPT-5を発表したとき、興味深いムーブメントが起こりました。
「Keep 4o運動」です。
性能が向上したはずのGPT-5は、多くのユーザーにとって「機械的で冷たい」と感じられ、「寄り添ってくれるGPT-4oを戻せ」という声が世界中から上がったのです。
この出来事は、私にとって非常に象徴的でした。人々がAIに求めているのは、単なる性能の高さだけではなく、もっと温かい何かであるという意外な発見。それは、これからのAIと人間の関係性を考える上で、極めて重要な示唆を与えてくれるものでした。
本記事では、AIの研究者であり、AI変革を支援する会社の経営者でもある私の視点から、2025年に起きたAIの変化を振り返りつつ、現在のAIがどこまで来ていて、何ができ、何ができないのかを整理します。
生成AIやAIエージェントは急速に進化していますが、その仕組みや限界が十分に理解されないまま、期待や不安だけが先行している場面も少なくありません。
前編では、AIの進化の方向性や特性を整理し、AIと向き合うための前提を確認し、後編ではその前提をふまえ、AI時代に人や組織に求められる役割について考えていきます。
目次
驚きに満ちた2025年のAIの進化
2025年は、AI業界にとって間違いなく転換点となる一年でした。
年明け早々、中国からChatGPTやGeminiと同水準のAIを、極めて低コストで開発したというニュースが飛び込み、いわゆる「ディープシークショック」が業界を駆け巡りました。
これまでAI開発には1兆円、10兆円規模の投資が不可欠だと考えられてきましたが、何十億、何百億円でも到達し得る可能性が示されたことの意味は非常に大きいものです。
年末にはGemini 3やGPT-5.2といった最新モデルが登場し、日本の共通テストでAIが満点を取ったというニュースも話題になりました。
知能そのもの、いわば「性能スコア」という観点では、AIはこの一年で明らかに別次元へと進んだと言ってよいでしょう。

しかし、2025年を象徴するのは性能向上そのものではなく、その限界がはっきり見えたことでした。学術的なベンチマーク――MMLU(Massive Multitask Language Understanding)のような試験で高得点を取れることが、必ずしも実務での有用性を保証しなくなったのです。
象徴的なエピソードとして、GPT-5 Proに「簡単な請求書作成」を依頼したところ、3時間かかっても失敗したという話があります。数式や知識問題では高スコアを叩き出す一方で、実世界の業務タスクでは期待通りに動かない。この「性能スコア」と「仕事での実感」の乖離は、現場でAIを使う人ほど強く感じたはずです。
冒頭で触れた「Keep 4o運動」も、この延長線上にあります。
AIは確かに賢くなった。しかし、冷たくなった、寄り添ってくれなくなったと感じる人が増えた。
これは感情論ではなく、「実務で頼れる存在かどうか」という、極めて合理的な違和感だったと私は捉えています。
だからこそ、私は2025年をもって、AI研究の競争は“後半戦”に入ったと考えています。
これまでの前半戦は、「どれだけ賢いモデルを作れるか」が主戦場でした。
一方、これからの後半戦で問われるのは、
- その知能を、どんな仕事で測るのか
- どのタスクを任せ、どこで人が介在するのか
- 実務の中で“失敗しないAI”をどう設計するのか
といった、評価と実用性の設計です。

AIがどれだけ賢くなったかよりも、AIが仕事の中でどう振る舞うか。
2025年は、その問いが業界全体に突きつけられた一年だったと言えるでしょう。
AIの進化の方向性
そのうえで、これからのAI進化の方向性は、大きく3つの潮流に集約されるでしょう。

1. 小型化 (SLM):
かつて巨大だったコンピューターが今やスマートグラスに収まるチップになったように、AIもどんどん小さくなり、あらゆるデバイスに「当たり前」のように組み込まれていきます。
2. エージェント化 (Agent):
会話するだけでなく、私たちの代わりにタスクを「実行」してくれるAIエージェントが、今後あらゆる業務を自動化していきます。
3. フィジカルAI (Physical AI):
ロボットとAIが融合し、物理世界での作業を代替します。これにより、工場や建設といった分野での課題解決が進むでしょう。
また、フィジカルAIによって物理的な仕事を解決するだけでなく、AIはより賢くなるかもしれません。
今のAIは「リンゴ」という言葉は知っていても、それを食べたり、触ったり、匂いを嗅いだりしたことはありません。
しかし、ロボットという身体を得ることで、AIは硬さや柔らかさといった、言葉にできない情報を獲得し、世界を本質的に理解し始めます。これが、AIをさらに賢くするのです。
5年後、10年後には、私たち一人ひとりの隣にパーソナルなAIアシスタントがいて、専門業務を行う様々なAIエージェントに指示を出してくれる。
そんな世界が、間違いなくやってくると私は確信しています。
2026年の主役は「AIエージェント」
2025年はAIエージェント元年でしたが、今後は業務プロセスを点ではなく線で変革し、「〇〇GPT」を超える、本当にプロセスにAIが組み込まれた姿を作ることが重要になる時代です。
2026年以降、AIの価値は「何を知っているか」ではなく、 「どこまでやり切れるか」で評価されるようになります。
その結果として起きるのが、Vertical AI――業務特化型AIエージェントの台頭です。
経理、法務、開発、マーケティング。それぞれの業務に特化し、ブラウザ操作やファイル処理、メール送信まで含めて、一連のタスクを自律的に完遂するAIエージェントが主戦場になります。

ここで重要なのは、AIエージェントの目的が、もはや「正しい答えを返すこと」ではないという点です。
目的はあくまで、業務を前に進めること。途中で多少遠回りをしても、多少修正が入っても、最終的にアウトカムを出せるかどうかが問われます。
この構造は、人間の仕事に非常によく似ています。
優秀な社員とは、知識量が多い人ではなく、不完全な情報の中でも判断し、動き、修正しながら成果を出せる人です。AIエージェントも、まさにその領域に足を踏み入れ始めています。
そしてもう一つ、見落としてはいけないのが、この競争はモデル単体の戦いではないという点です。
エージェントの価値は、
- モデルの知能
- 業務プロセスの分解
- ツールやデータとの接続
- AIの特性(失敗など)を前提としたプロセス設計
こうした要素の掛け算で決まります。
だからこそ、2026年のAI競争は、 「どのモデルが一番賢いか」ではなく、「どのAIが、現場で一番使われるか」へと完全に軸足が移っていくでしょう。
※AIエージェントについての詳細は後述します。
AIの仕組みと限界を知る
AIの進化についていくためには、その基本を正しく理解することが不可欠です。
AIの本質は「予測」である
AIを理解するうえで、最も重要なポイントはシンプルです。
AIは、学習データからルール(パターン)を見つけ、最も可能性の高い答えを予測している。
それ以上でも、それ以下でもありません。

たとえば来店客数の予測であれば、降水確率や過去の実績データから関係性を学習し、「この条件なら、おそらく◯人だろう」と出力します。
生成AIも、本質的には同じ構造を持っています。
次に来る単語、次に来る構造、次に来る音や画像を、最もそれらしくなる確率で予測しているに過ぎません。
この説明だけを見ると、「結局、ただの確率計算ではないか」と感じるかもしれません。
しかし同時に、人間の脳もまた、過去の経験や知識をもとに「次に起こりそうなこと」を予測し続けている存在でもあります。
重要なのは、AIが確率の予測で“しかない”から価値が低いわけでもなければ、確率の予測“なのに”万能だと考えるのも誤りだという点です。
ここを誤解すると、
- AIは理解している
- AIは考えている
- AIは知っている
といった過剰な期待が生まれます。
一方で、「どうせ確率の予測にすぎない」と過小評価してしまえば、この技術がもたらす実務的・構造的なインパクトも見誤ってしまう。
たかだか確率の予測であり、されど確率の予測。
この距離感で捉えることが、生成AIと健全に付き合うための出発点になります。
AIができること・できないことの境界
AIは非常に柔軟です。人間では扱いきれないような多次元データから関係性を見つけ出し、軸を増やすことで、より細かく、より滑らかな予測ができます。
一方で、学習データに含まれていないものは予測できません。
これがAIの決定的な制約です。
生成AIの登場によって「学習できる情報量」は爆発的に増えました。
だからこそ、GPTのような汎用モデルは、多くの場面で「それっぽい」答えを返せます。
しかしそれでも、
- 企業固有の文脈
- 現場特有の判断基準
- 暗黙知や価値観
こうしたものは、与えなければ分からない。
AIが間違えるのではなく、「分からないまま、もっともらしい予測をしている」だけなのです。

AIエージェントの台頭
近年の生成AIは、学習できる情報量が飛躍的に増加したことで、従来のAIにはなかった柔軟性を獲得しました。
しかし、「学習データに含まれないことは予測できない」という本質的な限界は変わりません。
このAI技術を核として、より自律的にタスクを実行するのが「AIエージェント」です。
AIエージェントとは、「環境を観測し、目的に基づいて意思決定を行い、行動を実行することで目標達成を目指す、自律的なソフトウェアシステム」と定義されます。
【AIエージェントとは何かを解説している記事】AIエージェントとは何か?定義、仕組み、導入メリットから未来予測まで解説(2025年9月公開)
AIエージェントの本質は、AIを「答える存在」から、行動する存在へと位置づけ直したところにあります。
単に質問に答えるのではなく、
- 何をすべきかを理解し
- 手順を考え
- 必要な情報を取りに行き
- ツールを使って実行し
- 結果を見て修正する
この一連の流れを前提に設計されている。それがAIエージェントなのです。
AIエージェントは「仕組み」でできている
AIエージェントは、魔法の箱ではありません。内部は、いくつかの役割に分解できます。

まず、人間からの指示を理解する入力理解。
次に、その目的をどう達成するかを考える推論・計画。
その過程で、社内データやドキュメントを参照する知識、外部SaaSやシステムを操作するツール連携が行われます。
さらに、実行全体を管理するオーケストレーションがあり、最後に結果を人に分かる形で返す出力生成がある。
この構造を見ると分かる通り、AIエージェントとは「AIモデル」そのものではなく、AIを業務プロセスに組み込むための設計思想だと言えます。
RPAとAIエージェントの決定的な違い
ここでよく比較されるのが、RPAです。
どちらも「自動でタスクを担ってくれるソフトウェア」ですが、性質は大きく異なります。
RPAは、いわば楽譜通りの演奏です。
決められた手順を、決められた通りに正確に実行する。
一方で、画面が変わる、例外が出る、といった想定外の事態には極端に弱い。
対して、AIエージェントは即興のジャズ演奏に近い。
曖昧な指示を理解し、状況に応じて手順を組み替え、多少の揺らぎがあっても目的に向かって進み続けます。

ただし、どちらが優れているか、という話ではありません。
完全に決まった作業はRPAが向いていますし、判断や柔軟性が必要な作業はAIエージェントが向いています。
AIの限界を前提にするから、エージェントが成立する
ここで、最初の話に戻ります。
AIは完璧ではありません。間違えますし、分からないこともあります。
だからこそ、AIエージェントは「一発で正解を出す」前提では設計されていません。
試し、失敗し、修正する。必要であれば人に確認する。
その前提でプロセス全体を設計するからこそ、AIは初めて実務で使える存在になります。
AIエージェントとは、AIの限界を無視する考え方ではなく、限界を織り込んだうえで、最大限の価値を引き出すための形なのです。
後編では、こうした前提を踏まえたうえで、AIによってビジネスや事業、組織の前提がどのように変わっていくのか、そして、その中で人や組織に求められる役割や判断とは何かについて掘り下げていきます。
※後編はこちら
記事の筆者

株式会社AVILEN データサイエンティスト
創業メンバーとしてAVILENに参画し、2021年から代表取締役に。 2023年にAVILENを東証グロースに上場。 東京大学大学院を修了し、機械学習による即時的な津波高予測の研究に従事。 金融データ活用推進協会標準化委員。



