2025年 生成AI総括レポート ――「対話ツール」から「自律型エージェント」へ、激動の12ヶ月を読み解く
2025-12-25
ライター:國末拓実
編集:小澤健祐
はじめに
2022年末にOpenAIがChatGPTを公開してから約3年。生成AIは私たちの働き方を確実に変え始めています。
2023年は「とりあえず触ってみよう」という実験の年でした。2024年は「どう使うべきか」というガイドライン議論の年でした。2025は、生成AIは様々な転換点を迎えました。
| 軸 | 2024年まで | 2025年 |
|---|---|---|
| AI活用スタイル | 対話・質問応答 | 自律行動・タスク完遂 |
| 企業での位置づけ | お試し・実験フェーズ | 業務プロセスへの本格実装 |
| 法規制 | ガイドライン議論 | 法制度の具体化 |
ChatGPTに「○○について教えて」と質問し、返ってきた回答を人間がコピー&ペーストして使う。そんな使い方は、もはや当たり前であり、「2024年までのスタイル」になりつつあります。
2025年のAIは、複雑なタスクを自律的に完遂する「AIエージェント」へと進化しました。
本記事では、この激動の1年を時系列で振り返りながら、中小企業のマーケティング担当者が押さえるべきポイントを整理します。
2025年 月次タイムライン――激動の12ヶ月を解読する
Q1(1~3月):静かなる脅威、国産LLMの胎動、著作権議論の本格化
【1月】セキュリティ脅威とインフラ投資
2025年の幕開けは、AIの「光と影」が同時に顕在化した月でした。
警察庁と内閣サイバーセキュリティセンター(NISC)は1月8日、中国と関係が疑われる脅威アクター「MirrorFace」による攻撃キャンペーンについて注意喚起を発表しました。
この攻撃は2019年頃から日本の安全保障・先端技術関連組織を狙っており、Windows Sandbox や Visual Studio Code を悪用したマルウェア実行などの手口が報告されています。フィッシングメールの文面が非常に自然な日本語であったことも指摘されており、LLMの普及によりこの種の攻撃のハードルが下がっている可能性が懸念されています。
一方、ポジティブな動きとして、SoftBank・OpenAI・Oracleらによる「Stargate Project」が注目を集めました。
| 1月の主要トピック | 概要 | 出典 |
|---|---|---|
| MirrorFace攻撃の注意喚起 | 中国と関係が疑われる組織的サイバー攻撃。日本の安全保障・先端技術関連組織が標的 | 警察庁・NISC |
| Stargate Project発表 | SoftBank・OpenAI・Oracleらによる巨大AIインフラ投資。総額最大5,000億ドル規模、初期フェーズで約1,000億ドル | OpenAI公式ブログ |
| DeepSeekの台頭 | 中国発の低コストAIがApp StoreでChatGPTのダウンロード数を上回る | Reuters |
| ChatGPT Gov発表 | OpenAIが米国政府機関向けChatGPTを提供開始。Azure上で運用可能、ChatGPT Enterprise相当の機能 | OpenAI公式ブログ |
Stargate Projectについて補足:総額は最大5,000億ドル規模であり、そのうち初期フェーズが約1,000億ドルとされています。
【2月】国産LLMとグローバルモデルの進化
2月は、日本発のLLMとグローバル大手の新モデルが相次いで発表された月でした。
| 2月の主要リリース | 概要 | 出典 |
|---|---|---|
| Rakuten AI 2.0 / 2.0 mini | MoE(Mixture of Experts)採用の日本語特化LLM。楽天グループのデータを活用 | 楽天公式リリース |
| note AIアシスタント | Gemini モデル搭載。全クリエイターが回数制限なし・無料で利用可能 | note公式ブログ |
| GPT-4.5(リサーチプレビュー) | GPT-4のスケールアップ版。幻覚の減少とユーザー意図への対応力向上 | OpenAI |
| EU AI Act初期条項施行 | 「許容不可能なリスク」のAIシステム禁止が2月2日に適用開始 | EU公式 |
楽天の「Rakuten AI 2.0」は、Mixture of Experts(MoE)アーキテクチャを導入し、特定のタスクに対して専門的なサブモデル(エキスパート)のみを活性化させることで、推論精度と処理速度、コスト効率の両立を目指しています。日本語タスクに最適化されていることが公式に説明されています。
【3月】規制の具体化
3月は、日本におけるAI利用の法的ガイドラインが具体化した月でした。
| 3月の主要トピック | 概要 | 出典 |
|---|---|---|
| 文化庁「AIと著作権」確定版 | 学習は原則自由、生成・利用は依拠性+類似性で判断 | 文化庁 |
文化庁の「AIと著作権に関する考え方について」確定版は、以下のフレームを示しました。
| 段階 | 判断基準 |
|---|---|
| 学習段階 | 原則として著作権侵害に当たらない(著作権法第30条の4)。ただし「享受目的」が併存する場合は例外 |
| 生成・利用段階 | 生成物が既存著作物と「類似」+「依拠(知っていた)」が認められる場合は著作権侵害 |
出典:文化庁「AIと著作権に関する考え方について」(2025年3月)
Q2(4~6月):オープンソースの逆襲、日本のAI推進法成立
【4月】Llama 4の衝撃
| 4月の主要リリース | 概要 | 出典 |
|---|---|---|
| Meta Llama 4シリーズ | オープンソースLLM。Scout(17B)とMaverick(400B)。Scoutは最大1,000万トークンの長文処理が可能 | TechCrunch |
Meta社の「Llama 4」は、GPT-4クラスの性能を持つモデルを自社インフラ(オンプレミス)で運用できることを意味しました。データプライバシーの観点からクラウド型AIの利用を躊躇していた製造業や金融機関にとって、「プライベートAI」構築の選択肢が広がりました。
【5月】AI推進法成立とClaude 4登場
5月28日、日本の国会で「人工知能関連技術の研究開発及び活用の推進に関する法律(AI推進法)」が可決・成立しました。
| AI推進法の構造 | 内容 |
|---|---|
| 推進体制 | 内閣に「AI戦略本部」を設置し、国家戦略を統括 |
| 法律の性質 | 「基本法」に近い枠組み。企業・政府・研究機関等の「責務」と推進体制を規定 |
| 企業の義務 | 情報提供や是正への協力義務(努力義務) |
| 罰則 | EU AI Actのような直接的な罰金規定はない |
EUのAI法(AI Act)が厳格な罰則を伴う「ハードロー」であるのに対し、日本のAI推進法は罰則のない「基本法」的な性格を持っています。ただし、実務家の間では、国の要請に協力しない場合の「企業名公表」等による社会的制裁が実務上のペナルティとして機能する可能性が議論されています。
| 5月の主要リリース | 概要 | 出典 |
|---|---|---|
| 日本AI推進法成立 | 5月28日成立、6月4日公布。罰則のない基本法的な枠組み | 国会、官邸発表 |
| Claude 4(Opus 4 / Sonnet 4) | Opus 4はSWE-bench Verified 72.5%達成。長時間の自律エージェントタスク遂行能力で評価 | Anthropic公式発表 |
Anthropicの発表によれば、Claude 4 Opusはソフトウェア開発向け指標(SWE-bench Verified)で72.5%を達成し、何時間にもわたる自律エージェントタスクの遂行能力で他モデルを凌駕したとされています。
【6月】現場DXの加速
| 6月の主要トピック | 概要 | 出典 |
|---|---|---|
| SmartHR 10周年 | 「人的資本経営プラットフォーム」への進化を宣言 | SmartHR |
Q3~Q4(7~12月):自律型エージェントの実装とグローバル規制の本格始動
【8月】GPT-5リリース
| 8月の主要リリース | 概要 | 出典 |
|---|---|---|
| OpenAI GPT-5 | エージェント機能を標準搭載。専門家レベルの回答品質 | OpenAI |
| Claude Opus 4.1 | SWE-bench Verified 74.5%達成。エージェント的タスクとコーディング性能向上 | Anthropic公式発表 |
Reutersの報道によれば、GPT-5は「ソフトウェア開発、専門文書の執筆、医療や金融における高度な問診・分析などで専門家レベルの回答品質を発揮」するとされています。
Anthropicの発表によれば、GPT-5のリリース直前に公開された「Claude Opus 4.1」は、SWE-bench Verifiedで74.5%(Opus 4の72.5%から約2ポイント向上)を達成しました。
【9~10月】国内AIの進展
| 9~10月の主要トピック | 概要 | 出典 |
|---|---|---|
| NTT tsuzumi 2 提供開始(10月20日) | 軽量・省電力。1GPUで動作可能。オンプレミス・プライベートクラウドで運用可能 | NTTプレスリリース |
| 日本政府×OpenAI戦略連携(10月) | デジタル庁とOpenAIが提携。新ツール「Gennai」を政府職員向けに提供予定 | OpenAI公式 |
NTTは2025年10月20日のプレスリリースで「tsuzumi 2」を発表しました。1GPUで動作する軽量・高性能な日本語LLMであり、オンプレミスやプライベートクラウドで運用可能と説明されています。
OpenAI公式のグローバル・アフェアーズ記事によれば、10月に日本デジタル庁とOpenAIの戦略的提携が発表され、OpenAI技術を用いた新ツール「Gennai」を政府職員向けに提供する計画が説明されています。
【11月】エージェント戦争の激化
11月は、主要AI企業による新モデルのリリースラッシュとなりました。
| 11月の主要リリース | 概要 | 出典 |
|---|---|---|
| OpenAI GPT-5.1 | Thinking Mode可視化。ユーザー好みの口調・トーン選択機能 | OpenAI |
| Claude Opus 4.5 | SWE-bench 80.9%達成(SOTA)。エージェント・コーディング性能がさらに向上 | Anthropic公式発表 |
| Claude Sonnet 4.5 | エージェント・コーディング向けのベストモデルとして位置づけ | Anthropic公式発表 |
| Google Gemini 3 | 推論力とマルチモーダル能力を飛躍的に強化。Gemini 関連サービスのMAU約6.5億人 | Google公式 |
Googleの発表およびThe Verge、WSJ等の報道によれば、Gemini 3 は2025年11月に発表され、さまざまなベンチマークでGPT-5.1やClaude 4.5を上回るとされています。Gemini 関連サービスのMAU(月間アクティブユーザー)は約6.5億人と報じられています。
Anthropicの発表によれば、Claude Opus 4.5はSWE-benchで80.9%のSOTA(State of the Art)を達成しました。
【12月】2025年の総括
12月は、OpenAIによるGoogleへの猛追により、AI開発競争が新たな局面を迎えた月となりました。
OpenAIの発表およびTimes of AI等の報道によれば、同社はGoogle Gemini 3の躍進を受け「コードレッド」を宣言し、12月11日に『GPT-5.2』シリーズを緊急リリースしました。
| 12月の主要リリース | 概要 | 出典 |
|---|---|---|
| Google Gemini 3 (Pro / Thinking) |
11月の発表に続き、12月には推論能力を強化した「Thinking」機能やエンタープライズ版が展開。複雑な論理的思考に対応。 | Google AI Changelog |
| OpenAI GPT-5.2 | 12月中旬に緊急リリースされた知識労働特化のフラッグシップモデル。Google Gemini 3への対抗として投入された。 | OpenAI |
| OpenAI GPT-5.2 Codex | GPT-5.2をベースに、長文コンテキスト圧縮などの技術を導入したコーディング特化モデル。 | OpenAI News |
| OpenAI ChatGPT Images | GPT-5世代の画像生成・編集モデル。「GPT Image 1.5」などを搭載し、高精度なビジュアル編集が可能に。 | OpenAI |
| Rakuten AI 3.0 | 12月18日発表。7000億パラメータを持つ国内最大規模の日本語LLM。「GENIAC」プロジェクトの支援を受けて開発。 | 楽天グループ プレスリリース |
Googleは、推論特化型の『Gemini 3 Deep Think』や軽量版『Flash』を相次いで投入し、全方位でのシェア維持を図っています。
国内では、楽天グループが7000億パラメータを持つ『Rakuten AI 3.0』をリリースし、日本語処理能力において国内最高水準を記録しました。
また、Anthropicらが主導するエージェント機能の標準化(AAIF設立)も進み、単なる言語モデルの性能競争から、自律的にタスクをこなす「エージェント型AI」への実務的なシフトが鮮明になっています。
ソブリンAIの戦場――日本企業の生存戦略
日本の主要ソブリンAIプレイヤー比較
2025年、経済安全保障の観点から「国産AI(ソブリンAI)」の重要性が再認識されました。海外製モデルへの依存リスク(データ流出、急な仕様変更、為替リスク)を回避するため、日本の主要企業が独自の戦略を展開しています。
| 企業 | モデル名 | アーキテクチャ・特徴 | ターゲット市場 | 出典 |
|---|---|---|---|---|
| SoftBank | Sarashina + LTM | 通信業界向け基盤モデル「LTM(Large Telecom Model)」と日本語特化LLM「Sarashina」を統合。 通信ネットワーク運用の自動化・品質予測に活用 |
通信インフラ制御、自社グループ | SoftBank公式発表 |
| NTT | tsuzumi 2 | 軽量・低消費電力。1GPUで動作可能。オンプレミス・プライベートクラウドで運用可能 | 金融・医療・自治体のオンプレミス環境 | NTTプレスリリース |
| NEC | cotomi | 高速推論を実現。業務システムへの組み込みに強み | 製造業、行政システム、金融 | NEC発表 |
| 楽天 | Rakuten AI 2.0 | MoE(Mixture of Experts)採用。日本語タスクに最適化。楽天グループのデータを活用 | Eコマース、トラベル、フィンテック | 楽天公式リリース |
注:SoftBankのモデル規模(パラメータ数)については、公開情報では具体的な数値は確認できていません。
「性能勝負」ではなく「文脈勝負」へ
これらの日本企業は、OpenAIやGoogleと「性能」だけで勝負するのではありません。以下の3つの特性を「参入障壁」から「競争優位」へと転換する戦略を採っています。
| 日本市場の特性 | グローバルAIの課題 | ソブリンAIの優位性 |
|---|---|---|
| 日本語の複雑さ | 敬語体系、文脈依存の主語省略などに弱い場合がある | 日本語特化の学習データと評価基準 |
| 日本特有の商習慣 | 稟議制度、業界特有の帳票様式等への対応が困難 | ローカルルールを理解し、既存フローに自然に統合 |
| 厳格なセキュリティ要件 | クラウド利用が前提。データが海外サーバーを経由 | オンプレミス運用可能。データを社外に出さない |
ユーザー企業の視点:どのAIをどう組み合わせるか
中小企業を含む日本企業にとって、現実的な選択肢は「グローバル基盤モデル+ソブリンAI」のハイブリッド利用です。
| 選択軸 | グローバルモデル(GPT-5/Claude/Gemini) | ソブリンAI(tsuzumi 2/cotomi等) |
|---|---|---|
| セキュリティ | クラウド利用が前提 | オンプレミス運用可能 |
| レイテンシ | ネットワーク経由で遅延あり | 自社サーバー運用で低遅延 |
| コスト | 従量課金。大量利用でコスト増 | 初期投資必要だが大量利用で単価低減 |
| 日本語性能 | 汎用的に高い | 日本語特化。業界特有の表現に強み |
| 既存システム連携 | API連携は容易だが深い統合には開発必要 | SIerとの連携で既存システムへの組み込みに強み |
日本のビジネスパーソンへの提言――2026年を見据えて
「プロンプト」から「AIオーケストレーション」へ
2024年までは、AIに対して的確な指示を出す「プロンプトエンジニアリング」がスキルとして注目されました。しかし、AIが自律的にタスクを完遂する「エージェント時代」においては、AIに目標・権限・評価基準をセットする「AIオーケストレーション」能力が求められます。
| ステップ | 内容 | 具体例 |
|---|---|---|
| 1. ゴール設定 | 何を達成したいのか明確に定義 | 「SNS投稿を考えて」→「新商品Aの認知拡大を目的に、20代女性向けのInstagram投稿案を3パターン作成」 |
| 2. 権限設計 | AIに何を使わせ、何を禁止するか | 「過去の投稿データは参照OK、顧客リストへのアクセスは禁止」 |
| 3. 評価とフィードバック | 品質チェックと改善の仕組み | 「ファクトチェックは人間が行う」「ブランドガイドラインとの整合性を確認」 |
「ハイブリッド・ワーク」の再定義
「ハイブリッド・ワーク」は、これまで「オフィスとリモートの組み合わせ」を意味していました。2025年以降、この言葉は「人間とAIエージェントの協働」を指すようになりつつあります。
| 領域 | AIに任せるタスク | 人間が担うタスク |
|---|---|---|
| 情報収集 | Web検索、データ抽出、要約 | 情報源の信頼性判断、解釈 |
| ドラフト作成 | 文章の下書き、構成案 | 最終判断、トーン調整 |
| 定型業務 | 経費精算、FAQ対応 | 例外処理、感情的配慮が必要なケース |
| 分析 | データ集計、可視化 | 仮説立案、意思決定 |
| 対人コミュニケーション | 一次回答ドラフト、翻訳 | 交渉、説得、責任を取ること |
セキュリティ・マインドセットとキャリア戦略
MirrorFace攻撃やディープフェイク詐欺の報告が示すように、AI時代のセキュリティは「画面の向こうの相手は偽物かもしれない」を前提としたゼロトラスト的発想が重要になっています。
キャリア戦略としての3つの方向性
| 方向性 | 内容 |
|---|---|
| パワーユーザー | AIツールを使いこなし、個人の生産性を最大化 |
| チェンジエージェント | AI活用を組織全体に展開し、変革を推進 |
| 守りのプロフェッショナル | AIガバナンス、セキュリティ、法規制対応を担う |
小さなPoCから始める
2026年に向けて「最初の一歩」を踏み出すための具体的なPoC候補です。
| 領域 | PoC内容 | 期待効果 |
|---|---|---|
| 社内FAQ対応 | 就業規則・マニュアルをRAGで学習させたチャットボット | 問い合わせ工数削減 |
| コンテンツ制作 | SNS投稿文案・メルマガ下書きのAI生成 | 制作時間短縮 |
| 顧客対応 | 問い合わせメールの一次回答ドラフト生成 | 対応リードタイム短縮 |
| データ分析 | 売上データの自然言語での分析・要約 | レポート作成工数削減 |
| 議事録作成 | 会議音声からの自動文字起こし・要約 | 議事録作成時間削減 |
社内提案のフレームワーク
| 要素 | 内容例 |
|---|---|
| 現状の課題 | 「毎月○時間を△△業務に費やしている」 |
| 改善見込み | 「工数○%削減が期待できる」 |
| リスクと対策 | 「情報漏洩リスクには社内ガイドライン策定で対応」 |
| スモールスタート計画 | 「まず1部署で2ヶ月試行し、効果測定」 |
| 必要な投資 | 「月額○円のSaaS契約+社内教育○時間」 |
おわりに
2025年は、AIが「魔法」から「実用品」へと着地した年でした。
GPT-4.5/5/5.1、Claude 4/4.5、Gemini 2.5/3といった基盤モデルの進化。日本のAI推進法成立と各国規制の具体化や、ソブリンAI構想の本格化。
これらの動きは、AIが「使うか使わないか」を議論する対象ではなく、「誰と、どのように働くか」というチームビルディングの対象になったことを示しています。
本レポートは、「過去1年の事実を思い出すための資料」であると同時に、「2026年の意思決定を支える戦略ドキュメント」です。
2026年は、「AIを使う/使わない」の議論から一歩進み、「どのAIと、どのような関係を築きたいのか」を問う一年にしてください。
※本レポートは2025年12月時点の公開情報に基づいて作成されています。一次ソースで確認できない情報については、その旨を注記しています。
HPは、ビジネスに Windows 11 Pro をお勧めします。
Windows 11 は、AIを活用するための理想的なプラットフォームを提供し、作業の迅速化や創造性の向上をサポートします。ユーザーは、 Windows 11 のCopilotや様々な機能を活用することで、アプリケーションやドキュメントを横断してワークフローを効率化し、生産性を高めることができます。
組織において Windows 11 を導入することで、セキュリティが強化され、生産性とコラボレーションが向上し、より直感的でパーソナライズされた体験が可能になります。セキュリティインシデントの削減、ワークフローとコラボレーションの加速、セキュリティチームとITチームの生産性向上などが期待できる Windows 11 へのアップグレードは、長期的に経済的な選択です。旧 Windows OSをご利用の場合は、AIの力を活用しビジネスをさらに前進させるために、Windows 11 の導入をご検討ください。
※このコンテンツには日本HPの公式見解を示さないものが一部含まれます。また、日本HPのサポート範囲に含まれない内容や、日本HPが推奨する使い方ではないケースが含まれている可能性があります。また、コンテンツ中の固有名詞は、一般に各社の商標または登録商標ですが、必ずしも「™」や「®」といった商標表示が付記されていません。
ハイブリッドワークに最適化された、Windows 11 Pro+HP ビジネスPC
ハイブリッドなワークプレイス向けに設計された Windows 11 Pro は、さらに効率的、シームレス、安全に働くために必要なビジネス機能と管理機能があります。HPのビジネスPCに搭載しているHP独自機能は Windows 11 で強化された機能を補完し、利便性と生産性を高めます。
詳細はこちら