2025年標誌著人工智慧發展的一個關鍵轉折點,尤其是在大型語言模型(LLMs)和代理式人工智慧(Agentic AI)領域。這些技術正從單純的自動化工具轉變為更具自主性和高度個人化的協作夥伴。本報告深入探討了這些前沿進展,及其對上班族日常工作和一般大眾個人生活的深遠影響。分析顯示,人工智慧不僅能顯著提升生產力並激發創造力,同時也帶來了認知能力潛在退化和複雜倫理挑戰。因此,為了實現人工智慧的潛力,並確保其負責任的部署,個人和組織必須採取平衡且以人為本的策略。
本節將詳細闡述人工智慧模型,特別是大型語言模型(LLMs)和新興的代理式人工智慧範式,在2025年的尖端發展,為理解其應用和影響奠定基礎。
2025年,大型語言模型持續快速發展,其能力已超越了單純的語言生成,展現出更深層次的推理和多模態互動能力。
OpenAI 在 o1 和 o3 系列中的主導地位
OpenAI 在其 o1 和 o3 系列模型中展現了顯著的進步,重新定義了 LLM 的功能界限。
- ChatGPT o1 (Strawberry):於2024年12月推出,完整的 o1 模型及其迷你版本已向 Pro、Plus 和 Team 用戶開放 。o1 的核心創新在於其對訓練和推理時間的優化,超越了以往對預訓練過程的單純關注 。該模型在回答問題前會進行「思考」,將複雜問題分解為小部分,理解上下文,並提供充分論證的答案,展現出先進的推理能力 。這種能力使其能夠解決美國數學邀請賽(AIME)級別的競爭性數學問題,並在多項評估中達到人類專家的水平 。此外,o1 在處理複雜金融問題和整合多組數據方面也表現出增強的能力 。
- OpenAI o1-Pro:於2025年3月發布,這款模型是 OpenAI 為開發者提供的最強大推理模型,此前僅供 ChatGPT Pro 訂閱者使用 。它利用更多的計算資源來「更努力地思考」複雜問題,擁有200,000個詞元(token)的上下文窗口,並支持函數調用和結構化輸出 。值得注意的是,o1-Pro 在編碼方面表現卓越,能夠分析大型程式碼庫並識別細微的錯誤 。然而,其定價也顯著高於其他模型,每百萬輸入詞元為150美元,每百萬輸出詞元為600美元 。
- ChatGPT o3-Pro:於2025年6月推出,o3-Pro 取代了 o1-Pro,成為 OpenAI 最先進的人工智慧推理模型 。它旨在「思考更長時間並提供最可靠的回應」,在數學、科學、編碼、商業和寫作輔助等領域表現出色 。o3-Pro 整合了全面的工具訪問權限,包括網路搜索、文件分析、視覺提示推理、Python 執行和記憶功能 。儘管其功能先進,但其 API 定價相較於 o1-Pro 顯著降低,每百萬輸入詞元為20美元,每百萬輸出詞元為80美元 。