← Terence 港聞日記 • 2026-05-06

🌍 國際·科技

ChatGPT 推 GPT-5.5 Instant 幻覺減半

來源:New MobileLife

摘要: OpenAI 推出 GPT-5.5 Instant,取代 GPT-5.3 Instant,幻覺大幅減少 52.5%,新增記憶來源功能,回應更精簡個人化。
🔍 深入分析(3 段)

OpenAI 將 ChatGPT 預設模型升級為 GPT-5.5 Instant,API 以「chat-latest」提供。內部測試顯示,高風險提示(醫學、法律、金融)幻覺減少 52.5%,困難對話中不準確聲明下降 37.3%。基準測試:AIME 數學 65.4%→81.2%,GPQA 科學推理 78.5%→85.6%,CharXiv 圖表 75.0%→81.6%,MMMU-Pro 69.2%→76.0%,OmniDocBench 錯誤率 14.6%→12.5%。新增記憶來源功能,可查看哪些上下文影響回覆。

對你而言,此更新直接提升 AI 工具在金融分析、數據提取的可靠性。幻覺減少 52.5% 意味著用於港股研究、經濟數據解讀時出錯率更低;記憶來源功能讓你追溯模型推理邏輯,適合驗證複雜分析。作為 AI 工具重度用戶,可將 GPT-5.5 Instant 用於整理 RSS 財經摘要、撰寫市場評論草稿,或輔助信用卡條款比較。注意:新模型回應更精簡,可能減少無用追問,但需測試對 Cantonese 金融術語的理解力。

建議立即在 ChatGPT 中切換模型測試,尤其針對港股技術分析或 mortgage rate 比較。留意 API 定價是否變動;若使用本地部署(如 llama.cpp),可對比 GPT-5.5 Instant 與開源模型在 Cantonese 財經文本上的表現。風險:OpenAI 未公佈 Cantonese 專項測試結果,建議先用低風險任務驗證。後續關注 OpenAI 是否推出針對香港市場的微調版本。

閱讀原文 →
★ 評分(教 AI 你嘅口味):