随着 2025 年接近尾声,科技巨头们不再仅仅为谁拥有最聪明的 LLM 而战;他们正在争夺谁拥有 “现实层” (Reality Layer)。
12 月的第三周,iOS 26.2 发布,引入了“液态玻璃” (Liquid Glass) 设计语言,让界面感觉像驱动它的 AI 一样流畅。与此同时,Google 的 Project Astra 已从研究实验室走向现实世界的测试者手中,旨在将每个智能手机摄像头变成一双有感知能力的眼睛。但在光鲜的更新之下,隐藏着日益增长的“功能差距”——人们意识到,虽然 AI 现在可以实时看到和听到我们,但实现一个完全自主、对话式的数字伴侣的梦想仍需几个软件周期。
本周的主题是:AI 正在走下屏幕,进入我们的感官。
🔹 iOS 26.2:“液态玻璃”界面与感官 AI
来源:Apple Support 👉 安全内容:https://support.apple.com/en-us/125884
👉 功能概览:https://support.apple.com/en-us/121115
- 液态玻璃设计: 苹果全新的 UI 大改版 Liquid Glass 随 iOS 26.2 正式亮相。它专注于表达感、无缝过渡,应用图标和控件能根据用户环境和光线动态调整。
- AirPods 获得“视觉”: 泄露的代码和早期更新表明,苹果正准备让 AirPods 支持通过 iPhone 摄像头的 Visual Look Up (视觉查找),允许用户在识别物体和地标时,通过耳机听到实时描述。
- 集成智能: 信息和 FaceTime 中的 实时翻译 等功能现在已成为标配,此外还有照片中先进的 Clean Up (清理) 工具,使用生成式 AI 去除干扰物,实现近乎完美的背景重建。
- 隐私至上: 尽管集成的深度不断增加,苹果仍继续推进 私有云计算 (Private Cloud Compute),确保即便是复杂的多模态请求也保持加密,且对公司不可见。
🔹 “Siri 2.0” 延迟:跨越功能差距
来源:Macworld, Elyment 👉 分析:https://www.macworld.com/article/3008896/
👉 路线图更新:https://elyment.com.au/blog/apple-intelligence-in-dec-2025
- 等待仍在继续: 虽然 iOS 19.2/26.2 带来了 情境屏幕感知 (Contextual Screen Awareness),但承诺的完整版 “Siri 2.0” 大改版——具有多轮对话记忆和深度第三方应用控制功能——已正式推迟到 2026 年初。
- 差距: 行业分析师称之为 “功能差距” (Feature Gap)。虽然 Google 的 Gemini 目前在照片编辑和复杂推理任务上优于苹果的原生模型,但苹果押注于更稳健、集成度更高的推广模式。
- 未来整合: 据报道,苹果正在敲定一项与 Google 达成的 10 亿美元交易,使用定制版的 Gemini LLM 作为 Siri 处理更复杂的离线推理任务的引擎。
🔹 Google Project Astra:将世界作为界面
来源:Google DeepMind, Tom’s Guide 👉 项目概览:https://deepmind.google/models/project-astra/
👉 发布时间线:https://www.tomsguide.com/ai/what-is-project-astra
- 实时多模态: Google DeepMind 的 Project Astra 现在正面向部分测试者整合进 Gemini Live。它允许用户将摄像头对准物体——从坏掉的笔记本电脑到奇特的带鱼——并询问“这是什么?”,延迟几乎为零。
- 主动式智能体: 与传统的机器人不同,Astra 旨在实现 行动智能 (Action Intelligence)。它可以直观地开启对话,记住过去交互中的关键细节,并根据你刚刚扫描过的菜单进行餐厅预订等操作。
- 实时翻译扩张: 截至 12 月 13 日,Google 翻译已开始向支持的耳机直接提供 实时音频翻译,实际上充当了现实对话的全能翻译机。
🔹 每周快照:感官整合
- 视觉 → Google Project Astra 和苹果的视觉智能将摄像头转变为 AI 的主要输入方式。
- 听觉 → 实时音频翻译和 AI 增强型 AirPods 将界面移至我们的耳边。
- 润色 → “液态玻璃”设计标志着为适应 AI 优先操作系统而进行的首次重大审美转变。
🔹 给开发者的两个建议
-
为“屏幕感知”而设计。 随着苹果在 iOS 26.2 中推进 情境屏幕感知,应用的 UI 现在已成为系统级 AI 的数据源。确保应用使用标准的无障碍标签;智能体能越好地“阅读”你的应用,Siri 或 Gemini 就越有可能在建议中显示你的功能。
-
实验实时视觉 API。 如果你正在从事利基项目(如潜水站点关键词研究或自动站点分析),请关注 Google 的 Visual Interpreter 研究原型。AI 实时“看”到网站布局并建议 SEO 优化的能力不再是科幻小说——它已经提供了开发者预览。