Om Malik :AI 会吃掉浏览器吗?
本文来自 Om Malik,观点很有意思,这里分享一下,翻译来自ChatGPT,原文地址:https://crazystupidtech.com/archive/will-ai-eat-the-browser/
我迷上了苹果的 Vision Pro。它几乎是一个完美的娱乐设备,也是我理想中的电视。诚然,我希望它能更轻一些;我非常希望它的电池续航更长一些。我也希望 Siri 在设备上的表现更好,比如当我问它关于正在观看内容的问题时(比如 Juan Soto 在道奇体育场打了多少本垒打?),它可以直接在扬基比赛的视频旁边展示答案,而不是让我去 Safari 浏览器单独查找相关信息,这实在太麻烦了。
如果说 Vision Pro 让我学到了什么,那就是在一个为沉浸式体验设计的设备上,Safari 浏览器显得像个事后补充品。在一个增强现实(AR)、虚拟现实(VR)和语音控制系统日益融入日常生活的世界里,浏览器的局限性显得格外刺眼。此时此刻,我无法想象没有 Vision Pro 的生活,但如果浏览器从我的生活中消失,我一点都不会介意。
对大多数人来说,很难想象没有互联网浏览器的生活。但随着人工智能(AI)将信息从文本、视频和音乐中解构为独特的、可重新混合的 AI 聊天流,我清楚地看到,在未来十年中,浏览器要么适应变化,要么消亡。
我的第一个真正的网页浏览器是 Lynx。我在 1993 年刚注册纽约服务提供商 The Pipeline 时就开始使用它。这是在 Mosaic 之前的事情,而 Mosaic 最终向大众引入了浏览器的概念,成为迈向互联网的重要一步。从那以后,各种浏览器——比如 Netscape、微软的 Internet Explorer、谷歌的 Chrome 以及苹果的 Safari——在不同阶段都曾是我生活的一部分。它们是通向互联网的主要入口,是访问和与开放网络上的信息互动的通用工具。它们帮助塑造了我们获取信息的方式,并改变了多个行业。
回顾过去,令人惊讶的是,无论是 1994 年的 Mosaic 还是 2024 年的 Chrome,这些网页浏览器的界面基本没有改变。你可以通过输入网址(或快速搜索)来打开网页;你可以保存书签;你可以前进和后退。但正如“人工智能”的到来正在迫使技术堆栈中的所有部分——设备、操作系统、应用程序、云平台、网络,甚至芯片——迅速适应和演变一样,浏览器也必须重新发明自己。它必须脱胎换骨,为这个新世界做好准备。
要理解浏览器为何处于巨大变革的边缘,我们需要回到互联网的起源。如果理解了浏览器的诞生背景,就能理解它的成长轨迹以及变革的必要性。1989 年,蒂姆·伯纳斯 - 李(Tim Berners-Lee)在欧洲核子研究组织(CERN)工作时创建了万维网(WWW),以满足一个简单平台的需求,用于科学家、大学和其他机构之间的信息共享。网页浏览器应运而生,目的是让这一过程更为简便。因此,网页浏览器最初是围绕文档设计的,这一前提至今未变。
大多数美国人第一次听说浏览器是通过《纽约时报》技术记者 John Markoff 的一篇文章。Markoff 的文章反映了对网络力量的乐观、理想化和乌托邦式的想法,鼓励读者将浏览器视为“信息时代隐藏宝藏的地图”。
“我写那篇文章是因为 DEC 的 Brian Reid 告诉我,网络的意义在于让中期职业生涯的计算机科学家受益,因为他们可以迅速与同事分享学术论文,”Markoff 在一封邮件中分享道。“从那个最初的想法开始,浏览器并没有改变太多,尽管如今的页面不那么学术化了,带有图片,而且常常用来播放视频。”
自从我看到最早版本的 Humane 的 AIPin、Snap 的 AR 眼镜,以及苹果 Vision Pro 的原型消息以来,我一直在思考浏览器的持久性。两年多前,随着用户友好版本的 ChatGPT 问世,一切都变得清晰了。
我并不指望这些设备明年或后年就会统治世界,但旅程已经开始。显而易见的是,这些新兴设备与我们迄今为止使用的计算机大不相同。首先,有些设备甚至可能没有屏幕或键盘。
其次,随着生成式 AI 的兴起,我们开始看到网页本身的原子化。这本身就削弱了网络的最初理念以及迄今为止的构建方式。如果没有文档可以连接,浏览器如何完成它迄今为止所做的工作?(Bill Gross 今年早些时候与 Fred 的一次谈话中也提出了类似的观点。)
更重要的是,在“人工智能”和“通用人工智能”(AGI)的炒作中被忽视的一点是,大型语言模型及相关技术从数据中生成逻辑流的能力,以及生成文本、视频或音频内容的能力。这是从“信息”角度来看最根本的进步。即使是早期(以及最近开发)的工具,比如 NotebookLM(可以将文本转化为音频),也让我们看到了未来的方向。
例如,十年内(或更快),苹果新闻的用户可能会要求其创建一个包含预选来源和主题的晨间新闻节目,并由合成的虚拟主播为他们朗读,或者通过未来版本的 Vision Pro(或类似设备)观看。
这些都不是科幻——现在几乎已经可以实现了,尽管质量不高。随着时间的推移,这不仅可能成为现实——还会成为一种习惯。因此,这将对互联网信息生态系统的运作方式带来重大变化。这些新技术为我们提供了更个性化、更对话化地控制信息的机会。
当前的应用程序需要用户主动参与。我们必须有意识地记录一切。我们总是在拍照、记录信息、手动追踪卡路里、检查成分表,以及在购物时研究营养信息。技术的挑战不仅在于构建更好的食品数据库,还在于实现无缝监控和干预,而无需用户的持续输入。
不久的将来,你可以想象一个非人类实体——姑且称之为“DietBot”——作为你的个人营养师和膳食规划师,而你几乎不需要付出任何努力。这种所谓的 DietBot 可以实时分析你的饮食模式、健康目标和饮食限制,从而匹配餐馆或食品杂货。它可以基于你的特定需求预先筛选选项,自动标记过敏原,推荐更健康的替代品,并根据你一天的活动调整份量建议。
尽管浏览器已经无处不在,以至于我们很难想象没有它的生活,但事实是,我们人类一直在适应以文档为中心的网络体验。我们被迫适应技术的局限,而不是让技术真正适应人类的需求。
整个网络生态系统的存在都是为了大型平台的货币化——正如 Flipboard 创始人兼 CEO Mike McCue(曾在 Netscape 全盛时期工作)所说,它在这一目的上表现得非常出色。
“自 90 年代中期以来,网络及其浏览器一直专注于通过 HTML 和 HTTP 等开放标准连接和呈现内容,”他表示。“这种方式几十年来运作良好,并推动了像亚马逊、Airbnb 等许多极有价值的基于网络的企业的兴起。”
McCue 认为,结合 ActivityPub 等协议和 AI,我们可以创造出更个性化、经调节的信息体验。他认为像 Claude 和 ChatGPT 这样的 AI 界面是一场巨变,但他也相信“你始终需要某种技术载体”。变化的是这种载体的使用方式。正如浏览器为移动优先世界进行了调整并变成应用程序一样,个性化、互动化、以对话为中心的 AI 系统将再次迫使浏览器进化。
那么,这种进化可能会是什么样子?
The Browser Company 的联合创始人 Josh Miller 正在开发一个名为“Arc”的浏览器,专为 AI 优先的时代设计。他认为,过去浏览器的用户界面需求减少了,但浏览器的核心技术将对我们的未来至关重要。“虽然大多数人认为我们正在构建一个浏览器,”Miller 在一次对话中说道,“我们实际上是在构建一个基于浏览器的系统。”
他希望将浏览器从单纯的查看器转变为类似操作系统的实体,在系统层面维护个人偏好和行为,使我们能够跨设备使用 AI,而无需在应用程序层面重复选择。他的新基于浏览器的操作系统将从根本上理解用户的上下文和偏好,从而更轻松地创建个性化体验。相比让应用程序决定我们如何与信息交互,我们的使用模式和偏好将塑造信息和服务的呈现方式。
Miller 相信,浏览器的核心技术,尤其是那些开放且被广泛采用的标准,使得浏览器能够快速演变并适应未来,我们将与多种设备互动——不仅限于台式电脑、笔记本电脑或手机。毕竟,可穿戴设备和无屏设备也需要浏览、检索和与信息交互,而不需要我们所熟悉的浏览器。
正如 iPhone 将自己定位为手机的再发明,浏览器也将经历类似的转型,Miller 说道。不过,这种转型“将是渐进的”,浏览器的当前形式“实际上将是这一转型的重要组成部分,几乎像是一种桥梁,引导人们迈向未来并让他们放下戒心。”
Miller 的乐观来源于浏览器能够为移动设备变形的事实。我们的移动应用程序本质上是包装了特定任务的浏览器,使互联网更加易于管理和个性化。下一次进化可能需要更多的调整。
随着 VR、AR、音频界面和聊天在我们日常生活中变得越来越重要——不仅仅是对我这样的 Vision Pro 爱好者,对每个人都是如此——网页浏览器的局限性变得日益明显。我毫不怀疑,这种关于浏览器作用及其工作方式的巨大变化,将产生深远的影响。