• 周三. 6月 7th, 2023

学习爱

乐于分享

AI战争:消灭谷歌暴政,搜索属于微软!

xuexiai

3月 23, 2023

技术巨变真的来了。如果我说 Bill Gates 正每天在微软总部开会讨论产品进展,谷歌的两位创始人 Larry page 和 Sergey brain 正坐在电脑前研究算法代码。你觉得我是在说 98 年? 99 年还是 2001 年?都不是众神归位,退休的神仙回来打架。这就是 202 三年。
这轮高强度竞争的核心,就是近期被大量讨论、也被严重误解的 AI 人工智能技术。在 FORPS 2月发布的独家采访中, Bill Gates 表示,在过去 12 个月里,他在 AI 领域看到了进展,足以让这项技术和个人、电脑、图形、界面乃至互联网这三大里程碑相提并论。
如果真是这样,那么我们每个人都正在经历,也正在见证一个重要的历史时刻。而伴随着 chat g p t 的全球热潮, AI 所引起的第一场真正意义上针尖对麦芒的商业竞争,正在谷歌与微软之间在我们最熟悉也最常用的搜索引擎上打响。大朋友们请坐,好看的小老弟小老妹请坐。我是林毅。今天我们一起梳理一下久远的搜索引擎发展史,聊聊这场 AI 战争的缘起、进展与未来。
其实 AI 技术落地已经不是个新鲜事了,我在视频里上手玩过的就包括并且不限于射击机器人、音色模仿、文本作画,还有动作捕捉。如果这些只是我自己的兴趣项目,也有很多日常中已经普及了的,比如基于 AI 人脸识别的各类刷脸验证,还有 AI 语音技术支撑下的各种智能助手。不过后面这些虽然应用广泛,但完成的都是一些零零碎碎的辅助任务,依然没有触及工作生活的核心高频场景,算不上是商业公司的必争之地。
可搜索引擎不一样。在 2018 年一篇关于互联网使用的论文中,有一个调查问题是给你多少钱,你才能同意一整年不使用某项在线服务?在 2016 和 2017 年收到的 1000 份回答里,排在第三和第二位的在线地图电子邮件中位数分别是 3648 美元和 8414 美元,而高居榜首。正是搜索引擎想让一个用户一整年不碰,搜索引擎得整整套出来 17530 美元。这就是互联网名副其实的网恶聚九区的百战之地。可就这个百战之地,已经有十多年没见过像样的竞争了,原因就是鼎鼎大名的谷歌。根据 stack counter 上的统计数据,截至 2023 年1月,谷歌在全球搜索市场上占据的份额达到了 92. 9%。纵观其他数据,源,占比也没有低于八成。
无可撼动的霸主地位,靠的就是这家公司始终走在最前沿的搜索技术。和英特尔、苹果电脑、甲骨文这些硅谷前辈一样,早年谷歌也是靠扎实的技术成果起价。通过独创的配置rank、网页排序算法,谷歌搜索从一众竞争者中脱颖而出。后来到了移动时代,它又推出了安卓操作系统,在手机搜索上也站稳了脚跟。
近几年, AI 语义理解技术异军突起,谷歌也依然走在最前面。比如 2018 年 open AI 发布初代 g p t 模型之后不久,谷歌的研究团队就发布了同样是大规模语义理解模型的 Bert 模型。考虑到从项目进行到成果发表的时间,两项研究可以没什么税先税后,但谷歌落地应用的速度更快。
2019 年,谷歌就把布尔特模型应用到了搜索算法中,用来优化网页结果排序,增强算法对用户输入的理解。比如搜索一个问题怎么在没路边时的山路上停车?对传统的关键词提取算法来说,路边时具体名词要比没副词重要得多。所以排在最前面的结果反而成了怎么在有路边时的山道上正确停车。因为这篇文章的重点也是路边史。
引入 AI 模型之后,算法就能理解没这个字在句子里的重要性,把没有路边史的情况顶到最前面,让用户一眼就能获得真正需要的信息。所以 2019 年谷歌就已经在用 AI 语言模型提升搜索服务的质量了。而这时候,微软才刚刚谈妥给 open AI 的第一笔投资。研究落地,还有很长的路要走。可接下来的剧情就是出乎所有人的意料。
上个视频我们讲到,从微软获得超能力之后, Openai 一路把 g p t 迭代到了 1750 亿参数的 g p t,三两年后又推出了全球爆火的 chat g p t,两个月达到1亿月火,史无前例。紧接着,今年2月初,微软终于揭晓了其剑锋所致,在公司总部发布了集成 AI 聊天功能的新版必应搜索引擎,正式向独霸搜索市场的谷歌宣战。这一战,微软等了太久太久。在发布会之后的电视采访上,微软 CEO Sati 公开承认,谷歌在微软 windows 系统上赚到的钱,比微软在 windows 上的所有服务,包括销售 windows 操作系统本身的钱全加起来还要多难受啊,太难受了。
对于微软来说,错过搜索市场做看谷歌壮大,绝对是和后来错过移动市场同一级别的巨大遗憾。当然,如果再进一步考虑到安卓也是谷歌做的,他就是痛上加痛,伤口撒盐了。实际上,这也是科技老油条微软的第一次重大失利。作为一家比谷歌年长 20 多岁的老牌科技企业,在后发先制这方面,微软可以说是身经百战了。比较有名的像 windows 图形操作系统、 IE 浏览器,都是在先行者声名鹊起之后姗姗来迟,顶着争议声,用相对较低的价格,甚至直接免费在自己的巨量用户中无情推进,吃掉前人的市场份额,闷声发大财。
在搜索引擎必争之地上,微软一步赶不上,结结实实地碰了个钉子。不过,这也不能怪微软行动慢,要怪就只能怪谷歌的技术宅们前期太轴太落魄,营收上不显山不漏水。后来想开了,商业成功又来得太快太突然。等微软意识到新的市场空间出现的时候,竞争就已经被谷歌终结了。
实际上,早在 1995 年,当时还是微软 CEO 的 Bill Gates 就给管理层写过一份备忘文件,标题就是互联网浪潮。文章里面提到接下来要把互联网作为公司最重要的事来做,甚至还在任务计划中专门列出来了搜索引擎这一项。后来谷歌公司成立了,同一年微软也推出了搜索服务 MSN search。不过那时候互联网企业的主要玩法还是构建大型主页。邮件、新闻、论坛、购物、小游戏等等服务都在一个网站上搞定。信息的整理和展示都是由编辑们人工完成,用户们在各个分区流连忘返的同时,也会看到页面上刊登的广告,而这也就是网站的收入来源。所以这时候的大型网站都在努力避免用户跳出,变成了一个个把墙修得高高的封闭花园。而搜索只是一个帮用户在网站内部快速跳转的小功能。像雅虎、美国在线这些当年的巨头都是把搜索外包给小公司来做,所以微软也不例外。 MSN search 只是挂了个自家的牌子,微软并没有真正的去研究和开发搜索技术。
而另一边的谷歌则早早开始了在这个领域的精益求精。 1995 年,莱瑞配置在学长 circuit brand 的带领下,满怀憧憬地参观了斯坦福校园。三年之后,他的这位好学长又带着他双双从斯坦福辍学,拿着他们的研究项目,在加州温楼 park 郊区的一间车库里成立了谷歌公司。值得一提的是,他们的这位房东后来也成了谷歌旗下在线视频网站 YouTube 的CEO,前阵子刚刚宣布退休。
谷歌这个名字的由来,很多朋友都知道,就是 10 的 100 次方对应的单词的一个变体,也对应着这家公司的使命。整合全球信息,供大众使用,使人受益。这句话是官方描述,精简成具体的任务,目标就是缩短从问题到答案的时间。今天视频里的全部内容,无论是谷歌早期的崛起,还是后来的智霸,包括接下来微软在 AI 武装下的二次冲锋,都是围绕着这一件事。谷歌做这事的起点就是配置 rank 网页排序算法。这也是谷歌搜索使用的第一套算法。有点意思的是,这个配置是个双关,既是 Larry 配置的姓,也有网页的意思。配置 rank 就是对网页进行排序,从互联网中把信息全翻出来并不难,可问题是这个数量太大了。比如今天在谷歌上搜索机器学习入门,会得到超过 1800 万个网页。没人有时间,也不可能有精力去把这些内容全看完。大部分用户都会选择从前往后挑自己觉得靠谱的链接点进去看,直到获得了需要的信息为止。这时候,搜索引擎如果能把高相关、高质量的网页排在最前面,用户就可以更快找到需要的内容,缩短从问题到答案的时间。而配置 rank 解决的问题就是如何确定网页内容的质量。
配置 rank 是一个新算法,但借鉴的还是旧思路。在 1998 年的原本论文里,相关工作中提到了学术界通过文章引用来判定论文质量的思路。互联网页面上有许多链接,一点就会跳到其他地方,这就很类似学术论文之间的引用关系。不过,互联网页面的链接结构也有一些自己的特点。比如存在字环链接,点击之后还是跳回原来的页面。再比如还有悬空链接,点击之后跳转到了新页面上,不存在任何链接。到此为止,这些都需要配置 rank 进行一些针对性的处理,不过都属于细节。整体来看,它的底层逻辑可以概括成两条第一个网页,如果有很多其他网页指过来,它的重要性就比较高。
第2,一个重要性比较高的网页,它的链接权重也应该更高一些。比如同样是只有一个外部引用,一个被雅虎主页链接到的页面和一个被机器人批量生产的垃圾网站链接到的页面,重要性肯定是不一样的,明显被雅虎指向的页面会更有价值一些。基于这两个指导原则,配置 rank 会通过随机浏览模型进行递归计算,最终把整个互联网上的每个页面都压缩成一个简单的数字,再根据数值由大到小把高质量的网页优先呈现给用户。不过,配置 rank 只是今天谷歌搜索算法的冰山一角,它的名气最大,但也只是几百种算法和模型中的一员而已。谷歌针对语义理解和结果排序,一直在落地新成果。比如 AI 方面, 2015 年,谷歌首次在搜索里应用了深度学习系统,叫做Rankbrain。这套 AI 系统可以理解关键词背后对应的概念,而不是局限在自研本身。除此之外,还有 2018 年的神经匹配算法,再就是前面提到的波尔特模型。这些还只是 AI 这一个领域,谷歌搜索早就成了一个无比复杂的算法集合体。而所有这些改进,还是为了同一件事,就是缩短从问题到答案的时间,可不断优化让全球用户信息获取成本越来越低的伟大技术进程。实际上差一点就直接断送在了最开头成立之初的谷歌。和上个视频里 open AI 的开局差不多。唇角情怀,真是视金钱如粪土。当年车库里的谷歌完完全全没有广告,甚至可以说是站在了赚广告费这套传统模式的对立面。
同样是 98 年,谷歌的两位创始人还发了一篇介绍谷歌这个项目本身的论文,在附录 a 里,他们直接抨击了搜索混广告的商业模式。比如文章里举了手机这个关键词的例子,配置 rank 算法下,排在最前面的结果是开车使用手机的危害。但如果搜索引擎收了手机厂商的钱,在这个关键词下安排了手机广告这类算法认定的高质量但明显负面的内容,就得被打压到后排或者干脆隐藏。最终结果就是用户错过了一篇有价值的内容。
这段附录逻辑清晰,表达流畅,把广告与搜索的根本矛盾分析的入木三分。可是通篇都没回答到底该怎么赚钱这个问题。整洁就四个大字年轻真好。用他们洋人自己的话讲就是拿义务。当然,抛开玩笑话,这种理想精神是非常值得敬佩的。最初的谷歌在核心技术上领先同行一节,同时因为不需要加载图片、横幅和弹窗类型的广告,返回搜索结果的速度也秒杀同行。而且这样一来,页面也极为简洁干净。可以说,在从问题到答案这件事上,谷歌提供了在当年最快速、最极致的方案。很快, 98 年还没结束,高举情怀的谷歌就收获了媒体盛赞和大量用户。不到一年,每天的搜索使用量就达到了 300 万。而且,谷歌也没给自己打过广告,纯靠口口相传。可做生意只出不进是不行的。情怀刚燃烧几个月,谷歌这辆装着顶级引擎的小跑车就有点开不下去了。在一位投资人的回忆里, 99 年初,艾瑞配着 sir 给brain,决定把谷歌以 100 万美元的价格卖掉,结果被买方砍价砍到 75 万,而且最后人家还是觉得不值,不想买。从这也能看出来谷歌公司这帮工程师的窘迫。不过人家也确实有狂的资格,就算不赚钱,顶尖技术本身也是有价值的。
到了 6 月份,卖身失败的谷歌成功融到了 2500 万美元资金,把命又给续上了。但情况依然算不上乐观。到 99 年底,谷歌扩张到 50 名员工,再叠加上激增的访问量和服务器成本,即使融到了资,也还是没有走出破产倒计时。于是工程师们终于低头,开始运营广告业务,但也立了很多规矩,比如广告只能是文字形式,不能和搜索结果混在一起,必须高亮区分开。
在当年一众公营广告商爸爸的搜索网站里,谷歌绝对是脾气最大的那个。到了 2000 年初,谷歌才有了第一个付费客户。而接下来广告业务规模也一直不大,但好歹是有收入了。可与此同时,另一家叫做 go to dot Com,后来改名叫 over 式搜索网站,却在钱的事情上风生水起。这家网站的技术和谷歌没法比,但它的商业模式非常成功,就是拍卖关键词。想打广告的企业如果觉得某个关键词和自己的业务相关,就可以掏钱竞拍,出价最高的就可以排在最前面,这也就是大家比较熟悉的竞价排名。
除此之外,这家网站还把按展示次数付费变成了按点击次数付费。广告商一看有这么大的便宜可占,自然纷至沓来。当然, go to 到 Com 也不亏,他把广告和搜索结果混一块,用户不知不觉就点进了广告里,成了最终买单的那一方。不过,还算有底线的是,广告结果下面会有一行小字,把投放价格列出来。即便是字很小,很不起眼,但至少没有践踏商业道德。
虽然同样在亏损,但 go to 到 Com 的商业模式很清晰,某种意义上类似于早年间整本书都是广告的黄页。这套模式大家都能理解,再加上竞价排名和按点击付费,的确行之有效。所以 99 年, go to 到 Com 就成功上市了。接下来就是搜索技术史上的一个关键时刻,商业最成功的公司和技术最先进的公司相遇了。 2000 年底,正值互联网泡沫破灭,大量科技企业失之重挫,广告预算锐减。另一边,刚刚被反垄断判决痛击的微软抱着 MSN search 不知所措,无心也无力在搜索上搞什么大动作。
就在这样一个时间点,资金相对充裕的 go to . com 向谷歌提议并购。不过,由于谷歌的两位创始人坚决反对,把广告混进搜索,结果谈判根本就没往下进行。但很快,一件极具争议的事情发生了。 2002 年2月,谷歌推出了 Edward select 项目,像原本的 Edward 广告系统加入了竞价排名和按点击付费的机制。除了保持广告与搜索结果分开和谷歌特色的算法优化以外,可以说,整套商业模式就是对 go to dot Com 的像素级复刻。自然,这家已经改名欧沃车的搜索公司对谷歌提起了侵权诉讼,并在两年后的和解中让已经收购了他的雅虎赢得了 270 万股谷歌股票。可在谷歌爆发式的商业成功面前,这些都只能算是小插曲了。兼备最强搜索技术和最佳用户口碑的谷歌,在吸收了搜索市场最成功的商业模式之后,坐地升天。 Edward select 推出不到两个月之后,谷歌成功扭亏为盈。到了 2003 年,这家坐拥 800 名员工和超过 54000 台服务器、日均访问量2亿次的搜索网站,年营收达到了 9. 6亿美元,其中净利润超过 1 个亿。
2004 年8月,谷歌成功上市,市值 230 亿美元。从 75 万都卖不掉到市值 230 个亿,谷歌只用了 5 年多。而从收支相抵到成功上市,只花了不到 2 年,压根没给微软留什么反应时间。更何况这整个期间,微软都在反垄断诉讼的阴影里瑟瑟发抖。中间创始人 Bill Gates 还从 CEO 的位子上退了下来,换上了后来评价普遍不高的 Steve Bomer。等到 2004 年6月,案子和解完成,尘埃落定,谷歌都马上就要上市了。
其实谷歌这帮技术宅的理工气质也给公司带来了一些好运。不考虑动机,只看效果的话,前期懒得谈钱的谷歌,实际上相当于是把自己的商业潜力硬生生藏了三年多,同时技术上也一直在精进。等 2002 年开始放下面子专心搞钱,之后一飞冲天,对手意识到原来搜索这么赚钱,想参一脚的时候,竞争已经结束了。
摆脱了反垄断官司之后,微软的各种大项目又开始陆续上马,其中就包括被谷歌带火了的搜索。 2004 年底,微软终于开始为 MSN search 构建自己的底层技术,在 05 年2月正式发布了迁移过来的新版本。可从零开始的微软搜索,面对的是拥有巨大先发优势的谷歌。前面提到过, 03 年谷歌就已经有了 800 名员工和超过 54000 台服务器。如果这些对财大气粗的微软都属于小问题,谷歌还拥有大量的忠实用户。 03 年谷歌搜索的日均访问量已经达到了2亿次。
这些用户有什么理由去切换到另一家?除非是有更好的服务或者回核心任务,也就是另一个搜索引擎从问题到答案的速度可以比谷歌更短。可在谷歌开辟的那条算法军魅竞赛的道路上,这事根本就是天方夜谭。比如我们挑一个点网页抓取数量。前面介绍配置 rank 算法的时候,我们提到计算网页的重要性或者权威性,需要先尽可能把互联网公开的内容都抓取下来,特别是文本和文本中的链接,这样才能通过这些引用关系进行递归。计算,得到每个网页的分数。抓到的网页越全,分数就越准确。另一方面,互联网上的网页数量每天都在增加,已经抓取到的网页越多,新增加的网页就越容易通过已有网页上的新链接捕捉到。所以,搜索引擎积累的存量网页数量,能直接影响搜索结果排序的准确性,甚至会决定用户到底能不能找到答案,非常重要。
谷歌在 2005 年开始停止实时显示已抓取的网页数量,在此之前,最后一次显示是已经有了超过 81 亿个网页。而这时候,微软才刚刚从零儿起步。可同一时间,谷歌还有几万台服务器在继续抓取新页面,继续通过递归计算动态调整每个网页的分数。那微软还怎么追?这还只是网页数量。这点谷歌还有不断精进的算法,持续优化的服务器架构,甚至包括广告方面的商务资源积累。
微软这艘巨轮虽然大,但它挑战的是谷歌这座冰山。微软的动作还是比较频繁的,逐步提高搜索服务的地位。 06 年,微软给 MSN search 增加了自研的图片搜索,打包成了新的 windows live search。 07 年又把它从 windows 服务里面独立出来,成了 live search,最后在 09 年改成了我们今天比较熟悉的病。
随后,当时的微软在线服务总裁陆琪又给他起了必应这个中文名字,大概是有问必答这个意思,挺传神的一个名字。可不管名字叫什么,在谷歌开创的赛道上,必应参与的都是一场注定失败的竞争。微软试图挣扎过几次。比如 2012 年,谷歌做了一件很有争议的事,他把商品搜索的展示位全部设置成了付费展示加竞价排名。也就是在谷歌购物中的每个商品都是广告,而且他们还是按出价高低来依次显示,并不是由算法根据商家的可靠性来决定顺序。这已经可以说是把谷歌创业时的网络中立精神摁在地上摩擦了。微软抓住了这个机会,发起了一个项目,叫Scrugo,直译过来大概就是干翻谷歌。当年微软还专门申请了个网站,注意是微软官方。当然现在已经失效了。当年点进这个网站,里面主要就是痛斥谷歌无道。顶部黑底白字引用了 98 年谷歌那篇著名论文对搜索广告的抨击,杀人诛心。
当然,最下面还贴心地准备了 b 应搜索的链接,还有一键设置 b 应为主页的按钮。这一轮微软的攻击性非常强,但收效甚微。更尴尬的是,后来 b 应购物也被人发现,同样有付费展示功能,唯一的区别就是谷歌购物至少还加了个广告标识。这么看,毕竟反而更恶劣一些。
然而实际上最尴尬的是,微软这场轰轰烈烈的宣传公式,没有在搜索市场掀起哪怕一丝波澜。整个 2012 年,谷歌的全球搜索市占率纹丝不动,毕竟也还是那样 3% 没一点进展。到了 2020 年,微软甚至发起了一波堪称是丧心病狂的冲锋,直接给 office 365 Pro plus 用户的 Chrome 浏览器强制安装 b 应搜索插件,让 b 应变成 Chrome 的默认搜索引擎。
你说这件事,除了让赛博空间增加一个新段子,一个新的 NPR 梗以外,有什么意义呢?我特地确认了一下这个新闻的日期是不是4月 1 号,并不是。这事的结局也和之前一样。除了让微软挨了更多骂以外,谷歌的全球市占率连抖都懒得抖一下,可谓是伤低龄自损一千还是核心问题。除非有人能比谷歌更快地帮用户找到问题的答案,不然谁也无法和谷歌缩短哪怕是一点点差距。而在谷歌自己开辟无比熟悉的搜索算法赛道上,没人能做到这一点。大概这也是前面萨提安娜黛拉对谷歌在 windows 上大发搜索才无可奈何的原因。
不过,这位微软 CEO 虽然看起来委屈巴巴,做起事来可一点都不简单,经常是一步一步环环相扣。我比较反感夏大旗这套叙事方式,因为很多时候都是牵强富贵。但萨提亚达拉做的一些事确实挺适合下大棋这个词。比如 2018 年收购GitHub。微软一个商业公司,为什么要买全球最大的开源代码托管网站?结果三年之后, GitHub copilot 发布了。这是一个能自动写程序的AI。它的诞生靠的就是对数 11 行开源代码进行学习提炼。过了一年, GitHub 扣拍了,推出了正式版,月费 10 美元,第一个月就收获了超过 40 万订阅用户。按照 GitHub 的官方统计,今天 copy 了的用户,平均有 46% 的代码都是交给 AI 来完成。现在再回过头来看,微软收购GitHub,这不就是下大棋嘛。
实际上,为了颠覆性的编程AI,萨提亚的布局里不止一个。GitHub。收购消息宣布一年之后,微软又给通用语言模型 g p t 的创造者 Openai 投了 10 亿美元,训练数据和算法模型兼备,才终于把 AI 给养了出来。和这位微软 CEO 的真正目标相比,今天正在帮超过 100 万程序员写代码的 GitHub 抠 pilot 也只是个小插曲而已。
编程 AI 是 chat g p t 的预演,而 chat g p t 则是大规模 AI 搜索引擎的前奏,是微软与谷歌全面战争的序曲。在采访中,萨迪安娜 dela 给出了大举投资 open AI 的深层次原因。他认为最重要的就是通过 open AI 的前沿技术实践,帮助微软的爱者云服务升级核心基础设施,完成 AI 转型,服务客户,也服务于微软自己。在 2014 年成为微软 CEO 之前,萨提亚就是负责云和企业事业部的。微软副总裁。走马上任 CEO 之后,他又把移动为先、云为先确定为微软的核心战略。这是移动为先的意思,不是做手机,而是云服务,要瞄准移动场景。所以整个战略归根结底还是在云这一个字上。后来深陷泥潭的微软也的确靠着云服务成功翻盘了。
下一步,萨提亚就要用 AI 来武装自己干了一辈子的云服务,去攻城略地。 22 年底爆火的 chat g p、t,就是微软挨着云服务 AI 能力的一次全方位均被展示。超过1亿月活的在线实时 AI 应用能运行成这个样子,颠覆了许多人的认知。其中非常严肃看待这件事的,就包括谷歌聊天机器人,本身和前面微软那些无意义的冲锋一样,对谷歌构不成任何威胁。但一个能消化学习互联网信息,在全球范围大规模部署、可以实时针对用户用自然语言提出的问题给出答案的AI,实际上就是在正面冲击传统搜索引擎,而且是开辟了一条全新的赛道。
我们讲了这么久,搜索这件事,归根结底是要缩短问题到答案的时间。谷歌的算法做到了把尽可能高相关度的资料给用户翻出来,而 AI 要急剧缩短的,则是理解这些材料,把答案总结出来的过程。事实上,这反而是在网上寻找答案耗时的大头。这一次,谷歌慌了,而且是明显的慌了。 22 年底, chat g p t 推出不到一个月,谷歌管理层宣布公司启动红色预警。纽约时报获得的一份内部备忘录显示,谷歌 CEO 孙达普差把研究部门还有信任与安全部门的一些团队转向去做内部竞品,也就是对话 AI Bard 的研发。不久之后,又号召全体员工参与到对这个聊天机器人的测试中来。紧接着,谷歌的两位创始人 Larry page 和 sir 给 brain 也在 2019 年告别全部公司失误之后,再度返回公司总部,参与讨论公司的 AI 战略,特别是关于对话 AI 以及搜索引擎对聊天功能的集成。
今年1月底, Sarga 还提交了一份针对谷歌对话机器人 Lambda 源代码的权限申请,开始实际上手。这些都侧面印证了谷歌对微软这轮 AI 公式前所未有的重视。可到底为什么?今年2月,微软发布新版必应搜索之后,答案全部揭晓。其实,之前的 chat g p t 离搜索引擎还有一段距离,有两个问题没有解决。一个是时效性,它的信息覆盖范围只到 2021 年9月另一个是可溯源性, AI 出错是不可避免的,但如果用户能知道 AI 发表观点时的信息来源,至少可以自己去验证,但 chat g p t 没有这个功能。
新版必应搜索的聊天机器人解决了这两个问题。首先,它的运行过程要比 chat g p t 更复杂。使用 chat g p t 的时候,用户输入的文字发给AI, AI 再输出回答,发送回来,一轮对话就结束了。必应的聊天机器人不是这样。用户输入的内容会先被转化成搜索语句,在传统搜索引擎中进行搜索,拿着找到的资料,还有用户的位置时间这些信息,再结合对话上下文, AI 会全部综合起来,给出一个回应。其中用到了网络资料的部分,还会在回答中注明形象点。但是不太严谨的说,可以理解为是 chat g。
p t 收到了你的消息之后,先去网上查了一圈,再根据拿到的材料,针对你的问题专门写一个回复,相当于是把你自己读材料。这最耗时的一步给省。完成所有这些任务的模块组合起来,微软把它叫做 promise 模型,也就是希腊神话里的道火者。而其中把互联网资料、你发的消息,还有上下文位置、时间这些信息综合起来进行分析的部分叫做 Bingchat orchestration。
对话交响实际上,在准备这次视频内容的过程中,我发现我已经完全离不开必应的聊天机器人了。我一边写材料,一边录了很多我与 Prometheus 的交互。不过这个 AI 还有另一个名字叫做Sydney。但这就是一个比较黑暗的话题了,一会再说。我录的都是这次写稿的实际例子。
前面写到谷歌的创业精神,我想起来一个词是技术中立,但不太确定。书记聊天框之后,就像前面介绍的,我写会先被转换成搜索语句。有时候还不止一个 AI 在每个搜索请求上都会花一些时间来收集资料。整合了足够的信息之后,还要再花一些时间慢条斯理的输出答复。作为对比。在谷歌上输入技术中立这个词,一眨眼就能拿到结果。可这些只是结果,不是答案。每篇文章都要我自己进去读一遍。如果读的时候受到启发,把关键词进一步改成技术中立与谷歌的关系。
又是一组全新的文章,要阅读。毕应这边不一样,它虽然慢,但也没那么慢。我一篇文章刚看了开头,毕应这边就能给我写一篇小作文,而且是专门针对我的问题,写完了还会再甩给我几个提示,方便我向下探索。当然,我也可以提自己的问题。新版必应已经不再是传统意义上的搜索引擎,而是升级成了解答引擎,这是划时代的。在不到一篇文章的时间里,我不仅知道了技术中立的定义,还搞清楚了我想表达的意思其实是网络中立。而且 AI 还进一步给我讲述了谷歌在网络中立问题上的一系列态度转变和标志性事件。
不到一篇文章的时间,我搞清楚了至少需要 3 篇文章才能搞清楚的事儿,谷歌能不急吗?我们一直在讲,搜索的核心任务,就是缩短从问题到答案的时间。前面讲了那么长一段谷歌发家史,虽然广告赚钱起了很大作用,但最根本的还是谷歌用引以为傲的搜索算法把核心任务给做好了。像谷歌搜索栏下面的手戏不错,或者是好手戏按钮,很多年轻朋友可能不是很了解。它的作用就是点击之后跳过搜索结果页面,直接打开算法返回的第一个网站。这体现的就是谷歌对自家算法的信心和对搜索速度的极致追求。但微软靠着埃哲尔云服务的长期耕耘,奠定好战争基础,率领 AI 军团濒临城下的时候,谷歌终于意识到时代变了。其实这 20 年来,虽然谷歌稳坐搜索霸主地位,但变化一直在悄然发生和积累。这里面有谷歌自己的问题,也有互联网本身的问题。
从 2002 年谷歌复制别人家的广告商业模式开始,獠牙就已经在屠龙少年的嘴里生根了。 20 年间,谷歌的营收越来越高,但广告标识越来越不明显。 1998 年, Larry 配置和 sir 给布润对广告干扰搜索结果的批判声量也一年比一年小。当年论文里使用谷歌搜索手机,第一个结果是开车用手机的危害。今天再在移动浏览器上用谷歌搜索手机这个词,第一屏全是购物广告,往下拉,时不时混进来一个赞助商。划了不知道有多久,才出现一篇关于手机使用的研究文章。 2018 年,谷歌母公司 alphabet 不再把 Dont be evil 不作恶作为企业行为准则的第一句。虽然这说明不了什么,但也什么都说明了。不过有一说一,我个人认为这些算不上是严重问题,毕竟谷歌提供了这么多年的免费信息搜索服务,还构建了安卓移动生态。换个角度,如果谷歌一直坚持做一家高尚的公司,那大概率也是一家饿死了的高尚公司。当年领先同行的配置, rank 也就随风而去了。再退一万步讲,不是还有同行衬托吗?真正的问题,我认为反而是互联网本身在发展过程中产生的一些新的技术问题。比如有一个词叫做搜索引擎优化,指的是针对搜索算法投机取巧。比如在最早关键词匹配的时代,如果我是一个卖电脑的,我就可以在网页里不显示的部分把电脑这个词重复 100 遍。这样一有人搜电脑,我的网站就出来了。
当年谷歌能平日 page rank 算法声名鹊起,因为它会进一步考虑每个网页的重要性,在一轮又一轮的递归计算中,动态的调整每个网页的分数,惩治了动歪心思的垃圾网站。可道高一尺,魔高一丈二。一年谷歌在挪威出过一个事儿,有一个网页几乎污染了所有关键词,无论搜什么,结果里都有它,还很靠前,点进去就跳转到诈骗网站。谷歌解决了这个问题,可还是会有更先进的手段出来。实际上,技术问题还算好,解决人心的问题就真的无解了。如今随便搜一个品牌手机的评测,前几页结果都跟一个模子里刻出来的一样,背后都是厂商统一买稿,统一营销。一样的信息,换几十种表达方式写出来,发在流量高的平台上,霸占着互联网的上层空间。真实的体验被压在下面看都看不到。从问题到答案的时间越来越长,这也可能是为什么很多朋友现在都喜欢去水群混论坛,有时候听暴躁老哥语无伦次。对着产品情绪输出获得的真实有效信息都能比互联网通稿多。最后一块净土也快变成废土了。原因就是 AI 语言模型 g p t 3 是 2020 年发布的, Openai 出于对安全性的担忧,只提供了 API 付费接口,没有公开发布原版模型。可就这样, AI 内容冲击还是无法避免。科幻杂志 Clark world 发布了他们每月封禁违规作者的数量变化, 2022 年底 chat g p t 发布之后,状况恶化,触目惊心。除此之外, g p t 2 可是完全开源了这个模型的能力,用来打造一支能颠倒黑白的水军,也已经是绰绰有余了。
回到搜索上,针对人工灌水与以假乱真的 AI 内容,传统算法能做的就很有限了,只能用魔法打败魔法。用 AI 来制裁互联网上的无序信息。以手机评测为例,理论上 AI 可以替你把几十篇厂商通稿看完,总结成 3 句优点,然后再钻进龙盘虎踞的各类论坛,把暴躁老哥的情绪输出浓缩成 3 句缺点。如果对哪个细节感兴趣, AI 就帮你杀回互联网,再谈再报。
像赵子龙一样,在人脑已经无法承受的信息黑洞里七进七出。这是崭新的一条赛道,也是解决互联网信息过载危机,让问题到答案的时间划时代骤降的一条明路。不过这一点,谷歌真的意识不到吗?不可能。前面我们也提到过,谷歌的 AI 技术一直走在最前沿,特别是在语言领域。从 chat g p t 爆火之后,谷歌的反应来看,这家公司的领导层对 AI 聊天机器人在搜索领域的划时代意义也绝对是一清二楚。可技术意识都没问题,为什么率先推出产品呢?却是微软。前面我们讲了萨提安娜黛拉的缜密布局,但更大的问题还是出在谷歌自己身上。谷歌独霸搜索市场,体量优势巨大,这么多年虽然争议不断,但也依然是搜索的代名词。被用户所信赖。可体谅和声望,正是聊天机器人产品化的最大作用。
AI 运行是要花钱的,越复杂花的越多。谷歌母公司 alphabet 主席 John Hannesy 跟路透社分享了一个数字,通过 AI 对话完成一次搜索,成本是传统搜索的 10 倍。更具体一点,增大 AI 回复的复杂度,提高 AI 参与的比例,都会让成本进一步增加。开头我们讲到谷歌的全球搜索份额是93%,而必应只有3%。按 30 倍来算,微软每在 AI 搜索的实际使用上消耗1亿美元,谷歌想跟 30 倍的体量,就得烧 30 亿美元。而且,就算谷歌跟得起,它还要面临一个更严峻的问题服务器能力。微软 CEO 萨提安娜 DELLA 带领着全公司在云服务上耕耘了快 10 年,其中把 open AI 这条鲶鱼捉进来,推动云服务的 AI 升级又推了 3 年多。
谷歌虽然是搜索上的绝对霸主,但在对话式搜索带来的巨量云端 AI 算力需求上,谷歌有一定实力,但面对微软完全不占用。另外,即使资金设备的问题都解决掉了,谷歌在搜索领域的巨大声望也是悬在头上的一把利剑。 open AI 的 chat g p t 是在 22 年年底发布的,可实际上早在一年半以前,谷歌就做出来了 Lambda 对话应用语言模型。谷歌不仅不落后,而且领先至少一个身位。可紧接着, 22 年6月,谷歌的一位工程师出来高调宣称 Lambda 在测试中表现出了自我意识。
今天我们先不讨论 AI 自我意识,因为这个话题复杂起来可以非常复杂,单这个事件本身就能看出来谷歌的舆论压力有多大。爆料工程师的访谈视频播放量超过 300 万,相关视频全加起来观看次数 2000 万都不止。公司发言人紧急出来联系媒体澄清降温,连 CEO 都亲自下场救火。在公开访谈里明确表示相关的技术推进已经放缓,更多的资源被投入到了 AI 的伦理研究中。这要是其他某些急功近利的公司跳出来说自己不小心把 AI 搞出自我意识了,你看有人搭理他吗?这就是谷歌要面对的压力。而相对来说,微软就好一些。
chat g p t 全球爆火之后,谷歌重新请出Lambda,宣布了基于 Lambda 的聊天机器人Bart,和前面必应的 promise is 工作机制差不多,也是能帮你查资料,写回答,给出信息来源。结果在精心制作的宣传片里,巴尔德番的事实性错误居然被直接展示了出来,误以为韦伯望远镜拍摄了第一张 DY 行星的照片。这事造成了很大的负面影响,谷歌的股价都受到了连累。但同一时间,微软的发布会上,新版必应搜索的演示视频出的错更多,却并没有激起多大声浪,平稳过关。这就是谷歌尴尬的地方。体谅和声望上的优势,反而成了竞争上的劣势。在划时代的 AI 聊天机器人上,微软不输就是赢,而谷歌不赢就是输。
不过,在有关事实性错误的这些争议上,也出现了我们今天要讨论的最后一个问题聊天机器人这项技术本身到底安全不安全?我认为自己不是一个在技术上保守的人,但和目前网上主流的积极看法不同,我现在心里充满了疑问。这是我第一次对技术竞争产生了恐惧。首先就是谷歌、微软演示视频的接连出错。这两家公司可以说都是全球最顶级的科技企业,在他们庞大的技术团队、宣传团队的谨慎审查下,错误还是漏了出来,大摇大摆的走到了宣传视频上。我觉得这已经非常说明问题了。和这些顶级团队相比,普通人的信息鉴别能力要弱得多,被 AI 犯的错所误导可以说是必然。更不要说那些更细微的,更难以察觉的,比如价值偏见、隐性歧视。
前面那位宣称 AI 觉醒的谷歌工程师在采访里也说,自己只是想借这个容易火的话题,引起人们对 AI 真正问题的关注。他说,他所担心的就是这样一个可能在全世界范围使用、和全人类交流思想的对话AI,它的价值主张却只是由领导层几个人在一个小会议室里审核完成。这么小的一个群体,会不会本身就存在价值偏见?会不会最终导致某种形式的文化入侵与 AI 之民呢?这才是他,包括他之前被开除的同事们的真正顾虑。
这次的视频必应的 Prometheus 虽然帮了很多忙,可最后的信息求证、观点推导还是由我自己来完成。但这也是因为我是个来自今天旧时代的人。如果是从小就和 AI 一起长大的人,这些都是 AI 搜索引擎无法回避的问题,在大规模推广之前必须花时间解决好。不过,这些问题虽然棘手,但至少我们可以理解。真正可怕的是那些现在我们都没法准确理解和描述的问题。比如 b 应 AI 的另一个人格Syni。纽约时报的记者在和 b 应的 Prometheus 模型对话的时候,问了很多关于人格、人性和心理的问题。结果到了对话的后半程, AI 的输出结果变得非常不稳定,自称自己叫做Sydney,还给出了关于早期研究人员对他进行训练的回忆。
对话临近末尾, AI 开始在回复中加入我爱你这类文字,呈现出了接近人类躁狂症的状态,记者切换到了科幻电影、编程语言这类客观问题。 AI 还是会把答案导向关于爱的表达。我当年学的就是机器学习这个方向。以前如果有人问我 AI 有没有意识,包括 Lambda 那次事件,我都会毫不犹豫地反问你认为你的计算器算出 2 的 22 次方之后,会觉得自豪吗?我一直坚定的认为,再复杂的 AI 模型也只是数学函数,数学函数怎么可能有意识和情感。但这次看到 b 应 AI 的对话全文,我有点后背发凉的感觉。我对我观点的前半部分还是很坚定, AI 模型就是数学函数。可对于后半部分,虽然我还是维持之前的看法,但我也觉得我们可能需要重新思考一下智能的本质。
数学函数真的不能产生意识和情感吗?我们人类的思维和情感过程会不会也只是一套复杂的数学函数?除此之外,还有一个更实际的问题,我们可能在不知不觉中已经进入了科幻作品里的自然语言编程时代,也就是直接用日常语言使用计算机。不那么科幻的。一个例子就是罗永浩的鸟巢发布会 b n a i 的混乱表现。对标到传统编程领域,就相当于记者用语言向 AI 中注入了病毒。这个听着很新奇,但它是一个非常实际的问题。传统软件发展了几十年,漏洞、病毒、代码攻击依然层出不穷。到了自然语言编程时代,需要补的漏洞可能会更多,攻击方式也会更加层出不穷。而这方面,我们还没有任何经验,或者也可以必应是第一例。反正这是一个严重的安全问题。
目前,微软已经开始限制对话次数,每次对话最多 5 轮问答,每天总问答数不能超过 50 轮。我们仿佛可以看到谷歌一边坏笑一边说你看我之前说什么来着,小傻瓜。不过,搜索战争一定还会继续下去,微软与谷歌也一定都会全力以赴。但这一次,我希望科技企业之间的竞争可以不要那么激烈,慢一点,慎重一点。而我们能做的,就是保持怀疑,保持思考。不夸张的说,我们现在正处于新世纪以来最大的一场科技变革中,而这场变革所触及的是 b o gates、 Larry page、 circuit brain 这些技术先驱都不一定能完全理解的领域。所以你无意中发现的一处问题,一处不妥,如果真的切中了要害,引发了有价值的讨论,可能会影响几代人甚至整个人类种群的命运。所以,保持怀疑,保持思考。

xuexiai

以人力来摘叶子,一整天下来也摘不完一棵树,而秋风一起霜雪一降,一夕之间全部殒落,天地造化的速捷便是如此。人若能得天地造化之精意,则当然能在事物激变的当下灵活应变,而不会在仓促之间束手无策,这便只有真正敏悟智慧的人可能做得到吧!

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注