技术并不一定带来公平,但一定会给最懂技术的人红利。
自从GPT-4发布以来,短短十来天,人类像来到了一个完全不同的世界。如果未来书写历史,AI时代的奇点,应是GPT-4正式对外发布的这一天:2023年3月15日。 关于GPT的新闻报道,堪称汗牛充栋,然而,不少认知,却不一定正确。特将平时思考整理成文,供各位读者参考。
01.GPT是什么 一组花费了十亿美金的大语言模型。而每次运行,同样都花费不菲,耗费的是超级计算机的算力。 想想看,有一个十亿美金的写作软件帮你改稿、找错别字;有一个十亿美金的助理帮你背东西,记住成千上万的术语;有一个十亿美金身家的人不知疲倦地陪你聊天。这就是划时代的变革啊。 未来,成本必然下降。但我们赶上了当初世界上第一台计算机在1946年诞生的那一个时代。
02.可怕的是GPT的使用时长 ChatGPT是历史上普及速度最快的一个产品,短时间内就达到了1亿月活。然而,比月活量更可怕的是使用时长。 如今微信、抖音、快手的日活跃时长大约在100分钟。而GPT相关产品每日使用时长有望超过2个小时。下一步,它可能依托API,无处不在,成为一个醒来就用的虚拟助理。 这是一种可怕的颠覆。因为本质上,人人都是自恋的,我们更喜欢理解并顺从自己的人。即使这是一个说话慢吞吞的AI。
03.GPT-4真正强悍的是推理能力 文心一言的理性思维能力距离GPT-4差多少?
一句话小结:GPT-4是推理引擎!不是百科! 如果将GPT-4想象成一个人类,我们最大的误解是以为它有很强的记忆力。其实不是,它最强的是推理能力。GPT-3.5的推理能力还只有三分,结果GPT-4一下子就到五分了,满分正是五分。 如果用人类的推理能力来类比,莎士比亚的推理能力是九阶,普通人是三四阶,而GPT-4的推理能力现在大约根据任务不同,在3.5阶到4.5阶波动。能写小说,但不够有趣;能理解非常复杂的推理,但仅限于各类条件清晰的。 但这也非常可怕了,也是真正使得GPT-4超越其他大模型之处。这意味着什么?就是可以实现真正的个性化学习、数字生命!这才是西蒙、纽约斯等人当年创立认知科学与人工智能时的梦想。 搞得业界心痒痒的。你们家怎么做到的!赶紧放出论文啊! 有人猜测是在训练代码库时意外习得推理能力;而我猜测研发团队引入了类似阿尔法狗的机制,设置了两条推理链相互竞争:显性推理与隐性推理,以及利用了庞大的用户输入数据。 然而真正的做法要等官方论文出来。但我敢打赌,18个月内,MIT或斯坦福或剑桥,三个AI重镇,必有论文以及开源模型出来。 新时代真的来临了。
04.大模型就是20年后的私家车 如果放在20年后看大模型呢?它其实就是一部私家车。 世界上第一台计算机诞生于1946年,当时造价是50万美金。按照黄金比例折算,等于现在的1200万人民币。从第一台计算机的造价到如今一台计算机的造价,77年下降了6000倍。按照如今科技的迭代速度,极有可能20年成本下降6000倍。 如果说今天的大模型是一台价值10亿美金的大飞机,造价昂贵,那么20年后的大模型,成本可能下降到16万美金。一台跑车的价格而已。而成本继续下降,就是一部私家车的价格而已。 未来的格局演化是,普通人搭公交地铁上班,使用公共的大模型;有钱人开私家车或私人飞机,使用更隐私、更个性化的大模型。
05.未来会形成两条路径演化 我并不认为大模型领域,会形成任何实质性的技术垄断。因为数据、算力、模型,在20年后都没有任何门槛。 数据:连OpenAI团队用的都是CC数据,一个互联网开源爬虫项目。 算力:今天看似昂贵,好比我们站在1946年,求神拜佛,想借刚刚发明的计算机帮我们跑微积分;然而,到了今天,谁还觉得算个微积分是一回事?算力增加的速度也会远远超过我们想象。 模型:一切都是开源的。OpenAI团队不开源,但无数顶尖高校团队,也会开源出一个又一个模型。 继续沿用大飞机与小汽车的隐喻,大模型领域的竞争,会形成两类路径:一类是致力于建设公共交通的大模型团队;另一类是致力于开发私人汽车的大模型团队。 这是两类不同的需求。真正容易产生行政垄断而非技术垄断的是在公共交通这条分支上。围绕大模型生产的上下游,同样将涌现出无数新的生态。
06.AI新时代的演化路线 以GPT等为代表的大模型重塑世界,大体上会沿着这个维度前进: 第一阶段:独霸信息世界(10年内相对成熟) 1、转译。语言与语言之间的转换。翻译这类受冲击最大。当然,还包括将机器语言与人类语言互转。 2、泛知识。一种语言内部,正确与否无伤大雅的那部分。最突出的就是娱乐。 3、认知复杂度较低的事实性知识。一种语言内部,能明确答案正确与否的那部分。最突出的是教育科研的事实性知识那部分。以往刷题能拿到答案的那部分。 4、认知复杂度较高的策略类知识。一种语言内部,极为复杂的那部分知识。答案非常依赖情境。典型如管理、销售、咨询。 第二阶段:干涉物理世界(20年内成熟) 5、从信息世界到物理世界。先是指挥电脑界面帮我们干活,接着是指挥机器人手臂这类帮我们操作物理世界。 第三阶段:解码心灵世界(100年相对成熟) 6、从信息世界、物理世界到心灵世界。结合脑与认知科学,一个人一生痕迹能被AI当作模式识别。从而生成一个更个性化的AI。
07.普通人如何应对AI新时代 第一步是保证每天使用GPT-4至少3个小时。只有如此,你才能形成具身的认知。 “认知”这玩意是很昂贵的。今天我们回看2000年那时,一个结论很清晰:互联网是个好行业。然而,当时很多人真不这么认为。同样,未来站在20年后,回看AI时代启动的2023年,可能又有无数人为自己的“认知”付出昂贵的代价。 平均来说,你一天可以问GPT-4大约100-200个问题。你可以提前将30-100个问题写下来。这些问题,建议指向具体的作品,最好你手头有示范数据,前期积累。 不断训练自己的提问能力,不断总结复盘与GPT沟通的过程,然后你会发现,GPT-4给你带来的生产力提升会令你惊奇。 不要问GPT-4那些泛泛而谈的问题,问那些,你自然得到的不是专属于你的作品,而是套话废话。 GPT-4特别像一面镜子。它反映的是你过往的认知与积累。如果你是一个博学的理性思维者,那么你看到的是GPT给你带来的生产力跃迁;如果你是一个游手好闲的玩家,那么你看到的是GPT与你侃大山带来的乐趣。 除此之外,还可以给大家一些建议: 所有的年初计划都要推翻重做,因为当初的年初计划少了一个时代大变量的改变。 所有的业务都尽量靠近GPT,放弃过往一切低效的赚钱模式。 所有的生产都尽量使用GPT,用它改造一切你的业务流程。 一切曾经成功过的产品,都值得用GPT重做一遍。 但更有价值的是那些专属于GPT时代的独特产品,这才是最大的鱼。
08.AI新时代的大鱼在哪里 无数人在我问这个问题:大语言模型如何与金融行业、教育行业、医疗行业、游戏行业等等结合。 其实,这么思考,一上来就错了。 参考20年前互联网发展的历史就明白了,那时,所有思考,如何用互联网服务自己“过往行业”的,没一家大成的。 产业结合,可以说是互联网行业发展到一个新的阶段之后的任务啊!甚至到了今天,我们也很难说,互联网行业改造了某些传统行业有多么成功。 是诞生了无数专属于互联网行业的产品与服务,才造就了一批又一批传奇。 同样,在今天思考通用人工智能技术、大模型技术,这类重大产业变革机遇的时候,你也要放弃,让技术服务传统行业的思维定势,那样,你拿到的其实是芝麻,却丢了西瓜。 在互联网行业诞生之前,有搜索行业吗?有搜索引擎优化(SEO)行业吗?统统没有。要寻找这类专属于新技术的产业机遇,这类才是AI新时代的大鱼。 有趣的是,人人看上的西瓜,反而最后你分不到手,因为大家抢得太厉害了,最后有人就将西瓜打碎了,都喝西北风。 反而是一些人们瞧不上的芝麻,组合在一起,结果成了美味可口的芝麻饼。这就是我如今带队在做的事。
09.AI时代是一个更好的时代吗? 不一定。前GPT时代,精英与其他人的差距可能是10分与30分的差距;而在GPT时代,将变为10分与100分甚至1000分的差距。 20年后,大模型成本快速下降并普及,大模型成为人生外挂:有钱人使用私有模型,普通人使用公用模型。 未来社会,在数字科技加持之下,极有可能二八分布变为一九了。百分之十的精英占有百分之九十的财富。 大模型带来的一个近似科幻的阶层差距变化就是,真正懂大模型的人,有实力训练大模型的人,可以让它随时随地收集自己与家人的数据。然后让其帮自己与家人出席各类需要书面语的场合。实际上,这跟化身万千没有任何区别。 不远的未来,当你还在用自己的脑汁干活儿,而那个跟你协同,或者指挥你的人,可能仅仅是某位富豪的大模型分身之一。而这份分身,消耗的算力甚至远远小于富豪在娱乐上需要的算力。 有那么一些现实版黑客帝国的味道了。
本文来自微信公众号“心智工具箱”(ID:Mindnote),作者:阳志平 |