上个月,Adobe 发布的一个视频引发了不小的轰动。视频展示了如何仅靠输入相关的文字信息完成图像生成、模型构建、图像编辑以及图形变体等各种任务。在看了视频之后,不少人惊呼「颠覆」、「逆天」。
不过,身处 AI 行业的人应该早有预感,「动嘴皮子修图」这件事从去年开始就已经很常见了,只不过大多出现在论文中。在这部分人看来,Adobe 新 demo 的意义更多地体现在另一个层面:研究与应用的「墙」正在被打破,而且速度是如此之快。
当然,这一切还得追溯到 ChatGPT 的意外破圈。
(资料图)
春节过后,ChatGPT 的热度开始在国内发酵。一时之间,从一线 CBD 到小县城,从 VC、技术大牛到普通企业主、打工人,似乎所有人都开始谈论 AI。
前者的话题可能主要聚焦于如何造出中国版 ChatGPT;而后者大多感到新奇、迷茫和焦虑:和以往 AI 的每一次发展高峰一样,大众热议 AI 可能带来的机会、负面影响。但简单聊聊你就会发现,大多数人并不知道 AIGC 能做什么,边界在哪儿,能给商业、产业或者一家商业公司的业务经营带来什么变化,多数人感受到的仅仅只是对从业的恐慌,或者对技术机会的兴奋。
对于后者的问题,没过多久,微软就率先给出了一种答案:通过与现有的办公软件结合,ChatGPT 可以转变为实实在在的生产力工具,就像微软 Copilot 所展示的那样。利用 Copilot,你可以以自然对话的形式「支使」软件完成一系列工作,比如自动把文档转成 PPT、把 Excel 总结成图表……
国内企业同样反应迅速。今天,在 Copilot 面世一个月后,阿里巴巴旗下的钉钉也迈出了重要一步,演示了一个生产力工具在接入通义千问大模型之后所能带来的变革,并分享了对于 AI 应用层的思考。和微软 Copilot 视频、4 月 11 日阿里云峰会发布的钉钉视频不同,今天,我们看到了实机演示以及更多的功能。
对于中国 AI 的发展来说,这是一个微小但却十分重要的信号:在已经十分拥挤的算法层外,大模型应用层的革命也已经开始了。从算法层落地到生产域,大模型商业场景的想象力开始更明确,而且后者可能蕴含更多的机会。
从技术革命到应用的革命:AI 应用层或迎来寒武纪大爆发
「目前,人工智能最令人兴奋的地方在于,其平台层正变得更加稳定,这意味着应用层是时候出现了。换言之,我们每天与之互动的那些东西即将涌现。」
这是美国风险投资公司 Index Ventures 合伙人 Rex Woodbury 在今年 1 月份的文章中写的一段话。短短三个月之间,他所说的这一切都在加速实现。
首先来看平台层。在过去的几十年里,人工智能技术得到了迅猛发展,包括算法、硬件、数据存储和处理能力等多个方面。最关键的是,GPT-4 的成功验证了 AI 社区近几年一直坚持的大模型路线的有效性。因此,在 GPT-4 发布后,国内外资金、研发力量迅速涌入这一赛道。美国约翰霍普金斯大学计算机系博士、「出门问问」创始人李志飞预测,仅中国在 1-2 年后就会有 50 家以上的公司做大模型。
不过,他也提醒大家,通用大模型赛道难度很大、商业竞争激烈,不一定适合所有人。他认为,「与其说现在就匆匆忙忙跳进去做通用大模型,还不如多想想做出了通用大模型以后又怎么样?」
从目前的形势来看,这个问题和造出国产版「ChatGPT」一样紧迫。在去年 12 月的时候,GitHub 前首席执行官 Nat Friedman 还吐槽说,与 2020 年就造出 GPT-3 的研究人员相比,产品人员其实是远远落后的。因为很多人听说要涉足人工智能和大型语言模型时,他们往往会认为需要大量专业知识,这其实是一个谬论。
ChatGPT 和 GPT-4 的出现让大多数人都意识到了这一点,应用层面必然奋起直追。就像之前某篇文章的热评所说,当前的「AI 时代不能睡觉,眼睛一闭就过时了」。
而且,应用层究竟蕴藏着多少机会目前还不好预测。在国外,OpenAI 开放了 GPT-4 API,海量企业、个人开发者开始接入。一位推特用户发帖说,他花 10 个小时用 ChatGPT 做了一款应用,24 小时内就收到了 1000 美元的订单,三周后就成功地把该应用卖掉了。可见,应用层需求的迫切程度远比想象中惊人。由于需求过大,OpenAI 前段时间还暂停过 ChatGPT Plus 的销售。
如果真如阿里巴巴 CEO 张勇所说,「所有产品都值得用 AI 重做一遍」,那我们用「寒武纪大爆发」来形容 AI 应用层即将面临的状态应该并不为过。
在国内,很多行业的从业者也已经跃跃欲试,试图抓住这波应用层的机会,不过,真正以产品形式出现的成果还很少,尤其是能切实提高生产力同时覆盖人群又足够广泛的生产力工具。
所以,钉钉的入局以及今天在现场的实机演示显得尤其难能可贵 —— 不仅标志着国内科技公司的着眼点开始从算法层迈向应用层;而且相比于 Copilot 的视频,我们兴奋地看到国内科技公司开始不只发布 PPT,而是直接上实机演示。这也意味着类 GPT 的前沿技术,可以在国内环境下,在生产力领域普及。
一句话,一条「/」,一场生产力变革
在微软发布「一句话就能让 AI 帮我做 PPT」的 Copilot 之后,人们有一种感觉:这家科技公司似乎又回到了它年轻时的样子。当年从 DOS 命令行到 Windows 图形界面交互的变革也是由这家公司来引领的。
和当年那次变革一样,Copilot 掀起的这场革命也有一个突出的特点:让原本只有少数人能掌握并自由运用的前沿技术走到了每个人身边,成为了实实在在的生产力工具。今天,钉钉的现场演示让我们看到,这场变革在国内也已经开始了:只需输入一条「/」,一个智能化世界的门就此打开。
在 4 月 11 日的 demo 中,我们看到,这条「/」能召唤文档创作、摘要提取、应用开发等各项能力。
今天的现场演示展示了「/」的更多用法,对于提升个人和企业的生产力都有很大帮助。
如果你是一位老师,你可以用「/」完成课件设计等工作,比如设计一个以「马德堡半球实验」为主题的实践活动:
如果你是一位企业工作者,通过「/」召唤出的知识机器人,可以让你一键创作自动学习的专属机器人。在创建过程中,你不需要再去手动设定问题和对应答案,因为机器人可以自动学习一篇文档、一个网页或者知识库链接中的内容,然后智能生成对话问答。通过多轮交互,你还可以让机器人不断学习新文档,自动新增、更新问答内容。一个专属的知识小模型的感觉有了。当然,生成调查问卷并自动整理报告这种小事更是不在话下。
从通义大模型开启企业邀测到钉钉官宣接入该模型,再到钉钉的实机演示,阿里只用了 11 天时间。这样的产品化速度给人一种争分夺秒的感觉,就像 Copilot 带给外界的感觉一样。
当然,这一切都是有迹可循的。阿里搞 AI 有优势,从芯片到算力到模型到应用,都自成一家,是国内可对标微软布局的全能选手。阿里云有芯片、算力与算法,作为阿里云组织的一部分,钉钉直接受益于阿里云多年来搭建起来的 AI 流程闭环和产业链协作效应,拥有架构优势。
钉钉自身则有 AI 技术落地所欠缺的应用和场景。从 2014 年创立至今,已经有 2300 万个组织启用了钉钉,用户总数超过 6 亿,行业覆盖政府、医疗、教育、餐饮、旅游、制造、零售、互联网等各类。有了这些真正的生产、应用场景,钉钉上积累了大量对产业需求和解决方案的洞察,具有用 AI 技术创造商业价值的探索环境。
在现场,钉钉还宣布,他们将在一年内完成所有场景的智能化布局。这意味着 AI 走向应用只是一个开始。这样一个大规模的生产力平台接入当前最具潜力的新技术,其影响力将是相当可观的。这也是它的里程碑意义所在。
结语
在 ChatGPT 刚刚破圈的时候,大众可能会有点疑惑,「这不就是语音助手吗?怎么那么火?」不过,在看到 ChatGPT 编程、解题等聊天之外的能力后,大家走向了另外一个极端:需求天马行空,什么问题都想试一试,比如让它推荐房产。作为一个连网都不能联的聊天窗口,ChatGPT 只能给出一些自己编造的答案或拒绝回答。
从本质上来说,GPT 确实不只是「chat」,「chat」只是 OpenAI 展示出来,让全球认知 GPT 的一个场景。
作为一个让全民感知 AI 能力的入口,ChatGPT 正在出色地完成自己的历史使命。类似的国内大模型也在不断迭代,缩小与 ChatGPT 的差距。正如张勇所说,「AI 大模型的出现是一个划时代的里程碑,人类将进入到一个全新的智能化时代。就像工业革命一样,大模型将会被各行各业广泛应用,带来生产力的巨大提升,并深刻改变我们的生活方式。」
不过,AI 在每一轮高速发展中都会面临从技术到应用,从研究到商业的落地难题,这一次的 AIGC 也不例外。
在商业场景、生产领域,大语言模型还能做什么、如何和产业侧或企业侧的业务经营更好地结合,原有的应用和能力哪些可以完美结合、哪些可能要彻底退出历史舞台,依然是颇具挑战性的问题。但这是中国科技公司,也是钉钉必须要解决的问题。
参考链接:
https://digitalnative.substack.com/p/ai-in-2023-the-application-layer
https://stratechery.com/2022/an-interview-with-daniel-gross-and-nat-friedman-about-chatgpt-and-the-near-term-future-of-ai/
https://mp.weixin.qq.com/s/Yiwsu-eVYJIrJkpM9l4Rqg
©THE END
转载请联系本公众号获得授权
投稿或寻求报道:content@jiqizhixin.com
标签: