生成式AI的核心价值

从前文的叙述中,我们对人工智能模型的两个主要类型——生成式AI和决策式AI有了一定的了解,也明晰了它们各自的“特长”是什么。简单来说就是,决策式AI擅长的是对新的场景进行分析、判断和预测,主要应用在人脸识别、推荐系统、风控系统、精准营销、机器人、自动驾驶等;生成式AI主要擅长自动生成全新内容,主流的内容形式它基本都能生成,包含文本、图片、音频和视频等。二者在技术路径、成熟程度、应用方向上都有诸多不同。而在下文中,我们将聚焦生成式AI,围绕其核心价值来展开论述。

生成式AI聚焦于认知的逻辑层面

你或许想不到,决策式AI和生成式AI不但名称不同,从认识论的角度看,二者聚焦的认知层面也不相同。何为认识论呢?认识论即为与知识来源和知识判断相关的理论。如图1-12,在认识论中,人们的认识过程被描摹为金字塔形的结构,人类的认知会逐渐进阶,从数据、信息、知识、逻辑向形而上的哲学、信仰迈进,所认识内容的颗粒度和结构深度也会随之不断改变。

图1-12 生成式AI和决策式AI聚焦于不同的认知层面

决策式AI聚焦“知识”层面,而生成式AI则聚焦高一级的“逻辑”层面,二者在内容认知程度上大不相同,但还未上升至认识论中的信仰和哲学层面。因此总体来说,决策式AI更多体现的是基于大量数据、信息形成的知识总结和判断,生成式AI体现的则是基于知识、信息和数据在逻辑层面产生的创新成果。后者是更接近人类智慧的AI技术,其内容的创新强度也更胜一筹。

在实际应用中,决策式AI根据已有数据进行分析、判断和预测,已经在推荐系统、风控系统和精准营销等诸多领域为人类服务,而生成式AI作为在认识论模型中更高阶的一种,并非只分析已有数据,而是归纳已有数据进行演绎创新,也正在内容创作、人机交互、产品设计等诸多方面为人类贡献力量。

生成式AI的优势

如果在与决策式AI相对照后,你还不太理解生成式AI的优势,我们就用一个简单的比喻来描述一下这两者:决策式AI更像在做选择题,分类是它的强项;生成式AI则擅长做简答题,以创作为长处。

从更深层次来说,决策式AI其实是有隐患的。我们现在来考虑这样一个场景:假设我们拥有一种分类效果很好的神经网络模型,这种网络有非常高的准确率,能游刃有余地处理常规的图像分类任务。但是,我们把一个加了少许噪声的图像输入模型后,这个模型居然发生了十分离谱的错误,而那张图像的改变在人类眼中十分微不足道。如图1-13,在一个测试中,技术人员给一张猫的图片(模型认为图像是猫的概率为90%,是马的概率为5%)添加了一些噪声,模型就离奇地将其分类成了马(模型认为图像是马的概率为90%,是猫的概率为5%)。这个案例说明,基于条件分布的神经网络模型貌似缺乏对图片的语义性理解,我们也可以以此来推测,与之相似的只对条件分布进行建模的决策式AI模型很难理解语义上的信息,也不易做出正确稳定的决策。

图1-13 噪声干扰决策式AI的识别能力

对此我们可以设想一下,仅需少许简单的改变,决策式系统就很有可能放弃它所做出的判断和选择,它们又怎么能取得我们的信任呢?若我们所使用的系统建立在如此不稳定的模型之上,其日常的运行就会充满隐患,如婴儿般的模型很容易走入歧途,给我们带来意想不到的麻烦。比如,决策式模型遇到一个新样本时的输出不稳定,原本高价值的客户被误识别为低价值客户,或者原本风险较高的客户被误识别为低风险客户,这些问题在现实场景中发生是阻碍决策式AI在更多行业落地的重要因素。

我们从模型背后的原理出发,会更好理解一些。决策式模型的原理是这样的:模型会从海量的猫和狗的图片数据中,了解到猫的外观和狗的外观差别非常大,当面对新的样本时,模型判断样本的外观和谁更相似,就认为样本是谁。

而生成式模型则是这样:它从训练集中了解到了猫的特质(如大小、毛色、身形等个性化特征),而后从关于狗的数据中也了解到了这些特征,当面对新样本时,它就会先提炼其数据的特质,将之和猫、狗分别进行比较,两方都得到一个概率,哪组数据的概率较大,它就认为样本是谁。

与决策式AI相比,生成式AI显然成熟得多,它可以学习人的思维逻辑,产出具备常理和特定规则的内容。其依托的生成式模型会关注结果是如何产生的,但生成式模型需要的是十分充足的数据量,这样才能保证模型能采样到数据本来的面目,所以生成式模型的速度相对来说会慢一些。与之相反,决策式模型对数据量的要求没有那么高,速度会更快,在小数据量下的准确率也可能更高。

基于生成式AI背后的原理,它的功能如此强大也就不足为奇了。如最新的生成式模型GPT等,就可以生成一系列的内容,给予人类更多的方便和选择,让人类能享受从冗余工作中被解放的快感。从这个角度来说,生成式AI真是某些打工人的“福星”呢!

生成式AI的价值

生成式AI究竟有多么“万能”,以至于令人咋舌呢?我们就在这里做一个全面的介绍,展示生成式AI的核心价值,看看它是如何用强大的专业功能覆盖众多工作领域的。

如果以粗放的标准来划分人类的内容生产工作,大略可以分为艺术创造性工作、设计性工作和逻辑思维性工作,而生成式AI在这三类均有涉猎,可以凭借强大的内容生产水平让人类产生“危机感”。

如在艺术创作领域,绘画已然不再能难倒生成式AI了。2023年3月,我国诞生了首部AIGC生成的完整情节漫画。艺术家王睿利用AIGC,以小说《元宇宙2086》为蓝本,通过加噪点、去噪点、复原图片、作画这几个步骤,将文字转化成了可视化的内容,画面线条流畅、色彩绚烂,给人以强烈的视觉冲击,也在中国的科技艺术发展史上留下了浓墨重彩的一笔。AIGC创作的绘画作品甚至都进入了拍卖领域。2022年12月,AI山水画的首次拍卖落下帷幕,成交价为110万元。该画作是百度文心一格和画家乐震文续画的陆小曼未完成的画稿《未完·待续》。大家都知道,中国的山水画注重写意,很难模仿到神韵,而文心一格将陆小曼存世的画稿、书法作品等作为AI的训练数据,大量的数据“投喂”使得AI的创作颇具陆小曼画作的灵性,到了以假乱真的地步。

除绘画外,歌曲创作领域也已经被AIGC“入侵”了,百度数字人度晓晓与龚俊数字人共同献声的《每分每秒每天》这首歌就是AI出品,从作词到编曲均由AI把控。演唱者度晓晓也大有来头,她是国内首个可交互的虚拟偶像,除了唱歌跳舞,主持也不在话下。

喜欢看视频的朋友也离不开AI的帮助。谷歌研究院最近就发表了一篇论文,致力于将文本条件的视频扩散模型(video diffusion model, VDM)应用于视频编辑,这个视频编辑框架可以创建动态相机运动、为图像中的事物设置动画等,未来大家也有机会利用这项技术制作自己的个性化电影。网飞发布的动画短片《犬与少年》也与AIGC有关。这个短片由AIGC制作,而且创造了一个“第一”——全球首个AIGC动画短片,人工智能小冰在这部动画里就利用自己的技术绘制了完整的画面和场景,让人类创作者有时间回归到更根本的创意性工作中去。

在设计性工作领域,AIGC更是大展拳脚,平面设计、3D设计、服装设计、环境艺术设计等统统不在话下。有了AIGC在绘画创作中的先例,我们就不难看出它在平面设计中也必然很出色。在Midjourney等AIGC绘图软件中,只需要标明是T恤设计、丝巾设计还是插画设计、角色设计,就可以得到可投入使用的设计稿,独幅图案抑或是连续纹样,它都能轻松搞定。

生成式AI还渗透到了3D领域,Magic3D就是GPU(图形处理器)制造商英伟达推出的一款应用,它会先用低分辨率粗略地对事物进行3D建模,然后进阶优化为更高分辨率。OpenAI的Dream Fields更是不需要照片就能生成3D模型,把“无中生有”玩得透彻,现在,生成船、花瓶、公共汽车、食物、家具等的模型都不在话下。利用AIGC生成3D模型的技术,未来,游戏、电影、虚拟现实等领域都不再需要工作人员手动进行3D建模了,方便、高效了许多。

你是不是也好奇AIGC是怎么在服装领域应用的?3D衣物建模是其背后的一项核心技术,随着技术的发展,甚至还能做到3D衣物重建和可控衣物编辑。国外的Project Muze是谷歌与Zalando电商合作,利用谷歌深度学习框架打造的AI服装设计师。其所构建的神经网络融合了超过600名时装设计师的风格和多种设计元素,只需用户输入性别、喜好、情绪等信息,它就能设计出一套独特的时装。虽然在AI与服装结合的道路上,我们还需要摸索进行高水准的设计,但在服装设计的产业布局中,AIGC将是不可缺少的一环。

在你生活的城市中,AI说不定已经在进行市区的环境艺术设计工作了。谷歌发布过一款能帮助城市进行绿化工作的AI工具,人类能借助AI和航拍,绘制一张城市的“绿化地图”,并据此来生成绿化建议,用以解决全球变暖造成的极端高温天气问题。这款AI工具既高效又科学,取代了传统上昂贵的逐块研究绿化的方式。试想一下,在未来所有的城市中,公园、道路……只要能见到植被的地方,可能都是由AI规划并推动实施的,你会生活在一个由AI进行科学规划后建设的绿色城市。生活在这里,你应该也会被随处可见的植物治愈吧。

在家装方面,“AI +家装”产业也发展得如火如荼。AIGC工具可以帮助家装设计师、从业者快速创作出设计图及方案,促进家装管理及服务智能化和精准化,推动“AI +家装”产业数字化应用升级;另外,引入、应用先进的智能对话技术,搭建人工智能客服服务体系,协助家装商家和用户更为及时和全面地追踪服务进度,能进一步帮助平台打造更加开放的家装内容和服务生态,提升家装体验。国内的一家科技企业群核科技成立了AIGC实验室,旨在拓展全空间领域AIGC,进行家居家装、商业空间、地产建筑等空间领域的AI设计生成和迭代创作。说不定以后为我们进行家居装修的都是AI设计师。

说了这么多,你可能会认为,AIGC无非就是被“喂”了足够多的人类创作的内容,模仿大于创造。其实AIGC并不是“copy怪”,它还能从事非常需要逻辑思维的工作,像写代码这种专业工作它也能做。ChatGPT可以帮人写代码想必大家都已经知道了,但可以做到什么程度,大家可能并不太了解。现实中可能已经有读者用它解决过不少代码难题。除了知名度颇高的ChatGPT,aiXcoder公司推出的aiXcoder XL也是AIGC的代表,在2023年2月首次开放了代码生成模型的API(应用程序编程接口),让更多使用者能够利用人工智能提升软件开发的质量和代码撰写的效率,极大地提升应用程序的推进速度。从写代码这点来说,AIGC通过分析大量开源项目的代码,学习语言特征,动态生成新的代码,能够对不同类型的任务更加灵活、快速地进行开发。

除了上文提到的众多领域,人工智能还进军医药领域。对此,“生物版ChatGPT”有话说。“生物版ChatGPT”的任务是生成蛋白质。在产业落地应用的场景中,许多从业者最关心的问题之一就是大分子药物,尤其是抗体等蛋白质类药物能不能使用AI“一键生成”。药企晶泰科技是AI药物研发的先行者,其自主研发了大分子药物设计平台XuperNovo,这个平台包括许多大分子药物从头设计的策略,其中有一款策略被称作“ProteinGPT”。如此命名的原因是ProteinGPT的技术路线与ChatGPT相似,ProteinGPT可以一键生成符合要求的蛋白质类药物设计。目前,ProteinGPT已经被正式应用于晶泰科技的各类大分子药物项目中,表现得非常好。

绘画、影视、环境艺术、家装、代码、医药……似乎只有我们想不到,没有AIGC做不到的,相信未来AIGC将会在更多领域得以应用,给我们带来意想不到的应用效果。

说了这么多,我们对生成式AI独特的价值和优势应该都有了不少认知。其实,生成式AI和决策式AI还能两相结合、强强联手,多层次、多维度地解决人类更多的烦恼,将我们从机械式的生硬工作中解放出来,提升内容生产的效率,当然前提是内容质量要过硬。为此,也需要技术人员对人工智能进行更多的研究、开发和测试,文明社会未来主要的突破口和增长点或许就系于AIGC之手。