AI(人工智能)的应用正在渗透到各行各业,在科学、工程技术领域已有令人震撼的表现。
根据氨基酸序列来准确预测蛋白质的三维结构,是困扰了生命科学家50年的问题。几年前,AlphaFold问世时,就有科学家惊呼:这也是21世纪截止目前人类在科学技术领域上的最大突破之一,也应该是人类有史以来在科学和技术领域最重要的突破之一。最新的成果AlphaFold 3(2024-5-8在Nature发表)能预测生物分子的结构和相互作用。而按照当前实验结构生物学的发展速度,这本需要数亿researcher-year的工作。[1]
工业界开始意识到AI for Science的魔力。潍柴动力把深度学习用于模型降阶,大大提高了发动机仿真的精度和速度。
生成式设计(Generative design)系统已经在某些方面超越人类工程师的设计水平。
近些年,数字孪生几乎在所有工程领域受到关注。人们发现只有在孪生空间(数字空间+物理空间)方能超越人类对装备物理系统的认识局限。
进一步的观察不难发现,AI应用的进展改变人们对科学、工程技术(其实不限于这些领域)的某些认知方式。认知方式的改变理所当然地应该在工程和教育领域受到关注,尤其在教育领域需要深度思考并采取相应的变革措施。
一、大模型与“物自体”
对某物的认识,人可以从其不同的属性描述之。一个人可以从不同维度描绘一个苹果的特征,如颜色、纹理、形状、大小、甜度、果皮(厚薄)、肉质(脆)、果汁……对那些特质的感觉就成为某人对那个苹果的认识。试想,不同的人对某个特定苹果的感知是有细微差别的,每个人对那个特定苹果属性的认知都不可能充分完整。
康德在《纯粹理性批判》[2]一书中提出“物自体”(又译“物自身”“自在之物”)概念。每个人看到的桃子(苹果)在心里的感觉都不一样,是偶然的一种“现象”,是人们的主观认知。物自体能够被认识,其先决条件是能够被感觉,能够被经验。但无论感觉能力还是感觉工具都是有限的。“被感觉的物自体”称之为“现象”(phenomenon),认识的对象也只能是现象,不可能是物自体本身(物自体不可以被认识)。“物自体”和“现象”理论揭示出了人类认识活动的本质。
再看看AI如何认识一个物。大模型Transformer架构的基本功能之一是单词的向量化,即把所有的单词变成向量。如苹果,ChatGPT⼀次可以提取出⾄少300种,甚⾄500种性质。对于人类而言,这是不可思议的。普通人认识苹果属性,很少超越十几种。这就是说,人们对一个物的认识多停留在一些容易被感觉、被经验的现象,那些不易被感觉、被经验的现象则被忽略了。
人类对物的认识,基于可感觉的属性、选择的属性、思辨的属性(如相对论等),但依然不是物自体本身。其实,人们对工程中的物理零部件或系统的认知何尝不是如此。已有的相关知识只不过是一些容易被感知、被监测、被推理的现象(包括模型),不是真正的物理零部件或系统自身,因为尚有许多属性(隐性的、虽然影响不大的)未被揭示。
AI对物的某些属性的认识可能超越人类(如前述苹果),人利用AI可以更深层次地认识物理系统属性及其属性之间的高阶关联。工程教育中,大量有关物理零部件或系统的知识看起来都很成熟,但AI却告示我们传统工程方法和技术知识的浅薄之处。当然,不能说AI就能够真正认识“物自体”。但通过AI,可以揭示更多的反映物理零部件或系统特性的现象,使人们更接近认识物理零部件或系统的本质。
工程师、教师和学生都应该意识到,对工程实际问题的处理,不能仅依赖已有的知识,需要借助AI加深对工程中“物”的认知。
二、AI能够“认识”或处理工程中的
默会知识和暗知识
专业教育中,教师传授的、学生学习的都是可表达的知识。其实,生活中、工程中都存在大量的难以描述甚至完全不可表达的知识。有些知识,易于被感知,却难以言述,通常称之为默会知识,如骑自行车,吹玻璃。工程中的很多技能(know-how)就属于默会知识,如机器装配中的技巧。同样是合格的零部件,但不同人装配的机器之质量却有明显差异,这就取决于装配师傅的手艺。学校教育对工程中的默会知识基本上是忽略的,这里存在知识和语言的逻辑鸿沟。默会知识不是绝对地不可言说,但不可能充分表达。这些知识的主要表达形式不是命题,而是行动/实践。[3]
有经验的工人有很好的技能,但未必能够充分表达其技能。企业中,某些生产工位无法机器换人,而操作工可能频繁更换,这样的大环境背景下,如何做好生产作业的标准化?依托工业摄像头,采集技能动作的数据,运用机器视觉算法,通过智能分析,则可以发现优化的动作轨迹。这种方法一方面可以实时视频监控分析工人作业的规范性,另一方面可用来培训新工人。图1是某公司对操作动作的轨迹识别及作业标准化的例子。
还有一类知识,既不能感知,又不能表达,通常称其为“暗知识”。
在数字时代,绝大多数情形下,知识可以表现为数据间相关性的集合。但其复杂的相关性绝大多数都在我们的感觉和理解能力之外。对于数据间的关系,人类凭感觉只能把握一阶的或线性关系,对二阶以上的非线性关系就很难把握。高阶的关联在人类感官和数学理解能力之外,即是人类难以感知和理解的暗知识。同样,工程中存在大量的暗知识。如企业中能源的消耗、影响成本的关联因素,人类工程师和管理者能够把握的都是显性的、简单的关联,很多隐性的关联根本意识不到。
谷歌旗下的DeepMind通过数据中心内的几千个传感器去收集温度、电量、耗电率、设定值等各种数据,包括建筑物结构的数据,用于训练深度神经网络的集合,最终把Google数据中心总体电力利用效率(Power Usage Efficiency,PUE)提升了15%。其基本思路是通过各种数据及AI发现工程系统中存在的高阶、复杂关联,亦即暗知识,进而采取措施。
工程师和工科教师都需要意识到,在智能时代知识处理对象和形成方式都有很大的改变。传统的知识处理对象是明知识(可表达);而在智能时代,除明知识外,还有默会知识和暗知识。传统的知识形成方式是经验、推理、建模(数学模型、图模型等)、实验等,而在智能时代则需加之以数据驱动、数据关联(利用AI)。
因此,工业界和教育界都不能囿于既有的学科知识,要掌握利用AI处理默会知识、发现暗知识的方法,要让工程师、企业管理者以及工科学生形成重视默会知识和暗知识的意识。
三、过程视角
工程学科本来是基于实践的,但在面对工程中的“过程”问题时主要基于命题导向的知识。这种知识即便在指向“过程”时,也是抽象的、一般的过程,而非特定物理对象进行中的过程。数字智能技术(数字孪生)使人们有可能认识特定物理系统进行中的、流动性的过程,换言之,这种过程是个性化的。
约翰内森认为,传统的命题导向的知识观把知识看作一种产品,而其实践的知识观则强调知识之为一个行动的过程。认识论的实践转向的一个重要特征,就是采取过程视角来看待人类知识:“采纳了过程视角的各种知识观通常被称作是实践的(pragmatic)——这个词来自希腊文prag-ma,它的一个含义是行动。”[3]黑格尔没有用静态的知性实体思维去考察存在,而是把世界理解为一种未完成的流动性存在,没有任何不变的本质,一切都处于永恒的变化过程中。海德格尔看待存在的本真面目由名词性视野变成动词性视野,从静态视角转向动态过程,在他的视界里世界就是一个发生、发展、灭亡的过程。[4] 海德格尔的哲学中有“此在”的概念,意指人。“这种存在者,就是我们自己向来所是的存在者,就是除了其它可能的存在方式以外还能够对存在发问的存在者。”[5] 海德格尔还认为,存在的本性是zu sein(to be):“去存在”,此在是始终面向未来,面向可能性,筹划自身的。
如果我们把一个智能装备看成是一个物理生命体,又当如何?物理生命体应该被时间规定,其所有的活动和“存在”都具有时间性。(犹如海德格尔言“此在”的时间性)。需要注意的是,这里的物理生命体不是指一个类型的装备,而是某一特定的、个体的装备。数字孪生技术的应用使得智能装备能够知道其自身现在的状态,且能够面向下一刻的状态。数字孪生的精髓就在于对动态的、个性化过程的认识。
需要说明的是,并非言工业时代人们不重视过程。传统上多是从一类物理系统过去的过程去认识,以模型认识和控制过程,这种对一类物理系统过程的抽象虽然也是必要的、有意义的,但具体对于特定物理系统运行动态的认识与控制是有局限性的;AI、数字孪生则强化对特定物理系统之个性化过程(进行中的过程)的认识,通过数据+AI去认识和优化特定对象的过程,这对于提升特定物理系统运行过程的质量具有更重要的意义。
四、基于数据的智慧:从时间空间维度
今天的数据越来越多样性。过去,数据都以关系型数据的形式存储在数据库、核心信息系统中,今天随时随地都在产生数据。数据已不只是发生在核心数据库、业务系统中,而是无时无刻不在身边产生(如社交平台、移动终端设备、互联网和协作网络、云端设备和各类联网智能设备)。[6] 企业需要有从海量数据来源中获取有价值信息的能力。
不妨从时间和空间维度认识基于数据的智慧。
时序数据库技术的普及程度大大增加,不同于关系数据库,时序数据库会跟踪并记录数据变更以及变更的特定时间。集中来自物联网和监控技术的临时数据规模呈爆炸式增长,在这一背景下,无论是历史分析还是预测分析都越来越依赖于查询某个时点的数值,并能持续精准和高效跟踪该数值的能力。
GE数字集团的Proficy Historian平台用于工业时序数据的存储。其Proficy Historian Edge通过驻留在边缘设备并提供分布式数据,彻底改变了数据采集和存储方式,为工业物联网(IIoT)提供支持。机器数据可推送到工厂级,该软件可以安装在许多物理IIoT设备和控制器上,这些设备和控制器将机器数据反馈给工厂或企业级的Historian,Historian再将数据发送到云端进行分析和流程优化。
GE的Proficy CSense能够从历史数据中挖掘见解并快速开发、测试和部署简单计算、预测性分析以及优化和控制解决方案,以减少差异性并改善运营。
另一方面,要从环境、空间中的数据提取洞见。从各种加工过程中,如切削加工、成形制造、微电子制造、MEMS(微电子机械系统)……分析车间加工环境、空间中的各种数据的高阶关联能够更深刻地认识加工机理以及影响加工质量的因素。
迪尔公司(Deere&Company)在使用其现代农用设备时,都会收集数据。在超过3.25亿英亩的土地上,迪尔从大约50万台设备上收集了数十亿次有关土壤、作物和天气状况的测量数据。通过将所有信息输入到机器学习算法和AI中,迪尔能够创建一个数字与模拟服务相结合的组合,实现种子、肥料和杂草的最优管理。[7]
人们还可从更广空间的数据提取洞见,生成“内容”。全球范围内的信息(即内容)呈爆炸式增长之势,并通过各种渠道广泛传播。现在有所谓内容供应链 (CSC)一说,这些内容将推动打造卓越的客户体验。生成式AI可以帮助内部或外部创意团队、营销、客户支持、产品开发、运营或其他职能部门的内容创作者来研究、构思、生成、定制和管理内容。生成式AI成为内容供应链的强力引擎。生成式AI可以创建出更加有效的营销文案和图像。[8]
总之,智能时代所展现出的智慧是基于数据的,尤其是体现物理系统(如装备)运行动态的时序、历史数据,以及影响物理系统运行的空间环境数据(也与时间有关)。此外,来自社会中各种途径的数据,经过AI的提取和分析,都可以成为很好的“内容”,以改进企业的产品战略,改善企业的运营。善于从这些数据中提取洞见,应该成为企业未来必备的能力。
五、思维与认知方式
尽管ChatGPT已显示出惊人的能力,但他毕竟只是人的工具。善用AI是未来人的能力的重要体现。善用AI主要表现在提示、提问。现在已有提示工程师(Prompt engineer)这一岗位,提示、提问是他们的重要工作。提示和提问是利用AI解决复杂问题的核心能力。所以,未来工程师的水平的重要体现之一即是提示、提问的能力!
人们发现在AI大模型中引入思维链(Chain of Thought)技术对提升大模型的推理能力非常有效。思维链将一个逻辑推理问题,分解成多个步骤,一步步进行,呈现清晰的逻辑链路。应用思维链后,大语言模型逻辑推理能力突飞猛进。[9] 一个人在与AI系统互动时,如果能够给予好的思维链提示,AI系统将生成更高质量的答案或解决方案。而人的思维链又基于自身的问题视野和问题意识。人对问题的观察、思考和想象,对问题节点以及节点之间关联的把握,都有利于形成针对某工程问题的思维链。为了让学生具备良好的问题意识和视野,教育需要从“知识导向”到“问题导向”的转型。思维链对于提升人的解决问题和创新的能力都是至关重要的。除了平素的学习和思考中有意识地重视思维链的构建外,还需要善于从AI系统获得思维链呈现。在处理某个实际工程问题中,大模型呈现的思维链或许能够给工程师很好的提示。[10]
肯尼斯和乔尔于2008年推出“新奇性搜索”(Novel Search)算法。通过评估新奇性并保留新奇性比较高的方案,从而像生物演化一样发生一定的变异,如此往复循环,直到达到预定的迭代次数或者将问题彻底解决。只要是新奇的就留下——只问新不新,不问好不好。斯坦利指出,人类在人工智能或机器学习领域的许多基准文化可能已落入歧途。算法的强大力量,并不在于当真正建立一个目标时,它们做事情的能力;而在于,当没有设定目标的时候,它们做事情的能力。他称之为目标悖论,其含义是,有时候拥有一个目标,会妨碍你实现目标。目标悖论并不是要完全没有目标,而是说有时没有目标,更有可能实现创新。[11]
“目标导向”总是存在收敛倾向,使人专注于目标而忽略了对新奇踏脚石的搜寻;而“问题导向”却是发散的,不断滋生新的问题,而其中某些问题便可能是通往宝藏地的新奇踏脚石。概而言之,智能时代人的能力更取决于问题视野(虽然问题视野也与知识关联)。
人的创新能力显然和思维方式有关。海德格尔认为,人们并不是没有思考,而是在以“计算性思维”进行思考,以“计算性思维权衡利弊”,它“唆使人不停地投机”“从不停息”却“达不到沉思”。[12] “计算性思维”欠缺对本质或深层次问题的“沉思”,传统的“知识导向”的学习容易引向计算性思维,计算性思维少了许多“趣味”。
康德区分了两种趣味,即感官的趣味(taste of sense)和反思的趣味(taste of reflection)。“关于愉悦的判断只是私人性的,而关于美的判断则具有一般的有效性(它是公共的),就此而言,有关愉悦的趣味可以称作感官的趣味,而关于美的趣味可以称作反思的趣味。”他认为:“在一切能力和才能中,趣味恰好是这样的东西,由于它的判断不能通过概念和规条来规定,它最需要的是范例,这些范例与在文化进展中保持了最长久赞同的东西有关,为的是不要马上又变得粗野和跌回到最初试验的那种粗糙性中去。”[13] 杨振宁曾说过:有没有taste(趣味)对于一个物理学家一生的事业具有决定性的影响。[14] 物理化学家出身的波兰尼则在更为一般的意义上谈论connoisseurship(鉴别力),因为它广泛地存在于科学(特别是化学、生物学、医学)、技术以及各种行业中。可见,不只是审美领域中有趣味问题,从数学、自然科学到政治、宗教,所有这些领域中都存在着趣味、鉴别力、判断力的问题。默会知识论认真地面对这些问题,把趣味、鉴别力和判断力主题化为一组具有普遍意义的认识论范畴。[3]
在工程领域,趣味、鉴别力、判断力可能体现一个人的视野、高度,直接影响其创新能力。这种素养很难如计算性思维所需的知识那样容易在书本中得以描述,在学校中得到传授,需要在实践中观察、比较,同时需要“沉思”,需要悟。
在工业界,趣味、鉴别力、判断力关系到企业的战略,影响企业发展大局,如企业的产品战略。不妨以智能产品为例。处于计算性思维水平的工程师首先想到的是智能产品的基础功能要素:感知、控制、互联、记忆、识别、学习、理解等,从中挑选适应市场需求的若干功能要素,然后确定相应的技术手段实现之。看起来也中规中矩。假如有一个技术开发部门的领导者,他平常爱观察很多产品范例,喜欢比较,凝练总结,沉思……他考虑的问题:能否扩展产品的目标功能?即增加一些与元目标(如扫地机器人的扫地)有联系、但并非直接属于元目标的功能(如扫地机器人可以远程与主人互动);能否重新定义产品的行业边界?如手机的很多功能已经是跨行业的;能否在产品卖出后延伸其价值链?如内置传感器的跑鞋,使用过程中采集数据,通过数据分析,为用户继续提供有参考价值的信息或建议;如何让消费者或用户自己创造新的体验,使他们感觉价值体现?如产品某些内容(功能、外观等)体现消费者或用户的创意,通过开放平台让用户很容易开发新应用的工业App。如此等等。难道不能说这是一些技术审美情趣?正如康德所言的“关于美的趣味”“反思的趣味”。
审美判断、趣味本质上是比较性的,正如康德所强调的“最需要的是范例”。通过收集范例、比较范例而获得感悟和灵感。需要特别指出的是,无论收集范例还是比较范例,AI都可以作出特别贡献。
上述思维链、目标悖论、趣味和判断力等都是处理工程问题和创新活动中涉及到的思维和认知方式,进一步分析发现,都关乎知识导向还是问题导向。无论在企业还是大学,知识导向的模式还是很流行的,或者是下意识的。人们按照既有的知识、逻辑,沿袭固有的途径,解决既定的问题。这种思维方式恐怕就属于“计算性思维”,也欠缺“趣味”。对于处理一般工程问题是有效的,但不利于创新,尤其是原始创新。问题导向则有利于形成发散思维,它是扩散的、求异的,有利于创造力形成。良好的问题意识可以使一个人行进在正确的学习和工作轨道上,而且又更善于利用AI丰富自己的趣味和审美判断力。
未来,人类教师应该把传授知识的任务逐步转移(有一个过程)给数字教师。学校应该鼓励教师着力引导学生“沉思”、感悟,多开展一些让学生之间交流感悟的活动,让学生形成对思维方式、判断力、鉴别力的“趣味”。
结语
AI在深刻地改变世界,改变人类对世界的认知能力,借助AI可以提升人们对物理世界的认知能力。工业界和教育界都应该有意识地利用AI去触及那些原本人类难以认识的、工程领域广泛存在的默会知识和暗知识,以及特定物理系统的运行动态(个性化过程)。要善于利用基于数据的智慧,从时序和历史数据中提取洞见,以提升产品性能和改善企业运营水平。
同时我们也需要改变自己对工程技术的认知方式。拓宽问题视野,利用AI丰富自己的趣味、判断力和技术审美情趣。
某种意义上说,人的问题意识、趣味意识、数据意识或许是人得以驾驭AI之智的“慧”。如何引导学生善用AI,使自己更智且慧,高等院校任重道远!