LLM,这可能不是一条寻找终极AI的路程(原创)
现在的这个大模型,LLM,它可能不是一条寻找终极AI,AGI的这样一个方法,让我们以质能方程E=MC^2来做例子讲解一下。
在爱因斯坦给出质能方程之前,肯定是也是有人去做质量和能量之间的关系的这样一些研究,那如果换到今天,以人工智能AI的这种方式来研究,那么基本的研究思路是什么呢?就是我肯定是通过大量的实验,去找出一系列质量与能量之间的这种关系,比如说去标出所在这个关系,我可能把它画在一张图上,标出所有的这些点,然后去寻找一个,就是两种方法,一个是几何法,就是我在去寻找一个曲线,这个曲线能够那么尽可能的贴近这个所有的这些点,这是一种方法。第二种,就是代数的方法,就是说做这个高阶方程的近似,这里面涉及到一些数学知识,大家都在高中时候应该都学过极限这些概念,那么都知道这个泰勒展开式,那么,任何一个函数,其实都可以去把它拆成这样一个泰勒展开式,展开成高阶的这种泰勒展开式。
几何方法对于低维的,一维、二维、三维的这种,那么其实还是比较有用的,但对于高维的,那么我们的问题,比如说通过这个大量的收集这个能量和质量,这个这个往往它是包括现在的AI研究的这些问题,它往往其实是一个高维场景的这样一个问题,所以几何方法通常我们就很难奏效,因为人类很难去想象这个三维以上的这种空间,甚至空间类的这种曲线、曲面到底是一个什么样的一个特征。
那剩下来,可能应该就是走这个代数的这条路程,那么我们就可以想象这个函数,怎么去找这样一个函数?它可能就是我们可以想象这个函数,它最终的泰勒展开,然后去求这个泰勒展开里面的这个每一项的系数。这样的话,可能就是联立这个方程组,联立方程组,这种求法可能就比较比较复杂。还有一种方法,就是我们这个编程上常用的,就是我可以把这个高次的这个表达式,把它拆成这种这个不断乘积的形式,比如说我这个a0乘X的N次方加上A1乘X的N-1次方,加上A2乘X的N-2次方等等这样一个式子,我们可以把它拆成什么,就是这个X加a,加个括号儿再乘以X,然后再加B,再括号儿再乘以一个X,等等依次次这样加上、乘上。这种方式的话,它其实就便于通过编程的方法,通过递归的方法去做,这个是编程上面的一个技巧。在编程方面,这上面怎么去求出中间的这些,比如说每一小段的,它这个里面的这些系数,还有常量,然后怎么使得整个函数可以去收敛,那这个就是就引入了一些像什么梯度这样的一些概念在里面。
我们想象一下,假设我们把能量和质量的所有的可能,所有的可能,啥都已经这个,这个我们都都找到了,那么把它带进去以后,那我们通过这种方式求出来一个很高次的这样一个这样一个方程,当然这个方程,它其实还是一个模拟的一个方程,对,它还不是终极的方程,那现在我们大家都知道终极的方程是这个质能公式。
下面就这个就几个方面再说一下,第一个,这个得出来的这个高次方程,它其实它不是终极公式终极公式。
第二个,这个它虽然不是终极公式,但是它是有用的,因为为什么?它已经,穷尽了所有的这种质量和能量的关系,这个都能符合这个方程,或者说就算不能符合绝大部分的质量和能量,都能够去与之这个进行跟它相符合相相符合,那么其他的有即使有一些,跟它不符合的,我们也可以通过这种这个相似性,去找,去找,那么基本上也就是其实是它是一个可用的一个一个方程。
第三个我们也发散一下,就说,即使我们如果是即使不用这种高次方程的方式来表示这样一个质能质量和能量的关系,我们甚至只是简单的把质量和能量的这种做成这个数对,然后把所有的这个数对,都把它做成一个集合,那这个集合本身其实也可以作为一个模型去使用。作为一个模型去使用,那么因为你一种的话,就是你能够比如说根据这个把质量做成K,就相当于是一个KV把质量做K,它的能量这个就是V,那么这种的话,我基本上都能够找到对应的K,那即使找不到的话,我也可以找一个近似的K来找到它的V。这个,其实也就是现在讲的这种大模型的一个作用,大模型的一个作用,因为大模型几乎几乎,穷尽了,这个,是因为现在讲的是大语言模型,所以几乎穷尽了这个目前的这个语言的一些一些场景,一些场景,所以的话可以把它当那个大模型来使用,而且,它也有了它的一个表现形式,就是这种高维的高阶的这种这种方程,这种代数方程的一个形式。
但不管是这个混在一起的这样一个几何,还是说我这个高阶的这样一个近似的一个一个一个礼盒出来的这样一个方程,它其实都不是最终的这种终极的这种智能公式对?最终,那么从这个那从爱因斯坦发现智能公式,那么他是通过这种方式吗?我觉得应该不是。
那么能不能从这个高阶方程去最终去突然的就是最终能出现这个,找到这种简洁的这种E等于MC平方的这样一个公式?这个目前来看,其实并没有这样一个可以预计的这样一个过程,我感觉这里面就其实会有一个质的跳跃,那这种质的跳跃是靠什么?我感觉这个才是人工智能里面要找的这个,这个认知智能的这样一个飞跃,那它只能靠什么,只能靠数学。
这就得说一下,现在这个AI这个技术的AI这个技术发展,虽然用到了一些数学,但AI里面目前用到的数学其实还是一些比较比较,低级的数学,总的来说大概也就是高中的数学知识,最至多也就大一的这个数学知识的这个这个范围,也就是一些什么极限。这个这个高阶这个展开式,最多加一些这个概率论的一些知识,概率论,现在很多都是初中的已经开始去学了,所以说,这个整体的这个数学知识,还是AI里面用的数学知识还是比较浅的。那数学的相对比较高深的知识对,什么普遍函数,这个群理论呐等等这些,其实这个AI里面,现在目前是都还没有涉及到,对?我觉得AI想要完成从大模型到终极模型的这个终极公式的这样一个一个一个跳跃的话,我觉得要有更多的数学家的参与才可以,最近的话,比如有一些类似于像一些近期有一些像像什么构造几何学,还有像这个图论这些知识,这些这些一些数学的一些领域的内容,在慢慢的注入AI领域。
所以现在的这种这个LM这种大语言大模型,其实我认为他也没有达到这个AGI的这个水平,也就是也没有真正的去跨出一个这种,模拟这种离合的这种方程,去到最终这种简洁的这个公式的这样一步,其实还还没有跨出去,还没有跨出去。
那所谓现在这个这个大模型,所谓的这种什么涌现,这种幻觉,其实我感觉都还不是真正的这种认知智能的一种表现,因为因为你毕竟还没有跨到那一步,他怎么去理解这个涌现和这个幻觉?我们可以举个例子,大家可能都都知道,这个语言大模型的,它这个基础是transformer的话,原理比较复杂,我在这儿就不多说了,那大家知道这个transformer这个词,它是变换、变化的意思变换,那个变形金刚也是transformer,那么它的本质其实就是变换。那大家也知道这个,我们其实人工智能里面,本质上是这个是一些数值的计算,那就任何实体,包括语言里面的这些,这个这个实体,什么主谓宾定状补等等这些东西,其实最终都要被转化成这个这个token,也就是数值化之后进行处理。
那在这个处理过程中,它其实就可以去做一些变换,也就是transformer,那变换的时候,这个那个实体之间就可以相互替换,然后,我们也经常说,为什么语言大模型它不具备常识,需要去做一些人工标注对,因为对语言来说。打个比方说就是羊吃草,这个,那么我们大家都知道羊吃草,这个是一个事实,但是草吃羊都知道,大家都知道这是错误的,但是对于语言模型来说,其实它没有这种观念,比如假设吃这个动作我们不动的话,那么把它两端的这个主语和宾语做替换,那在你拿这个所有的实体,这个语料里面的,在这个替换的过程中,肯定会出现草吃羊这样一个场景,出现这样一串文字,那这种替换过后怎么去判断它是不是一个事实,符不符合常识?那么有几种方法,一种是通过标注人工标注,那这种,它是标注它是错误的,不符合事实,还有一种就是通过概率的方式去,统计这种,如果出现的多,那可以认为它是一种事实,如果很少出现,几乎不出现,那可以认为它是一种错误。
关于质能方程的推导过程,大家可以去了解一下,应该是一个纯数学意义上的推导,应该不是那种大力出奇迹的这种这种方式。根据传说,尽管爱因斯坦的这个数学功底很深那个,但是在从狭义相对论,像广义相对论这个,这个过程中间,还是借助了其他的数学家的帮助,可见这个数学,这个对于这种高精尖的,这种深奥的理论推导起着一个决定性的作用。
所以说大模型这种方式,目前这种方式还很难真正的达到AI,因为中间还缺乏一个这个飞跃,当然也有可能这个路并不一定正确,理由前面也已经讲过了,而且看现在这种AI的这种算法,这个什么transformer,什么attention,这个基本上还是一种比较浅的数学,你可以理解为就是一种简单的一种变换,它还没有什么太高深的突破。总的来说,现在还是在一种工程学的范畴,统计学主要应该也还是工程上,工程方面,所以的话,它其实并没有一些理论上的突破,这个目前来看,短期内也不太,沿着这条路来说,也很难实现理论上的突破,除非有这个重大的这个这个转折,一个什么样的重大的转机,目前也看不出来。
尽管大模型可能不是一个这个终极目标,显然不是终极目标,而且也可能不是一条走向终极目标的这个正确道路,但是大模型所表现出来的能力也是有目共睹的,而且这是有用的,那么大家现在可以看到这个大模型,号称能取代人工90%的这个能力,但这个肯定也不是吹嘘的,这个其实怎么说,这个应该是说大模型的已经涵盖了大量的这种知识在里面,所以,他可以模拟绝大部分的工作,可以做到这些事情。可以说现在大模型能够取代所有人类的这种文案工作,甚至可以说是所有需要通过电脑来完成的工作,都可以逐步被取代掉。至于这个,目前,有人戏称说不能够取代这个真正的这个搬砖,也就是这种体力体力活。但实际上想一想,如果把大模型把它装在一个机器人的体内,那么机器人有它的人类的外形,那么他也可以做很多,这种搬砖的事也是可以去做的。
至于硅基生命,如果是以这种大模型为基础的这种,那么我觉得它应该也不是生命发展的一个方向,因为大模型这种能力,如果不能够得到一种质的飞跃的话,就算是它能穷尽人类所完成的所有工作,不论是体力还是智力的,那它也就会被限制在这个范围内,所以你它并不能体现出比现有的这个生命即我们人类这种碳基生命,并不能体现出更多的优越性,那也不符合生命的发展进化的这种规律。发展到今天,我觉得如果还想取得较大的进步,或者飞跃,那么我们的这些躲在深山里面的这个隐世的数学家们就需要出山了,要来见见众生了,不能只做这个号称第四次工业革命的这种人工智能革命的一个看客,也需要亲自下场。