-
谢耘:为什么要认真讨论大语言模型的“理解”问题?
【文/观察者网专栏作者 谢耘】
自今年初文生视频大模型Sora引爆热议后,本周美国软件巨头Adobe表示,将允许用户在其旗下的视频编辑软件中使用包括OpenAI的Sora在内的第三方生成式人工智能工具。
另外,马斯克旗下人工智能公司xAI于近日推出首个多模态模型 Grok-1.5 Vision。
xAI 表示:除文本功能外,Grok还可以处理各种各样的视觉信息,包括文档、图表、图表、屏幕截图、照片,并能进行多学科推理。xAI重点展示了Grok-1.5V的7个示例,包括:将手绘图表转换成Python代码、看食品标签计算卡路里、根据孩子的绘画讲睡前故事、解释梗图等。
马斯克xAI的多模态模型Grok-1.5V
Sora 可以在每次 API 调用中为自然语言提示创建最多三种视频变体。
无论在语言领域还是在视频领域,它们都给出了让许多人感到惊奇的结果,于是便出现了大量耸人听闻的说法。其中一个核心的话题就是有人认为这些模型已经具有了“理解”能力,它们能够理解语言背后的逻辑,能够理解物理世界的运动规律。
当谈到“理解”的时候,有多少人知道自己心中的“理解”到底是什么?如果大家对于什么是“理解”都没有共同认识的话,讨论这些生成模型是否有“理解”能力就失去了意义。
“理解”是一个我们再熟悉不过的词汇了,它同时也是智能意识领域中最基本与核心的问题之一。问题越基本,我们往往越熟视无睹,越觉得无需做什么解释,其实把它说清楚就越困难。
从小到大,我们都在努力地去“理解”,也希望被别人理解。可是好像却没有谁讲过到底什么是“理解”。在受教育的过程中,几乎所有课程,都是讲授需要我们去理解的知识内容,然后用考试来检验我们是否理解课程。但却没有一门普及性的课程教授我们应该如何去理解。“理解”似乎是一个如呼吸一样的理所当然的、每个人都会自然而然地无师自通的能力。
然而事情远非如此简单。只要是生理正常的人都一样地在正常呼吸,但是正常人之间的理解能力却是有很大的差异。如同一个老师教授的学生可以有很不同的结果表现。
如果我们将人类的理性意识活动做简化,可以得到下图所示的基本过程示意。
人类理性活动的简化示意
从这个过程中我们可以看到,理解是认知的结果也是行动的前提,是人类理性意识活动的核心环节。
所以对“理解”有一个清晰的认识,对于我们提升自己的理解能力,寻找意识活动的规律,包括人工智能在内的计算机应用这个人类的“外意识”,认识各种基于不同算法的“外意识”的能力边界都具有极其重要又十分普遍的意义。
01. 机器学习获得的“统计性理解”
在对人的理解做了一个比较全面的讨论之后,我们来看一下人类创造出来的“外意识”在“理解”的道路上到底走了多远,以及最终能走多远。
2023年以ChatGPT为代表的大语言模型的出现,再次引发了对机器是否具有了意识或理解能力的大规模议论。
图二 回归关联核心作用的示意
目前包括大语言模型在内的机器学习方法,接受的都是人类给其提供的用文字符号表达的内容,所以即使它有了某种“理解”,也仅仅是存在于文字符号这个抽象层面的,而做不到最为关键的回归关联理解。这被称为人工智能的“符号落地”问题。基于多种传感器构建“具身智能”的努力,包含了实现上图中所示的回归关联的意图。但是因为我们没有关于意识活动的基础科学理论来支撑这些努力,所以借助“具身智能”实现回归关联或“符号落地”这一目标能否实现以及能走多远,都还有待于在实践中去探索,难以做理论上的分析推断。
我们目前能够下的结论是,从人类理解的本质来讲,基于对文字符号做信息处理的机器学习算法,还不具有与人类一样的理解能力,因为它对这个世界是没有自己实在感知的,无法实现回归关联。
那么,包括大语言模型在内的机器学习算法在抽象的文字符号层面实现了某种关联吗?答案显然是肯定的。机器学习最著名的一点就是它能够发现与建立信息之间的相关性,并且因为也仅此而已而遭到诟病。但是这种相关性关联与人类在理解的时候依靠的反映客观联系的关联有所不同。机器学习是基于对人类生成的内容做文字符号层面的统计相关处理,来确定文字符号之间的概率性关联关系,然后据此给出相应的输出结果。这种文字符号之间的相关性并非是人类思考的基点,而是人类因思考而产生的文字符号表达形式的一种派生特征。
图源:CSDN
以生成式大语言模型为例,它是对用文字符号表达的内容在文字符号层面做概率性相关统计分析,进而通过文字符号之间的关联关系,在概率的意义上掌握学习样本所反映的文字符号的含义、语法规则和文字符号的组合习惯、及体现不同具体表述内容的组合方式等信息,或称之为知识。最后模型以此为基础通过自回归的方式来完成内容生成的任务。
这种依靠统计获得的文字符号之间的关联关系,是一种语言层面的表象关联。之所以说它是表象关联,是因为文字符号的组合是其表述内容的外在形式,并不能简单地等同于内容本身,所以才有“言外之意”“字面含义”等说法。因而依据它形成的关联也并不能完全等价于基于内容的关联。但同时,形式与内容终归有着统一的一面。所以这种统计关联,与人类在抽象知识层面依据内容与客观逻辑形成的关联有许多相通之处,但在一般的意义上也并不相同。
人类在做文字符号表达的时候,基本的逻辑是先做“构思”---捋清要表达的内容,确定要使用的表达的方式,然后根据文字符号所代表的现实意义,按照语法规则形成最后的表达形式。虽然这个过程常常包含了非逻辑化的潜意识过程,常常并没有严格清晰的阶段划分,但是这个基本逻辑依然在起决定性作用。在这个过程中,“构思”是基础与起点,最终形成的文字符号表达是结果。而且人类在这个过程中还有“反思”,它基于“构思”去斟酌修改已经形成的表述,让其能够更好地反映自己的初衷。
大语言模型是不存在“构思”这一关键环节的,当然也就不存在“反思”的过程。它是通过所谓的“自回归”过程来产生输出,即利用过去已形成的输出及掌握的概率性关联关系去推算下一步的输出。这是它与人类在生成文字符号表述时的一个本质差异。
它以得到的输入为起点,利用从学习样本中学习到的各种概率性关联关系,以“自回归”的方式按照顺序一步步组合出相应的输出。在这个输出中,文字符号的基本使用方式来自于对它从天量的学习样本中学到的语言学知识,这使得其输出在形式上可以很好地符合人类的表达习惯。同时根据其学习到的相关性关联关系,在其输出中还会含有许多来自其学习样本中表达不同内容的文字符号组合方式。
所以虽然它没有像人那样的“构思”过程,可它也并不是在言之无物或凭空编造,而是通过关联关系把其学习样本中的许多内容有序地一步步组合在了一起。这是“自回归”机制自己的“思考”方式。它从接受的问题出发,通过这种“思考”方式生成了看上去含义丰富内容完整的输出。由此,它让许多人以为它是以与人类类似甚至相同的思维方式生成了那些文字符号的表述。
如果仅仅从语言层面来看,大语言模型可以给出相当好的结果,其表达相当的顺畅,说的都是人话;但是在其对答如流中,如果我们从深层含义的角度来看,情况就变得复杂了。它有时会给出令人满意的答案,即它给出的结果比较好地符合人类的理解认知;有时则会出现困难,甚至给出的结果让人感到莫名其妙,即出现所谓的“幻觉”。这种“幻觉”并非是因为它走了神,而是因为它“思考”的底层机制与人类思考的机制是基于很不相同的原理,所以它按照自己的机制给出的有些结果对人类而言如幻觉一般。即使对于一些我们看上去比较简单的、但是没有包含在其学习样本中的问题或表达方式,它也可能出现根本性的混乱或错误。
比如曾有人问:“大象与猫哪个大?”大语言模型回答道:“大象大”;但当被问道:“大象与猫哪个不比另外一个大?”大语言模型则回复说:“它们哪个都不比另外一个大。” (“Stuart Russell专访:关于ChatGPT,更多数据和更多算力不能带来真正的智能”,闻菲,微信公众号:“机器之心”,2023年2月20日)如果这个回答是人类做出的,我们会说这个人在回答问题时“没走心”。这个例子很清楚地表明,因为大语言模型仅仅学到了文字符号层面的统计相关性关联,在面对这个用不太常见的方式表述的问题时,它基于统计相关给出的文字表达便无法与人类的期望相应,即不符合人类的理解。
而且目前大家公认大语言模型的推理能力很弱,对于稍复杂一点的逻辑关系就无能为力。这正反映了它依靠文字符号层面的统计相关性关联,仅仅能够反映语言所表达的浅层含义,而却很难体现出文字符号表达的内容所蕴含的复杂或深层一些的逻辑。
而它在什么问题上会出什么性质的错误,是我们难以预计的。原因就在于它在做关联组合输出时,仅仅是依据学习到的统计性关联,而并不是像人类那样基于内容含义去表述。对大语言模型能力与局限的分析,还是应该注重对底层机制的认识,不能仅仅依靠不完整的测试结果去论证。对于大语言模型而言,由于其面对问题的开放性,根本不存在对其做哪怕是比较充分测试的可能。
-
本文仅代表作者个人观点。
- 责任编辑: 史岱君 
-
“知假买假”者恶意高额索赔,最高法发布司法解释
2024-08-21 11:08 食品安全 -
学习时报:解放思想是个重大政治问题
2024-08-21 08:40 -
湖北:推行分管案件的县纪委副书记异地交流任职后,反腐力度明显加大
2024-08-21 08:17 廉政风暴 -
国家卫健委:将对授予护士处方权工作的必要性进行充分论证
2024-08-21 08:00 医疗改革 -
广西北海多人赶海遭雷击,官方通报:1人死亡
2024-08-21 07:42 -
放票秒没、60元门票被炒到1600元,故宫回应
2024-08-21 07:29 -
巴黎长荣桂冠酒店拒绝悬挂中国国旗遭旅法侨界谴责,中使馆发声
2024-08-21 06:50 -
智障男子服刑近10年改判无罪后哥哥发声:希望对相关法官追责
2024-08-20 21:50 疑案追踪 -
习近平接见第33届奥运会中国体育代表团
2024-08-20 19:37 -
习近平会见出席全国人大加入各国议会联盟40周年纪念活动
2024-08-20 19:10 -
郑州警方回应女子被男子压身下殴打:男子精神分裂
2024-08-20 18:14 -
央视起底:氧气放掉,用药直接丢垃圾箱,工伤保险基金成“提款机”
2024-08-20 18:01 医疗改革 -
强降雨致300多名受灾群众被困,葫芦岛应急局出动三十多架救援直升机
2024-08-20 17:32 极端天气 -
日媒中国籍播音员播报时说“钓鱼岛是中国”,最新后续
2024-08-20 16:30 日本 -
大搞数字政绩与家族式腐败,湖南省政协原副主席戴道晋被逮捕
2024-08-20 15:29 廉政风暴 -
多地农村地区离婚率上升引关注,机构和学者分析原因提出对策
2024-08-20 13:33 婚姻故事 -
受强降雨影响,辽宁葫芦岛4个村通信中断
2024-08-20 12:55 极端天气 -
足协竞赛部原部长黄松因受贿罪一审被判七年
2024-08-20 08:53 廉政风暴 -
出厂价5万卖给医院12万,国家医保局问询药企
2024-08-20 06:59 -
宁夏一化工车间发生爆炸,5人遇难
2024-08-19 22:09 安全生产
相关推荐 -
“特朗普此举,是怕好莱坞没凉透啊” 评论 52“这一领域中国正不战而胜,菲律宾也无法说不” 评论 73特朗普蔫了:俄乌和平协议“也许达不成” 评论 132涉及对华贸易,纳瓦罗对英国威胁上了 评论 148“气疯了!”美国年轻选民倒戈:为何牺牲我们? 评论 204最新闻 Hot
-
“特朗普此举,是怕好莱坞没凉透啊”
-
“这一领域中国正不战而胜,菲律宾也无法说不”
-
又作妖,美议员要提案强制英伟达芯片植入定位系统
-
“普京接受了邀请”
-
特朗普暗示:他俩可以接班
-
特朗普蔫了:俄乌和平协议“也许达不成”
-
威胁美国后又滑跪,日本财长:不抛美债
-
“气疯了!”美国年轻选民倒戈:为何牺牲我们?
-
越南工厂恐慌蔓延:客户已开始撤单,等90天有何用?
-
百日民调创80年最差,万斯:不相信、不在乎
-
塞尔维亚副总理:武契奇没放弃访俄
-
美印太司令部司令:中国在这方面超过美国,常常“夜不能寐”
-
巴菲特罕见警告美元:不会投资“在下地狱”的货币
-
48%流向美贫困区,“离了这些,我们根本活不起了”
-
“终于从中国借到了月壤,NASA却…”
-
阿尔巴尼斯成功连任,“特朗普因素成幕后推手”
-