-
讯飞刘庆峰:今天,中国的大模型底座能力到底怎么样?
发展中国通用人工智能,一定要有大模型的底座能力
在去年9月份发布的GPT-4V,OpenAI大模型在图文识别和理解分析能力上,上了一个大台阶,随后11月推出语音识别大模型Whisper,今年2月又推出了文生视频大模型Sora ,今年5月推出GPT-4o,看起来是一个又一个的热点,但实际上还是依托GPT-4的底层通用大模型能力。
以Sora为例,并不是外界所说的“对物理世界的认知进一步加强了”,而是通过GPT-4V的理解能力和生成能力,结合GPT-4V的“打标签”能力、传统的文生视频能力,用GPT方法做了重写,从而实现了Sora。本质上,与大模型在医疗领域做一个医疗专用模型,在教育领域做一个教育专用模型并没有本质差别,只要有算力、有数据,其实没有真正核心技术的壁垒。
我们要发展中国通用人工智能,整个产业一定要有大模型的底座能力,我们有很多人可以做专用系统,很多人可以做我刚才说的大模型所调用的各种专用的小系统。但是国家不能没有自主可控的通用大模型底座,这决定了我们本轮通用人工智能发展到底能走多远。我们这么热热闹闹的社会热点,这么多的投入,将来能不能真的走到红利兑现那一天,我觉得底座能力是至关重要的。
今天所有的企业一定要科学地认识到大模型能力的边界,我们可以举出很多成功的例子,也可以举出很多的坑、很多不行的地方,每一家都是如此,所以我们要给统计数据。比如医疗八十几分是什么概念,国家执业医师资格考试60分就可以通过了,我们要考协和医学院等分数最高的医学院,七十几分也就可以上了。大模型的能力并不是包治百病,并不是什么任务都能100%完成。但是可以大概把它分成这几块,一个是叫一般难度任务,用通用大模型底座就直接可做,比如说代码、文案、翻译这些,会用到文本生成、摘要这些能力,直接用底座就可以满足应用。
中等难度任务涉及了知识库、深度的客服,它需要定制优化后才能用,这一般来说必须要做SFT的专门优化,很多地方可以做到,现在在很多客服行业可以大幅提升效率。
还有很多高难度任务,比如说高难度数学推理、多阶的推理类的知识问答,以及开放域的通用智能体等,实际上是非常难的,需要更大的模型,还需要专门的算法去摸索,在这些领域中,它具有很强的不确定性。所以今天我们认清这个边界,每个企业就可以知道自己应该怎么去做。
实际上,今天企业要探讨的话题是我们怎么能用更少的算力、更高的效率来打造我们的专属模型和专属应用。我们企业可以拿通用底座来做自己的专用行业模型,一般来说一个月就可以上线,在底座能力上进一步提升。底座如果60分,专业模型可能会做到80分,然后有了专用的行业模型,每个企业或者企业的不同岗位,在针对私域的IT语料加上高质量的微调,又可以进一步提升,一周就可以完成。所以,我们现在希望与很多龙头企业打造行业模型,提供给行业内所有上下游公司。
若GPT-5发布,差距会有多大?
今天人工智能技术的发展绝不是一家公司可以把所有事情都做完的,在这个时代,做帝国注定要衰落,只有生态才能生生不息;必须是自主可控的繁荣生态,才有中国通用人工智能大未来。
我非常高兴地向大家报告,从今年1月30日讯飞星火V3.5发布以来,我们的开发者团队持续高速增长,目前已经增长到702万,这都是实名认证的开发者团队。海外开发者数量从34万增加到40万,大模型的直接相关开发者达到了57万,这些数据都还在快速增长中。
面向下一阶段的人工智能的发展,这一波通用人工智能浪潮,我们要打造新的生态。特别要关注到的,第一是源头技术生态。科大讯飞针对几百万开发者团队,我们希望只要有比较好的AI能力,不论是高校还是创业企业,都可以集成在我们的底层平台上,让几百万开发者团队都能够用起来。
过去18个月,用过我们人工智能能力的独立终端已经突破40亿。我们把源头技术生态打开来,让更多的英雄有用武之地。今天人工智能非常重要的一个特点是大平台加上英雄主义,所以我们把源头技术生态打开。智能体生态让无论是企业每个岗位的人,可以做自己岗位的助手,也可以做自己的个性化助手,做完以后都可以分享出来。在我们的平台上,我们将来会设计分享模式和商业机制,从而形成智能体的生态。只要你懂场景,只要你愿意自己去试,试完成功了,你就可以发布到我们的智能体生态上,让所有的一线洞察能力和经验成为整个商业体中的一环。还可以有应用生态,用原来的开发者生态来做各种应用,无论是创业,还是企业内部的应用。去年我们新增的几百万开发者团队中,有50%以上是企业应用。
最后行业生态是希望跟各个行业里面的龙头企业一道来打造整个行业模型,然后把这个行业模型提供给行业里面的生态伙伴来共享产业收益,目前我们已经和现在很多龙头企业在做这件事。
从源头智能体开发到行业生态,在推动的过程中,特别重要的是一定要底座技术的完全自主可控,否则可能我们就把大楼建在别人的院子里,建在沙滩上,随时会倒塌,要真正做到软硬件一体化,才能更深度地落地。
在这样大的发展过程中,我们一定要科学理性地认识到中美科技的综合差距。今天我们说讯飞星火V4.0对标GPT-4 turbo是全方位对标。但是我们同时要看到,一旦GPT-5发布,因为它的模型尺寸更大、训练时间更长、数据更多,又会把这个差距给拉开,甚至拉到一年以上。
当然,我们有信心快速追赶,而且是在完全国产算力自主可控算法和数据基础上来追赶,保证不出现代差,保证极限情况下,能够顶上扛上。我们既要认识到差距,又要有充分的信心,要能够科学理性地给出从源头技术、到生态、到产业应用落地的一整套打法,要以长期主义来打造真正自主可控的AI产业生态。
- 责任编辑: 沐梵 
-
专稿|任正非说的“盐碱地”,中国光伏的希望田野
2024-06-28 09:50 -
OpenAI终止对中国提供API服务,周鸿祎发声
2024-06-26 13:53 人工智能 -
首次!我国科学家实现猕猴全脑尺度神经活动监测
2024-06-25 18:20 科技前沿 -
习近平代表党中央、国务院和中央军委致电祝贺
2024-06-25 14:50 航空航天 -
专稿|不顾一切的脱钩:美国国会为何瞄准这家中国企业
2024-06-25 09:54 -
2023年度国家科学技术奖励名单公布
2024-06-24 17:46 -
“NASA和波音早就知道这个问题,但仍发射了火箭”
2024-06-24 16:23 -
李德仁、薛其坤获2023国家最高科技奖
2024-06-24 10:32 科技前沿 -
我国科研人员在月壤样本中首次发现天然石墨烯
2024-06-24 09:19 嫦娥奔月 -
我国重复使用运载火箭首次10公里级垂直起降飞行试验成功
2024-06-23 14:58 航空航天 -
纯度达99.9%!中国团队实现海上风电驱动海水制氢
2024-06-23 08:07 观察者头条 -
全球首台!这一重要装备研制成功
2024-06-22 13:09 中国精造 -
专稿丨鸿蒙与安卓彻底切割,未来胜算几何?
2024-06-21 19:35 华为 -
“加拿大决定跟,但也怕…”
2024-06-21 18:08 -
中国科学家发现治疗免疫性血小板减少症突破性新疗法
2024-06-21 07:27 -
2024世界人工智能大会7月4日开幕,特色亮点抢先看!
2024-06-20 16:00 2024世界人工智能大会 -
我国首个工业用途核能供汽项目正式建成投产
2024-06-19 15:17 能源战略 -
“千里眼”最大“角膜”:相当于把北京五环内地面平整到高低差小于1毫米
2024-06-19 09:10 中国精造 -
全球首台全高温超导托卡马克装置在上海建成运行
2024-06-19 08:15 -
“美国在核电技术上落后中国10-15年”
2024-06-18 16:42
相关推荐 -
“荒谬言论”,默茨:我会跟特朗普谈谈 评论 10中方同意接触,美媒紧盯:事关重大、令人鼓舞 评论 68印度指控巴与恐袭有关,称空袭是行使自卫权 评论 303直播:跟着军工组探访俄罗斯兵器博物馆 评论 127巴军:击落6架印军机,含3架新锐“阵风” 评论 1308最新闻 Hot
-
“荒谬言论”,默茨:我会跟特朗普谈谈
-
担心美国施压,在华德企:希望新一届德国政府确立平衡立场
-
“以方计划会越过另一条红线”,欧洲6国外长发布联合声明
-
印空军:今起在与巴基斯坦接壤地区进行演习
-
中方同意接触,美媒紧盯:事关重大、令人鼓舞
-
拜登卸任后首次受访:特朗普太掉价了,美国不代表掠夺
-
哥伦比亚准备加入“一带一路”?中方回应
-
印度指控巴与恐袭有关,称空袭是行使自卫权
-
首批145%关税中国货船抵洛杉矶港,美业界预警…
-
立陶宛和拉脱维亚又使坏,俄方怒斥
-
俄方宣布:8月底,普京将访华
-
特朗普又要给波斯湾改名了
-
英国快和美国谈成了?条件是…
-
改道、停飞,各大航司又遭罪了
-
巴军方公布回击细节:两国战机均未侵入对方领空
-
巴军:击落6架印军机,含3架新锐“阵风”
-