8月15日,科大讯飞召开星火认知大模型V2.0升级发布会,重点升级代码能力和多模态能力,并推出多项应用和产品。科大讯飞董事长刘庆峰表示,代码能力是支撑认知大模型智慧的关键维度,多模态能力则是实现通用人工智能的必经之路,也是科大讯飞既定的人工智能技术长期战略。
(资料图片)
谈及大模型落地行业面临的挑战以及“百模大战”的竞争走向,刘庆峰表示,未来大模型落地,不仅会面临算力安全和数据安全方面挑战,还需要考虑能否带来实际场景价值,而不能只构建概念。刘庆峰预测到明年上半年,国内做通用大模型的企业剩不了几家,但垂直行业模型将会百花齐放。
值得关注的是8月15日,由国家网信办等七部门正式发布的《生成式人工智能服务管理暂行办法》正式施行。当天,科大讯飞董事长刘庆峰接受南都记者专访时表示,管理办法划定了对安全性的重点监管范畴和企业可以自主发力的方向,对行业而言是好事。“我们更有底气知道我们能够在保障安全、符合国家产业的情况下,具备规模化推广能力。”刘庆峰称,但面向C端的生成式AI产品何时可以全面开放,还需要等到有关部门通知。
“百模大战”将在明年告一段落
自去年底ChatGPT走红后,一场生成式人工智能革命在国内科技圈悄然进行,不到半年时间,近百款大模型相继推出。对于“百模大战”,刘庆峰认为对于行业的发展是好事,“因为一个新技术新的行业趋势出来,更多的科研院所,更多的企业和创业者关注,本身就可以让它更快成熟,发展得更好。”
对于通用大模型的竞争,刘庆峰认为持续到明年就会告一段落。“我觉得到明年通用大模型国内剩不了几家,但是在各个垂直行业应该还是会有很多家,而且应该百花齐放。”刘庆峰称,“到明年上半年,大家就会看清楚,哪些企业具有自主研发能力和平台开发能力的,哪些公司是做垂直赛道的应用落地,又有哪些公司是使用第三方模型套壳训练的,哪些是瞎吹牛包装概念的,慢慢就会水落石出。”
此外,在刘庆峰看来,人工智能大模型赛道还存在鱼龙混杂,欺骗消费者和投资者的情况,为了产业持续健康发展,应该建立一套科学的测评方法,最好还有第三方独立的测评机构参与测评。
随着通用大模型竞争进入白热化阶段,大模型的商业化落地成为新的趋势,国内面向垂直产业的大模型异军突起。刘庆峰表示,对于一些创业公司或者没有太多技术积累的公司而言,做垂直大模型先解决行业的应用刚需,是比较好也是比较科学合理的选择。
去年12月,科大讯飞启动生成式预训练大模型“1+N”任务攻关,其中“N”是应用于教育、医疗、人机交互、办公等多个领域的专用大模型版本。除了讯飞,阿里、华为等在落地垂直行业上也有新动作。据了解,今年4月,阿里云宣布启动“通义千问伙伴计划”,与7家企业推动大模型在油气、电力、交通等行业落地。7月,华为发布盘古大模型3.0,应用在金融、制造、煤矿等多个领域。近日,携程推出首个旅游行业垂直大模型“携程问道”。
大模型落地两大关键:数据安全和场景价值
众所周知,大模型的研发过程,需要可以支撑千亿参数规模的大模型并行训练的算力和框架,以及数千张卡同时连续运行,系统架构以及并行训练的集群能力成为制约国内大模型研发今早的关因素之一。但在刘庆峰看来,算力只是制约大模型发展的短期因素,长期来看,数据安全和场景价值才是影响大模型落地的两大关键因素。
“如果说应用落地有什么困难的话,我觉得还是说两个角度,一个角度就是国产算力安全和数据安全”,刘庆峰表示,第三方开源的平台存在不可控的风险和数据安全问题,而通用人工智想要赋能各领域发展需根植在自主可控、足够安全平台上。另一方面则是行业价值,刘庆峰则强调要从原来的一味构建概念回归到依靠场景驱动,“基于场景才能知道带给客户的价值是什么,如新增效益、节约成本、提升质量等,同时通过构建专属模型,能够让用户在使用的过程中低技术门槛的自己做训练,才能够使它赋能千行百业。”
据悉,在安全可控方面,科大讯飞和华为已在联合打造面向超大规模大模型的训练国产算力的集群,形成集群化的优势,同时科大讯飞与华为联合发布了星火一体机,让企业可以部署私有化大模型。
【对话】
发布会后,刘庆峰就《生成式人工智能服务管理暂行办法》施行后对行业发展的影响、星火认知大模型能力短板等问题接受南都记者专访。以下为对话实录:
南都:8月15日也是《生成式人工智能服务管理暂行办法》落地施行的日子,管理办法对于讯飞在技术研发以及应用落地上会带来怎样的影响?
刘庆峰:管理办法首先给了非常明确的标准,就是国家对于通用人工智能它的安全性的关注,是在于你做的应用有没有媒体属性,有没有社会动员能力。
如果这两项没有,你是在一些垂直行业、垂直赛道工业领域的应用,不属于国家重点,比如网信办这七个部门要关注的安全的主要范围和内容,那么,管理办法就标定了我们企业可以自主发力的方向和哪些东西需要得到网信办双新认证的方向,我觉得给大家形成了一个边界,这是非常好的事。
此外,通过办法在执行前的各种讨论,也基本上让大家知道了科大讯飞作为一个通用人工智能的国家队之一,我们怎样在内部构建自我防范的安全体系,从数据如何清洗,如何防止大模型的幻象,如何从用户的实名认证到针对用户的黑名单的管理机制以及快速修订机制的一套方案,我们已经完全成型了。
有了这套体系,使我们对于大模型下一个阶段往个人用户的规模和推广,更有底气知道我们能够在保障安全符合国家法律的情况下,具备规模化推广能力。
南都:管理办法推出以来,讯飞在业务和研发上做了哪些调整?
刘庆峰:业务上,目前并没有特别的调整,但我们对安全审核,又有了更严的设计。例如,机器的审核和人工的审核以及审核出问题之后如何进行快速的管理,还有我们如何在模型上快速学习和弥补这些问题,我们都有了一整套方法,而且运行得非常的高效。
南都:讯飞星火大模型推出以来,你觉得最满意或者惊喜的能力是什么?
刘庆峰:第一个比较惊喜的是任意风格的长文本生成,中文的大家都做得还不错,但英文的,我们迅速地就接近了ChatGPT,在国内遥遥领先,这是让我比较惊喜的。因为我发现我们中国做大模型绝不仅仅只是做中文,应该要面向全世界学习知识,而且在英文中我们要对标。
第二个代码能力也还是给我比较有惊喜的,因为我们迅速地就知道了代码应该怎么做,而且验证成功。所以按照节奏,如果算力够、时间够,早就不止60分了,现在60分已经非常接近ChatGPT。所以代码能力是我们觉得特别重要,它不仅是对我们的软件开发有帮助,确实也可以大幅降低我们创业者的创业门槛,它也是将来我的大模型链接真实世界,链接数字世界的一个工具和桥梁。
南都:目前还不太满意的一些能力是什么?
刘庆峰:相对来说我们不满意的是多轮对话能力和长链条的逻辑推理能力,我觉得提升的不够快。一方面是因为模型尺度还要进一步提升,到了GPT4这样的规模它就会更好,另一方面还是因为我们还没有完全放开,用户规模数不够大,训练得不够。
(文章来源:南方都市报)
关键词: