科大讯飞称 8 月 15 日星火大模型重大版本升级,这透露了什么信息?
科大讯飞发布星火认知大模型 星纪元STERRA新车有望搭载
易车讯 日前,科大讯飞发布星火认知大模型。据官方介绍,中文领域它已在文本生成、知识问答、数学能力3个维度超越ChatGPT,同时还发布了教育、办公、汽车、数字员工四大行业应用成果。作为合作伙伴之一,奇瑞旗下的星纪元STERRA系列新车有望搭载。
针对汽车领域方面,星途星纪元STERRA作为合作伙伴之一,也向科大讯飞发出祝贺,表示作为科大讯飞合作伙伴,星途星纪元STERRA将以发布会为契机,全面深化与讯飞星火认知大模型的战略合作关系,积极推动新能源智能化技术突破与创新。
科大讯飞官方表示,汽车越来越成为一个懂我们的出行的伴侣。现在科大讯飞用国际先进的智能语音技术已经在汽车内部给大家提供很多交互的方便,可以直接导航,可以直接问天气,可以直接问汽车各种参数等等,可以实现多轮、多人、多领域、多模态的人机交互,坐在驾驶位上、副驾驶位和后排的每个人听的内容都不一样,我们甚至可以把一台20多万元车里的音效听起来超过百万豪车的音效。这些功能都已经在超4000万的用户中得到体验,服务车型超过1300个。
这一次我们通过认知大模型,进一步让人机交互再上一个新的台阶。表现在我们可以在人机对话中更自由、更拟人化地沟通,然后可以更懂汽车。
这是什么意思呢?所有汽车相关的专业知识,用我们的认知大模型学习之后,随便用户怎么问,它可以非常自由地回答你,使我们可以更加方便、安全地使用汽车。
另外还有一个特别重要的事情是开放性。通过插件方式与导航、媒体、餐饮、景点等各种技能链接融入,为汽车座舱提供丰富的实时信息和服务。
我们在汽车上的体验将跟原来完全不同,而且我们的生活、工作和在车内要做的所有事情的效率和人性化体验都会上一个全新的台阶。我们要用星火启动每一次出行的乐趣,不仅给我们的父母亲,也给孩子,给所有的乘客。
打开易车App,点击首页“智能化实测”,多角度了解热门新车科技亮点,获得选购智能电动车的权威参考依据。
科大讯飞星火大模型是免费的吗可以下载吗
是免费的,可以下载。科大讯飞的星火大模型打破常规,是国内率先实现应用层落地的AI大模型,也是发布会后即可面向所有大众开放,只需简单注册就可以免费使用的大模型。用户可以在官网或应用商店下载讯飞星火大模型聊天软件,并安装到自己的设备上。
科大讯飞大模型发布会怎么样
很成功。科大讯飞这次发布会更注重现场实测和应用体验,以科学的评测体系对技术先进性进行系统介绍,全程节奏紧凑、干货不断。从星火认知模型的“1”,到AI赋能教育、办公、汽车、数字员工的“N”,我们既看到了公司AI大模型的成果,同时也看到了具体产品商业落地的清晰路径,能够感受到公司作为人工智能“国家队”深耕行业10多年的深厚底蕴。
AI大模型扎堆上线,你觉得谁能强势出圈?
ChatGPT在这个春天霸占了中文互联网,普通人面对它多生出兴奋和焦虑交织的复杂情绪,而大公司不甘落后,纷纷宣布自己也在做类似的AI大模型。
继3月16日百度发布文心一言之后,4月7日,阿里云官宣大模型通义千问开始邀请测试。
4月8日,在人工智能大模型技术高峰论坛上,华为云人工智能领域首席科学家田奇分享了盘古大模型的进展及应用。他透露,华为盘古大模型正在推动人工智能开发从“作坊式”到“工业化”升级。
接下来,有多场大模型相关发布会扎堆举办。
4月10日,商汤“日日新SenseNova”大模型体系问世;4月11日,毫末智行自动驾驶生成式大模型DriveGPT雪湖·海若发布;由昆仑万维和奇点智源合作研发的天工大模型3.5发布在即,并将于4月17日启动邀请测试;5月6日,科大讯飞“1+N认知智能大模型”即将发布……
互联网巨头、人工智能公司、智能硬件公司、自动驾驶公司等各方力量,都积极参与到大模型这一场盛宴中来。
行业监管也迅速出手。4月11日,国家网信办发布通知,就《生成式人工智能服务管理办法(征求意见稿)》面向社会公开征求意见。
根据计算机科学家、自然语言模型专家吴军的说法,ChatGPT背后是一个叫做语言模型的数学模型在发挥作用,这项语言模型技术早在1972年就已经有了,是由他的导师弗莱德里克·贾里尼克(Fred Jelinek)在IBM期间带领团队研发出来的。
只是到了今天,由于算力不断提升,语言模型已经从最初基于概率预测的模型发展到基于Transformer架构的预训练语言模型,并逐步走向大模型的时代。
复旦大学计算机学院教授、MOSS系统负责人邱锡鹏曾这样描述大模型的能力飞跃:“当模型规模较小时,模型的性能和参数大致符合比例定律,即模型的性能提升和参数增长基本呈线性关系。然而,当 GPT-3/ChatGPT 这种千亿级别的大规模模型被提出后,人们发现其可以打破比例定律,实现模型能力质的飞跃。这些能力也被称为大模型的‘涌现能力’(如理解人类指令等)。”
每当有革命性的技术诞生,无一不是由其在具体行业的商用化应用来实质性地推动行业进步。作为连接技术生态和商业生态的桥梁,大模型也将在很多行业应用落地。
只是,这波来势凶猛的大模型热,究竟会催生万物生长改变万千业态,还是继区块链、元宇宙之后又一个看上去很美的泡沫?
特斯拉将Transformer大模型引入自动驾驶领域中,拉开了AI大模型在自动驾驶领域应用的开端。大模型在自动驾驶行业的应用将提升系统的感知和决策能力,已经被视为自动驾驶能力提升的核心驱动力。
4月2日,百度正式发布百度自动驾驶云Apollo Cloud2.0。百度智能驾驶事业群副总裁、智能网联业务总经理高果荣表示,Apollo Cloud2.0基于大模型实现了自动驾驶数据智能的搜索引擎,大模型的能力积累了自动驾驶数据智能的搜索引擎,从海量数据中能够精准找到自动驾驶面向不同场景的数据。
“在自动驾驶领域,BEV(Bird''s Eye View,鸟瞰视图)是当前主流的技术路线,未来可以朝着多模态、通用智能的方向发展。”商汤科技联合创始人、首席科学家、绝影智能汽车事业群总裁王晓刚表示。
他认为,在通用人工智能时代,输入提示词和多模态内容,就可以生成多模态的数据,更重要的是,可以用自然语言生成对任务的描述,用非常灵活的方式覆盖大量的长尾问题和开放性的任务,甚至是一些主观描述。
王晓刚举了一个例子来说明AI和AGI处理任务的不同。给定一张图片,判断是否需要减速,AI和AGI的反应有什么不一样呢?
现有的AI系统,会首先做物体检测,然后再物体框里做文字识别,最后做决策。整个过程中每一个模块都是事先定义好的任务。
而在通用人工智能下,给定图像,人们只需要用自然语言去问问题,比如,“这个图标是什么意思?我们应该做什么?”模型本身不会发生变化,它会通过自然语言的方式给出一系列逻辑推理,最后得出结论。比如,它会说,“前面限速30公里/小时”“前面100米是学校区域”“有小孩”“应该小心驾驶”“将车速降到30公里/小时以下”等。
王晓刚还指出,智能驾驶汽车领域有“数据飞轮”的说法,通用人工智能时代则会产生“智慧飞轮”,人和模型之间可以互动,通过人的反馈,模型能更好地理解人需要它展示什么样的能力,而去解锁更多技能。从数据飞轮升级到智慧飞轮,可以实现人机共智。
商汤基于多模态大模型,可做到数据的感知闭环和决策闭环。从前端自动采集高质量的数据,到利用大模型进行自动化的数据标注和产品检测,“能够几百倍地提升模型迭代的效率并降低成本”。
华为云EI服务产品部总裁尤鹏也表示,“整个数据标注是整个自动驾驶领域准确率、效率、成本最高的一部分”,这部分的效率直接影响到自动驾驶算法和驾驶等级的提升。他透露,华为云正在做预训练标注大模型,支撑后续的自动驾驶算法的训练,可能会在几个月后会发布。
除了自动驾驶,很多行业人士相信,智能座舱也将在大模型的赋能下有着质的提升,尤其将为人机交互打开新的大门。
百度集团资深副总裁、智能驾驶事业群组总裁李震宇认为人工智能将重塑汽车空间,人与汽车的关系将会截然不同。“未来,我们相信每辆汽车都会搭载一个数字虚拟人。未来的数字虚拟人不仅可以模拟人的外形,还可以注入灵魂,真正拥有对人类意图的理解……同时也不再是单一以前场景的车机助理的身份,而会转化成全能助理。”
他相信,随着通用人工智能的发展,智能座舱将成为汽车创新的新焦点,将会重塑其空间,届时用户和车企之间的距离将缩短,用户和品牌之间的关系将更为紧密。“拥有自然语言交流能力的智能车可以让车企与用户直接进行一对一的对话。当汽车成为全能助理后,车企将面对用户需求爆发式的增长。”
王晓刚称,在智能座舱板块,通用人工智能可以使基模型具备对空间环境的理解、用户状态的感知、多模态指令解析及多轮逻辑对话、内容生成等一系列能力,进而赋能包括情绪感知、智能助手、基于情感的对话、创意内容生成、个性交互等一系列功能,不断地提升个性化体验,进一步拓展应用场景。
“智能汽车是通用人工智能实现闭环的一个非常好的场景,我们已经有人机共驾。”王晓刚表示,“未来我们希望车和模型之间能够产生更有效的互动,那就完成了从人到车到模型这样一个互动闭环,能够让通用人工智能为我们提供更好的驾乘体验,解锁无限的想象空间。”
只是,消费者距离这种有着“无限的想象空间”的汽车生活还有多远,没有人说得出答案。
想象是美好的,不过,挑战也随之而来。
“过去我们一年要做大概1000万帧的自动驾驶图像的人工标定,请外包公司进行标定,大概6到8元钱一张,一年的成本接近一个亿。但是当我们使用软件2.0的大模型通过训练的方式进行自动化标定,效果会非常可怕——过去需要用一年做的事情基本上三个小时就能完成,效率是人的1000倍。”理想汽车创始人、董事长兼CEO李想OK表示,“对于员工来说,他们会感觉用拳头打架遇到了拿枪的。”
他认为,在这样的状况下,如何能够让软件2.0和现有人才进行融合,为他们提供怎样的全新工作流程、激励机制,如何去选用任用人才,给全行业提出了挑战。
更大的挑战可能还在于中外大模型技术的差距。
3月25日,在2023中国发展高层论坛上,360创始人、董事长兼CEO周鸿祎表示,目前来看,中国大语言模型和GPT-4的差距在两到三年时间,GPT的技术方向已经明确,不存在难以逾越的技术障碍,中国在场景化、工程化、产品化、商业化方面拥有巨大优势,应当坚持长期主义精神,迎头赶上。
4月9日,由中国人工智能学会主办的人工智能大模型技术高峰论坛上,融汇金信CTO李长亮认为,未来做通用大模型的和做场景的分层很清晰,没有中间态。做通用大模型需要大量的算力、数据、人员、资源等,只有有很强技术储备和资源调配能力的大公司才能做,中小创业公司在这条赛道上会很难;在垂直应用上,基于大模型的发展,结合场景的know-how做一些创新应用,则会有无数的企业诞生。
他还认为,中国在大模型这个产业赛道上是很有机会的,因为在中文场景下,我们更懂我们自己的语言,沉淀了大量的中文知识,会迅速追赶并超越。
我们也注意到,计算机科学家、自然语言模型专家吴军在4月3日晚得到的一场直播中则给当下的ChatGPT热泼了盆冷水。他直言ChatGPT在中国被过度炒作了,中国的大部分研究机构是做不了的。
在他看来,ChatGPT的原理很简单,但是在工程上要想做到,其实蛮困难,因为ChatGPT太耗资源,光硬件的成本就要差不多10亿美元,这还没算电钱。ChatGPT训练一次要耗多少电?吴军的说法是,大概是3000辆特斯拉的电动汽车,每辆跑到20万英里,把它跑死,这么大的耗电量,才够训练一次。这是非常花钱的一件事。
他的结论是,ChatGPT不算是一项新的技术革命,带不来什么新机会,最后可能的一个结果就是给几家大的做云计算的公司交钱。
由ChatGPT带起的大模型热,最终会在各行各业开花结果,还是盛名之下其实难副?不妨把这个问题交给时间。
本文由汽车商业评论原创出品
转载或内容合作请联系说明
违规转载必究
【本文来自易车号作者汽车商业评论,版权归作者所有,任何形式转载请联系作者。内容仅代表作者观点,与易车无关】
科大讯飞星火大模型如何下载
1、登录开放平台官网,选择产品服务,再找到AI能力开放
2、在列表中找到语音合成,再点击在线语音合成。
3、进入在线语音合成的页面后,在页面的上方可以找到使用指南和资源下载两个选项,点击资源下载即可下载科大讯飞的语音合成相关资源,包括模型数据等。