商汤科技“日日新”大模型体系全面升级。
·千亿级参数自然语言处理模型“商量”2.0版本支持阿拉伯语和粤语,推出小模型等不同参数量级的模型版本,可适配移动端等的应用需求。基于医学知识和临床数据开发的中文医疗语言大模型“大医”可提供导诊、问诊、健康咨询、辅助决策等多轮会话能力。
商汤科技“日日新”大模型体系全面升级。
7月7日,商汤科技董事长兼CEO徐立在2023世界人工智能大会“大爱无疆·日日新”人工智能论坛上宣布“商汤日日新”大模型体系全面升级,千亿级参数自然语言处理模型“商量”2.0版本支持阿拉伯语和粤语,推出小模型等不同参数量级的模型版本,可适配移动端等不同终端及场景的应用需求。
“日日新”大模型体系下,自然语言处理模型“商量”2.0版本突破了大语言模型输入长度的限制,推出不同参数量级的模型版本,可适配移动端、云端等不同终端及场景的应用需求,降低部署成本。“针对前端、终端的应用需求,我们推出了小模型,小模型不但性能上有一定突破,在前端的运行上也能够跑到高通骁龙8 Gen2的终端芯片上,使得我们更多的终端应用变得可能。”徐立表示。
文生图生成式大模型“秒画”3.0的模型参数从今年4月首次发布以来的10亿提升至70亿量级,实现专业摄影级的图片细节刻画。数字人生成平台“如影”2.0相较1.0版本的语音和口型流畅度提升30%以上,实现4K高清视频效果,具备AIGC生成形象及数字人歌唱功能,可应用于线上短视频、直播平台。商汤将与多个头部企业共建“云+AIGC+短视频直播”生态,带来高效低成本的AI视频和营销工具。
3D内容生成平台“琼宇”2.0(场景生成)的空间重建效率提升20%,渲染性能提升50%,1200TFLOPS/秒算力支持下,每100平方公里场景的建图时间仅38小时即可完成。3D内容生成平台“格物”2.0(物体生成)对小物体的纹理及材质还原达到毫米级精细度,突破对高反光和镜面物体的采集难题。在珠宝行业,依托“格物”2.0为珠宝品牌复刻珠宝首饰,可展现商品工艺特点。
在医疗场景,商汤基于医学知识和临床数据开发了中文医疗语言大模型“大医”,提供导诊、问诊、健康咨询、辅助决策等多场景多轮会话能力,未来将支持医学图像、文本、结构化数据等多模态综合分析。
在智能汽车的智能座舱方面,通过大模型的环境理解、逻辑思维和内容生成能力,形成“车舱大脑”。基于感知决策一体化的自动驾驶通用大模型UniAD,商汤构建车路云协同的交通体系,凭借多模态多任务通用大模型开发路侧视觉感知大模型,结合“琼宇”2.0及“格物”2.0构建智能交通孪生与仿真,并利用“商量”2.0的感知推理和人机交互能力,推动车路云共同向大模型对话式交互演进。