网站标志
导航菜单
当前日期时间
当前时间:
购物车
购物车中有 0 件商品 去结算 我的订单
商品搜索
商品搜索:
文章正文
“1+1>2”,Arm要在系统层面做文章
作者:    发布于:2023-11-14 20:53:53    文字:【】【】【

  半导体圈有多“卷”?看看各大厂商动作频频的发布会和时常更新的性能跑分就知道。近日,半导体厂商又“卷入”了生成式AI,展开性能、上市体验拉锯战。11月6日,联发科发布天玑9300旗舰5G生成式AI移动芯片,迎头赶上端侧人工智能这波浪潮。为更好服务于半导体厂商优化性能、降低开发者门槛的需求,芯片内核供应商也在为产业链合作方提供效率更高的开发体验。


      作为芯片IP供应商,Arm正在探索在内核IP的基础上以系统化的方式提供解决方案,作为支持产业链的新途径。TCS23就是为日趋复杂化的SoC开发提供的一站式、简约化的解决方案。天玑9300搭载的内核Cortex-X4和Cortex-A720,也使用了TCS23,在帮助天玑芯片实现AI功能同时,还实现峰值性能相较上一代提升40%,功耗节省33%。


      为芯片开发过程“瘦身”


      性能,是芯片设计厂商的生命线。为了实现在有限的空间内实现更优化的性能,SoC设计正逐渐复杂化。长期以来,更高性能的内核持续受到追捧,但要将SoC整体性能发挥到最优,不仅需要先进的内核,还要提升内核的能效比,实现多核系统能效最优。


      为了帮助SoC设计厂商实现系统级性能提升,Arm推出了全面计算解决方案(TCS),一方面集成Arm全新推出的IP产品,另一方面将涉及系统层面的物理IP、架构、工具、软件、硬件集于一体,从SoC设计厂商的视角,预先处理其应对计算子系统构建和配置过程中的诸多挑战:开发用于总线互联、系统级缓存(SLC)和内存管理单元(MMU)的第三方系统IP,以及将所有组件集成到CPU和GPU集群等各个环节中遇到的问题。

 

      Arm称TCS23是移动计算提供的一站式、简约化解决方案


      简言之,就是将业务关注重点从单IP拓展到包含架构、工具、软件在内的整体方案上,最终实现“1+1>2”的性能优化效果。


      Arm中国区业务全球副总裁邹挺在接受《中国电子报》记者采访时介绍了TCS作为系统级解决方案的优势:“首先,我们的合作伙伴能够基于此选择最合适的配置以及CPU、GPU、互连、MMU和系统缓存的组合,最大限度地提高目标用例的性能。其次,该解决方案能够帮助客户优化计算系统,以针对实际工作负载提供更具意义的性能表现。”针对当前终端产品配置人工智能功能的需求,TCS23还可帮助用户端设备上的人工智能相机等的工作负载映射到系统中的不同计算组件上,以此减轻执行机器学习模块的工作负载。


      早在2021年,Arm就已推出全面计算解决方案,在推出全新IP的基础上提供一整套专为无缝协同工作而设计的IP组合,能够大幅降低SoC设计的复杂性,减少工程成本和资源消耗,缩短上市时间。而全新的Arm全面计算解决方案(TCS23)在此基础上,顺应更广泛的移动计算趋势,可以实现对更复杂的用户体验、新软件功能的需求以及更高性能和效率的持续突破。

 

      Arm TCS23发布现场(左一为邹挺,右一为Arm高级副总监兼终端事业部总经理Chris Bergey)


      至于TCS23解决方案的整体性能如何,Arm进行了跑分测试。数据显示,TCS23可实现带宽用量减少、峰值性能提升、异构机器学习计算效果优化,同时还能保障用户数据的安全性。经过优化,可改善实际工作负载的响应时间并减少带宽用量,与上一代TCS22相比,该平台每帧流量所占用的DRAM带宽平均减少了30%。对于某些内容,特别是游戏,这一测试的结果更为出色。例如,在体验AAA级游戏《堡垒之夜》时,TCS23将系统级DRAM带宽降低了44%,促使GPU和DRAM平均功率消耗减小了20%。

 


      TCS23可有效减少DRAM带宽用量


      与TCS22相比,采用TCS23平台执行计算和图形性能基准测试实现了CPU峰值性能提升27%。此外,TCS23还对软件和硬件进行了优化,从而加快了机器学习工作负载运行速度。将全新CPU与TCS23平台中经提升的硬件和软件相结合后,Cortex-X4的机器学习性能平均提升了12%,Cortex-A720提升了9%,Cortex-A520提升了13%。


      灵活适应客户定制化需求


      当前,针对用户个性化需求提供定制化产品,成为终端供应商的发展共识,也带动了相关芯片产品的高灵活性、可适应定制化的需求。


      配合这一发展趋势,TCS23也为客户提供了调整空间。合作伙伴可基于TCS23进行不同配置,从而自行创建可扩展性高的计算解决方案。据了解,全新推出的TCS23提供了三种参考配置,包括:高端、性能和效率,适用于不同设备、应用场景和计算要求。此外,TCS具备可扩展性,为客户的不同应用市场的定制设计提供了充分的灵活性。


      举例来说, TCS23高端参考配置主要面向提供超优质性能和计算密集型体验,可满足高端和旗舰智能手机及笔记本电脑的常见需求,可呈现更具冲击力的视觉效果,包括提供流畅的沉浸式AAA级移动游戏体验、图像和视频增强并能增强先进AI应用场景以及设备多任务处理。TCS23性能参考配置专为满足多个消费电子设备细分市场的一系列计算要求而设计,包括高端数字电视和机顶盒,以及中端智能手机。TCS23效率参考配置兼具超低功耗、超低成本和高面积利用率等优势,主要适用于入门级数字电视和机顶盒(STB)以及可穿戴设备等更侧重上述能效因素的设备。


      此外,关于TCS23的灵活性,邹挺强调:“通过TCS23,Arm提供客户一个参考配置示例,合作伙伴完全可以根据需求,自行创建和配置可扩展性高的TCS计算解决方案,以精确地满足目标消费类细分市场的需求。TCS23合作伙伴可以根据实际需求选择所需的IP进行授权,也可依照目标应用市场进行系统配置。”


      终端设备的产品替换周期以年为计,芯片设计商与手机厂商每年都需要为下一代产品的提升预先进行准备。其产品优化方向千差万别,需求类型各有侧重,TCS23均可结合客户需求提供定制化的解决方案。


      例如,针对客户希望最大限度提高计算和图形性能的需求,Arm可为客户提供多种参考设计,帮助客户选择最合适的CPU、GPU和系统IP设置。又如,客户希望手机用户在玩高帧率游戏时可以保持更长的续航时间。针对这一需求,TCS23可帮助客户在CPU上对DDK(driver development kit)工作负载进行优化,优化GPU以使用系统缓存来提高游戏性能效率。再如,针对客户增加手机空闲模式使用天数的需求。Arm全面计算解决方案可通过各种电源管理技术优化计算系统,实现低泄漏功耗,从而减少空闲功耗模式消耗。


      邹挺表示,TCS23的功能可部署到各级移动设备上,且每种TCS23配置(优质、性能或效率)包含的IP都具有相同的硬件接口和软件支持,可以更有效地协同工作。


      TCS这一解决方案以系统层面被推出时,为行业带来了全新的尝试和思路。而TCS23也为未来移动计算提供了完整的平台。

浏览 (10) | 评论 (0) | 评分(0) | 支持(0) | 反对(0) | 发布人:
将本文加入收藏夹
新闻详情
脚注栏目
|
脚注信息
机电工程网(C) 2015-2020 All Rights Reserved.    联系我们