深入解析「卡顿帧堆栈」 | UWA GPM 2.0 技术细节与常见问题
- 作者:admin
- /
- 时间:昨天 10:00
- /
- 浏览:93 次
- /
- 分类:万象更新
在游戏开发过程中,卡顿问题一直是影响玩家体验的关键因素。UWA GPM 2.0全新推出的「卡顿帧堆栈」功能,专为研发团队提供精准、高效的卡顿分析方案,能够直观呈现游戏运行时的堆栈信息,助力团队迅速找到性能瓶颈。该功能一经上线,便引发了广泛关注,许多开发者提出了相关问题。下面,我们一一解答,看看是否有你关心的内容。
「卡顿帧堆栈」功能是否仅支持Unity引擎?
A:在Unity项目中,GPM SDK会自动对所有C#入口函数进行打点。自动打点支持由Unity Native层直接触发的C#函数,具体包括:
- 第三方插件或者项目自定义的MonoBehaviour的Update、LateUpdate、OnEnable等函数;
- 引擎C#入口函数,如URP的DoRenderLoop,UGUI的Canvas.SendWillRenderCanvases等;
- 引擎触发的C#回调函数,如MonoBehaviour的OnTriggerEnter、OnCollisionExit等。
主线程中任何的C#耗时都会被包含在以上的函数中;而对于引擎的Native堆栈,如 Camera.Render、Gfx.WaitForPresent等,暂不支持,这部分耗时会被记入「Others」中。
对于非Unity引擎的项目,研发团队可以通过GPM SDK提供的API手动打点,精确记录各个关键函数的执行耗时,实现相同的卡顿分析能力。
如何仅针对特定玩家采集「卡顿帧堆栈」信息?
A:你可以通过API自定义采集策略,决定是否开启「卡顿帧堆栈」功能,并根据项目需求灵活设定触发条件。例如,可以针对特定设备、特定用户群或特定场景动态启用数据采集,确保数据收集精准有效。
「卡顿帧堆栈」支持Lua代码的分析吗,还是仅限C#?
A:自动打点是支持C#的,Lua里面需要项目组自己调用GPM 2.0的API进行打点。可以参考SDK集成文档中的API “GpmSample.Push() / Pop()” 来进行操作。经过打点,无论是Lua、C++或者其他语言,都是可以支持的。
启用「卡顿帧堆栈」功能是否会影响游戏性能?
A:几乎不会产生额外性能开销。
原理:
- 打点API在创建GpmSample对象时,仅调用一次Native函数传递函数名字符串,在后续的Begin/End调用时,只需传递一个地址参数,开销极小;
- Unity中的自动打点采用了Native Hook的机制,同样具备极低的性能损耗。
验证:
UWA进行了详细的性能测试,对比了开启与关闭该功能时CPU耗时、利用率的变化,测试结果显示,该功能对游戏整体性能的影响可以忽略不计。具体的测试案例如下。
分别在正常场景(满帧)和压力场景(低帧)的环境下,进行1600次自动/API打点调用的测试,统计循环完成的耗时。
API测试代码如下,其中gpmApiSample为GpmSample类型。
int count = 0;
for (int i = 0; i < 1600;i++)
{
gpmApiSample.Push();
count++;
gpmApiSample.Pop();
}
自动打点测试,在一个Prefab上挂1600个实现了OnEnable函数的Monobehaviour组件。测试时统计其SetActive(true)的耗时。
正常场景下,平均每次打点调用,耗时在0.5~2微秒(千次调用约0.5~2ms);
压力场景下,平均每次打点调用,耗时最高约4微秒(千次调用约4ms)。
以下是小米12上的测试数据。
正常场景下,单次调用增量,API调用均值<1微秒;自动打点均值<1微秒。
![](http://uwa-ducument-img.oss-cn-beijing.aliyuncs.com/Blog/UWA_GPM2_15/1.png)
压力场景下,单次调用增量,API调用均值<1微秒;自动打点均值<2微秒。
![](http://uwa-ducument-img.oss-cn-beijing.aliyuncs.com/Blog/UWA_GPM2_15/2.png)
从实际测试结果看,两类打点方式造成的额外开销也在同一个数量级。当然由于每款游戏都各不相同,开销也会有差异。
而在网络层面,则确实会带来一些网络传输量方面的开销。目前从我们接入的Case看下来,大约额外需要10KB/分钟的上行流量。但如果某一时刻的代码堆栈层数很深,内容很多,那么可能会再稍高一些。
为了控制性能和采集量,我们目前的堆栈功能在相邻的2个采集点之间也加入了最少10秒钟的间隔。后续我们可以开一些API出来,让大家可以自由指定数据回传的时机,在性能压力较低的场景下再将所有堆栈数据全部回传。
我能调整采集堆栈的深度吗?
A:卡顿帧堆栈功能打开时默认的堆栈深度为1层,在「GPM设置」-「阈值设置」下可以对调用帧采集的最大深度进行更改,支持设置1-20层之间的任意数值。一般来说20层堆栈已经足够定位出发生异常的函数堆栈,再者过深的堆栈采集也会导致开销变大,因此UWA在这边开放至最大20层的深度。
![](http://uwa-ducument-img.oss-cn-beijing.aliyuncs.com/Blog/UWA_GPM2_15/3.png)
GPM 2.0「卡顿帧堆栈」功能为游戏研发团队提供了精准、直观的卡顿分析能力,让开发者能够快速锁定卡顿根因,优化游戏性能。无论是Unity还是其他游戏引擎,都可以通过自动或手动打点的方式,深入剖析各个环节的性能开销。如果你对游戏性能优化有更高要求,不妨试试GPM 2.0,让你的游戏体验更流畅!
关于GPM 2.0
GPM 2.0 是一款专为上线或测试阶段的游戏项目打造的高效性能监测工具。它不仅深入捕捉宏观性能数据,还通过其独特的性能无损截图功能,让开发者在不影响玩家体验的前提下,全面掌握玩家运行时的关键细节,从多个维度优化游戏的性能表现,提升整体用户体验。
如果您的项目也希望体验GPM 2.0的强大功能,欢迎随时与UWA取得联系。我们将为您提供免费试用机会,并在试用期间全程支持服务搭建、数据分析与反馈,确保您能够充分体验GPM 2.0带来的价值。
联系UWA:
邮件:sales@uwa4d.com
微信号:17502188376
GPM 2.0新功能 集锦
《GPM 2.0 全新发布「卡顿帧堆栈」功能|精准高效定位游戏玩家端性能》
《GPM 2.0 重新定义性能监测与优化|从未知到已知,从被动到主动》
《UWA GPM 2.0 重新定义性能监测与优化|如何高效预警和定位玩家端的性能问题》
GPM 2.0案例精讲 集锦
《我们的目标是不耗电、不发烫、不闪退》
《冒险闯关类玩家关注的四大体验》
《玩家端性能数据 一手掌握》
《造成设备功耗高的罪魁祸首》
《海外市场设备适配性优化实战》
《5000人测试背后的秘密》
GPM 2.0实操篇 集锦
《GPM 2.0 实操之Session篇之如果闪退是因为内存崩了》
《GPM 2.0 应用场景实例之解决让人头疼的问题》
《GPM 2.0 助力设备监测、行为分析与性能优化|玩家共测新体验》
《GPM 2.0 API 功能助力定制你的性能优化》
《GPM 2.0 驱动优化与投放决策|硬件性能一目了然》
《GPM 2.0 多维数据与实时截帧完美结合》