我们如何测试计算机

计算机测试方法

在ENBLE,我们对许多计算机进行了审查,而且已经这样做了很长时间。多年来,一些方法论可能发生了变化,但我们对深入产品审查的核心承诺从未改变。我们对笔记本电脑、台式机、平板电脑和其他类似计算机设备的审查过程包括两个部分:在ENBLE实验室中受控条件下的性能测试和我们专家审查人员的广泛实际使用。这包括评估设备的美学、人体工程学和功能。最终审查的判决是客观和主观判断的结合。

当一台计算机(通常是笔记本电脑、台式机、两合一混合设备或Chromebook)到达ENBLE实验室时,我们会将其设置为产品的典型用户。作为最佳实践,在设置过程中,我们会尽可能禁用侵入性的隐私和数据收集选项。然后,我们根据需要更新操作系统、GPU驱动程序、BIOS和制造商实用程序,并使用来自SiSoftware的Sandra、CPUID的CPU-Z、TechPowerUp的GPU-Z等应用程序收集有关系统组件(如CPU、GPU、RAM、SSD和主板)的信息。

我们的基准测试包括我们在每个兼容系统上运行的一组核心测试,以及针对特定用例的扩展测试,例如游戏或内容创作,在这些情况下,系统可能具有更强大的GPU或需要评估更高分辨率显示器。

Dan Ackerman/CNET

我们使用的基准测试软件列表会随着我们测试的设备的变化而变化。我们目前在每台兼容计算机上运行的最重要的核心测试是:

Primate Labs Geekbench 5和6我们同时运行单核和多核CPU测试,以及Vulkan(Windows)或Metal(MacOS)计算测试。在Android、苹果设备和Chromebook上,我们运行CPU测试和计算测试。Geekbench的CPU测试衡量了混合工作负载的性能。(我们同时运行两个版本的基准测试,以便与Geekbench 6发布之前测试的型号进行比较。)

Cinebench R23我们在Windows和MacOS设备上同时运行单核和多核测试。Cinebench用于测量用于3D渲染的纯CPU处理性能。

PCMark 10我们正在逐步淘汰这个Windows基准测试,但目前仍在运行最新一代版本,该版本模拟了广泛的功能,包括网页浏览、视频会议、照片编辑、视频编辑等。

3DMark Wild Life Extreme我们在MacOS(Apple silicon)、Windows、Android和iPadOS系统上运行此测试;这是少数能够跨平台测试图形性能的基准测试之一。我们还在无限模式下运行它,这在进行跨设备比较时消除了屏幕分辨率的变量。

3DMark Fire Strike Ultra、Time Spy和Port Royal我们在具有独立GPU的任何系统上运行这些测试,以测试系统的DirectX 11和DirectX 12图形性能,这对于游戏计算机尤为重要。我们正在逐步淘汰Port Royal,该测试专门用于测试Nvidia的RTX光线追踪性能,并转而使用3DMark的DXR或Speed Way(第一个测试DX12 Ultimate的光线追踪性能,第二个测试DX12 Ultimate的各种功能组合)。我们还添加了3DMark CPU Profiler、Storage和PCI Features测试,以了解在更多混合工作负载测试中看到的结果。

古墓丽影:暗影基准测试这是一款可以在低端游戏硬件上运行良好的旧游戏。它平衡了CPU和GPU的负载,而不仅仅依赖于GPU,并报告它们的使用情况。我们在具有独立GPU的系统上以1920×1080分辨率的最高质量预设运行游戏内置基准测试。

银河护卫队基准测试这是一款更现代的游戏,仍然可以在低端游戏硬件上运行,它衡量了纯GPU的性能。我们以1920×1080像素分辨率的高质量进行核心测试,但在相关硬件上可能会以更高分辨率和更高质量(例如启用完整光线追踪)运行,以进行比较。

The Rift Breaker CPU和GPU基准测试Rift Breaker结合了动作和复杂的模拟,这意味着它可以严重依赖于CPU和GPU来处理游戏的不同方面。我们以1920×1080像素分辨率的高质量进行核心测试,但在相关硬件上可能会以更高分辨率和更高质量(例如启用完整光线追踪)运行,以进行比较。

UL Procyon基准测试 如果一个系统满足运行Adobe Premiere Pro和Photoshop以及Photoshop Lightroom Classic的基本要求,我们将使用这两个基准测试在1920×1080像素分辨率下评估系统是否适合内容创作。与纯GPU基准测试不同,它们还提供了混合CPU和GPU负载处理的情况。

电池续航测试 对于所有带有电池的计算机,我们会更改设置,防止系统进入睡眠或休眠状态,禁用可能干扰测试的弹出窗口和通知,并将屏幕亮度和音量(输出到耳机)设置为50%。然后,我们在Chrome中使用Wi-Fi循环播放自定义YouTube视频,并使用计时器应用程序来跟踪系统保持活动状态的时间。

JetStream 2、MotionMark和WebXPRT 3 我们运行这些基于浏览器的测试来评估Chromebook的性能,并偶尔在Windows系统上运行它们进行比较。

Josh Goldman/CNET

其他测试

我们可能会对标准测试进行多个附加测试或变体;例如,我们会在使用电池电源时运行Geekbench和Cinebench,以查看笔记本电脑的节能设置对性能的影响。对于具有强大组件的系统,我们可能会运行其他基准测试的循环,以了解系统的稳定性和组件在完全负载下的运行温度。

自由选择的测试还可以包括在3DMark和支持它们的游戏中使用Nvidia的DLSS 2和3(在Nvidia上)、AMD的FidelityFX Super Resolution 2.x(在AMD上)或XeSS(用于Intel硬件)游戏提升和优化技术。对于中端及以上的GPU系统,我们有时会运行SpecViewPerf 2020(超越照片和视频编辑的专业内容创作和分析)或使用OBS Studio(流媒体)进行案例测试。

作为评测的一部分,我们通常会包括一份相关产品的得分对比表。当我们进行重大测试变更时,例如从一个版本的测试转移到另一个版本,我们会对两个版本或整个旧版本和新版本进行双重测试,以建立一个比较数据的数据库。

我们目前正在评估另外两组基准测试,以纳入我们的测试套件:UL Procyon最近添加的AI推理测试和具有高端图形和信息性基准测试的游戏Returnal。

由于很多计算机使用相同的一小部分CPU和GPU,相同的操作系统和类似的RAM和存储容量,这些基准测试结果通常符合我们的预期。这意味着通过查看系统的规格,我们可以相对于具有更好或更低规格系统的性能有一个合理的了解。特别是对于笔记本电脑,性能反映了制造商在分配功率方面的决策,即使插上电源。由于可以有多种方式来更改设置或自动化的“AI”驱动的设置调整,使得无法知道真正发生的情况,这使得情况变得非常混乱。