Всех приветствую, сегодня рассмотрим энергоэффективность различных ARM и x86 чипов, сравним их между собой в энергоэффективности. Начнём с определения энергоэффективности.
Что такое энергоэффективность?
Возьмём определение из Википедии (не самый лучший ресурс, но пусть будет): «Энергоэффективность — эффективное (рациональное) использование энергетических ресурсов.»
Энергоэффективность нужна как и для того, чтобы вычислительная техника потребляла меньше при выполнении большой задачи. Так и для того, что вычислительная техника меньше нагревалась, потребляла меньше, имела меньший размер и при этом имела такую же или большую производительность (что наблюдается почти на всём протяжении развитии микроэлектроники).
Участники тестирования
В тестирование энергоэффективности будут участвовать:
- Orange Pi 5 Plus – довольно новый участник тестов, хоть и упоминался в декабре, в нескольких статьях. Тут установлен чип Rockchip RK 3588. В тестах участвует версия на 16 ГБ;
- Orange Pi 3B – участник ещё первых обзоров и тестов, имеет на борту RK3566 и в данном случаи, будет тестироваться версия на 2 ГБ;
- Raspberry Pi 5 – тоже довольно старый участник тестов. Установлен чип Broadcom BCM2712. В тестах участвует версия на 4 ГБ первых ревизий;
- HP 255 G9 – ноутбук, появлялся в тестах летом прошлого года. Установлен чип AMD Ryzen 5 5625U, версия на 8 ГБ с IPS матрицей (обзор). В тестах будет подключён к блоку питания (для того, чтобы уравнять шансы ARM одноплатникам и тест был более интересный).
Список участников привели, характеристики их чипов приведены ниже в таблице.
| Производитель | Rockchip | Broadcom | AMD | |
| Название | RK3588 | RK3566 | BCM2712 | Ryzen 5 5625U |
| Большие ядра | ||||
| Тип ядер | ARM Cortex-A76 | ARM Cortex-A55 | ARM Cortex-A76 | AMD Zen 3 |
| Количество ядер | 4 | 4 | 4 | 6 |
| Количество потоков | 4 | 4 | 4 | 12 |
| Максимальная частота, ГГц | 2,4* | 1,8 | 2,4 | 4,3 |
| Малые ядра | ||||
| Тип ядер | ARM Cortex-A55 | - | - | - |
| Количество ядер | 4 | - | - | - |
| Количество потоков | 4 | - | - | - |
| Максимальная частота, ГГц | 1,8 | - | - | - |
| Всего ядер | 8 | 4 | 4 | 6 |
| Всего потоков | 8 | 4 | 4 | 12 |
| Кэш L3, МБ | 3 | 0,5 | 2 | 16 |
| Поддерживаемые типы ОЗУ** | DDR4/DDR5 | DDR3/DDR4 | DDR4 | DDR4 |
| Максимальный объём, ГБ | 32 | 8 | 16*** | 32 |
| Максимальный режим работы ОЗУ | 4266/6400 | 1866/4266 | 4266 | 4266/3200 |
| PCIe | 3.0 | 3.0 | 2.0**** | 3.0 |
| iGPU | ARM Mali G610 MC4 | ARM Mali G52 2EE | Broadcom Videocore VII | AMD Vega 7***** |
| Количество вычислительных блоково iGPU | 4 | 2 | 12 | 7 |
| Система | Ubuntu Noble | Ubuntu Noble | Debian 13 | Ubuntu Noble |
| Ядро системы | 6.1.115****** | 6.12 | 6.10 | |
* - Максимальная частота может быть меньше из-за особенности работы менеджера частоты в ядре ОС;
** - Упоминаются только типы памяти (не их формат, такие как LPDDR, SO-DIMM, DIMM и т.д.);
*** - Данное число основано на тех платах, которые были в продаже;
**** - В системе можно включить поддержку PCIe 3.0;
***** - Официально – AMD Radeon Graphics;
****** - ядро от Rockchip.
КПД блоков питания
Перед началом тестирования, поговорим о них. Для ноутбука HP 255 G9 используется блок питания на 45 Вт, а для одноплатников использовался блок питания для Raspberry Pi 5 на 27 Вт.
Для блока питания хоть и эмпирически, был определён К.П.Д. в 85% для нагрузки до 6 Вт и 88% в нагрузке от 6 Вт. А для блока питания ноутбука хоть и долгим поиском, но был найден номинальный К.П.Д – 85%.
В анализе были использованы результаты, которые не учитывают потери в блоке питания (про максимальное потребление поговорим позже).
После этого, можно перейти, собственно, к тестированию.
Режим простоя
Как видим, в режиме простоя, меньше всех потреблял RK3566. С разницей чуть больше 1 Вт, на втором месте оказался BCM2712, а на третьем, скажем так, сразу двое – RK3588 и Ryzen 5 5625U с отрывом в ещё один Вт от второго места. Можно добавить, что в выключенном состоянии все участники потребляют 0 Вт, за исключением BCM2712 – в выключенном состоянии потребляет 2 Вт. По итогу, можно сказать, что в данном раунде выиграл RK3566, но не сильно.
Тестирование энергоэффективности процессорной части
Начнём с более лёгкой нагрузки, в виде собранного sysbench (почему так будет объяснено позже). Посмотрим на результаты тестирования, как в один поток, так и в много потоков. Начнём с однопоточных результатов.
Самый лучший результат у чипа на Zen 3 – Ryzen 5 5625U (ничего удивительного – высокая частота + хорошая микроархитектура). А вот с BCM2712 и RK3588 ситуация интереснее – хоть частота и заявлена одинаковая, но если из-за менеджера частот у RK3588 частота больших ядер составляет 2,3 ГГц, то у BCM2712 такой проблемы нет, поэтому и вырывается вперёд (с другой стороны, разница от приложения к приложению выходит разная, но тут не только это влияет). И RK3566 на последнем месте с производительностью в 3 раза меньше, чем у ядер Cortex-A76. Посмотрим на среднее энергопотребление в тесте (как и в других тестах в дальнейшем).
Ожидаемо, RK3566 потребил меньше всего энергии, в почти 2 раза больше энергии потратил BCM2712. Ещё на 1 Вт больше потребил RK3588. И ещё в 5 раз больше употребил Ryzen 5 5625U. Посмотрим теперь на коэффициент энергоэффективности для лёгкой однопоточной нагрузки.
Лидером оказался BCM2712, с отрывом в 35%, на втором месте оказался RK3588. Ещё на 30% менее энергоэффективным оказался RK3566 (но тут не всё так просто, об этом поговорим в конце в выводах). К сожалению, хоть и ожидаемо, на последнем месте оказался Ryzen 5 5625U с отставанием от лидера в почти 3 раза (и это, несмотря на довольно энергоэффективную архитектуру Zen 3).
Посмотрим на результат в многопотоке.
RK3566 ожидаемо отстал. В 3,5 раза быстрее его BCM2712, а в 4 раза – RK3588. А Ryzen обогнал второе место в 2,1 раза. Посмотрим на энергопотребление.
BCM2712 потребил в 3 раза больше энергии, чем RK3566. RK3588 всего на треть больше потребил энергии, чем BCM2712. А безусловным «лидером» с конца по потреблению оказался Ryzen 5 5625U со своими 38 Вт (в 5,4 раза больше, чем у RK3588). Смотрим энергоэффективность.
RK3588 и BCM2712 оказались лидерами по энергоэффективность (разницу в 4% между ними не будем учитывать). На втором месте – RK3566, который отстал от лидеров на 50%. И аутсайдером (что неудивительно, исходя из потребления и результатов в многопотоке) R5 5625U с отставанием от лидеров в 2,4 раза.
Для чего же собирался sysbench? Летом, когда тестировался ноутбук, казалось, что результат у R5 довольно низкий. Казалось, что сборка увеличит производительность, но этого не случилось (и это будет учтено на будущее).
Теперь возьмём нагрузку посложнее – компиляции llama.cpp (заодно, можно и проверить, насколько увеличилась производительность в новых версиях llama.cpp). Собирать будем в многопоточном режиме (в однопоточном пришлось бы долго ждать RK3566).
Начнём со времени компиляции.
RK3566 сильно отстал, ближайший соперник – BCM2712 быстрее чуть больше чем в 2 раза. Если говорить про сам BCM2712, то он отстал от RK3588 на 55%, а он, в свою очередь отстал от Ryzen 5 5625U в 3 раза. Посмотрим на потребление.
Ryzen 5 5625U потребил больше всего, в 4,2 раза меньше потребил RK3588, вслед за этим, идёт BCM2712, который потребил на 39% меньше энергии. Меньше всего потреблял энергии RK3566 со своими 3,5 Вт.
Изначально, планировалось тут использовать коэффициент энергоэффективности.
Тут не очень понятно, что лучше, что хуже. Было решено перейти к более интересной методике – подсчёту потраченной энергии (чем меньше, тем лучше).
Как видим, все ARM чипы выступили приблизительно на одном уровне. Ryzen 5 5625U потратил побольше энергии, но далеко от ARM чипов не ушёл.
Теперь, собственно, перейдём к тестированию в llama.cpp.
Начнём с однопоточного режима.
Разница между RK3588 и BCM2712 составила 9%, а RK3566 отстал от них в 8 раз. А вот Ryzen 5 5625U обогнал их в 4,15 раза. Посмотрим на потребление.
RK3566 потребил меньше, чем BCM2712, в 2,5 раза. RK3588 потребил больше, чем BCM2712 на 15%, а вот R5 5625U потребил почти в 4 раза больше. Теперь посмотрим коэффициент энергоэффективности.
BCM2712 показал хороший коэффициент энергоэффективности для ARM чипов, отстал от лидера Ryzen 5 5625U на 15%. Rockchip показали себя тут так себе. RK3566 отстал от BCM2712 почти в 3 раза, а вот RK3588 отстал всего на 35%.
Перейдём к мультипоточной производительности.
RK3566 отстал от RK3588 и BCM2712 в 8,6 раз. В свою очередь, RK3588 и BCM2712 показали себя на равных. А почему так вышло – скорее всего ядро повлияло, но об этом в выводах поподробнее. Сразу можно понять, что RK3588 отстанет тут в энергоэффективности. И отдельно про R5 5625U – опередил этих двоих в 4,5 раза.
Перейдём к потреблению энергии.
Всё ожидаемо. Ryzen 5 5625U потребил в 3 раза больше, чем RK3588 и поэтому, можно сразу сказать, что энергоэффективность у Ryzen 5 5625U будет неплохая. В свою очередь, BCM2712 потребил больше энергии, чем RK3566 в 2,58 раза. Собственно, коэффициент энергоэффективности.
Если RK3566 для своего класса показал себя неплохо (отставание от BCM2712 составило 3,32 раза), то вот RK3588 отстал от BCM2712 на 24,8%. В свою очередь, BCM2712 по энергоэффективность довольно сильно приблизился к Ryzen 5 5625U, отставая от него всего на 18,6%.
Добавлю, что была информация, что увеличилась производительность ЦП в llama.cpp. Как видим, по сравнению с обзором, который был прошлым летом, ничего не поменялось. Предположу, что производительность увеличилась только под Windows (но это проверим не в этой статье).
И остался архиватор 7z как тест, который нагружает контроллер оперативной памяти и саму ОЗУ. Глянем на результат в MIPS.
RK3588, за счёт 4 дополнительных ядер Cortex-A55, опередил BCM2712 на 22,7%, тот, в свою очередь, обогнал RK3566 в 3 раза. RK3588, в свою очередь, отстал от Ryzen 5 5625U в 2,29 раза. Глянем на потребление.
RK3588, за счёт мелких ядер, увеличил своё потребление, относительно BCM2712, на 37,8%. RK3566 потребил на 88% меньше энергии, чем BCM2712. Ну и Ryzen 5 5625U потребил больше всех. Посмотрим, насколько это всё повлияло на коэффициент энергоэффективности.
BCM2712 снова оказался в лидерах, но тут разница чуть поменьше. RK3588 отстал на 12,2%, RK3566 – на 62,5% и самым неэффективным оказался Ryzen 5 5625U, эффективность которого на уровне RK3566 и отставание от лидера составило 76,2%.
Теперь перейдём к более интересному – протестируем другие блоки на энергоэффективность
Тестирование энергоэффективности ИИ-ускорителей в чипах
BCM2712 тут выбывает из-за отсутствия блоков для ИИ-ускорения. Про других участников – на Ryzen 5 5625U будет использоваться API Vulkan на iGPU для ускорения ИИ, на Rockchip – RKNPU. Посмотрим результаты в тесте.
RK3566 ускорился в 4,9 раза, отставая от RK3588 всего в 4,45 раза. Лидером оказался Ryzen 5 5625U, обогнав второе вместо в 3,6 раза. Неплохие показатели.
Посмотрим на потребление.
У RK3566 и RK3588 потребление не поменялось, а Ryzen 5 5625U уменьшилось на 39%, но результаты участников выросли в разы, а потребление уменьшилось или осталось такое же. Собственно, перейдём к коэффициенту энергоэффективности.
Если коэффициент энергоэффективности BCM2712 составил 12,41 при использовании процессорной части, то теперь по этому показателю его обгоняет даже слабый RK3566 на целых 32%. А RK3588 и Ryzen 5 5625U его унижают на 2,39 и 3,85 раза соответственно.
Теперь перейдём ко встроенной графике данных чипов.
Тестирование энергоэффективности встроенной графики
Для тестов, будет использоваться glmark2-wayland (который сильно быстрее версии на X11, который был в прошлых тестах). Посмотрим результат участников в нём.
BCM2712 всего в 2 раза быстрее RK3566, в свою очередь, RK3588 опережает BCM2712 в 4 раза. А если сравнить производительность RK3588 и RK3566, то выходит разница в 7,49 раза. А вот RK3588 отстал от Ryzen 5 5625U в 3,68 раза.
Посмотрим на потребление.
RK3566 потребил довольно мало (как обычно), в то же время, BCM2712 потребил всего на 26,8% больше, видим, что BCM2712 опять покажет себя неплохо. RK3588 быстрее BCM2712 всего в 2,11 раза. А вот RK3588 потребил меньше Ryzen 5 5625U в 4 раза. А тут коэффициент энергоэффективности у Ryzen 5 5625U просядет. На него и глянем.
Тут лидером оказался RK3588 (что было ожидаемо). Ryzen 5 5625U отстал от него на 10%. А вот BCM2712 отстал очень сильно (что неудивительно) – 90% разницы. И самый младший чип, RK3566, хуже в 2,8 раза.
Вслед за встроенной графикой, проверим декодеры.
Тестирование энергоэффективности энкодеров/декодеров
Для тестирования, используя ffmpeg, перекодируем 11 минутное 23 секундное видео из h264 в hevc. Глянем, за сколько управился каждый участник.
Видим явного аутсайдера – BCM2712, с большим отрывом, вторым с конца, был RK3566, с отрывом в 4,88 раза. Если говорить о лидерах, то для VA-API (в прошлый, когда тестировался ноутбук, его почему-то не удалось завести) всё неплохо. Как видим, разница между лидерами составляет 28,8%, что довольно неплохо.
Глянем на среднее потребление.
Хоть и кажется, что BCM2712 неплохо себя покажет, но вспоминая время обработки, покажет себя очень плохо. Того же касается и RK3566. Вот у RK3588 и Ryzen 5 5625U другая ситуация – они потребили больше, но выполнили работу сильно быстрее и ожидаемо, будут лидерами.
RK3588 оказался лидером, почти в 2 раза от него отстал Ryzen 5 5625U. RK3566 отстал от лидера, RK3588, на 60%, а вот BCM2712 показал себя очень плохо – отставание в 30 раз.
Перейдём к последней дисциплине тестирование – комбинированная нагрузка.
Тестирования влияния комбинированной нагрузки на CPU и iGPU на энергоэффективность чипов
Посмотрим на энергоэффективность при комбинированной нагрузке на CPU+GPU. Для процессорной части использовалась многопоточная нагрузка в виде sysbench, а для GPU – glmark2.
Начнём с процессорной части. Посмотрим на результаты и насколько они просели, по сравнению не с комбинированной нагрузкой.
Меньше всего потерял BCM2712 и Ryzen 5 5625U. Больше всех потерял в производительности RK3588, чуть меньше – RK3566. Посмотрим на такой же график для встроенных график.
Тут единоличным лидером оказался BCM2712, с почти 2-х кратным отставанием, на втором месте оказался RK3588. На третьем месте оказался Rk3566, с отставанием в 4,74 раза. Аутсайдером оказался R5 5625U, который отстал от лидера почти в 10 раз.
Теперь посмотрим на суммарное потребление в данном режиме каждой из систем.
Меньше всего потреблял энергии RK3566, на втором месте, с потреблением на 49% больше, оказался BCM2712. По сравнению с BCM2712, на 64% больше энергии потребил RK3588. А уже по сравнению с ним, в 3,7 раза больше потребил энергии Ryzen 5 5625U.
Посмотрим на энергоэффективность.
Уже ожидаемо, на первом месте оказался BCM2712, на втором месте, с отрывом в 90%, оказался RK3588, на третьем месте оказался RK3566, с отрывом в 4,73 раза. На последнем, снова ожидаемо, Ryzen 5 5625U, с отрывом от лидера в 10 раз.
Про потребление из розетки
Перед тем, как сделать выводы, упомянем про максимальное потребление из розетки во время тестов:
- RK3566 – 6 Вт
- RK3588 – 15 Вт
- BCM2712 – 15 Вт
- R5 5625U – 45 Вт.
Выводы
Сделаем выводы, исходя из этих тестов. Пройдёмся по каждому чипу отдельно.
Начнём с RK3588. Несмотря на 10 нм техпроцесс (предположительно Samsung) уступил 16 нм BCM2712. Можно ли назвать этот результат провальным? Нет. Хотелось бы лучше, да, но 2 место (местами 1 место, хотя бывало и 3 место) это не так плохо. И отставание от BCM2712 не такое большое, чтобы говорить о полном поражении от BCM2712. Если по процессорной части он показал так себе, то другие блоки очень эффективны и смогли навязать борьбу. Каковы возможны причины отставание в энергоэффективности процессорной части? Первая причина ядро ОС – 6.1 банально устарело, а в новых появились оптимизации, ускоряющие их работу, Вторая причина – менеджер частот, который выставляет менее низкие частоты (но не критично). По итогу, его можно назвать универсалом, который умеет всё, за счёт различных блоков, но не является самым лучшим в некоторых дисциплинах (энергоэффективность процессорной части).
Насчёт RK3566. Он всегда был на 3 месте (очень редко на 2), но для своего класса он себя показал неплохо. Почему? Всё просто, тот же BCM2537B0 потреблял больше энергии, чем тот же RK3566, но при этом был медленнее (хоть и не сильно) RK3566. Да, он не сможет тягаться с топами. Но за счёт более малого потребления, его можно спокойно использовать в автономных системах, которые должны долго работать от батареи (будь этим хоть планшет, смартфон, ретро-консоль, заканчивая сервером, который должен работать даже в условиях выключения на большое кол-во часов). Он мог бы показать лучше результат будь у него ядро ОС посвежее (что про RK3588 уже упоминалось).
BCM2712. Если RK3588 универсал, то данный чип заточен под процессорную производительность. Почему же? Всё очень просто. Первое – слабая производительность и энергоэффективность встроенной графики, которая сильно уступает Mali G610 MC4 и всего в 2 раза быстрее Mali G52 (можно сказать, что так, просто для галочки, чтобы хоть куда-то выводилась графика). Второе – меньше вспомогательных блоков, такие как декодеры, NPU и т.д.. Третье – оптимизация ядра ОС. Если бы ещё год назад BCM2712 мог и проиграть, то сейчас, за счёт более нового ядра ОС, обгоняет RK3588. Поэтому, он выиграл многие этапы с участием процессорной производительность (с энкодерами сильно не повезло – у его противников он был).
Ryzen 5 5625U. Самый производительный в тесте чип, но не сам энергоэффективный. Да, он занимал последние места. Сила этого чипа в другом – то, что это x86 чип. А что это даёт? Что оптимизируют код в первую очередь под данную систему команд (во вторую очередь – ARM) и под графику, которую используют на данных платформах. Наличия UEFI, что упрощает работу новичкам. Можно добавить, что в новых поколениях чипов энергоэффективность получше будет, но об этом в другой раз. Фактически, можно сказать, что его спасает совместимость и хорошая оптимизация с большого количества софта (и дело привычки пользователей, которые уже довольно хорошо привыкли к x86 и она стало стандартом де-факто). Отмечу, что тут встроенная графика себя показала неплохо - чуть отстала в энергоэффективности от RK3588, что уже неплохо.
И в рамках этого теста, когда-нибудь потестируем и другие чипы (как только что-то интересное попадётся, такое как Zen 4 и выше, Intel Core Ultra и выше, Qualcomm QCS6490 и Rockchip RK3576).
































