Предварительный Обзор AMD Carrizo
В рамках 28-нм техпроцесса AMD умудрилась сократить энергопотребление своих APU до двух раз и повысить производительность до полутора раз.
Если некоторые аналитики предсказывают AMD скорую погибель, то сама компания из Саннивейла хоронить себя явно не собирается. Да, архитектура Zen, разработанная практически с чистого листа, пока еще не готова, как и переход на 14-нм техпроцесс, однако и в рамках имеющихся технологий AMD готова на многое.
1. AMD Carrizo — это шестое поколение мобильных APU AMDСarrizo — это первые в мире APU производительного класса, полностью разместившиеся на одном кристалле, тогда как ранее в чипах такого класса графический чип или южный мост если и располагались на единой с процессором подложке, то в виде отдельного кристалла. Здесь же северный мост, Fusion Controller Hub (южный мост), графика и процессорные ядра уместились на одном кристалле, выращенном в рамках 28-нм техпроцесса Global Foundries.
2. Ядра общего назначения в Carrizo имеют архитектуру ExcavatorОна представляет собой уже четвертую итерацию логического развития идей архитектуры Bulldozer: сначала был собственно Bulldozer, потом Piledriver, Steamroller и наконец Excavator. По данным AMD, это также и последнее обновление данной архитектуры — дальше на смену не самому удачному дизайну придет темная лошадка Zen. В плане производительности на мегагерц Excavator не может предложить каких-либо сверъхестественных улучшений — по заявлениям самой AMD, показатель IPC (Instructions per Clock) в Excavator вырос на 4-15% по сравнению со Steamroller.
Роста удалось достигнуть за счет нескольких факторов. Во-первых, кеш-память первого уровня увеличена вдвое при сохранении прежнего уровня задержек, что позволило сделать предвыборку более эффективной. Во-вторых, сильно модернизирован блок предсказания ветвлений — объем буфера вырос на 50%, количество записей для отслеживаемых адресов перехода, соответственно, возросло с 512 до 768. Также ускорен сброс (flush-to-zero) блока вычислений с плавающей запятой. В-третьих, ядра Excavator поддерживают новые наборы инструкций — AVX2, MOVBE, SMEP, BMI версий 1 и 2, – которые процессоры AMD ранее использовать не могли. Наконец, в-четвертых, добавлена поддержка современных состояний простоя, что позволяет экономить энергию при невысокой нагрузке. Но самое важное — то, что ядра Excavator стали намного меньше ядер Steamroller в рамках того же техпроцесса, что позволило значительно сократить их энергопотребление и – не столь значительно – повысить частоты. О том, как это получилось, расскажем чуть ниже. Ну а здесь отметим, что в чипах Carrizo будет использовано четыре ядра Excavator — два блока по два — с 2 Мбайт общего на каждый блок кеша L2.
3. в Carrizo используется графика, которую сама AMD называет GCN третьего поколения.В третьем поколении архитектура претерпела некоторые изменения, с большей частью которых внимательные читатели уже знакомы — по сути, это поколение GCN было использовано в GPU Tonga (Radeon R9 285). Также встроенное графическое ядро получило 512 Кбайт собственной кеш-памяти второго уровня. Среди прочего заявлены поддержка DirectX 12 (Level 12), улучшенная производительность при работе с тесселяцией, цветовая компрессия без потерь, обновленный набор инструкций ISA, связность CPU- и GPU-кешей и высококачественный скейлер. В Carrizo графический контроллер Radeon R7 имеет 8 вычислительных кластеров, в то время как мобильные варианты Kaveri обладали лишь шестью такими блоками, то есть графическое ядро Carrizo располагает 512 потоковыми процессорами и способно выдавать пиковую производительность до 819 ГФЛОПС. Carrizo имеет три встроенных контроллера дисплеев и поддерживает вывод изображения с разрешением до 4K включительно.
4. в Carrizo встроен видеодекодер UVD-6, позволяющий аппаратно декодировать 4K-видео вформате H.264 или H.265 (HEVC)с частотой 60 кадров в секунду. По заявлениям AMD, это первый в мире ноутбучный чип с полностью аппаратным декодированием H.265, что калифорнийцы постарались подкрепить практическим примером — в демозоне рядом стояли ноутбуки на чипах Carrizo и Broadwell, воспроизводившие 4K-видео HEVC. Ноутбук на Carrizo не загружал центральный процессор даже на треть и воспроизводил видео достаточно гладко, тогда как аппарат на Broadwell демонстрировал загрузку ЦП на 80-100 % и показывал слайд-шоу.
Помимо H.264 и H.265, Universal Video Decoder 6 способен декодировать 4K MJPEG, VC-1/WMV Profile D, MPEG-2, MVC, AVC/H.264 и MPEG4/DivX. Благодаря в четыре раза возросшей пропускной способности он может тратить во столько же раз меньше времени на обработку HD-кадра, а все остальное время пребывать в состоянии низкого энергопотребления. По заявлениям AMD, одна только эта способность позволяет увеличить время работы от батарейки при просмотре видео на полчаса.
5. Carrizo — это первый APU, полностью удовлетворяющий спецификации HSA 1.0, установленной HSA Foundation. Это значит, что процессорные и графические ядра равноправны и имеют абсолютно одинаковый доступ ко всей оперативной памяти (AMD называет это hUMA — heterogeneous uniform memory). Соответственно, AMD предпочитает говорить не о 4 процессорных и 8 графических ядрах, а о 12 вычислительных. Задачи могут быстро передаваться между процессорами, а сами процессоры могут быстро сохранять свои состояния, переключаться на другую нагрузку и также быстро возвращаться к сохраненным состояниям позже, что позволяет выполнять параллельно больше разнородных задач. К тому же Carrizo поддерживает аппаратное ускорение обработки кода на Java, Python и C++ AMP.
К сожалению, на данном этапе очень мало реальных приложений позволяет использовать HSA, так что для демонстрации возможностей этой технологии AMD приходится с переменным успехом писать софт самой. Однако Carrizo также отлично работает с OpenCL 2.0, что позволяет ускорять работу в таких популярных приложениях, как Adobe Photoshop CC, Adobe Premiere и Libre Office.
6. Carrizo создан, чтобы ускорять Windows 10Windows Meida Player умеет пользоваться HEVC-декодером, который также можно использовать для стриминга видео через Skype for Business или стриминга изображения с Xbox One на PC. Также Carrizo поддерживает такие возможности Windows 10, как SECURE boot, InstantGo, TPM, bitlocker и приложения ARM Trustzone.
7. В чипах Carrizo установлено одно ядро ARM Cortex-A5которое, собственно, и отвечает за работу ARM Trustzone. Ему также выделено некоторое количество изолированной постоянной памяти и статической памяти с произвольным доступом. Ядро Cortex-A5 дополнено криптографическим сопроцессором, который позволяет работать с алгоритмами RSA, Sha и AES, использовать Zlib и RDRAND.
8. Дизайн кристалла Carrizo спроектирован с использованием технологических библиотек с высокой плотностью транзисторовЭтот подход к проектированию полупроводникового кристалла процессорное подразделение переняло у ATI — на его внедрение ушло немало времени, зато результат налицо. Спроектированный по лекалам, применяемым при создании графических чипов, кристалл Carrizo насчитывает 3,1 млрд транзисторов против 2,4 млрд у Kaveri (больше на 29 %), при этом по площади новый чип на 23 % меньше своего предшественника. Отдельные блоки удалось уменьшить еще эффективнее: скажем, планировщик блока работы с плавающей запятой сжался на 38 %, блок операций FMAC — на 35 %, контроллер кеша инструкций также “похудел” на 35 %.
Напомним еще раз: все это произошло в рамках одного и того же 28-нм техпроцесса. Это – в сочетании с архитектурными изменениями – позволило снизить энергопотребление при простое с 4,5 Вт у референсных ноутбуков на базе Kaveri до 2,7 Вт у устройств на базе Carrizo (правда, здесь AMD учитывает не 100 %-й КПД блока питания, потери энергии на котором пропорциональны общему энергопотреблению системы). В идеальном же случае энергопотребление систем на базе Carrizo оказывается почти в 2 раза ниже, чем у аналогов на Kaveri, а производительность — в 1,5 раза выше, что дает 2,4-кратный рост производительности на ватт.
9. TDP Carrizo составляет 15 Вт.Именно при таком уровне энергопотребления лучше всего раскрывает себя дизайн высокой плотности. Более того, уменьшенные транзисторы характеризуются меньшими токами утечки, что позволяют дополнительно поднять частоту. По исследованиям AMD, высокоплотный дизайн (high density) выигрывает у классического высопроизводительного (high performance — этот дизайн лежит в основе ядер предыдущего поколения Steamroller) при TDP менее 20 Вт. Однако следует понимать, что высокоплотный дизайн не даёт возможности выпускать классические десктопные процессоры со сравнительно высокой частотой не загнанные в рамки низкого TDP. Именно поэтому десктопных вариантов Carrizo мы не увидим.
10. Ноутбуки на основе APU Carrizo готовят все основные производители мобильных компьютеров— Acer, ASUS, Dell, HP, Lenovo и Toshiba.
НУ вот наконец революционное что то показали молодцы AMD
на том же тех процессе снизили энергопотребление увеличили производительность
кроме соединение северного и южного моста запихнули даже ARM чип !!
спецификация HSA 1.0 тож очень значимая вещь благодаря дирекс 12 надеюсь АМД оживет !!
4K видео проигрывают без напряга и сравнивается с последней архитектурой от интел тот пыжится не подетски))
Ждём новые видеоадаптеры ))
Интересно MSI тоже будет производить ноутбуки с AMD процами ?)[вложение удалено администратором]