
Видеокарта Iris Pro Graphics P6300 была выпущена компанией Intel, дата выпуска: 5 September 2014. Видеокарта предназначена для desktop-компьютеров и построен на архитектуре Generation 8.0 с кодовым названием Broadwell GT3e.
Частота ядра — 800 MHz. Частота ядра в режиме Boost — 1000 MHz. Технологический процесс — 14 nm. Количество транзисторов — 189 million. Энергопотребление (TDP) — 15 Watt.
Intel недавно представила обновленную линейку новых четырехъядерных процессоров Intel Broadwell Xeon E3-1200 v4. Серия серверных процессоров Intel Xeon E3-1200 v3 появилась на рынке во 2-м квартале 2013 года и и была тихо обновлена во втором квартале 2014 года на модели типа Е3-1231 v3. Теперь анонсированы Xeon v4. Разберемся: что же нового предлагает нам Intel?

В терминологии стратеги «тик-так», Broadwell это «тик»: производитель использовал архитектуру Haswell в 14-нанометровом исполнении. «Тик» не предполагает революционных изменений. Аналитики считают, что в этой фазе Intel допиливает известные технологии, а улучшения будут косметические. По спецификации Broadwell обеспечивает пониженное энергопотребление и сопоставимую с процессорами предыдущего поколения общую производительность.
Рассмотрим три новых серверных процессора Intel Xeon E3-1200 v4 на сокете LGA 1150.
| Процессор | Xeon E3-1285 v4 | Xeon E3-1285L v4 | Xeon E3-1265L v4 |
| Ядра/потоки | 4/8 | 4/8 | 4/8 |
| Технология Hyper-Threading | Есть | Есть | Есть |
| Тактовая частота | 3,5 ГГц | 3,4 ГГц | 2,3 ГГц |
| Максимальная частота в турбо-режиме | 3,8 ГГц | 3,8 ГГц | 3,3 ГГц |
| Разблокированный множитель | Нет | Нет | Нет |
| TDP | 95 Вт | 65 Вт | 35 Вт |
| HD Graphics | Iris Pro P6300 | Iris Pro P6300 | Iris Pro P6300 |
| Частота графического ядра | 1150 МГц | 1150 МГц | 1050 МГц |
| L3-кэш | 6 Мбайт | 6 Мбайт | 6 Мбайт |
| Интегрированная eDRAM | 128 Мбайт | 128 Мбайт | 128 Мбайт |
| Поддержка DDR3 | 1333/1600/1866 | 1333/1600/1866 | 1333/1600/1866 |
| Технологии vPro/TSX-NI/TXT/VT-d | Есть | Есть | Есть |
| Расширения набора инструкций | AVX 2.0 | AVX 2.0 | AVX 2.0 |
| Сокет | LGA1150 | LGA1150 | LGA1150 |
Объем кэш-памяти третьего уровня урезан на 2 Мб, то есть на четверть по сравнению с предыдущими моделями Xeon. Как замечает www.anandtech.com, потеря 2 Мб L3 несущественна, учитывая появление eDRAM объемом 128 МБ в L4.
Содержание
Что такое eDRAM?
В начале 2007 года Intel и IBM совместно с AMD, Toshiba и Sony почти одновременно заявили о технологии, которая позволит ускорить работу процессоров в два раза. Для этого было предложено использовать память eDRAM (embedded DRAM), которая будет применяться вместе с технологией «кремний на изоляторе» (SOI, Silicon-on-Insulator). В IBM заявили, что это позволит существенно ускорить кэш-память, в три раза увеличить ее плотность и в пять раз уменьшить потребляемую мощность в режиме бездействия процессора. Тогда планировалось использовать кэш-память объемом 24 Мб.
Технологически embedded DRAM — это DRAM, встраиваемая («embedded») в процессор в отличие от SDRAM. eDRAM требует напряжения 1 В, что заметно ниже питания обычной памяти. На практике это означает, что eDRAM потребляет меньше энергии, обеспечивая сопоставимое быстродействие. Ячейки eDRAM меньшего размера — 0.108um² для SRAM и 0.029um² для eDRAM — на чип того же размера влезет на порядок больше чуть более медленных ячеек памяти.

Intel не только поставил известный Haswell на 14-нанометровые рельсы. В процессорах Broadwell производитель использовал возможности eDRAM настолько полно, насколько это сегодня возможно. Производитель заявляет о 25% улучшении таких параметров, как энергопотребление и тепловыделение.

Кристалл eDRAM Crystalwell объемом 128 МБ играет роль кэш-памяти четвертого уровня. Кэш подобного объема был у Haswell, но лишь в топовых моделях E7. При этом eDRAM может использоваться и графическим ядром, и вычислительными ядрами процессора при обработке больших объемов данных — например, текстур. По заявлению производителя, Crystalwell обеспечивает пиковую пропускную способность на уровне 51,2 Гбайт/с в каждую сторону (102,4 Гбайт/с суммарно).

Согласно тестам, проведенным 3Dnews.ru, латентность основанного на eDRAM L4-кэша составляет 55 тактов, а пропускная способность — примерно вдвое выше по сравнению с двухканальной DDR3-1866 SDRAM.
Crystalwell позволяет процессору преодолеть относительные ограничения низкой пропускной способности системной памяти и показать лучшее быстродействие в задачах по обработке HD-видео и в математических операциях.
Согласно собственным тестам Intel (использовался Supermicro SuperServer), при использовании Broadwell возможна одновременная обработка 4368 HD-видеопотоков. Этот же показатель при использовании процессоров Haswell составляет 3120. Налицо увеличение производительности на 40%. Все материнские платы Supermicro серии Х10 подерживают v4 после обновления BIOS.

Видеоядро Iris Pro Graphics
В новой линейке процессоров использовано графическое ядро Iris Pro Graphics, «облегченную» версию которого ранее можно было встретить только в мобильных процессорах Haswell. Теперь Iris Pro Graphics P6300 имеет конфигурацию GT3е и 48 исполнительных устройств (EU, execution units) против 40 EU в графических ядрах Iris Pro Graphics 5100 и 5200 у Haswell.
Использование Iris Pro Graphics P6300 является и существенным отличием новых Xeon от Xeon E3-1200 v3 на Broadwell: в прошлой линейке использовались менее продвинутые Intel HD Graphics P4600 и Intel HD Graphics P4700.
Понятным преимуществом рассматриваемых процессоров является то, что устанавливаются они в слот LGA1150: владельцы материнских плат на основе набора системной логики Intel Z97 и Intel H97 могут легко апгрейдить систему. Формально новые Xeon совместимы с материнскими платами на основе набора системной логики восьмой серии на сокете LGA1150.
Пользователи, обновляющиеся с Haswell на Broadwell, теперь могут сделать это сравнительно дешево. Так, если рекомендованные цены Intel на E3-1285L v3 составляют $774, то стоимость E3-1285L v4 — $445.
Недостатком для некоторых пользователей может оказаться невозможность разгона этих процессоров. Впрочем, эта серия Xeon — серверное решение, а любителям оверклокинга производитель предлагает другие процессоры новой линейки.
Тесты
В ряде тестов, проведенных www.anandtech.com, процессоры Intel Broadwell Xeon E3-1200 v4 показали противоречивые результаты.
При архивировании 2867 файлов общим объемом 1,52 Гб лучший результат показал E3-1285L v4, обогнав даже более мощный E3-1285 v4.

Однако в других тестах Xeon отставал от конкурентов. Конвертация серии из 170 изображений с помощью приложения FastStone Image Viewer v.4.9 оказалась для новых Xeon довольно сложной задачей.

Запуск эмулятора игровых консолей Dolphin показал, что в отработке 3D-сцен Intel Broadwell Xeon E3-1200 v4 опережает только слабые процессоры.

В то же время при конвертировании видео формата x264 в mp4 Broadwell отстал только от Intel Core i7 6700К. 
Подводем итоги
Линейка процессоров Intel Broadwell Xeon E3-1200 v4 благодаря использованию нового кристалла памяти eDRAM обгоняет старые модели в решении тяжелых вычислительных задач и обработке HD-видео при сниженных значениях мощности и тепловыделения.
Для чего они нужны:
1) высокопроизводительные графические станции
2) выделенные сервера выполняющие задачи транскодирования и потокового вещания без использования GPU типа Tesla. Новые процессоры Интел показывают 40% к производительности на таких задачах и позволяют снизить издержки на аппаратную часть транскодеров. Тут приведена сравнительная таблица производительности для продуктов онлайн-вещания Wowza — какие процессоры для каких задач подходят.
2) выделенные сервера позволяющие виртуализировать графические приложения — для этого раньше было нужно ставить Теслу или что-то подобное
Мы в Hostkey предлагаем в аренду выделенные сервера в Москве и Нидерландах — новый тип процессоров для виртуализации 3Д приложений и стриминга/обработки видео появится у нас в начале 2016 года.
Для подобных задач мы рекомендуем клиентам использовать многоядерные процессоры Xeon старших серий, например машина в конфигурации 2х Xeon E5-2670 v2 с 20 ядрами на 2,5ГГц в на базе суперкомпьютерной платформы Т-Платформы и 32Гб памяти обойдется в 23000 рублей в месяц.
Выход в свет нашей первой статьи по настольным процессорам семейства Broadwell кроме всего прочего вызвал и пару справедливых замечаний, касающихся тестирования графического ядра в игровых приложениях. Действительно: тесты-то есть, но для сравнения взят только GPU HD Graphics 4600, с которым и так все понятно. А вот как успехи нового «графического топа» Intel выглядят на фоне процессоров AMD или недорогих дискретных видеокарт — с практической точки зрения вопрос более важный. Тем более, что процессоры C-серии дороже аналогичных Haswell долларов этак на 100, а этого вполне достаточно для приобретения Radeon R7 250X или чего-то близкого, то есть не совсем уж медленного решения.
Вот сегодня мы все вопросы и снимем.
Конфигурация тестовых стендов
| Процессор | Intel Core i5-4690K | Intel Core i5-5675C | Intel Core i7-4770K | Intel Core i7-5775C |
| Название ядра | Haswell | Broadwell | Haswell | Broadwell |
| Технология пр-ва | 22 нм | 14 нм | 22 нм | 14 нм |
| Частота ядра, ГГц | 3,5/3,9 | 3,1/3,6 | 3,5/3,9 | 3,3/3,7 |
| Кол-во ядер/потоков | 4/4 | 4/4 | 4/8 | 4/8 |
| Кэш L1 (сумм.), I/D, КБ | 128/128 | 128/128 | 128/128 | 128/128 |
| Кэш L2, КБ | 4×256 | 4×256 | 4×256 | 4×256 |
| Кэш L3 (L4), МиБ | 6 | 4 (128) | 8 | 6 (128) |
| Оперативная память | 2×DDR3-1600 | 2×DDR3-1600 | 2×DDR3-1600 | 2×DDR3-1600 |
| TDP, Вт | 88 | 65 | 84 | 65 |
| Графика | HDG 4600 | IPG 6200 | HDG 4600 | IPG 6200 |
| Кол-во EU | 20 | 48 | 20 | 48 |
| Частота std/max, МГц | 350/1200 | 300/1100 | 350/1250 | 300/1150 |
| Цена | Н/Д(0) T-10887398 | Н/Д(0) T-12645002 | $412(82) T-10384297 | Н/Д(0) T-12645073 |
Процессоров Intel будет две пары — чтобы четко понять, где у Core i7 есть преференции перед Core i5, а где одна суета сует и томление духа. Сравнение будет идти в игровых приложениях, разумеется, и с дискретной видеокартой. Этот вопрос мы, впрочем, уже исследовали, но там i5 и i7 были разночастотными, а сегодня мы их по этому параметру уравняли. В принципе, можно было бы и Broadwell той же частоты взять, но он такой есть только в виде Xeon, т. е. не сказать чтоб массовое решение. Так что тут прямых пересечений не будет — просто обе сокетные модели бытового назначения.
| Процессор | AMD A10-6800K | AMD A10-7850K |
| Название ядра | Richland | Kaveri |
| Технология пр-ва | 32 нм | 28 нм |
| Частота ядра std/max, ГГц | 4,1/4,4 | 3,7/4,0 |
| Кол-во ядер(модулей)/потоков вычисления | 2/4 | 2/4 |
| Кэш L1 (сумм.), I/D, КБ | 128/64 | 192/64 |
| Кэш L2, КБ | 2×2048 | 2×2048 |
| Кэш L3, МиБ | — | — |
| Оперативная память | 2×DDR3-2133 | 2×DDR3-2133 |
| TDP, Вт | 100 | 95 |
| Графика | Radeon HD 8670D | Radeon R7 |
| Кол-во ГП | 384 | 512 |
| Частота std/max, МГц | 844 | 720 |
| Цена | $138(73) T-10387700 | $162(67) T-10674781 |
Процессоров AMD мы решили взять два — чтоб не скучно было. К тому же тут тоже интересно оценить прогресс графики, и не стоит забывать о том, что и у A10-6800K есть брат-близнец в виде Athlon X4 760K. А какой из «Атлонов» выбрать при использовании дискретной видеокарты (760К или 860К) — вопрос интересный с практической точки зрения. Тем более, 760К заработает и на плате с «обычным» FM2. Может быть такое, что пользователя перестал удовлетворять какой-нибудь старенький A6-5400K, и он решил сменить процессор и добавить дискретную видеокарту? Вполне может. Вот и посмотрим, есть ли при таком раскладе смысл менять системную плату.
Что касается прочих условий тестирования, то они были равными, но не одинаковыми: частота работы оперативной памяти была максимальной поддерживаемой по спецификациям, а они немножко отличаются. А вот ее объем (8 ГБ) и системный накопитель (Toshiba THNSNH256GMCT емкостью 256 ГБ) были одинаковыми для всех испытуемых. Все тесты проводились и при использовании встроенного видеоядра (которое есть у всех шести процессоров), и совместно с дискретным Radeon R7 250X.
Методика тестирования
Поскольку нами уже было установлено, что на программы из набора iXBT Application Benchmark 2015 конкретная видеокарта влияет очень слабо, мы ограничились игровой методикой iXBT Game Benchmark 2015. Все результаты были получены в разрешении 1920×1080 (Full HD) при минимальных настройках качества и в 1366×768 при максимальных настройках. Почему такой выбор? Максимальные настройки при FHD-разрешении «не по зубам» не только интегрированным видеоадаптерам, но и многим недорогим дискретным решениям. Но повысить качество хочется многим — пусть даже ценой снижения разрешения. Тем более, что снижение не всегда такое уж радикальное — на руках у пользователей все еще встречаются и старые мониторы вплоть до поддерживающих максимум 1280×1024 точки. Поэтому почему бы и не проверить «низкие» режимы. К тому же, при настройках на максимальное качество удельная доля нагрузки на GPU увеличивается, а нам сегодня как раз интересны GPU. И пусть даже они не справятся с работой — получится стресс-тест, хорошо демонстрирующий собственно возможности графики.
Минимальное качество высокого разрешения

Как видим, HD Graphics в Haswell с этой задачей не справляется, на обоих А10 уже поиграть можно, но на грани, а Broadwell с Iris Pro сомнений не оставляет. Но если говорить об использовании дискретной видеокарты, то тут все процессоры равны. Цена же Athlon X4 в разы ниже, чем у любого Core i7. Такое же положение дел будет и в других играх с невысокими требованиями к производительности процессора, но высокими — к графике.

Но WoT, впрочем, прямая противоположность сформулированному выше — здесь графика нужна постольку-поскольку. Лишь бы не мешала. HD Graphics 4600 очевидно мало. Остальных — достаточно настолько, что при добавлении дискретной видеокарты производительность не увеличивается, а может даже снизиться.

Еще одна процессорозависимая игра, которой достаточно и HDG 4600 для выбранного режима. Впрочем, более быстрая графика даже при слабой процессорной части позволяет добиться более высоких результатов. А дискретный видеоадаптер показывает, что кэш четвертого уровня в ряде случаев действительно делает Broadwell-С куда более быстрым решением, нежели Haswell. Практической пользы, впрочем, от этого немного — 200 или 300 кадров это уже неважно. Тут, очевидно, надо качество повышать, чем мы чуть позже и займемся.

Игра тяжелая для всех систем, но в первую очередь — видеокарты. Как видим, только интегрированная графика Broadwell, причем в старшей модификации (GT3e) вообще позволяет играть в таком режиме: Haswell GT2 традиционно отстает вдвое, а лучшие IGP AMD — в полтора раза. Однако при использовании недорогой дискретной видеокарты все внезапно становятся равными: и дешевые Athlon (а отключение графической части в А10 именно так преобразует процессоры), и дорогие Core i7.

В предыдущей версии Metro расклад подобный. Правда тут уже А10 подбираются к порогу играбельности, но без натяжек пригодны только Broadwell-С и им подобные. Дискретка (даже такая относительно слабая, как 250Х) от производительности процессоров зато уже зависит. Другой вопрос, что «атлонов» по-прежнему хватит, а десятью кадрами в секунду можно и пренебречь.

В очередной уже раз Hitman похож на Metro 2033 с небольшими вариациями. Например, здесь очень по-разному ведут себя два А10 разных поколений даже при использовании дискретки, т.е. оптимизации в Kaveri — не пустой звук. Однако как не оптимизируй, а Core i5 намного быстрее. Что же касается интегрированных решений, то тут снова без натяжек пригодны только Broadwell-С — на остальных придется снижать разрешение.

Очень тяжелая игра с которой не может справиться даже Iris Pro! Впрочем, как видим, здесь и 250Х хватает без особого запаса — в паре с медленными процессорами так и вовсе на пороге играбельности.

Как мы уже не раз говорили, в минимальном режиме Tomb Ra >
В этой игре без дискретки никуда. Причем, что любопытно, Iris Pro 6200 как обычно вдвое быстрее, чем HDG 4600, но вот решения AMD обгоняет уже незначительно. Судя по всему, основная нагрузка на шейдерные и прочие блоки, а их при помощи eDRAM не ускоришь. Посмотрим — как это проявится при увеличении качества.

Новых А10 более-менее хватает, Broadwell-С достаточно без натяжки, Haswell тут ловить нечего (если не считать R-серию, также снабженную видеоядром GT3e). Но. но дешевле будет поставить дискретную видеокарту.
Итак, что мы имеем в режиме минимального качества? Broadwell-С справляются почти со всеми играми нашего набора, кроме одной. Производительность Broadwell GT3e примерно вдвое выше, чем у Haswell GT2, да и интегрированную графику AMD эти решения обходят раза в полтора. Но лучше, конечно, при возможности использовать дискретную видеокарту — это даже дешевле может выйти. И всегда уж как минимум не медленнее.
Низкое разрешение, но высокое качество

Дискретная видеокарта играть позволяет даже при использовании недорогого процессора, интегрированная графика все еще непригодна. Никакая.

С большим трудом и напрягаясь Core i5-5675C выбрался за 30 FPS. Более дешевая связка из Athlon X4 760K или 860К и R7 250X не напрягаясь набирает почти 40. Комментарии излишни.

Вот здесь Iris Pro 6200 выглядит очень хорошо. Пусть дискретная видеокарта и чуть быстрее, но незначительно. Хуже то, что ее использование не всегда возможно, так что появление мощного интегрированного видео — большое благо для тех, кто находится в таких условиях.

Недостаточно и младших дискретных карт — значит об интегрированных решениях можно забыть на практике. С точки зрения теории же любопытно то, что здесь они достаточно близки друг к другу, что немудрено: когда основная нагрузка ложится на сам GPU, никакие ухищрения в плане работы памяти уже не помогают.

Все еще более выражено чем в предыдущем случае. Любопытно разве что то, что HDG 4600 быстрее, нежели Radeon HD 8670D. Однако практически значимым это не является.

Опять не справляется даже дискретная карта, а ее отрыв от интегрированных решений увеличивается до трех-пяти раз. При минимальном же качестве, напомним, было иногда и меньше двух. Т.е. чем выше требования к GPU, тем больше разница между интегрированными и дискретными вариантами последних. Что более чем ожидаемо, но не всеми учитывается.

При наличии дискретной видеокарты играть можно, а вот интегрированной совсем не хватает, причем любой. Аналогичная картина была и на минимальных настройках FHD, только тут она стала еще нагляднее. Но ничего удивительного — вообще для этой игры желательны карты уровня минимум Radeon R7 265 и выше. И таких игр не так уж мало.

Если при минимальных настройках эта игра очень щадяща к видеосистеме, то увеличение качества может «поставить на колени» и куда более мощные решения, чем нами сегодня рассматриваются. Т.е. пространство для маневра здесь огромное, но удачно им воспользоваться могут только владельцы дискретных видеокарт.

Аналогичным образом ведет себя и Sleeping Dogs, только вот преимущества дискретного решения еще более зримы. А вот бенефиции от eDRAM еще заметнее улетучиваются, поскольку до скорости текстурирования дело даже не доходит: пока еще слишком слабы сами графические процессоры. Но слабы по-разному, так что интегрированный Radeon R7 может даже обогнать Iris Pro. На практике, впрочем, это не имеет значения, поскольку оба все равно слишком медленные.

И еще один подобный случай подтверждает высказанную выше гипотезу 🙂
В общем и целом, как видим, попытки использования режимов с высоким качеством картинки (пусть даже со снижением разрешения) только лишь на интегрированной графике как правило обречены на фиаско.
Итого
Итак, что мы видим? Режимы низкого качества хорошо поддаются современной интегрированной графике. По крайней мере, лучшим представителям последней. Идея с eDRAM правильная и логичная — позволяет ослабить нехватку пропускной способности памяти. Собственно, благодаря этому решения линейки Iris Pro становятся самыми быстрыми в своем классе. Не обязательно Broadwell — Haswell не сильно хуже, но такие модификации последнего в сокет не устанавливаются, что накладывает свою специфику.
Но могут ли геймера устроить низкокачественные режимы? Пожалуй, что нет. Во всяком случае, если современные игры ему вообще интересны — на минимальных настройках «современность» легко улетучивается, напоминая картинку десятилетней давности зачастую. Особенно если вспомнить высокую стоимость процессоров Intel с GT3e — за эти деньги можно купить что-нибудь попроще, зато с хорошей дискретной видеокартой. Решения AMD намного доступнее, да и при увеличении качества картинки «проседают» в производительности слабее, поскольку сами графические процессоры все-таки пока мощнее (и eDRAM это не исправить), но. Но ничего принципиально это не меняет — все равно итоговая производительность чересчур низкая, так что серьезно полагаться на графические возможности APU AMD геймеру не приходится.
Что нас ожидает в ближайшем будущем? Процессоры линейки Skylake по прогнозам со временем обзаведутся графическими ядрами типа GT4e, где будет и больше исполнительных устройств, чем ранее (собственно, «подрастут» и GT с привычными циферками, но куда менее заметно, а вот появление новой модификации прямо намекает на радикальные изменения), и eDRAM. Да еще и поддержка DDR4 увеличит пропускную способность памяти — пусть и не сразу, может быть. Однако из этого не следует, что даже такие процессоры справятся с высококачественными режимами игр из нашей методики даже при низком разрешении — производительность для этого надо повысить в 3-5 раз, что вряд ли получится. Обгонять же младшие дискретные видеокарты у них будет получаться чаще, но в основном лишь там где либо «и так достаточно», либо «все равно принципиально не хватает», так что сам по себе факт большей или меньшей производительности не слишком важен.
В общем, прогресс в области интегрированной графики хорошо заметен. Но пока с точки зрения геймера он все еще недостаточен для того, чтобы принципиально изменить положение дел. Полноценный игровой компьютер как и ранее обязан иметь дискретную видеокарту, причем более дорогую, чем процессор. Что, кстати, делает Broadwell-C в любом случае плохим игровым решением (даже с дикретной видеокартой) — можно убедиться, что преимущества кэш-памяти четвертого уровня не настолько велики, чтобы оправдать более высокие цены. Если бы вместо 250Х мы использовали 290Х (например) они были бы заметнее, но все равно эти деньги как раз лучше на видеокарту и потратить — отдача будет намного больше. К тому же, и ограниченный теплопакет мешает — Core i5 зачастую оказывается чуть более быстрым, чем Core i7, работающий на более высокой тактовой частоте, чего и близко нет при сравнении 4690К и 4770К. В общем, Broadwell-C — изначально нишевое решение, прекрасно подходящее для компактных компьютеров, но в «обычном» модульном десктопе делать ему особо нечего: там нет необходимости «ужиматься» в 65 Вт и можно использовать мощные видеокарты, либо хорошо сэкономить, если высокая производительность видео не требуется. 




