Fermi идет в массы: обзор GeForce GTX 460

Появление линейки видеоадаптеров Fermi шибко затянулось. Первыми появились GeForce GTX 480 и GTX 470. Дальнейший выпуск GTX 465 показал, что чип GF100 для решений среднего ценового сегмента не подходит, поэтому nVidia разработала более простой GF104, тот, что и используется в GTX 460.

Особенности чипа

Архитектура Fermi является на нынешний день наиболее универсальной и производительной в мире, и все-таки ключевой проблемой самых дорогих чипов является их тепловыделение и энергопотребление, несмотря на тонкий техпроцесс 40 нм, по которому чипы изготавливаются. Появившиеся весной этого года чипы GF100 не сделали революции в видеоиграх, ибо основной конкурент, AMD, уже давнехонько предлагает видеокарты с поддержкой API DirectX 11, в то время как nVidia повременила с выпуском карт с поддержкой нового API Microsoft.

Калифорнийцы солидно поработали над архитектурой Fermi, в результате им удалось сформировать поистине универсальный продукт, обладающий колоссальной вычислительной мощностью. Не секрет, что nVidia уже давно идет по пути преобразования привычных всем графических чипов в универсальную вычислительную систему. Мощность сотен вычислительных ядер, помноженная на огромную производительность установленной на графическом ускорителе памяти, попросту заставляет задействовать ресурсы графической карты для многих задач. Тут и распределенные вычисления, и облачные расчеты, и трассировка лучей, и создание еще более реалистичных трехмерных сцен – возможности поистине безграничны, но при этом не требуется сооружение с дюжиной объединенных в сеть компьютеров.

В результате, появившийся чип Fermi оказался наделен огромным количеством транзисторов – 3.2 млрд. Это значительно больше, чем у AMD Radeon HD 5870 – 2.15 млрд. А архитектура чипа насчитывает 480 универсальных процессоров, объединенных в 4 кластера по 4 потоковых мультипроцессора. Правда, у GTX 480 единственный мультипроцессор отключен, потому что общее число процессоров в архитектуре GF100 составляет 512 (то есть на один мультипроцессор, названный SM – Streaming Multiprocessor, приходится 32 ядра CUDA, которые мы и называем универсальными процессорами в данном случае).

Блок-схема GF100
Блок-схема GF100

Является ли это искусственное ограничение следствием низкого выхода годных чипов, или же nVidia в будущем планирует к выпуску сверхдорогой ускоритель словно бы GTX 480 Ultra с 512 процессорами на борту – мы не знаем. Архитектура чипа, как уже говорилось, универсальна, ядра CUDA поддерживают все современные технологии GPGPU: кроме CUDA, поддерживаемой nVidia, тут реализованы возможности OpenCL и Microsoft DirectCompute. Контроллер памяти ядра GF100 содержит шесть 64-битных контроллеров, в силу того что интерфейс памяти у видеокарт на основе GPU GTX 480 384-битный, а у GTX 470, у которых отключен один контроллер – 320-битный.

Каждый из 16 SM оснащен одним блоком PolyMorph Engine и одним Raster Engine на кластер, которые обеспечивают возможности аппаратной тесселяции и трассировки лучей, а кроме того рослый порядок качества выводимой на экран картинки. К тому же, Fermi оснащен поддержкой шейдеров новой, пятой версии Shader Model 5.0, как и Radeon пятитысячной серии. Ещё nVidia не может не похвастаться появившимся новым режимом сглаживания 32x CSAA (Coverage Sampling Antialiasing), а также улучшенной производительностью полноэкранного сглаживания FSAA: теперь в режиме 8x происходит минимальное падение производительности по сравнению с 4x – всего около 10%, в то время как у GT200 производительность падала без малого в два раза.

Таким образом, GF100 получился весьма сложным чипом с огромным числом транзисторов, что сделало его горячим и «прожорливым». Выпущенная следом за старшими моделями GTX 465 обладала посредственным соотношением цены к производительности. Это подтолкнуло nVidia к разработке более дешевого в производстве чипа и платы с более простой и недорогой разводкой компонентов и обвязки. Как раз таким чипом с «новой» переработанной топологией и стал GF104.

Новый чип GF104, видеокарты на основе одной из версий которого получают наименование GeForce GTX 460, также основан на архитектуре Fermi, при всем при том имеет существенные отличия от прародителя – чипа GF100. По сути, GF104 – это «почти половинка» GF100. В этом месте всего 8 из 16 блоков потоковых мультипроцессоров, при этом один из восьми SM просто отключен. Однако сами SM претерпели некоторые изменения – ныне любой из них содержит не 32, а 48 ядер CUDA.

Сравнение GF100 и GF104
Соотнесение GF100 и GF104

Контроллеров памяти у GF104 не три, а четыре, при этом конфигурация графической памяти может содержать 768 Мб памяти GDDR5 с шириной шины 192 бит, либо 1024 Мб с шиной 256 бит. В остальном архитектура осталась на практике неизмененной.

Мультипроцессор - это практически независимый GPU
Мультипроцессор – это практически самостоятельный GPU

Принятые меры делают новоиспеченный чип куда больше «холодным» и менее прожорливым, несмотря на то, что частотная формула в целом снизилась не сильно: 675 МГц по чипу (у GTX 480 было 700 МГц) и 900 МГц по памяти – максимальная потребляемая мощность снизилась почти вдвое, до 160 Вт.

По сравнению с собственными продуктами прошлого и позапрошлого поколений, GTX 460 быстрее в 2.6 раза по сравнению с GeForce 8800GT, и достигает более чем 4.5-кратного отрыва при работе приложений, поддерживающих PhysX (по сравнению с той же 8800GT).

Кстати, NVIDIA в особенности заостряет внимание на недюжинных возможностях разгона нового чипа. Основываясь на переработанной архитектуре, можно уверовать в действительно высокий потенциал. Однако, как говорят: «Доверяй, но проверяй!», вследствие этого мы проведем собственное изыскание производительности новинки, но сначала рассмотрим один из продуктов на основе GF104 подробнее.

Технические характеристики

Видеокарта

GF GTX 460

GF GTX 480

GF GTX 285

AMD HD 5870

Техпроцесс, нм

40

40

55

40

Число транзисторов, млрд.

2

3,2

2,15

1,4

Частота GPU, МГц

675

700

648

850

Количество процессоров

336

480

240

1600

Количество текстурных блоков

56

60

80

80

Количество блоков ROP

24/32

48

32

32

Версия шейдеров

5.0

5.0

4.0

5.0

Поддержка DirectX

11

11

10

11

Частота памяти, МГц

900 (3600)

924 (3696)

1242 (2484)

1200 (4800)

Разрядность шины памяти, бит

192/256

384

512

256

Тип памяти

GDDR5

GDDR5

GDDR3

GDDR5

Объем памяти, Мб

768/1024

1536

1024

1024

Потребляемая мощность, Вт

160

250

204

188

Дизайн

Видеокарта среднего ценового диапазона «199$» производства Zotac призвана конкурировать с недорогими решениями от AMD, вследствие того что дизайн печатной платы предельно упрощен. Видеокарта получилась довольно компактной по длине, однако сохранила двуслотовый дизайн с мощной системой охлаждения.

Референсные модели GTX 460 от различных вендоров будут отличаться только наклейкой на корпусе турбины
Референсные модели GTX 460 от различных вендоров будут разниться лишь наклейкой на корпусе турбины

Как видите, карта получилась сильно короткая, что выдает в продукте уровень mainstream с головой – типично видеоадаптеры ценового диапазона «199$» стараются совершить компактными для экономии материалов и упрощения схемотехники. С обратной стороны платы самое меньшее элементов, даже микросхемы памяти уместились с одной стороны карты. Радует наличие усилительной пластины, однако рамки около чипа не предусмотрено.

Так выглядит плата с обратной стороны
Так выглядит плата с обратной стороны

Да и при снятом радиаторе очевидно, что элементов на плате не так много. В глаза бросается трехфазный стабилизатор питания графического процессора, и однофазный – питания памяти. Чипов памяти на нашем образце только шесть, по 1024 Мбит каждый – всего 768 Мб. Интерфейс в этом случае имеет ширину 192 бита, так как один из четырех контроллеров памяти не задействован. При этом может быть расширение объема оперативной памяти до 1024 Мб – местоположение для распайки ещё двух чипов предусмотрено – и такие варианты практически вместе с тем с младшей моделью уже появились на рынке. В случае восьми микросхем в действо вступают все четыре контроллера видеопамяти с возможностью передачи данных на скорости до 115.2 Гб/с (против 86.4 Гб/с) при работе памяти в 256-битном режиме.

Разводка печатной платы GTX 460 сильно отличается от флагманских моделей
Разводка печатной платы GTX 460 очень отличается от флагманских моделей

Память набрана модулями Samsung с временем доступа 0.5 нс (4 ГГц), что позволяет надеяться на недурственный разгон чипов. Графический чип, выпущенный на 12-й неделе 2010 года, имеет маркировку GF104-300-KA-A1, что говорит о ранней ревизии A1. Чип обладает необычной прямоугольной формой.

Память Samsung употребляется и в остальных видеокартах серии
Память Samsung используется и в остальных видеокартах серии

Питание карты обеспечивается двумя шестиконтактными разъемами PCI-E 12V, которые расположены с заднего торца платы. Если учитывать небольшую длину карты, то подключение питания не составит проблем более того в компактных корпусах.

GTX 470 также влетает двумя шестиштырьковыми разъемами, но ее энергопотребление немаловажно выше
GTX 470 также обходится двумя шестиштырьковыми разъемами, но ее энергопотребление значительно выше

Набор интерфейсов на задней панели включает два порта Dual-Link DVI-I и один порт Mini-HDMI. Другую половину задней планки занимает вентиляционная решетка.

Задняя панель GTX 460 полностью повторяет таковую у других видеокарт на базе Fermi
Задняя панель GTX 460 полностью повторяет таковую у других видеокарт на базе Fermi

Система охлаждения

Вентиляционная система видеокарты претерпела конструктивные изменения по сравнению с аналогами видеокарт GeForce GTX 480/470/465 и связаны они с удешевлением конструкции. Впрочем, максимальное тепловыделение у нового чипа существенно ниже, чем у более дорогих карт на основе Fermi.

При таковой конструкции системы охлаждения кожух не очень-то и нужен
При таковый конструкции системы охлаждения кожух не очень-то и нужен

Отныне радиатор кулера обдувается не центробежным вентилятором-турбиной, а обычным лопастным. Теперь жаркий воздух не полностью удаляется из корпуса: часть его уходит сквозь решетку на задней панели, а количество – в пространство корпуса системного блока через отверстие рядом с разъемами дополнительного питания видеокарты.

Двух тепловых трубок достаточно, чтобы охладить GTX 460
Двух тепловых трубок достаточно, чтобы охладить GTX 460

Радиатор системы охлаждения гибридной конструкции: медное основание закрыто алюминиевым лепестковым радиатором, который непосредственно обдувается вентилятором, кроме того, с основанием контактирует пара тепловых трубок, на которые нанизаны тонкие алюминиевые ребра – им достается радиальный воздушный поток вентилятора. Таким образом, радиатор напоминает конструкцию, реализованную MSI на видеокарте Radeon HD 4890 Cyclone OC, за исключением пластикового кожуха на GTX 460.

Ровная поверхность куда важнее зеркального отражения
Ровная поверхность куда важнее зеркального отражения

Основание радиатора ровное и обработано фрезерованием: напомним, что для чипов, закрытых теплораспределительным кожухом, полировка не требуется, более того, даже экономически нецелесообразна, поскольку бороздки способствуют лучшему распределению термопасты при прижатии, а также обеспечивают оптимальный контакт основания с чипом.

В одиннадцатилопастной конструкции нет ничего необычного
В одиннадцатилопастной конструкции нет ничего необычного

Вентилятор жутко качественный, он произведен компанией AVC, имеет типоразмер 80х15 мм и оснащен гидродинамическим подшипником, который обеспечивает длительный срок службы. Рамки вентилятор не имеет из-за особенностей конструкции системы охлаждения. Однако откопать на замену подобный вентилятор в случае поломки штатного практически невозможно, неужели что независимо доработать стандартный.

Тестирование

Тестирование нового чипа обещает быть интересным, оттого что в новой видеокарте множество структурных изменений. Но сначала о разгоне: мы смогли увеличить частоту чипа GF104 со стандартных 675 МГц до 870 МГц (прирост составил внушительные 195 МГц, так что NVIDIA не обманула, указывая на высокий разгонный потенциал), а частоту памяти с 3600 до 4320 МГц. По нашему мнению, прирост шибко приличный, но сколь разгон влияет на производительность?

Тестовый стенд:

  • Intel Core i7-980X@3,4 ГГц
  • 3*2 ГБ Elixir PC3-12800U
  • DFI UT X58-T3eH8
  • Western Digital WD3200JD
  • Thermaltake Thoughpower XT 650W
  • Windows 7
  • Драйвер ForceWare 197.17

Синтетика

3D Mark Vantage
3D Mark Vantage

3D Mark Vantage однозначно «отдает предпочтение» архитектуре Fermi, которая наиболее универсальна на сегодняшний день. Для синтетического теста это неудивительно, ведь он учитывает производительность графического чипа в общих чертах. Аккурат потому обновленная архитектура DirectX 10.1 от AMD не достигает высоких результатов в данном тесте (напомним, Radeon HD 5830 и GeForce GTX 460 находятся в одной ценовой категории).

Диаграмма производительности Unigine Heaven в режиме DX10
Диаграмма производительности Unigine Heaven в режиме DX10

Диаграмма производительности Unigine Heaven в режиме DX11
Диаграмма производительности Unigine Heaven в режиме DX11

Синтетический тест Unigine Heaven также показывает превосходство архитектуры Fermi, причем результаты в режимах DirectX 10 и 11 отличаются практически в два раза. А что же будет, если активировать режим тесселяции?

Диаграмма производительности Unigine Heaven в режиме с максимальной тесселяцией
Диаграмма производительности Unigine Heaven в режиме с максимальной тесселяцией

В общих чертах производительность падает, но в процентном соотношении это падение ниже у GeForce, чем у Radeon. Что интересно, GTX 460 оказывается существенно производительнее HD 5830.

Игровые тесты

Диаграмма производительности AvP в разрешении 1680*1050
Диаграмма производительности AvP в разрешении 1680*1050

Диаграмма производительности AvP в разрешении 1920*1080
Диаграмма производительности AvP в разрешении 1920*1080

«Чужие супротив Хищника» показывают приемлемый уровень даже в разрешении Full HD, при этом падение производительности при активации тяжелых режимов приводит к существенной потере производительности, особенно у младших продуктов. При этом карты NVIDIA лучше переносят работу с полноэкранным сглаживанием. Разгон не слишком сильно помогает GTX 460 справляться со сложной игрой, однако позволяет отвоевать немного FPS. Семейство Radeon при активации сглаживания и анизотропной фильтрации теряет в производительности настолько, что комфортная игра становится невозможной.

Диаграмма производительности DiRT2 в разрешении 1680*1050
Диаграмма производительности DiRT2 в разрешении 1680*1050

Диаграмма производительности DiRT2 в разрешении 1920*1080
Диаграмма производительности DiRT2 в разрешении 1920*1080

DiRT 2 требователен к производительности видеокарт, но при этом младшей модели NVIDIA более чем достаточно для комфортной игры на любых режимах. Отметим только, что в режиме разгона при игре в тяжелых режимах карта догоняет GeForce GTX 470, которая находится на «более высокой ступени эволюции». Сопоставление с продуктами конкурента вынуждает последних если не сдаться, то по крайней мере посторониться.

Диаграмма производительности Far Cry 2 в разрешении 1680*1050
Диаграмма производительности Far Cry 2 в разрешении 1680*1050

Диаграмма производительности Far Cry 2 в разрешении 1920*1080
Диаграмма производительности Far Cry 2 в разрешении 1920*1080

Крушить африканских боевиков с джипа можно с достаточно большим комфортом как на продуктах AMD, так и на новом бюджетном GeForce. Новая видеокарта NVIDIA показывает себя на уровне Radeon HD 5850, обгоняя младшего собрата данной карты в среднем на 29%. Разгон почти вплотную приближает производительность 460-го к возможностям GTX 470, однако средний FPS все еще остается хоть и на более низком, но крайне даже комфортном уровне.

Диаграмма производительности World In Conflict в разрешении 1920*1080
Диаграмма производительности World In Conflict в разрешении 1680*1050

Диаграмма производительности World In Conflict в разрешении 1920*1080
Диаграмма производительности World In Conflict в разрешении 1920*1080

World In Conflict: Soviet Assault более справедлив к видеоадаптерам AMD. В данной игре Radeon HD 5830 выглядит молодцом, и по своей производительности его легко сравнить с GTX 460. Но стоит только разогнать последний, как он практически догоняет GTX 470, производительность которого немало выше. Кстати, падение производительности при активации сглаживания несколько ниже у продуктов NVIDIA, причем, что характерно, благодаря повышенной производительности разогнанной памяти, GTX 460 в данном режиме всего на один FPS отстает от GeForce GTX 470 – пригожий результат.

Диаграмма производительности Crysis: Warhead в разрешении 1680*1050
Диаграмма производительности Crysis: Warhead в разрешении 1680*1050

Диаграмма производительности Crysis: Warhead в разрешении 1920*1080
Диаграмма производительности Crysis: Warhead в разрешении 1920*1080

Crysis: Warhead – развлекуха не первой свежести, но все еще требовательная к ресурсам системы. Даже к таким ресурсам, которыми обладает собственник видеокарт AMD Radeon 5830 или NVIDIA GeForce GTX 460. В разрешении Full HD с максимальными настройками комфортно игрывать в данную игру на видеокартах уровня «199$» невозможно. Даже разогнанный герой сегодняшнего обзора при активации анизотропной фильтрации и полноэкранного сглаживания не выдает больше 24 кадров в секунду, при этом минимальный FPS остается на уровне 13. Впрочем, для AMD игра так же не по зубам – приходится снижать свойство картинки. Единственная карта, которая справляется с игрой – GeForce GTX 480, но было бы необычно приметить иную картину с топовым видеоадаптером внутри игровой системы.

Диаграмма производительности Resident Evil 5
Диаграмма производительности Resident Evil 5

Resident Evil 5 не так требователен – по сравнению с «Кризисом» игра без затей «летает». Неудивительно, что все тестируемые карты тянут эту игру при среднем FPS больше 60 кадров в секунду, несмотря на высокое дозволение картинки и бойкий нелегкий графический режим, улучшающий качество изображения.

Диаграмма производительности Batman: Arkham Asylum в разрешении 1680*1050
Диаграмма производительности Batman: Arkham Asylum в разрешении 1680*1050

Диаграмма производительности Batman: Arkham Asylum Warhead в разрешении 1920*1080
Диаграмма производительности Batman: Arkham Asylum Warhead в разрешении 1920*1080

Batman: Arkham Asylum является одной из немногих игр, обладающих поддержкой PhysX. В этом режиме сравнивать карты AMD и NVIDIA бессмысленно – первые не поддерживают PhysX. Однако интересная картина получается в стане NVIDIA – свойский новичок показывает себя с лучшей стороны, что говорит об отличной оптимизации универсальных процессоров CUDA. Особенно на фоне GTX 470, новинка от NVIDIA выглядит просто превосходно – при более низком энергопотреблении последней, её производительность выше, а разгон лишь добавляет очков. Производительность при выводе высококачественного изображения падает несильно у всех видеокарт, что в целом отличает новую архитектуру NVIDIA от конкурентов.

А в настоящий момент о не менее интересном – энергопотреблении. Мы замеряли общее потребление энергии всей системой, нагрузив её графическим тестом Furmark.

Энергопотребление тестируемых видеокарт
Энергопотребление тестируемых видеокарт

В целом, переработанный чип Fermi является более экономичным решением, чем первое поколение архитектуры. Даже разогнанная видеокарта не позволяет достичь системе того уровня энергопотребления, что присущ GeForce GTX 470 и тем более 480. Что интересно, система с AMD Radeon HD 5830 показала потребляемую мощность на уровне разогнанного GTX 460 – для NVIDIA, новинки в области DirectX 11 которой считали самыми прожорливыми, это прорыв. Уровень шума, показанный видеокартой, оказался на уровне, сопоставимом с продукцией конкурента – вентилятор кулера не разгонялся выше 50%, при этом максимальная температура чипа составила 69 градусов Цельсия – и это в разогнанном режиме. Поэтому говорить, что видеокарты NVIDIA четырехсотой серии поголовно шумные и греются, как печки, минимум некорректно.

Выводы

Новой видеокарте NVIDIA стоимостью 200 долларов гарантирован счастливый момент посреди экономных геймеров. Оба крупнейших производителя графических чипов неизменно делали основную ставку на данный ценовой сегмент, в котором заурядно сильно сильны продажи. На этот раз NVIDIA, несмотря на задержку с выходом решений DirectX 11, представила действительно увлекательный продукт, который с уверенностью не возбраняется рекомендовать практически всем. Следует отметить, что также поставляется версия видеокарты с 1 ГБ видеопамяти и увеличенной шириной шины памяти. Ее цена составляет $230.

Комментариев: [0] / Оставить комментарий

Keywords:

gtx, geforce gtx, gtx было, gtx также, gtx fermi, gf gtx, gtx пригожий, gtx производительность, gtx данном, gtx радиатор