Сучасні графічні процесори містять безліч функціональних блоків, від кількості і характеристик яких залежить і підсумкова швидкість рендеринга, що впливає на комфортність гри. З порівняльного кількості цих блоків в різних відеочіпах можна приблизно оцінити, наскільки швидкий той чи інший GPU. Характеристик у відеочіпів досить багато, в цьому розділі ми розглянемо лише найважливіші з них.

Тактова частота відеочіпа

Робоча частота GPU зазвичай вимірюється в мегагерцах, т. Е. Мільйонах тактів в секунду. Ця характеристика прямо впливає на продуктивність відеочіпа - чим вона вища, тим більший обсяг роботи GPU може виконати в одиницю часу, обробити більшу кількість вершин і пікселів. Приклад з реального життя: частота відеочіпа, встановленого на платі Radeon HD 6670 дорівнює 840 МГц, а точно такий же чіп в моделі Radeon HD 6570 працює на частоті в 650 МГц. Відповідно будуть відрізнятися і всі основні характеристики продуктивності. Але далеко не тільки робоча частота чіпа визначає продуктивність, на його швидкість сильно впливає і сама графічна архітектура: пристрій і кількість виконавчих блоків, їх характеристики і т. П.

У деяких випадках тактова частота окремих блоків GPU відрізняється від частоти роботи решти чіпа. Тобто, різні частини GPU працюють на різних частотах, і зроблено це для збільшення ефективності, адже деякі блоки здатні працювати на підвищених частотах, а інші - ні. Такими GPU комплектується більшість відеокарт GeForce від NVIDIA. Зі свіжих прикладів наведемо відеочіп в моделі GTX 580, більша частина якого працює на частоті 772 МГц, а універсальні обчислювальні блоки чіпа мають підвищену вдвічі частоту - 1544 МГц.

Швидкість заповнення (філлрейт)

Швидкість заповнення показує, з якою швидкістю відеочіп здатний малювати пікселі. Розрізняють два типи філлрейта: піксельний (pixel fill rate) і текстурний (texel rate). Піксельна швидкість заповнення показує швидкість відтворення пікселів на екрані і залежить від робочої частоти і кількості блоків ROP (блоків операцій растеризації і блендінга), а текстурная - це швидкість вибірки текстур даних, яка залежить від частоти роботи і кількості текстурних блоків.

Наприклад, піковий піксельний філлрейт у GeForce GTX 560 Ti дорівнює 822 (частота чіпа) × 32 (кількість блоків ROP) \u003d 26304 мегапікселів в секунду, а текстурний - 822 × 64 (кількість блоків текстурування) \u003d 52608 мегатекселей / с. Спрощено справа йде так - чим більше перше число - тим швидше відеокарта може малювати готові пікселі, а чим більше друге - тим швидше проводиться вибірка текстурних даних.

Хоча важливість "чистого" філлрейта останнім часом помітно знизилася, поступившись швидкості обчислень, ці параметри все ще залишаються дуже важливими, особливо для ігор з нескладною геометрією і порівняно простими пиксельними і вершинними обчисленнями. Так що обидва параметри залишаються важливими і для сучасних ігор, але вони повинні бути збалансовані. Тому кількість блоків ROP в сучасних відеочіпах зазвичай менша за кількість текстурних блоків.

Кількість обчислювальних (шейдерних) блоків або процесорів

Мабуть, зараз ці блоки - головні частини відеочипа. Вони виконують спеціальні програми, відомі як шейдери. Причому, якщо раніше піксельні шейдери виконували блоки піксельних шейдеров, а вершинні - вершинні блоки, то з деякого часу графічні архітектури були уніфіковані, і ці універсальні обчислювальні блоки стали займатися різними розрахунками: вершинними, пиксельними, геометричними і навіть універсальними обчисленнями.

Вперше уніфікована архітектура була застосована в відеочіпі ігрової консолі Microsoft Xbox 360, цей графічний процесор був розроблений компанією ATI (згодом купленої AMD). А в відеочіпах для персональних комп'ютерів уніфіковані шейдерні блоки з'явилися ще в платі NVIDIA GeForce 8800. І з тих пір все нові відеочіпи засновані на уніфікованої архітектурі, яка має універсальний код для різних шейдерних програм (вершинних, піксельних, геометричних та ін.), І відповідні уніфіковані процесори можуть виконати будь-які програми.

За кількістю обчислювальних блоків і їх частоті можна порівнювати математичну продуктивність різних відеокарт. Велика частина ігор зараз обмежена продуктивністю виконання піксельних шейдеров, тому кількість цих блоків дуже важливо. Наприклад, якщо одна модель відеокарти заснована на GPU з 384 обчислювальними процесорами в його складі, а інша з тієї ж лінійки має GPU з 192 обчислювальними блоками, то при рівній частоті друга буде вдвічі повільніше обробляти будь-який тип шейдеров, і в цілому буде настільки ж продуктивніше.

Хоча, виключно на підставі одного лише кількості обчислювальних блоків робити однозначні висновки про продуктивність не можна, обов'язково потрібно врахувати і тактову частоту і різну архітектуру блоків різних поколінь і виробників чіпів. Тільки по цих цифрах можна порівнювати чіпи тільки в межах однієї лінійки одного виробника: AMD або NVIDIA. В інших же випадках потрібно звертати увагу на тести продуктивності в цікавлять іграх або додатках.

Блоки текстурування (TMU)

Ці блоки GPU працюють спільно з обчислювальними процесорами, ними здійснюється вибірка і фільтрація текстур і інших даних, необхідних для побудови сцени і універсальних обчислень. Число текстурних блоків в відеочіпі визначає текстурну продуктивність - тобто швидкість вибірки текселей з текстур.

Хоча останнім часом більший упор робиться на математичні розрахунки, а частина текстур замінюється процедурними, навантаження на блоки TMU і зараз досить велика, так як крім основних текстур, вибірки необхідно робити і з карт нормалей і зсувів, а також позаекранного буферів рендеринга render target.

З урахуванням упору багатьох ігор в тому числі і в продуктивність блоків текстурування, можна сказати, що кількість блоків TMU і відповідна висока текстурная продуктивність також є одними з найважливіших параметрів для відеочіпів. Особливий вплив цей параметр надає на швидкість рендеринга картинки при використанні анізотропної фільтрації, що вимагають додаткових текстурних вибірок, а також при складних алгоритмах м'яких тіней і новомодних алгоритмах начебто Screen Space Ambient Occlusion.

Блоки операцій растеризації (ROP)

Блоки растеризації здійснюють операції запису розрахованих відеокартою пікселів в буфери і операції їх змішування (блендінга). Як ми вже відзначали вище, продуктивність блоків ROP впливає на філлрейт і це - одна з основних характеристик відеокарт всіх часів. І хоча останнім часом її значення також дещо знизилося, все ще трапляються випадки, коли продуктивність додатків залежить від швидкості і кількості блоків ROP. Найчастіше це пояснюється активним використанням фільтрів постобработки і включеним антиалиасинг при високих ігрових налаштуваннях.

Ще раз відзначимо, що сучасні відеочіпи не можна оцінювати тільки числом різноманітних блоків і їх частотою. Кожна серія GPU використовує нову архітектуру, в якій виконавчі блоки сильно відрізняються від старих, так і співвідношення кількості різних блоків може відрізнятися. Так, блоки ROP компанії AMD в деяких рішеннях можуть виконувати за такт більше роботи, ніж блоки в рішеннях NVIDIA, і навпаки. Те ж саме стосується і здібностей текстурних блоків TMU - вони різні в різних поколіннях GPU різних виробників, і це потрібно враховувати при порівнянні.

геометричні блоки

Аж до останнього часу, кількість блоків обробки геометрії було не дуже важливим. Одного блоку на GPU вистачало для більшості завдань, так як геометрія в іграх була досить простою і основним упором продуктивності були математичні обчислення. Важливість паралельної обробки геометрії і кількості відповідних блоків різко виросли при появі в DirectX 11 підтримки тесселяції геометрії. Компанія NVIDIA першої распараллеліть обробку геометричних даних, коли в її чіпах сімейства GF1xx з'явилося по кілька відпо блоків. Потім, схоже рішення випустила і AMD (тільки в топових рішеннях лінійки Radeon HD 6700 на базі чіпів Cayman).

В рамках цього матеріалу ми не будемо вдаватися в подробиці, їх можна прочитати в базових матеріалах нашого сайту, присвячених DirectX 11-сумісним графічним процесорам. В даному випадку для нас важливо те, що кількість блоків обробки геометрії дуже сильно впливає на загальну продуктивність в найновіших іграх, які використовують тесселяцию, начебто Metro 2033, HAWX 2 і Crysis 2 (з останніми патчами). І при виборі сучасної ігрової відеокарти дуже важливо звертати увагу і на геометричну продуктивність.

обсяг відеопам'яті

Власна пам'ять використовується відеочіпами для зберігання необхідних даних: текстур, вершин, даних буферів і т. П. Здавалося б, що чим її більше - тим завжди краще. Але не все так просто, оцінка потужності відеокарти за обсягом відеопам'яті - це найбільш поширена помилка! Значення обсягу відеопам'яті недосвідчені користувачі переоцінюють найчастіше, до сих пір використовуючи саме його для порівняння різних моделей відеокарт. Воно і зрозуміло - цей параметр вказується в списках характеристик готових систем одним з перших, так і на коробках відеокарт його пишуть великим шрифтом. Тому недосвідченому покупцеві здається, що раз пам'яті в два рази більше, то і швидкість у такого рішення повинна бути в два рази вище. Реальність же від цього міфу відрізняється тим, що пам'ять буває різних типів і характеристик, а зростання продуктивності зростає лише до певного обсягу, а після його досягнення просто зупиняється.

Так, в кожній грі і при певних налаштуваннях і ігрових сценах є якийсь обсяг відеопам'яті, якого вистачить для всіх даних. І хоч ти 4 ГБ відеопам'яті туди постав - у неї не з'явиться причин для прискорення рендеринга, швидкість обмежуватимуть виконавчі блоки, про які йшлося вище, а пам'яті просто буде достатньо. Саме тому в багатьох випадках відеокарта з 1,5 ГБ відеопам'яті працює з тією ж швидкістю, що і карта з 3 ГБ (за інших рівних умов).

Ситуації, коли більший обсяг пам'яті призводить до видимого збільшення продуктивності, існують - це дуже вимогливі ігри, особливо в надвисоких дозволах і при максимальних налаштуваннях якості. Але такі випадки зустрічаються не завжди і обсяг пам'яті враховувати потрібно, не забуваючи про те, що вище певного обсягу продуктивність просто вже не виросте. Є у чіпів пам'яті і більш важливі параметри, такі як ширина шини пам'яті і її робоча частота. Ця тема настільки велика, що докладніше про вибір обсягу відеопам'яті ми ще зупинимося в шостій частині нашого матеріалу.

Ширина шини пам'яті

Ширина шини пам'яті є найважливішою характеристикою, що впливає на пропускну здатність пам'яті (ПСП). Велика ширина дозволяє передавати більшу кількість інформації з відеопам'яті в GPU і назад в одиницю часу, що позитивно впливає на продуктивність в більшості випадків. Теоретично, по 256-бітної шині можна передати в два рази більше даних за такт, ніж по 128-бітної. На практиці різниця в швидкості рендеринга хоч і не досягає двох разів, але дуже близька до цього в багатьох випадках з упором в пропускну здатність відеопам'яті.

Сучасні ігрові відеокарти використовують різну ширину шини: від 64 до 384 біт (раніше були чіпи і з 512-бітної шиною), в залежності від цінового діапазону і часу випуску конкретної моделі GPU. Для найдешевших відеокарт рівня low-end найчастіше використовується 64 і рідше 128 біт, для середнього рівня від 128 до 256 біт, ну а відеокарти з верхнього цінового діапазону використовують шини від 256 до 384 біт шириною. Ширина шини вже не може рости чисто через фізичних обмежень - розмір кристала GPU недостатній для розведення більш ніж 512-бітної шини, і це обходиться занадто дорого. Тому нарощування ПСП зараз здійснюється за допомогою використання нових типів пам'яті (див. Далі).

частота відеопам'яті

Ще одним параметром, що впливає на пропускну здатність пам'яті, є її тактова частота. А підвищення ПСП часто безпосередньо впливає на продуктивність відеокарти в 3D-додатках. Частота шини пам'яті на сучасних відкритих буває від 533 (1066, з урахуванням подвоєння) МГц до 1375 (5500, з урахуванням почетвереній) МГц, тобто, може відрізнятися більш ніж в п'ять разів! І так як ПСП залежить і від частоти пам'яті, і від ширини її шини, то пам'ять з 256-бітної шиною, що працює на частоті 800 (3200) МГц, буде мати більшу пропускну здатність у порівнянні з пам'яттю, що працює на 1000 (4000) МГц з 128-бітної шиною.

Особливу увагу на параметри ширини шини пам'яті, її типу і частоти роботи слід приділяти при покупці порівняно недорогих відеокарт, на багато з яких ставлять лише 128-бітові або навіть 64-бітові інтерфейси, що вкрай негативно позначається на їх продуктивності. Взагалі, покупка відеокарти з використанням 64-бітної шини відеопам'яті для ігрового ПК нами не рекомендується зовсім. Бажано віддати перевагу хоча б середнього рівня мінімум з 128 або 192-бітної шиною.

типи пам'яті

На сучасні відеокарти встановлюється відразу кілька різних типів пам'яті. Стару SDR-пам'ять з одинарної швидкістю передачі вже ніде не зустрінеш, але і сучасні типи пам'яті DDR і GDDR мають значно відрізняються характеристики. Різні типи DDR і GDDR дозволяють передавати в два або чотири рази більшу кількість даних на тій же тактовій частоті за одиницю часу, і тому цифру робочої частоти найчастіше вказують подвоєною або учетверённой, множачи на 2 або 4. Так, якщо для DDR-пам'яті вказана частота 1400 МГц, то ця пам'ять працює на фізичної частоті в 700 МГц, але вказують так звану «ефективну» частоту, тобто ту, на якій повинна працювати SDR-пам'ять, щоб забезпечити таку ж пропускну здатність. Те ж саме з GDDR5, але частоту тут навіть учетверяется.

Основна перевага нових типів пам'яті полягає в можливості роботи на великих тактових частотах, а відповідно - в збільшенні пропускної здатності в порівнянні з попередніми технологіями. Це досягається за рахунок збільшених затримок, які, втім, не так важливі для відеокарт. Першою платою, що використовує пам'ять DDR2, стала NVIDIA GeForce FX 5800 Ultra. З тих пір технології графічної пам'яті значно просунулися, був розроблений стандарт GDDR3, який близький до специфікаціям DDR2, з деякими змінами спеціально для відеокарт.

GDDR3 - це спеціально призначена для відеокарт пам'ять, з тими ж технологіями, що і DDR2, але з поліпшеними характеристиками споживання і тепловиділення, що дозволило створити мікросхеми, що працюють на більш високих тактових частотах. Незважаючи на те, що стандарт був розроблений в компанії ATI, першою відеокартою, її використовує, стала друга модифікація NVIDIA GeForce FX 5700 Ultra, а наступної стала GeForce 6800 Ultra.

GDDR4 - це подальший розвиток «графічної» пам'яті, що працює майже в два рази швидше, ніж GDDR3. Основними відмінностями GDDR4 від GDDR3, істотними для користувачів, є в черговий раз підвищені робочі частоти і знижене енергоспоживання. Технічно, пам'ять GDDR4 не сильно відрізняється від GDDR3, це подальший розвиток тих же ідей. Першими відеокартами з чіпами GDDR4 на борту стали ATI Radeon X1950 XTX, а у компанії NVIDIA продукти на базі цього типу пам'яті не виходили зовсім. Переваги нових мікросхем пам'яті перед GDDR3 в тому, що енергоспоживання модулів може бути приблизно на третину нижче. Це досягається за рахунок більш низької номінальної напруги для GDDR4.

Втім, GDDR4 не отримала широкого поширення навіть у рішеннях AMD. Починаючи з GPU сімейства RV7x0, контролерами пам'яті відеокарт підтримується новий тип пам'яті GDDR5, що працює на ефективній учетверённой частоті до 5,5 ГГц і вище (теоретично можливі частоти до 7 ГГц), що дає пропускну здатність до 176 ГБ / с з застосуванням 256-бітного інтерфейсу. Якщо для підвищення ПСП у пам'яті GDDR3 / GDDR4 доводилося використовувати 512-бітну шину, то перехід на використання GDDR5 дозволив збільшити продуктивність вдвічі при менших розмірах кристалів і меншому споживанні енергії.

Відеопам'ять найсучасніших типів - це GDDR3 і GDDR5, вона відрізняється від DDR деякими деталями і також працює з подвоєною / учетверённой передачею даних. У цих типах пам'яті застосовуються деякі спеціальні технології, що дозволяють підняти частоту роботи. Так, пам'ять GDDR2 зазвичай працює на більш високих частотах в порівнянні з DDR, GDDR3 - на ще більш високих, а GDDR5 забезпечує максимальну частоту і пропускну здатність на даний момент. Але на недорогі моделі до сих пір ставлять «неграфічні» пам'ять DDR3 зі значно меншою частотою, тому потрібно вибирати відеокарту уважніше.

дипломна робота

Блоки операцій растеризації (ROP)

Блоки растеризації здійснюють операції запису розрахованих відеокартою пікселів в буфери і операції їх змішування (блендінга). Як вже зазначалося вище, продуктивність блоків ROP впливає на філлрейт і це - одна з основних характеристик відеокарт. І хоча останнім часом її значення дещо знизилося, ще трапляються випадки, коли продуктивність додатків сильно залежить від швидкості і кількості блоків ROP. Найчастіше це пояснюється активним використанням фільтрів постобработки і включеним антиалиасинг при високих налаштуваннях зображення.

Автоматизація обліку банківських операцій та її реалізація в програмі "1С Бухгалтерія"

Якщо всю діяльність компанії можна розділити на бізнес процеси, то і процеси можна розділити на більш дрібні складові. У методології побудови бізнес процесів це називається декомпозицією ...

Внутрішні і периферійні пристрої ПК

Вивчення дискретної моделі популяції за допомогою програми Model Vision Studium

Основним «будівельним елементом» опису в MVS є блок. Блок - це деякий активний об'єкт, що функціонує паралельно і незалежно від інших об'єктів безперервному часу. Блок є орієнтованим блоком ...

Використання LMS Moodle в навчальному процесі

Для будь-якого курсу обов'язкова наявність центральної області. Лівої і правої колонки з блоками може не бути. Але різні блоки, що входять до складу системи управління навчанням Moodle, збільшують функціональність ...

Дослідження можливостей викладача в системі дистанційного навчання Moodle

Для додавання нових ресурсів, елементів, блоків або редагування наявних у вашому курсі натисніть кнопку Редагувати, розташовану в блоці управління. Загальний вигляд вікна курсу в режимі редагування представлений на малюнку 2.5: Малюнок 2 ...

Моделювання при розробці програмного забезпечення

Словник мови UML включає три види будівельних блоків: сутності; відносини; діаграми. Суті - це абстракції, які є основними елементами моделі ...

Моделювання роботи в бібліотеці

Оператори - блоки формують логіку моделі. У GPSS / PC є близько 50 різних видів блоків, кожен з яких виконує свою конкретну функцію. За кожним з таких блоків стоїть відповідна підпрограма транслятора ...

Основні можливості CSS3

Можна оригінально оформити текст за допомогою різноманітних розмовних блоків, які, знову таки, зроблені на основі CSS3 технологій. (Рис 5.) Рис 5 ...

Основні можливості CSS3

Ефект напівпрозорості елемента добре помітний на фоновому малюнку і отримав поширення в різних операційних системах, тому що виглядає стильно і красиво ...

Підготовка текстового документа відповідно до СТП 01-01

Блоки (плати) розширення або карти (Card), як їх іноді називають, можуть використовуватися для обслуговування пристроїв, що підключаються до IBM PC. Вони можуть використовуватися для підключення додаткових пристроїв (адаптерів дисплея, контролера дисків тощо.) ...

Поломка і ремонт відеокарти

Ці блоки працюють спільно з шейдерних процесорів всіх зазначених типів, ними здійснюється вибірка і фільтрація текстурних даних, необхідних для побудови сцени ...

Програма реєстрації процесу виробництва для автоматизованої системи управління підприємством електронної промисловості

Розрізняють 11 типів блоків, з яких може бути виготовлена \u200b\u200bконкретна MES система для того чи іншого виробництва ...

Розробка програмного комплексу розрахунку компенсацій з капітального ремонту

На найнижчому рівні гранулярності дані бази даних Oracle зберігаються в блоках даних. Один блок даних відповідає певному числу байтів фізичного простору на диску ...

Розробка апаратно-програмного забезпечення системи управління транспортними платформами в Simatic Step-7

Системні блоки є компонентами операційної системи. Смороду могут містіті програми (Системні Функції, SFC) або дані (Системні блоки Даних, SDB). Системні блоки Надаються доступ до важлівіх системних функцій ...

Пристрої, що входять до складу ЕОМ

Блоки (плати) розширення або карти (Card), як їх іноді називають, можуть використовуватися для обслуговування пристроїв, що підключаються до IBM PC. Вони можуть використовуватися для підключення додаткових пристроїв (адаптерів дисплея, контролера дисків тощо.) ...

Мабуть, зараз ці блоки - головні частини відеочипа. Вони виконують спеціальні програми, відомі як шейдери. Причому, якщо раніше піксельні шейдери виконували блоки піксельних шейдеров, а вершинні - вершинні блоки, то з деякого часу графічні архітектури були уніфіковані, і ці універсальні обчислювальні блоки стали займатися різними розрахунками: вершинними, пиксельними, геометричними і навіть універсальними обчисленнями.

Вперше уніфікована архітектура була застосована в відеочіпі ігрової консолі Microsoft Xbox 360, цей графічний процесор був розроблений компанією ATI (згодом купленої AMD). А в відеочіпах для персональних комп'ютерів уніфіковані шейдерні блоки з'явилися ще в платі NVIDIA GeForce 8800. І з тих пір все нові відеочіпи засновані на уніфікованої архітектурі, яка має універсальний код для різних шейдерних програм (вершинних, піксельних, геометричних та ін.), І відповідні уніфіковані процесори можуть виконати будь-які програми.

За кількістю обчислювальних блоків і їх частоті можна порівнювати математичну продуктивність різних відеокарт. Велика частина ігор зараз обмежена продуктивністю виконання піксельних шейдеров, тому кількість цих блоків дуже важливо. Наприклад, якщо одна модель відеокарти заснована на GPU з 384 обчислювальними процесорами в його складі, а інша з тієї ж лінійки має GPU з 192 обчислювальними блоками, то при рівній частоті друга буде вдвічі повільніше обробляти будь-який тип шейдеров, і в цілому буде настільки ж продуктивніше.

Хоча, виключно на підставі одного лише кількості обчислювальних блоків робити однозначні висновки про продуктивність не можна, обов'язково потрібно врахувати і тактову частоту і різну архітектуру блоків різних поколінь і виробників чіпів. Тільки по цих цифрах можна порівнювати чіпи тільки в межах однієї лінійки одного виробника: AMD або NVIDIA. В інших же випадках потрібно звертати увагу на тести продуктивності в цікавлять іграх або додатках.

Блоки текстурування (TMU)

Ці блоки GPU працюють спільно з обчислювальними процесорами, ними здійснюється вибірка і фільтрація текстур і інших даних, необхідних для побудови сцени і універсальних обчислень. Число текстурних блоків в відеочіпі визначає текстурну продуктивність - тобто швидкість вибірки текселей з текстур.

Хоча останнім часом більший упор робиться на математичні розрахунки, а частина текстур замінюється процедурними, навантаження на блоки TMU і зараз досить велика, так як крім основних текстур, вибірки необхідно робити і з карт нормалей і зсувів, а також позаекранного буферів рендеринга render target.

З урахуванням упору багатьох ігор в тому числі і в продуктивність блоків текстурування, можна сказати, що кількість блоків TMU і відповідна висока текстурная продуктивність також є одними з найважливіших параметрів для відеочіпів. Особливий вплив цей параметр надає на швидкість рендеринга картинки при використанні анізотропної фільтрації, що вимагають додаткових текстурних вибірок, а також при складних алгоритмах м'яких тіней і новомодних алгоритмах начебто Screen Space Ambient Occlusion.

Блоки операцій растеризації (ROP)

Блоки растеризації здійснюють операції запису розрахованих відеокартою пікселів в буфери і операції їх змішування (блендінга). Як ми вже відзначали вище, продуктивність блоків ROP впливає на філлрейт і це - одна з основних характеристик відеокарт всіх часів. І хоча останнім часом її значення також дещо знизилося, все ще трапляються випадки, коли продуктивність додатків залежить від швидкості і кількості блоків ROP. Найчастіше це пояснюється активним використанням фільтрів постобработки і включеним антиалиасинг при високих ігрових налаштуваннях.

На нашому форумі щодня десятки людей просять консультації з питань модернізації своїх, у чому ми охоче їм допомагаємо. Кожен день «оцінюючи збірку» і перевіряючи обрані нашими клієнтами компоненти на сумісність, ми стали помічати, що увагу користувачі приділяють в основному, і іншим, безперечно, важливим комплектуючих. І рідко хто згадує, що при апгрейді комп'ютера потрібно обов'язково оновити не менш важливу деталь -. І сьогодні ми розповімо і покажемо, чому про це не варто забувати.

«... Хочу прокачати комп штоб все літало, купив проц i7-3970X і мамку ASRock X79 Extreme6, плюс відяху RADEON HD 7990 6Гб. Що ще нан ???? 777 »
- приблизно так починаються близько половини всіх повідомлень, що стосуються поновлення стаціонарного комп'ютера. Виходячи зі свого або сімейного бюджету, користувачі намагаються вибрати самий, саму і найспритніші та красиві модулі пам'яті. При цьому, наївно вважаючи, що їх старенький на 450Вт впорається і з ненажерливої \u200b\u200bвідкритий, і з «гарячим» процесором під час розгону одночасно.

Ми, зі свого боку, вже ні раз писали про важливість блоку живлення - але, каємося, напевно, це було недостатньо наочно. Тому сьогодні ми виправилися, і підготували для вас пам'ятку про те, що буде, якщо при апгрейді вашого ПК ви забудете про - з картинками і докладними описами.

Отже, ми вирішили оновити конфігурацію ...


Для нашого експерименту ми вирішили взяти абсолютно новий середньостатистичний комп'ютер, і оновити його до рівня «ігрова машина». Конфігурацію сильно міняти не доведеться - достатньо буде поміняти, пам'ять і відеокарту, щоб у нас з'явилася можливість пограти в більш-менш сучасні ігри при гідних налаштуваннях деталізації. Початкова конфігурація нашого комп'ютера така:

Блок живлення: ATX 12V потужністю 400 Вт

Зрозуміло, що для ігор така конфігурація, м'яко кажучи, слабенька. Значить, прийшов час щось змінювати! Почнемо ми з того ж, з чого починає більшість спраглих «апгрейду» - с. Материнську плату ми міняти не будемо - поки нас вона влаштовує.

Так як материнську плату ми вирішили не чіпати, то підберемо сумісний з сокетом FM2 (благо, для цього на сайті Нікс є спеціальна кнопка на сторінці опису материнської плати). Не будемо скупитися - візьмемо доступний, але швидкий і потужний процесор з частотою 4.1 ГГц (до 4.4 ГГц в режимі Turbo Сore) і розблокованим множником - ми теж любимо «порозгонив», ніщо людське нам не чуже. Ось характеристики обраного нами процесора:

Характеристики
Частота шини CPU 5000 МГц потужність, що розсіюється 100 Вт Частота роботи процесора 4.1 ГГц або до 4.4 ГГц в режимі Turbo Сore ядро Richland кеш L1 96 Кб x2 кеш L2 2048 Кб x2, працює на частоті процесора Підтримка 64 біт Так кількість ядер 4 множення 41, незаблокований множник відеоядро процесора AMD Radeon HD 8670D з частотою 844 МГц; підтримка Shader Model 5 Max обсяг оперативної пам'яті 64 Гб Макс. кол-во моніторів для підключення 3 з прямим підключенням або до 4 моніторів при використанні DisplayPort разветвителей

Одна планка на 4Гб - не наш вибір. По-перше, ми хочемо 16Гб, а по-друге - нам потрібно задіяти двоканальний режим роботи, для чого в наш комп'ютер ми встановимо два модуля пам'яті об'ємом по 8 Гб кожен. Висока пропускна здатність, відсутність радіаторів і гідна ціна роблять ці самим «смачним» вибором для нас. До того ж, з сайту AMD можна скачати програму Radeon RAMDisk, яка дозволить нам безкоштовно створити супершвидкий віртуальний накопичувач об'ємом до 6Гб абсолютно безкоштовно - а безкоштовні корисні штуки люблять все.


Характеристики
Обсяг пам'яті 8 Гб
кількість модулів 2
стандарт пам'яті PC3-10600 (DDR3 1333 МГц)
частота функціонування до 1333 МГц
таймінги 9-9-9-24
Напруга живлення 1.5 У
Пропускна спроможність 10667 Мб / сек

Грати на вбудованому відео з комфортом можна тільки в «сапера». Тому для того, щоб оновити комп'ютер до ігрового рівня, ми вибрали сучасну і потужну, але не найдорожчу,.


Їй стала з 2Гб відеопам'яті, підтримкою DirectX 11 і OpenGL 4.x. і відмінною системою охолодження Twin Frozr IV. Її продуктивності з лишком повинно вистачити для того, щоб ми могли насолодитися новітніми частинами найпопулярніших ігрових франшиз, на кшталт Tomb Raider, Crysis, Hitman і Far Cry. Характеристики обраної нами виглядають наступним чином:


Характеристики
GPU GeForce GTX 770
частота GPU Одна тисяча дев'яносто вісім МГц або до 1150 МГц в режимі GPU Boost
Кількість шейдерних процесорів 1536
відеопам'ять 2 Гб
Тип відеопам'яті GDDR5
Розрядність шини відеопам'яті 256 біт
частота відеопам'яті 1753 МГц (7.010 ГГц QDR)
Кількість піксельних конвеєрів 128, 32 блоки вибірки текстур
інтерфейс PCI Express 3.0 16x (сумісний з PCI Express 2.x / 1.х) з можливістю об'єднання карт за допомогою SLI.
порти DisplayPort, DVI-D, DVI-I, HDMI, Перехідник на D-Sub в комплекті
охолодження відеокарти Активне (радіатор + 2 вентилятора Twin Frozr IV на лицьовій стороні плати)
Роз'єм живлення 8 pin + 8 pin
підтримка API DirectX 11 і OpenGL 4.x
Довжина відеокарти (виміряно в НІКС) 263 мм
Підтримка обчислень загального призначення на GPU DirectCompute 11, NVIDIA PhysX, CUDA, CUDA C ++, OpenCL 1.0
Максимальне енергоспоживання FurMark + WinRar 255 Вт
Рейтинг продуктивності 61.5

несподівані труднощі

Тепер все, що потрібно для апгрейда нашого комп'ютера, у нас є. Встановимо нові комплектуючі в наявний у нас корпус.


Запускаємо - і не працює. А чому? А тому, що бюджетні блоки живлення фізично не здатні запустити комп'ютер з кожен більш-менш. Справа в тому, що для харчування в нашому випадку потрібні два 8-pin коннектора, а блок живлення має «в базі» всього один 6-pin коннектор живлення відеокарти. З огляду на, що набагато більше потрібно ще більше конекторів, ніж в нашому випадку, стає зрозуміло, що блок живлення потрібно міняти.

Але це ще півбіди. Подумаєш, немає коннектора харчування! У нашій тестовій лабораторії знайшлися досить рідкісні перехідники з 6-pin на 8-pin і з molex на 6-pin. Ось такі:


Варто відзначити, що навіть на бюджетних сучасних блоках харчування з кожним новим випуском роз'ємів Molex стає все менше - так що нам, можна сказати, пощастило.

На перший погляд - все добре, і шляхом деяких хитрощів ми змогли оновити системний блок до «геймерской» конфігурації. Тепер давайте симітіруем навантаження, запустивши на нашому новому ігровому комп'ютері тест Furmark і архіватор 7Zip в режимі Xtreme Burning одночасно. Ми могли запустити комп'ютер - вже добре. Запуск Furmark система теж витримала. Запускаємо архіватор - і що це ?! Комп'ютер вимкнувся, перед цим порадувавши нас ревом розкрученого на максимум вентилятора. "Скоромний" штатний 400Вт не зміг, як не старався, прогодувати відеокарту і потужний процесор. А через посередньої системи охолодження наш сильно нагрівся, і навіть максимальні оберти вентилятора не дозволили йому видати хоча б заявлені 400Вт.

Вихід є!

Припливли. Купили дорогі комплектуючі, щоб зібрати ігровий комп'ютер, а грати на ньому, виходить, не можна. Прикро. Висновок зрозумілий всім: старий не підходить для нашого ігрового комп'ютера, і його потрібно терміново міняти на новий. Але на який саме?

Для нашого прокачаний комп'ютера ми вибирали за чотирма основними критеріями:

Перший - це, звичайно ж, потужність. Ми вважали за краще вибрати з запасом - нам же захочеться і процесор порозгонив, і в тестах синтетичних бали понабирали. З урахуванням всього того, що може нам знадобитися в майбутньому, ми вирішили вибирати потужністю не нижче 800Вт.

Другий критерій - це надійність. Нам дуже хочеться, щоб взятий «із запасом» пережив наступне покоління відеокарт і процесорів, не згорів сам і при цьому не спалив дорогі комплектуючі (разом з тестовим майданчиком). Тому, наш вибір - тільки японські конденсатори, тільки захист від коротких замикань і надійний захист від перевантаження будь-якого з виходів.

Третій пункт наших вимог - зручність і функціональність. Для початку, нам потрібен - працювати комп'ютер буде часто, і особливо гучні БП укупі з відеокартою і процесорним кулером зведуть з розуму будь-якого користувача. До того ж, нам не чуже почуття прекрасного, тому новий блок живлення для нашого ігрового комп'ютера повинен бути модульним і мати відстібаються кабелі та конектори. Щоб нічого зайвого не було.

І останній за списком, але не менш важливе, критерій - це енергоефективність . Так, нас турбує і навколишнє середовище, і рахунки за електрику. Тому, обраний нам блок живлення повинен відповідати, як мінімум, стандарту енергоефективності 80+ Bronze.

Зіставивши і проаналізувавши всі вимоги, ми вибрали серед нечисленних претендентів, який максимально повно задовольняв всі наші вимоги. Ним став потужністю 850W. Зауважимо, що за цілим рядом параметрів він навіть перевершив наші вимоги. Давайте подивимося його специфікацію:

Характеристики блоку живлення
тип обладнання Блок живлення з активним PFC (Power Factor Correction) модулем.
властивості Обшивка шлейфів, Японські конденсатори, Захист від коротких замикань (SCP), Захист від підвищення напруги (OVP), Захист від перевантаження будь-якого з виходів блоку окремо (OCP)
+ 3.3V - 24A, + 5V - 24A, + 12V - 70A, + 5VSB - 3.0A, -12V - 0.5 A
Від'єднуються кабелі живлення Так
ККД 90%, Сертифікований на стандарт 80 PLUS Gold
Потужність блоку живлення 850 Вт
Конектор живлення мат.плати 24 + 8 + 8 pin, 24 + 8 + 4 pin, 24 + 8 pin, 24 + 4 pin, 20 + 4 pin (розбірний 24-pin коннектор. 4-pin можуть відстібатися у разі необхідності, розбірний 8-pin конектор)
Конектор живлення відеокарт 6x 6/8-pin роз'ємів (розбірний 8-pin роз'єм - 2 контакту відстібаються)
MTBF 100 тис. Годин
Охолодження блоку живлення 1 вентилятор: 140 x 140 мм (на нижній стінці). Система пасивного охолодження при навантаженні до 50%.
Управління швидкістю обертання вентилятора Від термодатчика. Зміна швидкості обертання вентилятора залежно від температури всередині блоку живлення. Ручний вибір режиму роботи вентилятора. У режимі Normal вентилятор обертається постійно, а в режимі Silent повністю зупиняється при низькому завантаженні.


, Один з кращих за ці гроші. Встановимо його в наш корпус:


Тут сталося щось, що нас трохи збентежило. Здавалося б, все зібрали грамотно, все підключили, все запрацювало - а блок живлення мовчить! Тобто, взагалі: вентилятор як стояв на місці, так і стоїть, а система при цьому справно запустилася і функціонує. Справа в тому, що при навантаженні до 50% блок живлення працює в так званому тихому режимі - НЕ розкручуючи вентилятор системи охолодження. Загуде вентилятор тільки під великим навантаженням - одночасний запуск архиваторов і Furmark все-таки змусив кулер обертатися.


У блоку живлення цілих шість 8-pin6-pin конекторів живлення відеокарти, кожен з яких представляє собою розбірний 8-піновий коннектор, від якого при необхідності можна відстебнути 2 контакту. Таким чином, він здатний без зайвого клопоту і труднощів прогодувати будь-яку відеокарту. І навіть не одну.


Модульна система блоку живлення дозволяє відстебнути зайві і непотрібні кабелі живлення, що дозволяє поліпшити продувність корпусу, стабільність роботи системи і, звичайно ж, естетично покращує зовнішній вигляд внутрішнього простору, що дозволяє сміливо рекомендувати моддерам і любителям корпусів з віконцями.
купити надійний і потужний блок живлення. У нашому огляді ним став. - і як бачите, не випадково. Купивши такий же в НІКС, ви може бути впевнені в тому, що всі компоненти вашої високопродуктивної системи будуть забезпечені достатньою і безперебійним харчуванням, навіть при екстремальному оверклокінгу.


До того ж, блоку живлення потужністю вистачить на кілька років вперед - краще з запасом, в разі, якщо ви збираєтеся і в майбутньому оновлювати систему високорівневими комплектуючими.

У першій частині нашого керівництва по відеокартам для початківців користувачів ми розглянули ключові компоненти: інтерфейси, виходи, систему охолодження, графічний процесор і відеопам'ять. У другій частині ми поговоримо про функції та технології відеокарт.

Базові компоненти відеокарти:

  • виходи;
  • інтерфейси;
  • система охолодження;
  • графічний процесор;
  • відеопам'ять.

Частина 2 (ця стаття): графічні технології:

  • словничок;
  • архітектура графічного процесора: функції
    вершинні / піксельні блоки, шейдери, швидкість заповнення, текстурні / растрові блоки, конвеєри;
  • архітектура графічного процесора: технологія
    техпроцес, частота графічного процесора, локальна відеопам'ять (обсяг, шина, тип, частота), рішення з декількома відеокартами;
  • візуальні функції
    DirectX, високий динамічний діапазон (HDR), повноекранне згладжування, текстурная фільтрація, текстури високого дозволу.

Словничок базових графічних термінів

Частота оновлення (Refresh Rate)

Як в кінотеатрі або на телевізорі, ваш комп'ютер симулює рух на моніторі, виводячи послідовність кадрів. Частота оновлення монітора вказує на те, скільки разів в секунду на екрані буде оновлюватися картинка. Наприклад, частота 75 Гц відповідає 75 оновлень в секунду.

Якщо комп'ютер обробляє кадри швидше, ніж може виводити монітор, то в іграх можуть з'явитися проблеми. Наприклад, якщо комп'ютер прораховує 100 кадрів в секунду, а частота оновлення монітора складає 75 Гц, то через накладок монітор може виводити тільки частину картинки за період свого поновлення. В результаті з'являються візуальні артефакти.

В якості вирішення можна включити V-Sync (вертикальну синхронізацію). Вона обмежує кількість видаваних комп'ютером кадрів до частоти оновлення монітора, запобігаючи появі артефактів. Якщо включити V-Sync, то число прораховуваних в грі кадрів ніколи не перевищить частоту оновлення. Тобто при 75 Гц комп'ютер буде виводити не більше 75 кадрів в секунду.

Слово "Pixel" розшифровується як " picture element "- елемент зображення. Він являє собою крихітну точку на дисплеї, яка може світитися певних кольором (в більшості випадків відтінок виводиться поєднанням трьох базових кольорів: червоного, зеленого і синього). Якщо дозвіл екрана становить 1024x768, то на ньому можна помітити матрицю з 1024 пікселів по ширині і 768 пікселів по висоті. Все разом пікселі і складають зображення. Картинка на екрані оновлюється від 60 до 120 разів на секунду, в залежності від типу дисплея і даних, які видаються виходом відеокарти. ЕПТ-монітори оновлюють дисплей рядок за рядком, а плоскі РК-монітори можуть оновлювати кожен піксель окремо.

Всі об'єкти на 3D-сцені складаються з вершин. Вершина - точка в тривимірному просторі з координатами X, Y і Z. Кілька вершин можна згрупувати в полігон: найчастіше це трикутник, але можливі і більш складні форми. Потім на полігон накладається текстура, що дозволяє об'єкту виглядати реалістично. 3D-куб, показаний на ілюстрації вище, складається з восьми вершин. Більш складні об'єкти мають криві поверхні, які насправді складаються з дуже великого числа вершин.

Текстура - це просто 2D-картинка довільного розміру, яка накладається на 3D-об'єкт, щоб симулювати його поверхню. Наприклад, наш 3D-куб складається з восьми вершин. До накладення текстури він виглядає як проста коробка. Але коли ми завдамо текстуру, то коробка стає пофарбованої.


Піксельні програми-шейдери дозволяє відеокарті видати вражаючі ефекти, наприклад, як цю воду в Elder Scrolls: Oblivion.

Сьогодні існує два види шейдерів: вершинні і піксельні. Вершинні програми-шейдери можуть змінювати або трансформувати 3D-об'єкти. Піксельні програми-шейдери дозволяють змінювати кольори пікселів на основі будь-яких даних. Уявіть собі джерело світла на 3D-сцені, який змушує світитися освітлювані об'єкти яскравіше, і в той же час, призводить до відкидання тіні на інші об'єкти. Все це реалізується за допомогою зміни колірної інформації пікселів.

Піксельні шейдери використовуються для створення складних ефектів в ваших улюблених іграх. Наприклад, код шейдера може змусити пікселі, що оточують 3D-меч, яскравіше світитися. Ще один шейдер може обробити всі вершини складного 3D-об'єкта і симулювати вибух. Розробники ігор все частіше вдаються до допомоги складних програм-шейдеров для створення реалістичної графіки. Практично будь-яка сучасна гра з багатою графікою використовує шейдери.

З випуском наступного інтерфейсу прикладного програмування (API, Application Programming Interface) Microsoft DirectX 10 на світ вийде третій тип шейдеров під назвою геометричні шейдери. З їх допомогою можна буде ламати об'єкти, модифікувати і навіть знищувати їх в залежності від необхідного результату. Третій тип шейдеров можна буде точно так же програмувати, як і перші два, але роль його вже буде інший.

Швидкість заповнення (Fill Rate)

Дуже часто на коробці з відеокартою можна зустріти значення швидкості заповнення. В принципі, швидкість заповнення вказує на те, з якою швидкість графічний процесор може видавати пікселі. У старих відеокарт можна було зустріти швидкість заповнення трикутників (triangle fill rate). Але сьогодні виділяють два типи швидкості заповнення: піксельну (pixel fill rate) і текстурну (texture fill rate). Як вже говорилося, піксельна швидкість заповнення відповідає швидкості видачі пікселів. Вона розраховується як число реєстрових операцій (ROP), помножене на тактову частоту.

Текстурну швидкість заповнення ATi і nVidia вважають по-різному. nVidia вважає, що швидкість виходить множенням числа піксельних конвеєрів на тактову частоту. А ATi примножує число текстурних блоків на тактову частоту. В принципі, обидва способи коректні, оскільки nVidia використовує по одному текстурних блоків на блок піксельних шейдеров (тобто по одному на піксельний конвеєр).

З урахуванням даних визначень дозвольте рушити далі і обговорити найбільш важливі функції графічного процесора, що вони роблять і чому вони такі значущі.

Архітектура графічного процесора: функції

Реалізм 3D-графіки дуже сильно залежить від продуктивності відеокарти. Чим більше блоків піксельних шейдеров містить процесор і чим вище частота, тим більше ефектів можна накласти на 3D-сцену, щоб поліпшити її візуальне сприйняття.

Графічний процесор містить багато різних функціональних блоків. За кількістю деяких компонентів можна оцінити, наскільки графічний процесор потужний. Перед тим, як рухатися далі, дозвольте розглянути найважливіші функціональні блоки.

Вершинні процесори (блоки вершинних шейдеров)

Як і блоки піксельних шейдеров, вершинні процесори виконують код програм-шейдеров, які стосуються вершин. Оскільки більший бюджет вершин дозволяє створювати більш складні 3D-об'єкти, продуктивність верхових процесорів дуже важлива в 3D-сценах зі складними об'єктами або з великою їх кількістю. Втім, блоки вершинних шейдеров все ж не так очевидно впливають на продуктивність, як піксельні процесори.

Піксельні процесори (блоки піксельних шейдеров)

Піксельний процесор - це компонент графічного чіпа, виділений на обробку піксельних програм-шейдеров. Ці процесори виконують обчислення, що стосуються тільки пікселів. Оскільки пікселі містять інформацію про колір, піксельні шейдери дозволяють досягти вражаючих графічних ефектів. Наприклад, більшість ефектів води, які ви бачили в іграх, створюється за допомогою піксельних шейдеров. Зазвичай число піксельних процесорів використовується для порівняння піксельної продуктивності відеокарт. Якщо одна карта оснащена вісьмома блоками піксельних шейдеров, а інша - 16 блоками, то цілком логічно припустити, що відеокарта з 16 блоками буде швидше обробляти складні піксельні програми. Також слід враховувати і тактову частоту, але сьогодні подвоєння числа піксельних процесорів ефективніше по енергоспоживанню, ніж подвоєння частоти графічного чіпа.

уніфіковані шейдери

Уніфіковані (єдині) шейдери ще не прийшли в світ ПК, але прийдешній стандарт DirectX 10 якраз спирається на подібну архітектуру. Тобто структура коду вершинних, геометричних і піксельних програм буде єдина, хоча шейдери виконуватимуть різну роботу. Нову специфікацію можна подивитися в Xbox 360, де графічний процесор був спеціально розроблений ATi для Microsoft. Буде дуже цікаво побачити, який потенціал несе новий DirectX 10.

Блоки накладення текстур (Texture Mapping Unit, TMU)

Текстури слід вибрати і відфільтрувати. Ця робота виконується блоками накладення текстур, які працюють спільно з блоками піксельних і вершинних шейдеров. Робота TMU полягає в застосуванні текстурних операцій над пікселями. Число текстурних блоків в графічному процесорі часто використовується для порівняння текстурной продуктивності відеокарт. Цілком розумно припустити, що відеокарта з великим числом TMU дасть більш високу текстурну продуктивність.

Блоки растрових операцій (Raster Operator Unit, ROP)

Процесори растрових операцій відповідають за запис піксельних даних в пам'ять. Швидкість, з якою виконується ця операція, є швидкістю заповнення (fill rate). У ранні дні 3D-прискорювачів число ROP і швидкість заповнення були дуже важливими характеристиками відеокарт. Сьогодні робота ROP як і раніше важлива, але продуктивність відеокарти вже не впирається в ці блоки, як було раніше. Тому продуктивність (і число) ROP вже рідко використовується для оцінки швидкості відеокарти.

Конвеєри

Конвеєри використовуються для опису архітектури відеокарт і дають цілком наочне уявлення про продуктивність графічного процесора.

Конвеєр не можна вважати суворим технічним терміном. У графічному процесорі використовуються різні конвеєри, які виконують відрізняються один від одного функції. Історично під конвеєром розуміли піксельний процесор, який був підключений до свого блоку накладення текстур (TMU). Наприклад, у відеокарти Radeon 9700 використовується вісім піксельних процесорів, кожен з яких підключений до свого TMU, тому вважають, що у карти вісім конвеєрів.

Але сучасні процесори описати числом конвеєрів досить складно. У порівнянні з попередніми дизайнами, нові процесори використовують модульну, фрагментовану структуру. Новатором в цій сфері можна вважати ATi, яка з лінійкою відеокарт X1000 перейшла на модульну структуру, що дозволило досягти приросту продуктивності через внутрішню оптимізацію. Деякі блоки процесора використовуються більше, ніж інші, і для підвищення продуктивності графічного процесора ATi постаралася знайти компроміс між числом потрібних блоків і площею кристала (її не можна дуже сильно збільшувати). У даній архітектурі термін "піксельний конвеєр" вже втратив своє значення, оскільки піксельні процесори вже не підключені до власних блокам TMU. Наприклад, у графічного процесора ATi Radeon X1600 є 12 блоків піксельних шейдеров і всього чотири блоки накладення текстур TMU. Тому не можна говорити, що в архітектурі цього процесора є 12 піксельних конвеєрів, як і говорити, що їх всього чотири. Втім, за традицією піксельні конвеєри все ще згадують.

З урахуванням сказаних припущень, число піксельних конвеєрів в графічному процесорі часто використовують для порівняння відеокарт (за винятком лінійки ATi X1x00). Наприклад, якщо взяти відеокарти з 24 і 16 конвеєрами, то цілком розумно припустити, що карта з 24 конвеєрами буде швидше.

Архітектура графічного процесора: технологія

техпроцес

Під цим терміном розуміють розмір одного елемента (транзистора) чіпа і точність процесу виробництва. Удосконалення технологічних процесів дозволяє отримати елементи менших розмірів. Наприклад, техпроцес 0,18 мкм дає елементи більшого розміру, ніж 0,13-мкм техпроцес, тому він не такий ефективний. Транзистори меншого розміру працюють від меншої напруги. У свою чергу, зниження напруги призводить до зменшення теплового опору, що дає зниження кількості тепла, що виділяється. Удосконалення техпроцесу дозволяє зменшити відстань між функціональними блоками чіпа, а на передачу даних потрібно менше часу. Скорочення відстаней, зниження напруги і інші поліпшення дозволяють досягати більш високих тактових частот.

Кілька ускладнює розуміння те, що для позначення техпроцесу сьогодні використовують як мікрометри (мкм), так і нанометра (нм). Насправді все дуже просто: 1 нанометр дорівнює 0,001 мікрометра, тому 0,09-мкм і 90-нм техпроцеси - це одне і те ж. Як вже зазначалося вище, менший техпроцес дозволяє отримати більш високі тактові частоти. Наприклад, якщо порівнювати відеокарти з чіпами 0,18 мкм і 0,09 мкм (90 нм), то цілком розумно очікувати від 90-нм карти більш високої частоти.

Тактова частота графічного процесора

Тактова частота графічного процесора вимірюється в мегагерцах (МГц), тобто в мільйонах тактів за секунду.

Тактова частота безпосередньо впливає на продуктивність графічного процесора. Чим вона вища, тим більше роботи можна виконати за секунду. Для першого прикладу візьмемо відеокарти nVidia GeForce 6600 і 6600 GT: графічний процесор 6600 GT працює на частоті 500 МГц, а у звичайної карти 6600 - на 400 МГц. Оскільки процесори технічно ідентичні, 20% приріст тактової частоти 6600 GT призводить до більш високої продуктивності.

Але тактова частота - це ще далеко не все. Слід враховувати, що на продуктивність дуже сильно впливає архітектура. Для другого прикладу візьмемо відеокарти GeForce 6600 GT і GeForce 6800 GT. Частота графічного процесора 6600 GT становить 500 МГц, але 6800 GT працює всього на 350 МГц. А тепер візьмемо до уваги, що у 6800 GT використовуються 16 піксельних конвеєрів, а у 6600 GT - тільки вісім. Тому 6800 GT з 16 конвеєрами на 350 МГц дасть приблизно таку ж продуктивність, як процесор з вісьмома конвеєрами і подвоєною тактовою частотою (700 МГц). З урахуванням сказаного, тактову частоту цілком можна використовувати для порівняння продуктивності.

локальна відеопам'ять

Пам'ять відеокарти дуже сильно впливає на продуктивність. Але різні параметри пам'яті впливають по-різному.

обсяг відеопам'яті

Обсяг відеопам'яті, напевно, можна назвати параметром відеокарти, який найбільше переоцінюють. Недосвідчені споживачі часто використовують обсяг відеопам'яті для порівняння різних карт між собою, але в реальності обсяг слабо впливає на продуктивність в порівнянні з такими параметрами, як частота шини пам'яті і інтерфейс (ширина шини).

У більшості випадків карта зі 128 Мбайт відеопам'яті буде працювати майже так само, як карта з 256 Мбайт. Звичайно, є ситуації, коли більший обсяг пам'яті призводить до збільшення продуктивності, але слід пам'ятати, що більший обсяг пам'яті не буде автоматично приводити до зростання швидкості в іграх.

Де обсяг буває корисний, так це в іграх з текстурами високого дозволу. Ігрові розробники докладають до гри кілька наборів текстур. І чим більше пам'яті буде на відеокарті, тим більш високу роздільну здатність можуть мати завантажуються текстури. Текстури високого дозволу дають більш високу чіткість і деталізацію в грі. Тому цілком розумно брати карту з великим об'ємом пам'яті, якщо всі інші критерії збігаються. Ще раз нагадаємо, що ширина шини пам'яті і її частота набагато сильніше впливають на продуктивність, ніж обсяг фізичної пам'яті на карті.

Ширина шини пам'яті

Ширина шини пам'яті - один з найважливіших аспектів продуктивності пам'яті. Сучасні шини мають ширину від 64 до 256 біт, а в деяких випадках навіть 512 біт. Чим ширше шина пам'яті, тим більше інформації вона може передати за такт. А це безпосередньо впливає на продуктивність. Наприклад, якщо взяти дві шини з рівними частотами, то теоретично 128-бітна шина передасть в два рази більше даних за такт, ніж 64-бітна. А 256-бітна шина - ще в два рази більше.

Більш висока пропускна здатність шини (виражається в бітах або байтах в секунду, 1 байт \u003d 8 біт) дає більш високу продуктивність пам'яті. Саме тому шина пам'яті набагато важливіше, ніж її обсяг. При рівних частотах 64-бітна шина пам'яті працює зі швидкістю всього 25% від 256-бітної!

Візьмемо такий приклад. Відеокарта з 128 Мбайт відеопам'яті, але з 256-бітної шиною дає набагато більш високу продуктивність пам'яті, ніж 512-Мбайт модель з 64-бітної шиною. Важливо відзначити, що у деяких карт з лінійки ATi X1x00 виробники вказують специфікації внутрішньої шини пам'яті, але нас цікавлять параметри зовнішньої шини. Наприклад, у X1600 внутрішня кільцева шина має ширину 256 біт, але зовнішня - всього 128 біт. І в реальності шина пам'яті працює з 128-бітної продуктивністю.

типи пам'яті

Пам'ять можна розділити на дві основні категорії: SDR (одиночна передача даних) і DDR (подвоєна передача даних), при якій дані передаються за такт в два рази швидше. Сьогодні технологія одиночної передачі SDR застаріла. Оскільки у пам'яті DDR дані передаються в два рази швидше, ніж у SDR, важливо пам'ятати, що у відеокарт з пам'яттю DDR найчастіше вказують подвоєну частоту, а не фізичну. Наприклад, якщо у пам'яті DDR вказана частота 1000 МГц, то це ефективна частота, при якій повинна працювати звичайна пам'ять SDR, щоб дати таку ж пропускну здатність. А насправді фізична частота становить 500 МГц.

З цієї причини багато хто дивується, коли для пам'яті їх відеокарти вказана частота 1200 МГц DDR, а утиліти повідомляють про 600 МГц. Так що доведеться звикнути. Пам'ять DDR2 і GDDR3 / GDDR4 працює за таким же принципом, тобто з подвоєною передачею даних. Різниця між пам'яттю DDR, DDR2, GDDR3 і GDDR4 криється в технології виробництва і деяких деталях. DDR2 може працювати на більш високих частотах, ніж пам'ять DDR, а DDR3 - ще на більш високих, ніж DDR2.

Частота шини пам'яті

Подібно процесору, пам'ять (або, точніше, шина пам'яті) працює на певних тактових частотах, вимірюваних в мегагерцах. Тут підвищення тактових частот безпосередньо впливає на продуктивність пам'яті. І частота шини пам'яті є одним з параметрів, які використовують для порівняння продуктивності відеокарт. Наприклад, якщо всі інші характеристики (ширина шини пам'яті і т.д.) будуть однаковими, то цілком логічно стверджувати, що відеокарта з 700-МГц пам'яттю працює швидше, ніж з 500-МГц.

Знову ж, тактова частота - це ще не все. 700-МГц пам'ять з 64-бітної шиною буде працювати повільніше, ніж 400-МГц пам'ять з 128-бітної шиною. Продуктивність 400-МГц пам'яті на 128-бітної шині приблизно відповідає 800-МГц пам'яті на 64-бітної шині. Слід також пам'ятати, що частоти графічного процесора і пам'яті - абсолютно різні параметри, і зазвичай вони розрізняються.

інтерфейс відеокарти

Всі дані, що передаються між відеокартою і процесором, проходять через інтерфейс відеокарти. Сьогодні для відеокарт використовується три типи інтерфейсів: PCI, AGP і PCI Express. Вони розрізняються пропускною спроможністю і іншими характеристиками. Зрозуміло, що чим вище пропускна здатність, тим вище і швидкість обміну. Втім, високу пропускну здатність можуть використовувати тільки найсучасніші карти, та й то лише частково. У якийсь момент швидкість інтерфейсу перестала бути "вузьким місцем", її сьогодні просто достатньо.

Найповільніша шина, для якої випускалися відеокарти, це PCI (Peripheral Components Interconnect). Якщо не вдаватися в історію, звичайно. PCI дійсно погіршувала продуктивність відеокарт, тому вони перейшли на інтерфейс AGP (Accelerated Graphics Port). Але навіть специфікації AGP 1.0 і 2x обмежували продуктивність. Коли стандарт збільшив швидкість до рівня AGP 4x, ми почали наближатися до практичного межі пропускної здатності, яку можуть задіяти відеокарти. Специфікація AGP 8x ще раз подвоїла пропускну здатність у порівнянні з AGP 4x (2,16 Гбайт / с), але відчутного приросту графічної продуктивності ми вже не отримали.

Найновіша і швидкісна шина - PCI Express. Нові графічні карти зазвичай використовують інтерфейс PCI Express x16, який поєднує 16 ліній PCI Express, що дають сумарну пропускну здатність 4 Гбайт / с (в одному напрямку). Це в два рази більше, ніж пропускна здатність AGP 8x. Шина PCI Express дає згадану пропускну здатність для обох напрямків (передача даних на відеокарту і з неї). Але швидкості стандарту AGP 8x було вже досить, тому ми поки не зустрічали ситуації, коли перехід на PCI Express дав приріст продуктивності в порівнянні з AGP 8x (якщо інші апаратні параметри однакові). Наприклад, AGP-версія GeForce 6800 Ultra буде працювати ідентично 6800 Ultra для PCI Express.

Сьогодні найкраще купувати карту з інтерфейсом PCI Express, він протримається на ринку ще кілька років. Найпродуктивніші карти вже не випускаються з інтерфейсом AGP 8x, і рішення PCI Express, як правило, знайти вже легше аналогів AGP, та й коштують вони дешевше.

Рішення на декількох відкритих

Використовувати кілька відеокарт для збільшення графічної продуктивності - ідея не нова. У ранні дні 3D-графіки копання 3dfx вийшла на ринок з двома відеокартами, що працюють паралельно. Але зі зникненням 3dfx технологія спільної роботи декількох споживчих відеокарт була забута, хоча ATi випускала подібні системи для професійних симуляторів ще з виходу Radeon 9700. Пару років тому технологія повернулася на ринок: з появою рішень nVidia SLI і, трохи пізніше, ATi Crossfire .

Спільне використання декількох відеокарт дає достатню продуктивність, щоб вивести гру з високими настройками якості з високою роздільною здатністю. Але вибирати те чи інше рішення не так просто.

Почнемо з того, що рішення на основі декількох відеокарт вимагають велику кількість енергії, тому блок живлення повинен бути досить потужним. Все це тепло доведеться відводити від відеокарти, тому потрібно звернути увагу на корпус ПК і охолодження, щоб система не перегрілася.

Крім того, пам'ятайте, що SLI / CrossFire вимагає відповідної материнської плати (або під одну технологію, або під іншу), яка зазвичай коштує дорожче в порівнянні зі стандартними моделями. Конфігурація nVidia SLI буде працювати тільки на певних платах nForce4, а карти ATi CrossFire - тільки на материнських платах з чіпсетом CrossFire або на деяких моделях Intel. Ситуацію ускладнює і те, що деякі конфігурації CrossFire вимагають, щоб одна з карт була спеціальної: CrossFire Edition. Після виходу CrossFire для деяких моделей відеокарт ATi дозволила включати технологію спільної роботи по шині PCI Express, причому з виходами нових версій драйверів число можливих комбінацій збільшується. Але все ж апаратний CrossFire з відповідною картою CrossFire Edition дає більш високу продуктивність. Але і карти CrossFire Edition коштують дорожче звичайних моделей. На даний момент ви можете включити програмний режим CrossFire (без карти CrossFire Edition) на відкритих Radeon X1300, X1600 і X1800 GTO.

Слід враховувати й інші фактори. Хоча дві графічні карти, що працюють спільно, і дають приріст продуктивності, йому далеко до двократного. Але грошей-то ви віддасте в два рази більше. Найчастіше приріст продуктивності становить 20-60%. А в деяких випадках через додаткових обчислювальних витрат на узгодження приросту немає взагалі. З цієї причини конфігурації на декількох картах навряд чи виправдовують себе з дешевими моделями, оскільки дорожча відеокарта, як правило, завжди обганяє пару дешевих карт. Загалом, для більшості споживачів брати рішення SLI / CrossFire сенсу не має. Але якщо ви хочете включити всі опції поліпшення якості або грати в екстремальних дозволах, наприклад, 2560x1600, коли треба прораховувати більше 4 мільйонів пікселів на кадр, то без двох або чотирьох спарених відеокарт не обійтися.

візуальні функції

Крім чисто апаратних специфікацій, різні покоління і моделі графічних процесорів можуть відрізнятися набором функцій. Наприклад, часто говорять про те, що карти покоління ATi Radeon X800 XT сумісні з Shader Model 2.0b (SM), в той час як nVidia GeForce 6800 Ultra сумісна з SM 3.0, хоча їх апаратні специфікації близькі один до одного (16 конвеєрів). Тому багато споживачів роблять вибір на користь того чи іншого рішення, навіть не знаючи, що означає ця різниця. Що ж, дозвольте поговорити про візуальних функціях і їх значимості для кінцевого користувача.

Ці назви найчастіше використовують в суперечках, але мало хто знає, що вони означають насправді. Щоб розібратися, давайте почнемо з історії графічних API. DirectX і OpenGL - це графічні API, тобто інтерфейси прикладного програмування (Application Programming Interface) - відкриті стандарти коду, доступні кожному.

До появи графічних API кожен виробник графічних процесорів використовував власний механізм спілкування з іграми. Розробникам доводилося писати окремий код для кожного графічного процесора, який вони хотіли підтримати. Дуже дорогий і неефективний підхід. Для вирішення цієї проблеми були розроблені API для 3D-графіки, щоб розробники писали код під конкретний API, а не під ту чи іншу відеокарту. Після чого проблеми сумісності лягли вже на плечі виробників відеокарт, яким довелося гарантувати, що драйвери будуть сумісні з API.

Єдиною складністю залишається те, що сьогодні використовуються два різних API, а саме Microsoft DirectX і OpenGL, де GL розшифровується як Graphics Library (графічна бібліотека). Оскільки API DirectX сьогодні в іграх більш популярний, ми сконцентруємося саме на ньому. Та й на розвиток ігор цей стандарт вплинув сильніше.

DirectX - це створення Microsoft. Насправді, в DirectX входить кілька API, тільки один з яких використовується для 3D-графіки. DirectX включає API для звуку, музики, пристроїв введення та ін За 3D-графіку в DirectX відповідає API Direct3D. Коли говорять про відеокарти, то мають на увазі саме його, тому в даному відношенні поняття DirectX і Direct3D взаємозамінні.

DirectX періодично оновлюється, у міру того, як графічні технології просуваються вперед, а ігрові розробники впроваджують нові методи програмування ігор. Оскільки популярність DirectX швидко зросла, виробники графічних процесорів почали підганяти випуск нових продуктів під можливості DirectX. З цієї причини відеокарти часто прив'язують до апаратної підтримки того чи іншого покоління DirectX (DirectX 8, 9.0 або 9.0c).

Ситуацію ускладнює і те, що частини API Direct3D можуть змінюватися з часом, без зміни поколінь DirectX. Наприклад, в специфікації DirectX 9.0 зазначена підтримка Pixel Shader 2.0. Але оновлення DirectX 9.0c включає Pixel Shader 3.0. Таким чином, хоча карти відносяться до класу DirectX 9, вони можуть підтримувати різні набори функцій. Наприклад, Radeon 9700 підтримує Shader Model 2.0, а Radeon X1800 - Shader Model 3.0, хоча обидві карти можна віднести до покоління DirectX 9.

Пам'ятайте, що при створенні нових ігор розробники враховують власників старих машин і відеокарт, так як якщо ігнорувати цей сегмент користувачів, то рівень продажів буде нижче. З цієї причини в ігри вбудовується кілька шляхів коду. У гри класу DirectX 9, напевно, є для сумісності шлях DirectX 8 і навіть шлях DirectX 7. Зазвичай, якщо вибирається старий шлях, то в грі зникають деякі віртуальні ефекти, які є на нових відкритих. Але, принаймні, можна грати навіть на старому "залозі".

Багато нові ігри вимагають установки новітньої версії DirectX, навіть якщо відеокарта належить до попереднього покоління. Тобто нова гра, яка буде використовувати шлях DirectX 8, все одно вимагає установки новітньої версії DirectX 9 для відеокарти класу DirectX 8.

Які ж відмінності між різними версіями API Direct3D в DirectX? Ранні версії DirectX - 3, 5, 6 і 7 - були відносно прості за можливостями API Direct3D. Розробники могли вибирати візуальні ефекти зі списку, після чого перевіряти їх роботу в грі. Наступним важливим кроком в програмуванні графіки став DirectX 8. У ньому з'явилася можливість програмувати відеокарту за допомогою шейдеров, тому розробники вперше отримали свободу програмувати ефекти так, як їм потрібно. DirectX 8 підтримував версії Pixel Shader від 1.0 до 1.3 і Vertex Shader 1.0. DirectX 8.1, оновлена \u200b\u200bверсія DirectX 8, отримала Pixel Shader 1.4 і Vertex Shader 1.1.

В DirectX 9 можна створювати ще більш складні програми-шейдери. DirectX 9 підтримує Pixel Shader 2.0 і Vertex Shader 2.0. DirectX 9c, оновлена \u200b\u200bверсія DirectX 9, включила специфікацію Pixel Shader 3.0.

DirectX 10, майбутня версія API, буде супроводжувати нову версію Windows Vista. На Windows XP встановити DirectX 10 не вийде.

HDR розшифровується як "High Dynamic Range", високий динамічний діапазон. Гра з HDR-освітленням може дати набагато більш реалістичну картинку, ніж гра без такого, причому не всі відеокарти підтримують HDR-освітлення.

Перед появою відеокарт класу DirectX 9 графічні процесори були серйозно обмежені точністю обчислень освітлення. До сих пір освітлення можна було розраховувати тільки з 256 (8 біт) внутрішніми рівнями.

Коли з'явилися відеокарти класу DirectX 9, вони отримали можливість видавати освітлення з високою точністю - повні 24 біта або 16,7 млн. Рівнів.

З 16,7 млн. Рівнів і після того, як був зроблений наступний крок по продуктивності відеокарт класу DirectX 9 / Shader Model 2.0, на комп'ютерах стало можливим і HDR-освітлення. Це досить складна технологія, і дивитися її потрібно в динаміці. Якщо говорити простими словами, то HDR-освітлення збільшує контрастність (темні відтінки виглядають темніше, світлі - світліше), в той же час підвищуючи кількість деталей освітлення на темних і світлих областях. Гра з HDR-освітленням здається більш живий і реалістичною, ніж без нього.

Графічні процесори, відповідні останньої специфікації Pixel Shader 3.0, дозволяють розраховувати освітлення з більш високою 32-бітної точністю, а також виконувати змішання (blending) з плаваючою комою. Таким чином, відеокарти класу SM 3.0 можуть підтримувати спеціальний метод HDR-освітлення OpenEXR, спеціально розроблений для кіноіндустрії.

Деякі ігри, які підтримують тільки HDR-освітлення методом OpenEXR, не підуть з HDR-освітленням на відкритих Shader Model 2.0. Втім, гри, які не спираються на метод OpenEXR, працюватимуть на будь-який відеокарти DirectX 9. Наприклад, Oblivion використовує метод OpenEXR HDR і дозволяє включати HDR-освітлення тільки на новітніх відкритих, які підтримують специфікацію Shader Model 3.0. Наприклад, nVidia GeForce 6800 або ATi Radeon X1800. Ігри, які використовують 3D-движок Half-Life 2, та ж Counter-Strike: Source і майбутня Half-Life 2: Aftermath, дозволяють включати HDR-рендеринг на старих відкритих DirectX 9, які підтримують тільки Pixel Shader 2.0. Як приклади можна привести лінійку GeForce 5 або ATi Radeon 9500.

Нарешті, слід враховувати, що всі форми HDR-рендеринга вимагають серйозної обчислювальної потужності і можуть поставити навіть найпотужніші графічні процесори "на коліна". Якщо ви хочете грати в новітні ігри з HDR-освітленням, то без високопродуктивної графіки не обійтися.

Повноекранне згладжування (скорочено AA) дозволяє усунути характерні «драбинки» на кордонах полігонів. Але слід враховувати, що повноекранне згладжування споживає чимало обчислювальних ресурсів, що призводить до падіння частоти кадрів.

Згладжування дуже сильно залежить від продуктивності відеопам'яті, тому швидкісна відеокарта з швидкою пам'яттю зможе прорахувати повноекранне згладжування з меншою шкодою для продуктивності, ніж недорога відеокарта. Згладжування можна включати в різних режимах. Наприклад, згладжування 4x дасть більш якісну картинку, ніж згладжування 2x, але це буде великим ударом по продуктивності. Якщо згладжування 2x подвоює горизонтальне і вертикальне дозвіл, режим 4x його учетверяется.

На все 3D-об'єкти в грі накладаються текстури, причому, чим більше кут відображається поверхні, тим більше спотвореної буде виглядати текстура. Щоб усунути цей ефект, графічні процесори використовують фільтрацію текстур.

Перший спосіб фільтрації називався білінійну і давав характерні смужки, які були не дуже-то приємні оку. Ситуація покращилася з впровадженням трилинейной фільтрації. Обидві опції на сучасних відкритих працюють практично без шкоди продуктивності.

На сьогодні найкращим способом фільтрації текстур є анізотропна фільтрація (AF). Подібно повноекранного згладжування, анізотропну фільтрацію можна включати на різних рівнях. Наприклад, 8x AF дає більш високу якість фільтрації, ніж 4x AF. Як і повноекранне згладжування, анізотропна фільтрація вимагає певної обчислювальної потужності, яка збільшується у міру підвищення рівня AF.

Всі 3D-ігри створюються з урахуванням конкретних специфікацій, і одне з таких вимог визначає текстурну пам'ять, яка знадобиться грі. Всі потрібні текстури повинні уміщатися в пам'ять відеокарти під час гри, інакше продуктивність буде сильно падати, оскільки звернення за текстурою в оперативну пам'ять дає чималу затримку, не кажучи вже про фото підкачки на жорсткому диску. Тому, якщо розробник гри розраховує на 128 Мбайт відеопам'яті як мінімальна вимога, то набір активних текстур не повинен перевищувати 128 Мбайт в будь-який час.

У сучасних ігор є кілька наборів текстур, так що гра без проблем буде працювати на старих відкритих з меншою кількістю відеопам'яті, а також і на нових картах з великим об'ємом відеопам'яті. Наприклад, гра може містити три набори текстур: для 128 Мбайт, 256 Мбайт і 512 Мбайт. Ігор, які підтримують 512 Мбайт відеопам'яті, сьогодні дуже мало, але вони все ж є самою об'єктивною причиною для покупки відеокарти з таким об'ємом пам'яті. Хоча збільшення обсягу пам'яті практично не позначається на продуктивності, ви отримаєте поліпшення візуальної якості, якщо гра підтримує відповідний набір текстур.