Полный обзор новой AMD Apu A10-6800K, протестированной в стандартной комплектации и сильно разогнанной, чтобы оценить отличия от предыдущего поколения.
Процессор AMD A10-6800K
Заключение Несмотря на то, что «энтузиасты», в основном, холодно встретили в свое время первую платформу APU AMD с процессорами Llano, обычные пользователи оценили новинку по достоинству. Покупка ATI сделала возможным для AMD воплотить в жизнь свои смелые идеи насчет скрещивания процессорной и графической части в едином устройстве. Кто интересовался новостями в то самое время, когда APU только зарождались, тот должен помнить, какое огромное число споров породила эта новость. Некоторые люди считали, что мало-мальски мощное GPU не удастся перенести без потерь под крышку процессора, что это приведет к невероятной прожорливости конечного продукта с энергопотреблением под 200 Вт.
Другая сторона настаивала, что со временем технологии будут столь хороши, что позволят произвести эту технологически сложную процедуру, не только сохранив приемлемые показатели тепловыделения и потребления энергии, но и ускорив интегрированное графическое ядро. Так или иначе, APU появились и теперь находят свое пристанище во многих компьютерах пользователей, а AMD выпускает новое поколение устройств. И оно несет в себе большое число изменений, начиная с принципиально другой архитектуры вычислительных ядер, и заканчивая более мощными GPU.
Платформа и архитектура В последнее время компания AMD славилась своими платформами-долгожителями, которые позволяли сидеть на определенном «сокете» до упора, год из года обновляя там только процессор, несмотря на выход и более новых платформ. В этот раз подобного не произошло, и время разъема FM1 подошло к концу. Прошлое, настоящее и будущее платформ APU Зато в будущем нам обещают простой апгрейд, так как FM2 пробудет в строю дольше и примет еще более совершенные процессоры, о которых нам пока мало что известно, если не брать в расчет слухи.
Наборы логики для платформы FM2 Управлять новыми процессорами призваны три серии набортной логики, и две из них уже должны быть хорошо известны пользователям: это A55 и A75,используемые на платах с разъемом FM1. В качестве топового чипсета выступает новая микросхема A85X, нацеленная на материнские платы высокопроизводительного сектора. Преимущества платформы Trinity В подробной официальной презентации рассказывается, чем новая платформа лучше, и, как несложно догадаться, это соотношение «производительность на ватт» или, если угодно, на рубль.
На 6800K можно играть, особенно если довести частоту IGP до гигагерца. Так, в разрешении 1920 х 1080 играбельны абсолютно все современные игры на средних настройках графики и отключенным сглаживанием, лишь в особо тяжелых случаях с Crysis и Metro приходилось сбрасывать настройки на минимальные. Онлайновые развлечение и прочие нетребовательные к графической карте игры порой можно запускать на максимальных настройках и выставлять 4х анизотропную фильтрацию. Думаю, что для интегрированного видеоядра это хороший результат. Производительность процессорной составляющей достаточна для выполнения абсолютно всех работ на ПК, начиная от печатания текста в документе и заканчивая обработкой фотографий. В целом, если принять во внимание возможность беспроблемной работы на частотах выше 4,5 ГГц, то 6800K можно назвать одним из самых производительных процессоров AMD в пересчете на ядро. Но главным козырем все же остается цена. A10-6800K реально приобрести за 4600 рублей, что очень недорого для четырехядерного процессора с нормальным видеоядром, способным без особых проблем выдать 25 кадров в современных играх и также поучаствовать в обсчете всего, что использует OpenCL.
Прибавьте к этому возможность беспроблемного разгона как графической, так и процессорной части, и получится очень привлекательный продукт для тех, кому ПК нужен по большей части работать и смотреть видео, периодически поигрывая в современные игры.
Не секрет, что согласно информационной утечке анонс процессоров AMD Trinity для мобильного сегмента может состояться 15 мая. По всей видимости, сведения, которыми обладают отраслевые обозреватели, являются достоверными. Приведенные в данной заметке слайд-модули получили распространение из корейского сегмента "всемирной паутины", где они были запущены с лёгкой подачи маркетингового отдела AMD.
Но не все могут позволить старшие процессоры на данной платформе. В то время как 5800X3D стоит на рынке 360 долларов, новый 5700X3D стоит привлекательные 250 долларов. Оба чипа имеют одинаковые ограничения по энергопотреблению: TDP 105 Вт.
AMD также представила Ryzen 7 5700. В нем отсутствует интегрированная графика, поэтому он не является APU, как 5700G.
AMD A10-7800 против AMD A10-5800K
Корпорация AMD анонсирует процессор AMD Alchemy Au1550. AMD Radeon R7 series. AMD A10-5600K номинально является четырехъядерным процессором, однако «честных» модулей у него всего два, зато каждый оснащен парой вычислительных блоков. Стандартная частота — 3,8 ГГц, при автоматическом разгоне — до 4,2 ГГц. ᐅ Честные отзывы про процессор AMD A10 Richland! А также процессоры AMD Epyc поколения Milan-X с 64 ядрами и более чем 800 МБ кэш-памяти. Компания AMD представила первые в мире видеокарты на основе двухчипового графического процессора.
Обзоры электроники с AMD A10-7300 :
- AMD анонсировала новые процессоры для Socket AM4. -
- AMD анонсировала новые процессоры для Socket AM4.
- Цены и сроки выпуска
- Процессор AMD A10-5700
- AMD A10-7890K — самый мощный гибридный процессор | Новости интернет-магазина XCOM-SHOP
Мобильные процессоры Intel 10 поколения обгоняют последние чипы AMD
Иными словами, это тот же CPU, но с интегрированной графикой. Такие процессоры называют гибридными. Впоследствии идея получила кодовое название AMD Fusion, что на русский язык переводится как «слияние». Ее суть заключалась в объединении центрального микропроцессора на основе решений AMD и графического чипа на основе Radeon, создаваемых приобретенной ATI. По замыслу разработчиков, такой гибридный процессор давал бы возможность выпускать компактные, автономные, экономичные, унифицированные системы, позволяющие выполнять широкий круг задач, где не требуется обработка «тяжелой» графики.
Сказано — сделано! Эти процессоры имели два, три или четыре ядра Husky с микроархитектурой, аналогичной Athlon II, заряжались графическим ядром Sumo, унаследовавшим микроархитектуру младших представителей пятитысячной серии Radeon HD, и потребляли не более 100 Вт. Но, честно говоря, даже старший представитель семейства — AMD A8-3850 — с современными на тот момент играми и то не со всеми справлялся с огромным трудом и лишь на минимальных настройках. Именно они и стали первооткрывателями процессорной архитектуры Piledriver и первыми массовыми APU.
Переход на архитектуру VLIW4 позволил устанавливать меньше потоковых ядер, но использовать их более эффективно, что также хорошо сказалось на тепловом пакете процессора и его тактовой частоте. Мы не можем утверждать, что второе поколение APU от AMD совершило абсолютный прорыв в мощности встроенной графики, но в не изобилующие спецэффектами игры вроде Diablo 3 или World of Warcraft: Cataclysm стало возможным комфортно играть и без дискретной видеокарты. А в сравнении с Llano новый Trinity стал мощнее где-то на треть. Эти чипы по-прежнему были основаны на архитектуре Piledriver и отличались от предшественников лишь несколькими изменениями, направленными на снижение энергопотребления.
Строение Trinity Начать хотя бы с того, что теперь это «потомок» настольной архитектуры Bulldozer в плане вычислительных ядер, а вернее, второе поколение, выходящее под наименованием Piledriver. В левой части расположено два двухъядерных модуля, выполненных по 32 нм технологии, каждый их которых оснащен кэш-памятью второго уровня. Между блоками кэша находится интегрированный серверный мост. Длинная выделяющаяся полоса сверху — это контроллер памяти DDR3. К слову, официально процессоры поддерживают память с частотой вплоть до 1866 МГц, но можно использовать и более быстрые планки памяти. В нижней части находятся блоки, отвечающие за работу процессора с шиной PCI-E, а также контроллеры вывода изображения. Но самое интересное — это то, что чуть больше половины всего пространства занято графическим ядром. В сравнениях AMD старается показать, как мощная интегрированная графика помогает избавиться от лишних трат. На следующем слайде сравнивается недешевая модель конкурента Intel Core i5 с дискретной видеокартой NVIDIA GT 635 Уровень производительности графики в сравнении с GT 630 Как оказалось, процессор AMD обойдется не только дешевле этой связки, но и окажется немного быстрее в играх, при использовании разумных настроек качества, разумеется. Такая игра слов появилась, потому стало возможным использование мощностей графических ядер в обычных приложениях для работы с CPU.
В качестве одного из примеров показывается работа Winzip. Что удивительно, даже действительно слабая модель в линейке — AMD A4 5300 — оказывается быстрее, чем Core i3. А использование ускорения через OpenCL — это еще один плюс в рамках новой концепции.
С другой стороны, разлоченные модели APU разгоняются бодрее, чем их предшественники на ядре Trinity, что однозначно свидетельствует о проведенной работе над ошибками. Так, со средненьким воздушным кулером 6800K покоряет отметку в 4,7 ГГц, тогда как не всякий 5800K добирался до такой частоты без применения хорошей оверлокерской СО. Графическое же ядро по-прежнему главенствует на рынке, уделывая встроенную в Ivy Bridge HD 4000 не зря же ATi покупали! В качестве видеопамяти по-прежнему выступает оперативка, которая спеками именно для этой модели процессора рекомендуется шустрая, DDR3-2133, тогда как остальным настольным моделям Richland предписано работать с DDR3-1866. Практика показала, что при разгоне видеоядра скорость RAM начинает хорошо так влиять на показатели. Кстати, об играх.
На 6800K можно играть, особенно если довести частоту IGP до гигагерца. Так, в разрешении 1920 х 1080 играбельны абсолютно все современные игры на средних настройках графики и отключенным сглаживанием, лишь в особо тяжелых случаях с Crysis и Metro приходилось сбрасывать настройки на минимальные. Онлайновые развлечение и прочие нетребовательные к графической карте игры порой можно запускать на максимальных настройках и выставлять 4х анизотропную фильтрацию.
Благодаря этим улучшениям, производительность на такт несколько повысилась по сравнению с процессорами Richland. Производительность Исходя из рабочих частот, A10-7300 обеспечивает быстродействие на уровне Intel Core i3-4100U Haswell. Производительности вполне достаточно для рутинных задач вроде работы в офисных приложениях или браузере и просмотра видео.
Архитектура GCN 1.
AMD анонсировала новые процессоры для Socket AM4.
Улучшите это руководство Читатели помогают поддержать MSpoweruser. Мы можем получить комиссию, если вы совершите покупку по нашим ссылкам. Прочтите нашу страницу раскрытия информации, чтобы узнать, как вы можете помочь MSPoweruser поддержать редакционную команду.
Предположим, к примеру, что процессору необходимо произвести операцию умножения двух чисел. Первое число — это Data A, которое имеет адрес 1, а второе число — Data D, имеющее адрес 4. Пусть Data A хранится в первом модуле памяти, а Data В — во втором. В случае использования 128-битного контроллера памяти придется сначала загрузить 64 бита данных по адресу 1 Data A из первого модуля памяти и одновременно с этим 64 бита данных по адресу 2 Data B , которые процессору не нужны. Далее будут загружены 64 бита данных по адресу 3 Data C , которые также не нужны процессору, и 64 бита данных по адресу 4 Data D.
Как видите, применение 128-битного контроллера памяти в данном случае малоэффективно. Если же используются два независимых 64-битных контроллера памяти, то за один такт загружается 64 бита данных по адресу 1 Data A и 64 бита данных по адресу 4 Data D. Кроме применения двух независимых 64-битных контроллеров памяти вместо одного 128-битного, имеются и другие улучшения контроллера памяти. Операции чтения имеют преимущество перед операциями записи, а данные, предназначенные для записи, откладываются в специальном буфере. Кроме того, контроллер памяти умеет анализировать последовательности запросов и делать соответствующую предвыборку. Ядро процессора Как известно, процесс обработки данных процессором включает несколько этапов. В простейшем случае можно выделить четыре этапа обработки команды: выборка из кэша; выполнение; запись результатов.
Сначала инструкции и данные забираются из кэша L1, который разделен на кэш данных D-cache и кэш инструкций I-cache, — этот процесс называется выборкой. Затем выбранные из кэша инструкции декодируются в понятные для данного процессора примитивы машинные команды — такой процесс называется декодированием. Далее декодированные команды поступают на исполнительные блоки процессора, выполняются, а результат записывается в оперативную память. Процесс выборки инструкций из кэша, их декодирование и продвижение к исполнительным блокам осуществляются в предпроцессоре Front End , а процесс выполнения декодированных команд — в постпроцессоре, называемом также блоком исполнения команд Execution Engine. Стадии обработки команд принято называть конвейером обработки команд, а рассмотренный нами конвейер является четырехступенчатым. Заметьте, что каждую из этих ступеней команда проходит за один процессорный такт. Соответственно для примитивного четырехступенчатого конвейера на выполнение одной команды отводится четыре такта.
Конечно, рассмотренный нами процессор является гипотетическим. В реальных процессорах конвейер обработки команд сложнее и включает большее количество ступеней. Причина увеличения длины конвейера заключается в том, что многие команды являются довольно сложными и не могут быть выполнены за один такт процессора, особенно при высоких тактовых частотах. Поэтому каждая из четырех стадий обработки команд выборка, декодирование, выполнение и запись может состоять из нескольких ступеней конвейера. Собственно, длина конвейера — это одна из наиболее значимых характеристик любого процессора. Итак, разобрав схему гипотетического классического процессора, давайте перейдем к рассмотрению нового ядра. Структурная блок-схема одного ядра процессора на базе микроархитектуры AMD K10 показана на рис.
Структурная блок-схема одного ядра процессора на базе микроархитектуры AMD K10 Изучая структурную схему нового ядра и сравнивая ее со схемой легендарного K8, можно заметить, что общих черт у них больше, чем различий. Собственно, микроархитектура K10 наследует черты микроархитектуры K8, являясь ее логическим развитием. Используется все тот же 12-ступенчатый конвейер, как и в микроархитектуре K8. Однако, несмотря на внешнее сходство, новое ядро процессора все же претерпело существенные изменения. Итак, расскажем обо всем по порядку. Предвыборка данных и инструкций Как уже отмечалось, в случае классического гипотетического процессора исполнение кода процессором начинается с процесса выборки инструкций и данных из кэша L1. Однако для того, чтобы инструкции и данные попали в этот кэш, их нужно предварительно туда загрузить из оперативной памяти.
Такой процесс называется предвыборкой данных и инструкций из оперативной памяти. В процессорах с микроархитектурой K8 имеются два блока предвыборки Fetch Unit : один для предвыборки данных, а другой для предвыборки инструкций. Блок предвыборки данных производит предвыборку в кэш L2. В микроархитектуре AMD K10 предвыборка данных осуществляется непосредственно в кэш L1, что, по утверждению представителей компании AMD, способствует повышению производительности, несмотря на вероятность засорения кэша L1 ненужными данными. Кроме того, в блоках предвыборки процессоров с микроархитектурой K10 реализован механизм адаптивной предвыборки данных, позволяющий динамически изменять глубину предвыборки, что позволяет избежать засорения кэша L1 ненужными данными. Ну и последнее новшество, связанное с предвыборкой данных и инструкций, — это, как уже отмечалось, наличие нового блока предвыборки, расположенного в контроллере памяти. Такой блок анализирует запросы к памяти, предсказывает, какие данные понадобятся процессору, и извлекает их в собственный буфер, не занимая кэш процессора.
Одно ядро нового Core i7 для ноутбуков набирает в Geekbench более 5,5 тысяч баллов. Это сопоставимо с результатами 12-ядерного AMD Ryzen 9 3900X, который работает на более высоких частотах, имеет значительно большее тепловыделение и предназначен для настольных компьютеров. В зависимости от выбранной конфигурации системы его ядра показывают результат от 5 до 6,5 тысяч баллов, однако без разгона «планку» в 5 500 они берут с трудом.
Шок контент!!!
В зависимости от выбранной конфигурации системы его ядра показывают результат от 5 до 6,5 тысяч баллов, однако без разгона «планку» в 5 500 они берут с трудом. Шок контент!!! Какой гений это придумал? Москва, Большой Саввинский пер.
Обзор и тестирование процессора AMD A10-7800
В то же время в бенчмарке 3DMark 06 преимущество A10-5800K над A8-3850 оказалось куда более заметным 9396 очков против 6223 очков и, вероятно, реализовано за счет гораздо более быстрой графики в APU Trinity.
Мы долго-долго думали и решили предложить вам отказаться при сборке системника от... Не поверите! От видеокарты! Что это такое? Сейчас расскажем. Так было вначале Если кратко, то термин APU Accelerated Processing Unit, ускоренное обрабатывающее устройство означает микропроцессорную архитектуру, подразумевающую объединение центрального процессора с графическим на одном кристалле. Иными словами, это тот же CPU, но с интегрированной графикой.
Такие процессоры называют гибридными. Впоследствии идея получила кодовое название AMD Fusion, что на русский язык переводится как «слияние». Ее суть заключалась в объединении центрального микропроцессора на основе решений AMD и графического чипа на основе Radeon, создаваемых приобретенной ATI. По замыслу разработчиков, такой гибридный процессор давал бы возможность выпускать компактные, автономные, экономичные, унифицированные системы, позволяющие выполнять широкий круг задач, где не требуется обработка «тяжелой» графики. Сказано — сделано! Эти процессоры имели два, три или четыре ядра Husky с микроархитектурой, аналогичной Athlon II, заряжались графическим ядром Sumo, унаследовавшим микроархитектуру младших представителей пятитысячной серии Radeon HD, и потребляли не более 100 Вт.
Модели процессоров A10-7850K и A10-7700K также войдут в бандл c шутером Battlefield 4 от EA, чтобы подарить геймерам новые незабываемые впечатления от игры.
Что они там с Гипертранспортом сделать сумели, ума не приложу! Про FP -- отдельная история...
Сам не тестировал меня оно не очень интересует , но неделю назад с Делловцами говорили -- их просто смех пробрал от словосочетания "Барселона и FP"... Пока в Сети я видел сравнения только прототипов полугодовой давности.
Гибридный процессор AMD A10-5800K показывает себя в бенчмарках
Итоги теста В стенах нашей тестовой лаборатории процессор AMD A10-9700 проявил себя не лучшим образом и получил всего 34,1 балла из 100 возможных. 127 объявлений по запросу «amd a10 Socket FM2» доступны на Авито во всех регионах. Процессоры AMD А-серии под кодовым названием «Kaveri» с графикой AMD Radeon R7 обладают целым рядом удивительных преимуществ, которые значительно повысят производительность ПК и сделают игровой процесс еще более захватывающим. ᐅ Честные отзывы про процессор AMD A10 Richland! AMD A10-5600K номинально является четырехъядерным процессором, однако «честных» модулей у него всего два, зато каждый оснащен парой вычислительных блоков. Стандартная частота — 3,8 ГГц, при автоматическом разгоне — до 4,2 ГГц.
Обзор гетерогенного процессора AMD A10-7800
Что примечательно, AMD удалось сохранить сопоставимый уровень задержки обращений к памяти между поколениями CPU: 118 нс против 108 нс, из которых только 3 нс приходится на IO-блок, а 10 нс уже на саму память. Компания Intel официально анонсировала новые процессоры 10-го поколения серии Comet Lake-S. Предварительные спецификации процессоров AMD Ryzen 7000 'Raphael'. Оснащенный Security Engine от SafeNet™, сетевой процессор Au1550 представляет собой универсальную высокопроизводительную высокоинтегрированную защищенную систему на кристалле (SOC) с малым потреблением. В итоге пользователи, которые приобретут процессор AMD FX-8350, всего за 195 долларов (аналог от компании Intel – i5 3570K, стоимостью 235 долларов), получат 8 процессорных ядер, работающих с частотой до 4,2 ГГц!!! и 8 Мбайт кеш-памяти уровня L3.
AMD представляет процессор Alchemy Au1550 с интегрированной поддержкой безопасной сетевой обработки
хоть и старый, но всё ещё можно юзать. Процессор AMD A10 7800 как по мне показался довольно хорошим для своего времени, но я думаю не стоит покупать его так как уже существует более хорошие варианты покупок. Ознакомиться с отзывами покупателей, узнать достоинства и недостатки, поделиться своим отзывом о Процессор AMD PRO A10-8770 OEM. Процессор AMD A10-5700 разработан на основе 32 nm технологического процесса и архитектуры Trinity. Сравниваем AMD A10-7800 и AMD A10-5800K, и выявляем кто лучше по техническим характеристикам, в играх и бенчмарках. Geekbench 5, Cinebench R20, Cinebench R15 and FP32 iGPU (GFLOPS).
Тест процессора AMD A10-9700
Про FP -- отдельная история... Сам не тестировал меня оно не очень интересует , но неделю назад с Делловцами говорили -- их просто смех пробрал от словосочетания "Барселона и FP"... Пока в Сети я видел сравнения только прототипов полугодовой давности. Ну "не шмагли" они, чего повторять аргументы полугодовой давности, когда процессор пощупать было нельзя!
Декодер транслирует x86-инструкции в простейшие машинные команды микрооперации , называемые micro-ops. Сами х86-команды могут быть переменной длины, а вот длина микроопераций уже фиксированная. Инструкции x86 разделяются на простые Small x86 Instruction и сложные Large x86 Instruction. Простые инструкции при декодировании представляются с помощью одной-двух микроопераций, а сложные команды — тремя и более микрооперациями. Простые инструкции отсылаются в аппаратный декодер, построенный на логических схемах и называемый DirectPath, а сложные — в микропрограммный Microcode Engine декодер, называемый VectorPath. Этот декодер представляет собой своеобразный программный процессор. Он содержит программный код, хранящийся в MIS Microcode Instruction Sequencer , на основе которого воспроизводится последовательность микроопераций.
Аппаратный декодер DirectPath является трехканальным и может декодировать за один такт три простые инструкции, если каждая из них транслируется в одну микрооперацию, либо одну простую инструкцию, транслируемую в две микрооперации, и одну простую инструкцию, транслируемую в одну микрооперацию, либо две простые инструкции за два такта, если каждая инструкция транслируется в две микрооперации полторы инструкции за такт. Таким образом, за каждый такт аппаратный декодер DirectPath выдает три микрооперации. Микропрограммный декодер VectorPath также способен выдавать по три микрооперации за такт при декодировании сложных инструкций. При этом сложные инструкции не могут декодироваться одновременно с простыми, то есть при работе трехканального аппаратного декодера микропрограммный декодер не используется, а при декодировании сложных инструкций, наоборот, бездействует аппаратный декодер. Микрооперации, полученные в результате декодирования инструкций в декодерах DirectPath и VectorPath, поступают в буфер Pack Buffer, где они объединяются в группы по три микрооперации. В том случае, когда за один такт в буфер поступает не три, а одна или две микрооперации в результате задержек с выбором инструкций , группы заполняются пустыми микрооперациями, но так, чтобы в каждой группе было ровно три микрооперации. Далее группы микроинструкций отправляются на исполнение. Если посмотреть на схему декодера в микроархитектурах K8 и K10, то видимых различий, казалось бы, нет рис. Действительно, принципиальная схема работы декодера осталась без изменений. Разница в данном случае заключается в том, какие инструкции считаются сложными, а какие — простыми, а также в том, как декодируются различные инструкции.
Так, в микроархитектуре K8 128-битные SSE-инструкции разбиваются на две микрооперации, а в микроархитектуре K10 большинство SSE-инструкций декодируется в аппаратном декодере как одна микрооперация. Кроме того, часть SSE-инструкций, которые в микроархитектуре K8 декодируются через микропрограммный VectorPath-декодер, в микроархитектуре K10 декодируются через аппаратный DirectPath-декодер. Декодирование команд в микроархитектурах K8 и K10 Кроме того, в микроархитектуре K10 в декодер добавлен специальный блок, называемый Sideband Stack Optimizer. Не вникая в подробности, отметим, что он повышает эффективность декодирования инструкций работы со стеком и, таким образом, позволяет переупорядочить микрооперации, получаемые в результате декодирования, чтобы они могли выполняться параллельно. Диспетчеризация и переупорядочивание микроопераций После прохождения декодера микрооперации по три за каждый такт поступают в блок управления командами, называемый Instruction Control Unit ICU. Главная задача ICU заключается в диспетчеризации трех микроопераций за такт по функциональным устройствам, то есть ICU распределяет инструкции в зависимости от их назначения. Для этого используется буфер переупорядочивания ReOrder Buffer, ROB , который рассчитан на хранение 72 микроопераций 24 линии по три микрооперации , — рис. Каждая группа из трех микроопераций записывается в свою линию. Из буфера переупорядочивания микрооперации поступают в очереди планировщиков целочисленных Int Scheduler и вещественных FPU Scheduler исполнительных устройств в том порядке, в котором они вышли из декодера. Планировщик для работы с вещественными числами FPU Scheduler рассчитан на 36 инструкций, и его основная задача заключается в том, чтобы распределять команды по исполнительным блокам по мере их готовности.
Просматривая все 36 поступающих инструкций, FPU-планировщик переупорядочивает следование команд, строя спекулятивные предположения о дальнейшем ходе программы, чтобы создать несколько полностью независимых друг от друга очередей инструкций, которые можно выполнять параллельно. Диспетчеризация и переупорядочивание микроопераций Планировщик инструкций для работы с целыми числами Int Scheduler образован тремя станциями резервирования RES , каждая из которых рассчитана на восемь инструкций. Все три станции, таким образом, образуют планировщик на 24 инструкции. Этот планировщик выполняет те же функции, что и FPU-планировщик. Различие между ними заключается в том, что в процессоре имеется семь функциональных исполнительных блоков для работы с целыми числами три устройства ALU, три устройства AGU и одно устройство MULT. Выполнение микроопераций После того как все микрооперации прошли диспетчеризацию и переупорядочивание в соответствующих планировщиках, они могут быть выполнены в соответствующих исполнительных устройствах рис. Выполнение микроопераций Блок операций с целыми числами состоит из трех распараллеленных частей. По мере готовности данных планировщик может запускать на исполнение из каждой очереди одну целочисленную операцию в устройство ALU и одну адресную операцию в устройство AGU. Количество одновременных обращений к памяти ограничено двумя. Таким образом, за каждый такт может запускаться на исполнение три целочисленных операции, обрабатываемые в устройствах ALU, и две операции с памятью, обрабатываемые в устройствах AGU.
Отметим, что в микроархитектуре K8 при выполнении операций с памятью имеется одно существенное ограничение. Дело в том, что операции обращения к памяти должны идти в том виде, в котором они записаны в коде программы, то есть более поздние в программе операции обращения к памяти не могут выполняться перед более ранними. Понятно, что такое ограничение может существенно отразится на эффективности выполнения программного кода, поскольку нередко блокирует выполнение программы на несколько тактов.
В то же время у AMD тоже есть козырь: ее гибридные процессоры так называемые APU, Accelerated Processing Unit являются выгодным предложение с точки зрения игровой производительности. Встроенные в них графические ускорители позволяют запускать большинство современных игр и при этом не тратиться на дискретную видеокарту. Теперь интригующую новинку уже можно купить в нашем магазине. Новая модель тоже относится к поколению Godavari, представленному в прошлом году. В основе нового процессора лежит два вычислительных модуля Steamroller. Это означает, что чип оснащен четырьмя ядрами. В частности, новинка обладает 4 МБ кэш-памяти второго уровня.
Для увеличения пропускной способности подсистемы памяти используется одновременный доступ к двум различным модулям памяти по двум 64-битным каналам двухканальный режим работы. Это позволяет теоретически в два раза увеличить пропускную способность подсистемы памяти, поскольку за каждый такт работы контроллера памяти можно считывать две порции данных объемом по 64 бита, то есть всего 128 бит. Однако применение двухканальной схемы работы контроллера памяти имеет и свои нюансы. Проблема заключается в том, что если процессору потребовались 64 бита данных данные A , хранящиеся по адресу 1, то вместе с ними одновременно будут считаны и 64 бита данных данные B , хранящихся по соседнему адресу 2 в другом модуле памяти. В операциях линейного чтения больших объемов данных такая ситуация лишь удваивает пропускную способность памяти. Однако может оказаться так, что процессору не нужны считанные данные B, а нужны только данные A. В этом случае двухканальный режим работы памяти не позволяет получить выигрыш в производительности, и соответственно 128-битный контроллер памяти будет функционировать с эффективностью одного 64-битного. Применение двух независимых 64-битных контроллеров памяти, как в микроархитектуре AMD K10, позволяет одновременно загружать блоки данных с произвольными адресами из различных модулей памяти. Предположим, к примеру, что процессору необходимо произвести операцию умножения двух чисел. Первое число — это Data A, которое имеет адрес 1, а второе число — Data D, имеющее адрес 4.
Пусть Data A хранится в первом модуле памяти, а Data В — во втором. В случае использования 128-битного контроллера памяти придется сначала загрузить 64 бита данных по адресу 1 Data A из первого модуля памяти и одновременно с этим 64 бита данных по адресу 2 Data B , которые процессору не нужны. Далее будут загружены 64 бита данных по адресу 3 Data C , которые также не нужны процессору, и 64 бита данных по адресу 4 Data D. Как видите, применение 128-битного контроллера памяти в данном случае малоэффективно. Если же используются два независимых 64-битных контроллера памяти, то за один такт загружается 64 бита данных по адресу 1 Data A и 64 бита данных по адресу 4 Data D. Кроме применения двух независимых 64-битных контроллеров памяти вместо одного 128-битного, имеются и другие улучшения контроллера памяти. Операции чтения имеют преимущество перед операциями записи, а данные, предназначенные для записи, откладываются в специальном буфере. Кроме того, контроллер памяти умеет анализировать последовательности запросов и делать соответствующую предвыборку. Ядро процессора Как известно, процесс обработки данных процессором включает несколько этапов. В простейшем случае можно выделить четыре этапа обработки команды: выборка из кэша; выполнение; запись результатов.
Сначала инструкции и данные забираются из кэша L1, который разделен на кэш данных D-cache и кэш инструкций I-cache, — этот процесс называется выборкой. Затем выбранные из кэша инструкции декодируются в понятные для данного процессора примитивы машинные команды — такой процесс называется декодированием. Далее декодированные команды поступают на исполнительные блоки процессора, выполняются, а результат записывается в оперативную память. Процесс выборки инструкций из кэша, их декодирование и продвижение к исполнительным блокам осуществляются в предпроцессоре Front End , а процесс выполнения декодированных команд — в постпроцессоре, называемом также блоком исполнения команд Execution Engine. Стадии обработки команд принято называть конвейером обработки команд, а рассмотренный нами конвейер является четырехступенчатым. Заметьте, что каждую из этих ступеней команда проходит за один процессорный такт. Соответственно для примитивного четырехступенчатого конвейера на выполнение одной команды отводится четыре такта. Конечно, рассмотренный нами процессор является гипотетическим. В реальных процессорах конвейер обработки команд сложнее и включает большее количество ступеней. Причина увеличения длины конвейера заключается в том, что многие команды являются довольно сложными и не могут быть выполнены за один такт процессора, особенно при высоких тактовых частотах.
Поэтому каждая из четырех стадий обработки команд выборка, декодирование, выполнение и запись может состоять из нескольких ступеней конвейера. Собственно, длина конвейера — это одна из наиболее значимых характеристик любого процессора. Итак, разобрав схему гипотетического классического процессора, давайте перейдем к рассмотрению нового ядра. Структурная блок-схема одного ядра процессора на базе микроархитектуры AMD K10 показана на рис. Структурная блок-схема одного ядра процессора на базе микроархитектуры AMD K10 Изучая структурную схему нового ядра и сравнивая ее со схемой легендарного K8, можно заметить, что общих черт у них больше, чем различий. Собственно, микроархитектура K10 наследует черты микроархитектуры K8, являясь ее логическим развитием. Используется все тот же 12-ступенчатый конвейер, как и в микроархитектуре K8. Однако, несмотря на внешнее сходство, новое ядро процессора все же претерпело существенные изменения. Итак, расскажем обо всем по порядку. Предвыборка данных и инструкций Как уже отмечалось, в случае классического гипотетического процессора исполнение кода процессором начинается с процесса выборки инструкций и данных из кэша L1.
Цены и сроки выпуска
- Содержание
- Apple A10 - Wikipedia
- Процессор AMD A10-4600M – подробности о мобильном представителе Trinity
- Таблицы видеокарт
- Процессор AMD A10-6800K
- Мобильные процессоры Intel 10 поколения обгоняют последние чипы AMD
Навигация по записям
- Общая информация
- AMD и NVIDIA представили мощнейшие графические процессоры для ИИ
- AMD представляет процессор Alchemy Au1550 с интегрированной поддержкой безопасной сетевой обработки
- AMD A10 с графикой Radeon R7 – самый игровой из гибридных процессоров!
- Подробно разбираем, почему долгожданные Intel Core 10-ого поколения — полный провал
Обзор: amd a10
Geekbench 5, Cinebench R20, Cinebench R15 and FP32 iGPU (GFLOPS). Новейшие процессоры AMD A10-7700K и AMD A10-7850K – это настоящий кладезь технологий и великолепный результат многолетнего труда лучшего производителя процессоров со встроенной графикой. В базе данных популярного бенчмарка Geekbench появились результаты тестирования новейших процессоров Intel 10 поколения. низковольтный процессор, основанный на архитектуре Kaveri. AMD Radeon R7 series. Рейтинг процессоров AMD 2023 года ТОП–10 лучших процессоров AMD Какой процессор АМД лучше для игр? Например, по итогам 2022 года NVIDIA заняла большую часть рынка видеокарт, тогда как AMD ушла ниже 10%.