Вычислительная техника и микропроцессоры Тема 4 32++ разрядные МП и МК и системы на их основе.

Презентация:



Advertisements
Похожие презентации
Автор: учитель информатики Комкова Мария Сергеевна, г.Москва.
Advertisements

Архитектуры с параллелизмом на уровне команд. Два класса Суперскалярные процессоры Процессоры с длинным командным словом.
Процессор В ПК устройством, которое обрабатывает все виды информации (числовую, текстовую, графическую, видео- и звуковую), является МИКРОПРОЦЕССОР или.
Процессор – это центральное устройство компьютера. Он выполняет команды находящейся в оперативной памяти программы и взаимодействует.
Кэш - память. Кэш-память это высокоскоростная память произвольного доступа, используемая процессором компьютера для временного хранения информации.
Архитектура микропроцессоров И ее эволюция. Процессор и память: Команды и данные.
Иногда говорят «персональный компьютер». Уточнение «персональный» здесь не случайно – это значит свой, личный, доступный большинству людей, ведь существует.
Архитектуры с параллелизмом на уровне команд. Два класса Суперскалярные процессоры Процессоры с длинным командным словом.
Характеристика процессора и внутренней памяти компьютера.
Общая структура и состав персонального компьютера.
Системы с несколькими конвейерами В процессорах Intel конвейер появился только начиная с 486 модели. Но уже в Pentium-е было два конвейера из 5 стадий:
Процессор – это блок, предназначенный для автоматического считывания команд программы, их расшифровки и выполнения.
Учебный курс Введение в цифровую электронику Лекция 5 Обмен информацией в микропроцессорной системе кандидат технических наук, доцент Новиков Юрий Витальевич.
Введение в параллельную обработку. Уровни параллелизма в процессорах Параллелизм данных (DLP – Data Level Parallelism) Параллелизм команд (ILP – Instruction.
Микропроцессор Центральный процессор (ЦПУ, CPU, от англ. Central Processing Unit) это основной рабочий компонент компьютера, который выполняет.
Архитетура компьютерных систем. Архитектура системы команд как интерфейс между программным и аппаратным обеспечением Архитектура системы команд.
МикропроцессорыМикропроцессоры. Микропроцессор Микропроцессор процессор (устройство, отвечающее за выполнение арифметических, логических операций и операций.
Основная микросхема компьютера, в которой и производятся все вычисления. На процессоре установлен большой медный ребристый радиатор, охлаждаемый вентилятором.
Процессоры История платформы процессоров на архитектуре х86 Презентация: Бурдина Алексея Группы: 331.
Архитектура ЭВМ (лекция 7) проф. Петрова И.Ю. Курс Информатики.
Транксрипт:

Вычислительная техника и микропроцессоры Тема разрядные МП и МК и системы на их основе

Лекция 12 Содержание Методы повышения производительности современных МП Иерархия памяти МПС, организация кеш- памяти Архитектура Pentium и др.

Тенденции развития микропроцессоров Современный уровень развития микропроцессорной техники достиг такого уровня что, в течение 5 лет происходит смена двух-трех поколений микропроцессоров. По прогнозам аналитиков (2004 года) к 2012 году число транзисторов в микропроцессоре достигнет до 1 млрд., тактовая частота возрастет до 10 ГГц, а производительность достигнет 100 млрд. оп/с.

4.1 Методы повышения производительности МП и МПС Делятся на несколько групп Технологические Архитектурные Уровня системы команд Усовершенствование системных шин, многоуровневая организация памяти и.т.д.

4.1 Технологические методы повышения производительности МП повышение тактовой частоты, увеличение числа транзисторов в кристалле, увеличение числа слоев металлизации Каждый из этих методов сталкивается со своими трудностями

Повышение тактовой частоты Несмотря на рост быстродействия ключей, прекратился рост тактовых частот процессоров, хотя раньше это был синоним производительности. Остается только увеличивать число ядер - 2, 4, 8, 80, кто больше? Несколько лет назад Intel штурмовала вершины тактовых частот, и в обиходе были цифры 10 ГГц и выше. В начале прошлого года снизили планку до 4-:- 5 ГГц. Но прошел год, пропали упоминания и о 5 ГГц. С некоторого времени существует тенденция, когда максимальная тактовая частота процессоров с переходом на более тонкие технологические процессы, по крайней мере, не растет. (См. таблицу).

Повышение тактовой частоты Год Техноло- гия мкм ,090,0650, Длина канала нм Макс. тактовая частота процессора МГц /Модель 200/ Pent / Pent ium Pro 1000/ Pent- ium III 3800/ Pent- ium * / Quad- Core Xeon Прог- ноз 3000

Повышение тактовой частоты При переходе с 130нм на 90нм тех. процесс прирост тактовой частоты непропорционален, а при переходе с 90нм тех. процесса к 65 нм прироста вообще не было. Это бросается в глаза. Еще одно явное подтверждение сказанного, Intel была вынуждена сообщить о снятии из своих планов производства процессора Pentium 4 с тактовой частотой 4ГГц. Это сделано не только по причине тепловыделения, но и из-за их нестабильной работы. Вместо повышения тактовой частоты фирма применила многоядерность.

Помехи при повышении частоты Помехи в цепях питания микросхем известны, это явление всегда рассматривалось с точки зрения помехоустойчивости узлов выполненных на быстродействующих интегральных микросхемах. Появление чипов с сотнями миллионов ключей, каждый из которых имеет быстродействие на много порядков большее приобрело качественно новое значение. Изменился не только уровень помехи, но она приобрела еще и энергетическую составляющую, расширился спектральный диапазон. Старыми методами проблема стала нерешаема.

Потребление мощности Для увеличения скорости вычислений производители применили известный способ повышения производительности, используемый в серверах. Это параллельное вычисление на нескольких процессорах или многоядерных процессорах, что иногда является полным аналогом многопроцессорных серверов. Пока ядер 2 и 4. И как предел стремления повысить производительность, это 80 ядерный чип представленный Intel. Он представляет собой 32-битный процессор, содержащий 100 млн. транзисторов, с рабочим напряжением питания 0,95В, работающий на частоте 3,16 ГГц и потребляющий 98 Вт. После поднятия тактовой частоты до 4ГГц производительность возросла, но мощность превысила 120 Вт.

Увеличение числа транзисторов Для увеличение числа транзисторов используются более совершенные технологические процессы с меньшими проектными нормами а также более плотная компоновка функциональных блоков кристалла. Но при минимальном размере деталей внутренней структуры интегральных схем 0,1-0,2 мкм достигается оптимум, ниже которого все характеристики транзистора быстро ухудшаются. При этом начинают проявляться эффекты квантовой связи и пр.

Ограничения Снижение размера транзистора процессора ограничено: Чисто технологическими сложностями, влияющими на стабильность и повторяемость структур процессоров. Физическими закономерностями, ограничивающими минимальные размеры КМОП транзистора. Помехами, генерируемыми процессорами. Верхняя граничная частота, которых растет со снижением технологических норм. Что в свою очередь приводит к саморазогреву структуры процессора.

Увеличение числа транзисторов Проектная норма 0,05-0,1 мкм ( нм) - это нижний предел твердотельной микроэлектроники, основанной на классических принципах синтеза схем. Сейчас работы в области нанотехнологий ведутся в четырех основных направлениях: - молекулярная электроника; - биохимические и органические решения; - квазимеханические решения на основе нанотрубок; - квантовые компьютеры. Три последних пребывают пока еще в значительной степени на уровне теоретических работ. Наибольшие практические результаты достигнуты в области молекулярной электроники.

Число слоев металлизации Увеличение числа слоев металлизации (от 4-5 до 10-12)– тоже не панацея. Кстати, различные фирмы по-разному подходят к этой технологии.

4.1 Архитектурные методы повышения производительности МП Конвеерная обработка Суперскалярная архитектура (Увеличение числа функциональных устройств) Увеличение объема внутрикристальной памяти

Конвеерная обработка команд

Повышение степени внутреннего параллелизма Каждое семейство микропроцессоров демонстрирует в следующем поколении увеличение числа функциональных исполнительных устройств и улучшение их характеристик, как временных (сокращение числа ступеней конвейера и уменьшение длительности каждой ступени), так и функциональных (введение ММХ расширений системы команд и т.д.).

Упрощенная структура суперскалярного МП

Увеличение числа функциональных устройств (ограничения) Основное препятствие на пути повышения производительности за счет увеличения числа функциональных устройств – это организация загрузки этих устройств полезной работой, которую можно проводить динамически путем исследования программного кода на стадии исполнения и статически на уровне компиляции программ. Первый подход используется в суперскалярных микропроцессорах, второй – в микропроцессорах с длинным командным словом

Методы уровня системы команд Команды, выбранные на исполнение, могут следовать друг за другом в неизменном порядке, определяемом при их выборке из памяти, либо их порядок может изменяться, позволяя исполнять команды, для которых готовы операнды. Внеочередное исполнение команд предполагает следующие механизмы: переименование регистров с целью устранения ресурсных зависимостей «запись после чтения» и «запись после записи»; предсказание переходов; динамическое назначение команд на исполнительные устройства, включая изменение порядка исполнения по сравнению с порядком, в котором эти команды были извлечены

Увеличение объема внутрикристальной памяти Современное состояние микроэлектроники характеризуется растущим разрывом между скоростью обработки данных в микропроцессорах и быстродействием внешней оперативной памяти. Время выполнения однотактной команды микропроцессора на порядок меньше времени доступа к памяти вне кристалла. В таких условиях прибегают к построению многоуровневой иерархической памяти с использованием внутрикристальной кэш-памяти и применению мультитредовой архитектуры МТА, в которой задержка доступа в память в одном процессе «скрывается» за временем выполнения других процессов

Иерархия памяти в современных МПС Регистровый файл Кеш 1 уровня Кеш 2 уровня Основная память Внешние носители Флеш-память HDD CD/DVD FDD и др.

Разновидности кеш-памяти Существует несколько типов Кеш-памяти. По типу записи кеш может быть со сквозной записью, с обратной записью, либо комбинацией того и другого. При записи в кеш со сквозной записью обновляется как кеш-память, так и основная память; кеширование с обратной записью обычно обновляет только кеш-память. Кеширование с обратной записью обновляет главную память только при выполнении операции обратной записи, которая запускается при необходимости, например для распределения новых строк памяти в уже заполненном кеше. Операции обратной записи также запускаются механизмами, используемыми для поддержания непротиворечивости кеша.

Разновидности кеш-памяти По типу хранения наиболее сложным является ассоциативный кеш. Ассоциативная кеш-память имеет дополнительную область для каждого блока памяти, которая называется тегом. Когда в ассоциативную память передается адрес, каждый тег одновременно сравнивается с этим адресом. Если тег совпадает с адресом, то обеспечивается доступ к блоку памяти, связанному с этим тегом. Это называется кеш-попаданием. Если такое совпадение не произошло, то кеш сообщает о кеш- промахе. В случае кэш-промаха требуется дополнительный цикл шины для обращения в основную оперативную память.

Разновидности кеш-памяти Кеши в мультипроцессорных системах требуют особого рассмотрения. Если один процессор выполняет доступ к данным, кешируемым в другом процессоре, требуется обеспечить правильность принимаемых им данных. Если же он выполняет модификацию данных, то все остальные процессоры, обращающиеся к этим данным, должны верно принять модифицированные данные. Это свойство называется непротиворечивостью кеша. В многопроцессорных системах обеспечение непротиворечивости кеша может потребовать вмешательства со стороны системного программного обеспечения.

Параметры кеш-памяти

Pentium Pentium был первым CISC процессором использующим суперскалярную архитектуру.CISC Pentium имеет два конвейера, которые могут выполнять две инструкции одновременно. Каждый конвейер имеет свое арифметическо- логическое устройство (ALU), совокупность устройств генерации адреса и интерфейс кэ­ ширования данных.

Pentium Двойной конвейер Pentiumа выполняет простую команду за пять этапов: предварительная подготовка, первое декодирование, второе декодирование ( генерация адреса ), выполнение обратная выгрузка результата.

Упрощенная схема 32-разр х86

Pentium u-конвейер основной, выполняет все операции над целыми и вещественными числами; v-конвейер вспомогательный, выполняет только простые операции над целыми и частично над вещественными. Чтобы старые программы (для 486) в полной мере использовали возможности такой архитектуры, необходимо их перекомпилировать. перекомпилировать

Особенности Pentium 64-битная шина данных. Позволяет процессору Pentium обмениваться вдвое большим объемом данных с оперативной памятью, чем 486 за один шинный цикл (при одинаковой тактовой частоте). Механизм предсказания адресов ветвления. Применяется для сокращения времени простоя конвейеров, вызванного задержками выборки команд при скачкообразном изменении счетчика адреса во время выполнения команд ветвления. Для этого в процессоре используется буфер адреса ветвления BTB (Branch Target Buffer), использующий алгоритмы предсказания адресов ветвления.ветвления BTB

Особенности Pentium В процессорах Pentium используется кэш- память первого уровня (кэш L1) объемом 16Кб, разделенная на 2 сегмента: 8Кб для данных и 8Кб для инструкций. По сравнению с 486 МП изменён и механизм кэширования.кэш- память Улучшенный блок вычислений с плавающей запятой (FPU, сопроцессор).FPUсопроцессор Cимметричная многопроцессорная работа (SMP).SMP

IntelIntel Pentium II процессор архитектуры x86, анонсированный 7 мая 1997 года. Ядро Pentium II представляет собой модифицированное ядро P6 (впервые использованное в процессорах Pentium Pro).x867 мая1997 годаPentium Pro Основными отличиями от предшественника являются увеличенный с 16 до 32 Кб кэш первого уровня и наличие блока SIMD-инструкций MMX (появившихся немногим ранее в Pentium MMX), повышена производительность при работе с 16-разрядными приложениями.SIMDMMXPentium MMX В системах, построенных на базе процессора Pentium II, повсеместное применение нашли память SDRAM и шина AGP.SDRAM AGP

Три основных направления Начиная с Pentium II, Intel выделяет три основных направления в производстве процессоров: Pentium – высокопроизводительный процессор для рабочих станций и домашнего применения, Celeron – бюджетный вариант для офиса или дома, Xeon – серверный вариант, обладающий повышенной производительностью.