Презентована архитектура Lunar Lake от Intel
Во время Intel Tech Tour 2024 состоялась презентация Lunar Lake, из которой стало известно об основных модификациях. Преимущественно эти процессоры были спроектированы для ноутбуков, однако некоторые из улучшений могут быть перенесены на Arrow Lake и использоваться на ПК.
Для достижения желаемого уровня производительности и мощности в новой архитектуре Lunar Lake были проведены значительные оптимизации. Наиболее значительные изменения претерпели ядра Skymont и E-cores. Интегрированная графика Xe2, также существенным образом повлияла на повышение производительности видеочипа.
Lunar Lake отличается новейшим нейронным процессором, который имеет производительность 48 TOPS и может использоваться для ИИ. Если учитывать общую производительность, то она составляет 120 TOPS, и это будет иметь значительное влияние на возможности искусственного интеллекта.
Одной из целей внедрения мобильных процессоров этой серии стало обеспечение энергоэффективности. Планируется также использование этой архитектуры в следующих проектах от Intel (Panther Lake и Arrow Lake).
Для создания лучшей из возможных архитектур, Intel использовали техпроцесс N3B от TSMC. Такой выбор особенно повлиял на характеристики вычислительных ядер, NPU, и встроенной графики. Относительно контроллера, компания решила использовать техпроцесс TSMC N6. Только плитка 22FFL Foveros была разработана Intel.
Структура SoC Lunar Lake
Строение процессоров Lunar Lake будет иметь свои особенности, такие как - 4 Е-ядра и 4 Р-ядра. На базовой плитке будут размещаться N6, TSMC N3B и элемент жесткости. Два стека памяти будут размещены на микросхеме в конфигурациях 32 и 15 ГБ. Гарантированная пропускная способность на чип будет до 8,5 ГТ/с.
Вычислительная плитка будет состоять из чипов NPU 4.0, Xe2 и основных ядер. Для повышения частоты запросов, плитка будет иметь 8 МБ «бокового кэша», который в свою очередь будет использоваться совместно вычислительными блоками.
Энергоэффективные ядра
Значительный прогресс был достигнут с использованием Skymont и усовершенствованиями, которые касаются ядра Lion Cove. Если говорить конкретнее, то произойдет 68 процентное увеличение IPC в работе с плавающей запятой, и 38 процентное - в целочисленных нагрузках. В таком случае, почти в 4 раза увеличится производительность в выполнении многопоточных задач, и до 2 раз в выполнении однопоточных.
Компания планирует также положительные изменения в векторной производительности, это станет возможным благодаря переходу от двух 128-битных векторных каналов к четырем. Также будут изменения касаемо минимизации задержки.
Предыдущие энергоэффективные ядра имели кэш 2 МБ, а теперь эта цифра будет значительно увеличена до 4 МБ.
Производительные ядра
Неожиданным шагом от компании стало удаление Hyperthreading, что обеспечивало средний прирост IPC в 14 процентов. Было обнаружено что гиперпоточность которая положительным образом влияет на увеличение IPC в многопоточной нагрузке, становится не очень целесообразной в гибридном дизайне. Intel сообщает, что в зависимости от мощности чипа, общая производительность составит 10 - 18 %.
Благодаря удалению Hyperthreading, ядро стало меньше и появилась возможность использования других изменений, таких как увеличение ядер GPU или Е-ядер. Благодаря этому важному шагу, компания смогла повысить эффективность на 15 процентов и производительность - 10 %.
Если сравнивать с предыдущей архитектурой, то блок предсказаний был расширен в 8 раз. Кроме того, пропускная способность от кэша до L2 была утроена, а также пропускная способность выборки инструкций удвоена. Что касается микроопераций то их очередь такого была увеличена до 192.
Графика Intel Xe2
Графический процессор Xe2 будет значительно отличаться производительность к использованию искусственного интеллекта и будет иметь увеличенную общую производительность в полтора раза. Кроме новых процессоров Lunar Lake, Xe2 также будет доступен в игровых видеокартах.
Ядро второго поколения в архитектуре Xe характеризуется увеличением кэша, увеличением поддержки некоторых типов данных, и модификация векторных механизмов. Графический процессор состоит из элементов с фиксированными функциями, визуализации что значительным образом влияет на текстуры и геометрию.
Векторный механизм поддерживает следующие инструкции BF16, INT4, INT2, FP16 это в необходимо для операций, связанных с искусственным интеллектом. В блоке визуализации также состоялось значительное количество улучшений и ускорений.
Видеочип Lunar Lake имеет 8 блоков трассировки лучей, 64 векторных механизмов, 2 ядра Xe, и еще много других компонентов.
Контроллер и NPU 4.0
NPU значительно превысил характеристики конкурентов. Отдельный чип необходим в первую очередь для задач, касающихся ИИ, а также для экономии аккумулятора. В целом производительность Lunar Lake - 120 TOPS.
В общем произошло значительное количество улучшений в архитектуре, в особенности механизмов DMA и MAC, 6 механизмов нейронного вычисления, и многое другое. По сравнению с предыдущим поколением NPU, пропускная способность значительно увеличилась.
Плитка контроллера имеет все функции ввода-вывода, а также контроллеры памяти. Компания заявляет, что ноутбуки Lunar Lake будут иметь минимум 2 порта подключения.