Исследователи из Государственного Университета Северной Каролины разработали новую технологию, которая позволит увеличить производительность гибридных чипов AMD Fusion примерно на 20%. Для этого пришлось воспользоваться такими особенностями архитектуры х86, как предварительная выборка данных и большая кэш-память, чтобы ускорить выполнение параллельных задач на графических процессорах.
«Современный подход производителей, выпускающих смешанные чипы с центральным и графическим процессорами на одном кристалле, снижает расходы на их производство и делает компьютерные вычисления более энергоэффективными. Тем не менее, CPU и GPU по-прежнему работают почти независимо друг от друга, и редко вместе выполняют программы, так что в этом плане остаётся пространство для повышения производительности. Именно в более тесном сотрудничестве процессоров и заключается наш подход».
Центральные процессоры сейчас имеют меньше вычислительной мощности, чем графические, но более приспособлены для решения сложных задач. Они обладают большим количеством блоков специального назначения, отсутствующих в GPU.
«Мы позволяем графическому процессору взять на себя выполнение вычислительных задач, а центральные процессоры будут им в этом помогать, осуществляя предварительную выборку данных из памяти. Таким образом, процессоры занимаются теми задачами, для которых они лучше всего приспособлены». Образно говоря, в этой связке CPU является «мозгом», который принимает решения и осуществляет гибкую выборку данных, а GPU «мускулами», которые обрабатывают предоставленные ему данные.
После того, как центральный процессор запускает предназначенное для GPU приложение, графическое ядро генерирует программу для предварительного выполнения, используя предлагаемый разработчиками алгоритм компиляции и содержащую команды доступа к памяти. Программа не производит никаких операций с данными с плавающей точкой и исполняется до того, как в дело вступает графический процессор, так как центральный процессор обладает более высокими тактовыми частотами и более высоким уровнем параллельного выполнения команд. Механизм предварительной выборки работает с кеш-памятью второго уровня центрального процессора, в результате данные, с которыми работает GPU, хранятся в памяти L3, что приводит к существенному сокращению времени задержек при обмене данными. Предварительная программа контролируется приложениями на пользовательском уровне и предоставляет высокий уровень точности исполнения и гибкости. Эксперименты, проведённые в ряде бенчмарков, показали, что что такой подход увеличивает скорость вычислений в среднем на 21,4%, а максимум достигал величины 113%.
Статья «CPU-Assisted GPGPU on Fused CPU-GPU Architectures» будет представлена в конце февраля на 18-м международном симпозиуме высокопроизводительных компьютерных архитектур.
В середине прошлого года компания AMD выпустила ускоренные процессорные элементы Llano, которые своим появлением, казалось, ознаменовали закат брендов Athlon II и Sempron. Эти основанные на архитектуре К10 процессоры принято относить к моделям начального и среднего уровней. Однако, несмотря на появление новой А-серии и некоторых других семейств процессоров, AMD продолжает использовать названия Athlon II и Sempron в продуктах на архитектуре Llano без встроенного графического чипа. Так, прошлым летом вышел 4-ядерный Athlon II 631 под сокет FM1 с тактовой частотой 2,6 ГГц, затем в ноябре Athlon II 651.
Вчера к ним добавилось две новых модели: Athlon II X4 641 и 638 уже фигурируют в прайс-листе компании. Первый из них является 4-ядерным процессором с тактовой частотой 2,8 ГГц. Каждое ядро обладает кэш-памятью L2 объёмом 1 Мб. Процессор поддерживает стандартный для К10 набор команд SIMD вплоть до SSE3, AMD64, защиту Enhanced Virus и виртуализацию. Энергопотребление у данной модели 100 Вт. Стоимость новинки составляет в онлайн-магазинах $90-95 при рекомендуемой производителем розничной цене $81.
Процессор Athlon II 638 также является 4-ядерным с L2 4 Мб, тактовой частотой 2,7 ГГц и TDP 65 Вт. Остальные его характеристики, включая и стоимость, идентичны показателям Athlon II X4 641.
Компания Intel выпустила новые твердотельные накопители, серию SSD 520, впервые с контроллером SandForce SATA 6 Гбит/с в своём составе. Серия содержит пять моделей накопителей с ёмкостями от 60 Гб до 480 Гб.
Несмотря на различную вместимость, все они построены на контроллере SandForce SF-2281 SATA 6 Гбит/с и 25-нм флэш-памяти MLC NAND производства IMFT (совместное предприятие Intel и Micron). Эта конфигурация сходна с другими накопителями SandForce, например OCZ Vertex 3 и Kingston HyperX, однако Intel делает акцент на том, что в данном случае тщательно отбирались самые качественные чипы памяти.
Печатная плата была переработана, и используется специально разработанная Intel для этой серии прошивка. Она, по словам разработчиков, добавит надёжности новым накопителям, что должно порадовать пользователей, испытавших проблемы с другими SSD на SandForce SF-2281. На сайте Anandtech.com провели тестирование новых накопителей, и установили, что в отличие от конкурентов, изделий Intel ведут себя стабильно и не вылетают с синим экраном при отсоединении в процессе работы системы. Что касается производительности, она примерно та же, что и у накопителей конкурентов на этом контроллере. Максимальная скорость чтения и записи 550 Мбит/с и 520 Мбит/с.
Серия SSD 520 уже доступна для приобретения. Стоимость младшей модели составляет $149, а старшей объёмом 480 Гб $999.
Каких только новостей не появлялось за последнюю неделю со ссылкой на проведённое компанией AMD мероприятие Financial Analyst Day, однако о чем там не говорилось, так это о планах компании в сфере графических карт для рабочих станций. Тем не менее, отказываться от борьбы за рынок профессиональных карт AMD не собирается. Подтверждением тому служит выпуск новой модели начального уровня под названием FirePro V3900 на смену карте предыдущего поколения V3800.
По сравнению с предшественником, новая карта получила значительные усовершенствования. Объём памяти удвоился и составляет теперь 1 Гб, пропускная способность памяти тоже возросла в два раза и равняется 28,8 Гбит/с. В качестве графического чипа используется GPU Turks из серии HD 6800. Карта поддерживает последние версии OpenGL и OpenCL.
В данном сегменте уже много лет доминируют продукты Nvidia, занимая в настоящее время 80% рынка. Учитывая, что несколько лет назад соотношение было 90-10 в пользу Nvidia, AMD может заявлять о прогресс в борьбе профессиональных видеокарт. Чтобы конкурировать с Nvidia в сегменте рабочих станций, компания ведет довольно агрессивную ценовую политику, и предлагает эксклюзивные технологии, например Eyefinity. Ни одна карта от Nvidia начального и среднего уровней не поддерживает больше двух мониторов. В V3900 их поддерживается сразу пять.
Разработчики заявляют, что новинка превосходит в большинстве тестов карты Quadro 400 и V3800. Судя по спецификациям, это вполне закономерный исход тестов. Производительность, измеряемая в операциях одинарной точности, возросла на 20%, до 624 ГФлоп. Вместе с ней выросла и рекомендуемая розничная цена карты, с $99 до $119.
На стыке первого и второго кварталов нынешнего года Intel собирается представить новое поколение процессоров Atom CE, с кодовым именем Berryville. Разработчики приложили все усилия, чтобы выпустить, наконец, под этим брендом достойные процессоры, и собирается бросить вызов решениям от ARM.
Всего компания планирует выпустить семь новых моделей процессоров, хотя некоторые их них будут доступны только определённым компаниям-партнерам Intel. Все новинки будут 2-ядерными, с поддержкой технологии Hyper-Threading. Этим, а также встроенными графическими ядрами с частотой 400 МГц Berryville весьма напоминает процессоры Intel Cedar Trail.
Процессором начального уровня будет CE5310 (или CE5320) с частотой 1,2 ГГц и поддержкой HDMI. Далее идёт CE5343 с частотой 1,8 ГГц и также с отсутствием поддержки аппаратного декодирования, тогда как все старшие модели обладают ею. Зато он поддерживает технологию PQE (Picture Quality Engine), которая является новой технологией компании, сочетающей аппаратное и программное ускорение видео.
Остальные пять моделей процессоров поддерживают аппаратный декодер H.264, и чтобы воспользоваться его преимуществами, Intel предоставит разработчикам специальные SDK. Сюда входят модели Atom CE5328 1,2 ГГц, CE5348 1,8 ГГц, CE5315 1,2 ГГц. Последние две, CE5318 1,2 ГГц и CE5338 1,8 ГГц, предназначены для интеграции в состав SmartTV, так что вместо HDMI у них имеется интерфейс LVDS. Поставляться они будут только производителям телевизоров.
Все новые процессоры поддерживаются два порта SATA, три USB и две линии PCI-Express, а также интерфейс eMMC 4.4 NAND. Чтобы стать конкурентоспособными, новая серия процессоров должна быть не слишком дорогой, и разработчики постарались приложить усилия для снижения стоимости используемых материалов.