Компания NVIDIA выпустила для Linux CUDA Toolkit 3.2
Компания NVIDIA выпустила пакет CUDA Toolkit 3.2, позволяющий задействовать в Linux-приложениях API CUDA, позволяющее вынести некоторые вычислительные задачи на плечи GPU. В состав тулкита входит специализированный C/C++ компилятор, отладчик cuda-gdb, GUI-интерфейс для профилирования кода, набор базирующихся на задействовании GPU вариантов математических библиотек (BLAST BLAS, FFT, Sparse Matrix, RNG и т.д.), вспомогательные инструменты и документация.
Из добавленных улучшений можно отметить:
* В состав пакета интегрированы библиотеки с реализацией функций кодирования и декодирования видеопотоков H.264 с привлечением мощности GPU;
* Производительность выполнения матричных преобразований в библиотеке CUBLAS увеличена на 50% - 300%, при работе на GPU с архитектурой Fermi. Производительность вычисления корней в CUFFT увеличена от 2 до 10 раз по сравнению с неакселерированным вариантом библиотеки;
* В состав пакета интегрирована новая библиотека CUSPARSE с поддержкой GPU-акселерированных операций с разряженными матрицами, которые выполняются при задействовании GPU в 5-30 раз быстрее;
* В состав интегрирована новая библиотека CURAND с функциями по генерации случайных чисел.
* Добавлена поддержка новых продуктов семейства 6GB Quadro и Tesla. Для GOU Tesla добавлена возможность активации режима TCC (Tesla Compute Cluster), но пока только для платформы Windows;
* В отладчики cuda-gdb и Parallel Nsight добавлена поддержка работы с несколькими GPU и возможность отладки GPU на устройствах с более чем 4 Гб памяти;
* В утилите cuda-memcheck добавлена поддержка всех GPU на базе архитектуры Fermi;
* Для компилятора Intel C Compiler (ICC) v11.1 на 64-разрядных Linux-дистрибутивах добавлена поддержка CUDA-компилятора NVCC;
* Добавлена поддержка управления памятью при помощи стандартных функций malloc() и free() в вычислительных ядрах CUDA;
* Реализован новый интерфейс nvidia-smi (NVIDIA System Management Interface), поддерживающий вывод различных параметров производительности, таких как процент загруженности GPU;
* Добавлено 10 новых демонстрационных приложений, показывающих возможности CUDA. Например, приведен пример задействования библиотеки для акселерации кодирования H.264-видеопотоков, представлен фильтр для удаления шума с изображений и различные математические подпрограммы.
Пакеты с CUDA Toolkit 3.2 доступны для Linux дистрибутивов Fedora 13, Red Hat Enterprise Linux 4.8 и 5.5, Ubuntu Linux 10.04, openSUSE 11.2 и SUSE Linux Enterprise Desktop 11-SP1.
Источник 0