УНИВЕРСАЛЬНЫЙ УСКОРИТЕЛЬ ДЛЯ ВЫСОКОПЛОТНЫХ ВЫЧИСЛЕНИЙ
Модуль LinQ HPS – это высокопроизводительный укоритель для инференса сложных нейронных сетей (CNN, Transformer и т. д.) в реальном времени. Он обеспечивает низкую задержку при обработке малых батчей, обладает пиковой производительностью до 960 TOPS (int8) и интегрируется в стандартные 19-дюймовые стойки.
Ускоритель основан на оригинальной архитектуре LinQ H, не использует сторонние IP-ядра и поддерживает прямую интеграцию с экосистемой TensorFlow 2.x и PyTorch (через ONNX). Использование внутреннего компилятора LinQ Compiler с элементами ИИ обеспечивает глубокую оптимизацию вычислительных графов, что позволяет свести задержку инференса к минимуму.
УНИВЕРСАЛЬНЫЙ УСКОРИТЕЛЬ ДЛЯ ВЫСОКОПЛОТНЫХ ВЫЧИСЛЕНИЙЫХ
- Сверхнизкая задержка при малом батче (текущий: 2,3ms, возможность оптимизации до 1,5 ms для ResNet-50)
- Высокая эффективность на малом батче на CNN /Transformer моделях
- Линейная масштабируемость при установке нескольких ускорителей
- Форм-фактор 3U Rackmount, поддержка стандартной 19" стойки
- Дополнительные опции ASIC-плат для аппаратного видеокодирования (H.264, H.265 и др.)
- Нет сторонних IP в вычислителях (ARM, etc.)
- Специализированные оптимизаторы в компиляторе (DNN Quant, Graph Optimizer)
- Программный стек собственной разработки
- Прямая интеграция с TF2
- Поддержка PyTorch через ONNX
- Пиковая производительность 960 TOPS (int8)
УНИВЕРСАЛЬНЫЙ УСКОРИТЕЛЬ ДЛЯ ВЫСОКОПЛОТНЫХ ВЫЧИСЛЕНИЙЫХ
- Корпоративные и облачные сервисы (MLaaS, таргетинг, рекомендации)
- Распределенные вычисления
- Оптимизация энергопотребления
- Городская безопасность
- Исследование и разработка лекарств
- Интеллектуальная видеоаналитика
- Биометрия и контроль доступа
УНИВЕРСАЛЬНЫЙ УСКОРИТЕЛЬ ДЛЯ ВЫСОКОПЛОТНЫХ ВЫЧИСЛЕНИЙЫХ