12:43 вечера EDT – Первое выступление, которое в прямом эфире публикуется сегодня в Hot Chips, принадлежит Тесле, который демонстрирует свои вычислительные и резервные решения для полностью автономного вождения автомобиля. Мы предполагаем, что это означает автомобиль 5-го уровня, поэтому будет интересно посмотреть, что там упоминается.
12:56 EDT – Похоже, мы начнем через минуту
13:00 по восточному поясному времени – Представлено бывшим архитектором AMD, который работал над бульдозером и дзен
01:01 вечера EDT – FSD = полностью самостоятельное вождение
01:01 вечера EDT – Требуется нестандартное оборудование для очень быстрого запуска CNN
01:01 вечера EDT – Уровень 5 – жесткая цель
01:01 вечера EDT – 100 Вт был пределом для компьютера
01:01 вечера EDT – FSD нужно было переоборудовать в автомобили HW2.x
13:02 ПО ВОСТОЧНОМУ ВРЕМЕНИ – Охлаждение в этих автомобилях ограничено
13:02 ПО ВОСТОЧНОМУ ВРЕМЕНИ – HW2.x был предварительно FSD
13:02 ПО ВОСТОЧНОМУ ВРЕМЕНИ – Посмотрел на рынок, ничего подходящего для соответствия уровням мощности и ограничения форм-фактора
13:02 ПО ВОСТОЧНОМУ ВРЕМЕНИ – Тесла должен был разработать собственный чип для достижения этих целей
13:03 ПО ВОСТОЧНОМУ ВРЕМЕНИ – Двойной резервный SoCs
13:03 ПО ВОСТОЧНОМУ ВРЕМЕНИ – Резервные источники питания
13:03 ПО ВОСТОЧНОМУ ВРЕМЕНИ – Обратная совместимость
13:03 ПО ВОСТОЧНОМУ ВРЕМЕНИ – перекрывающее поле камеры с избыточными путями
13:03 ПО ВОСТОЧНОМУ ВРЕМЕНИ – Четыре камеры на синем питании, четыре на зеленом питании
13:03 ПО ВОСТОЧНОМУ ВРЕМЕНИ – Вся информация отправляется на оба SoCs
13:04 ПО ВОСТОЧНОМУ ВРЕМЕНИ – оба могут обрабатывать все независимо
13:04 ПО ВОСТОЧНОМУ ВРЕМЕНИ – богатый набор датчиков
13:04 ПО ВОСТОЧНОМУ ВРЕМЕНИ – Камеры, радар, графические процессоры, карты, IMU, ультразвук, колесные тики, угол поворота
13:05 EDT – У двух SoC есть планы. Планы сравниваются, и когда они согласны, действия предпринимаются мастером, и он проверяется подчиненным SoC, и он повторяется
13:05 EDT – Как много ТОПов для рабочих нагрузок Тесла, 50 ТОПов были минимальной планкой
13:05 EDT – Высокая загрузка при размере партии один (видео)
13:06 EDT – Завершено с суб-40W / чип. Лучшая в своем классе энергоэффективность для вывода
13:06 EDT – Ведущие результаты задержки. Безопасность и защита получает специальные процессоры
13:06 EDT – Samsung 14FF
13:06 EDT – 260мм2, 6b транзисторы
13:06 EDT – AECQ100
13:07 EDT – 12 процессоров A72 справа, 1 процессор GPU
13:07 EDT – Два нейросетевых ускорителя, с нуля. Все остальное был отраслевой IP
13:07 EDT – Двойные NNA, каждый из которых имеет размер 96×96 MAC, могут сделать 36,8 TOP за каждую NNA
13:08 ПО ВОСТОЧНОМУ ВРЕМЕНИ – 32 МБ SRAM за экземпляр, оптимизирована пропускная способность
13:08 ПО ВОСТОЧНОМУ ВРЕМЕНИ – многие программы могут быть резидентными в SRAM
13:08 ПО ВОСТОЧНОМУ ВРЕМЕНИ – простая модель программирования
13:08 EDT – Создан для 2 ГГц +
13:08 ПО ВОСТОЧНОМУ ВРЕМЕНИ – 72 ТОПов для всего SoC на 2 ГГц
13:08 EDT – 14 месяцев от Арки до Ленты
13:08 EDT – Первый кремниевый успех
13:08 EDT – взял на себя некоторые расчетные риски по дизайну
13:09 EDT – Моделирование задач
13:09 EDT – Нужно сделать все правильно
13:09 EDT – Используется Verilator, в 50 раз быстрее, чем коммерческие симуляторы
1:10 вечера по восточному поясному времени – ННА Дизайн Мотивация. Решить сверточную нейронную сеть
1:10 вечера по восточному поясному времени – 99,7% операций – это MAC
1:10 вечера по восточному поясному времени – Ускорение MAC делает квалификацию / пул более чувствительной
01:11 вечера EDT – Выделенное квантование и пул HW для ускорения вещей
01:13 вечера EDT – 8-битные MUL с 30-битными ADD
01:15 EDT – Переходя через слайд. Основные вещи MatMul
01:20 вечера EDT – Поток управления чрезвычайно важен для производительности и мощности
01:20 вечера EDT – Большая часть энергии тратится на перемещение инструкций и данных
01:21 вечера EDT – FSD исключает чтение / запись DRAM
01:21 вечера EDT – Минимизируйте чтение SRAM
01:21 вечера EDT – Оптимизированная мощность переключения MAC
01:21 вечера EDT – Одночасовой домен
01:21 вечера EDT – DVFS мощность / тактовая частота
01:22 вечера EDT – Для вывода, когда вы сделали со слоем, он может быть разрушен и не сохранен
01:22 вечера EDT – Набор инструкций – здесь все операции
01:23 вечера EDT – Ограниченная поддержка OoO
01:24 вечера EDT – Инструкции от 32B до 256B (256B = свертка в одной инструкции)
01:24 вечера EDT – микроархитектура ННА
01:25 вечера EDT – 32 МБ SRAM с одним портом на банк
01:25 вечера EDT – 256B для чтения bw, 128B для записи bw
01:25 вечера EDT – 1 ТБ / с массы тела в SRAM
01:27 вечера EDT – Программируемый блок SIMD с 3 циклами
01:28 вечера EDT – FP16 и INT типы данных
01:28 вечера EDT – Предикативная поддержка для всех инструкций
01:29 вечера EDT – Максимальное объединение и среднее объединение
01:29 вечера EDT – требуется специальное оборудование для пула
13:30 по восточному поясному времени – 2,5-кратная производительность по платформе HW2,5 для 1,25-кратной мощности
13:30 по восточному поясному времени – Стоимость модуля снижена на 20%
01:31 вечера EDT – вопросы и ответы
01:31 вечера EDT – Q: Двойные резервные SoC. Понимание двойного аспекта? Вы разделяете нагрузку? О: У разработчиков программного обеспечения есть возможность использовать его в любом случае. Мы в первую очередь предназначены для безопасности.
01:32 EDT – Вопрос: 2 экземпляра Convolution Engine. Почему 2? A: Цель использования полосы пропускания 96×96 x2. Сладкое место для физического дизайна, области, физического дизайна.
01:32 EDT – В: 37 ТОПОВ? A: INT8
01:33 EDT – Вопрос: нестандартная модель или публичная? Обычай
01:35 EDT – В: Почему именно SoC, а не карта PCIe? A: Автомобильный должен пройти жизненный цикл. Карта PCIe не будет работать.
01:35 EDT – Вопрос: ведение журнала? A: да
01:36 EDT – В: Что, если два SoC не согласны? A: У нас высокая частота кадров. Но пропущенный кадр не влияет на производительность.
01:37 EDT – Вопрос: сырые топы? A: да
01:38 EDT – Q: Охлаждение? A: Зависит от автомобильной платформы. Воздух или вода. Но снижение мощности было ключевым для этой платформы
01:38 EDT – Это упаковка. Время перерыва, затем NVIDIA Multi-Chip
01:38 EDT -.
Add comment