Tehnografi.com - Технологические новости, обзоры и советы
[adinserter block="67"]

Hot Chips 31 Live Blogs: решение Tesla для полного самостоятельного вождения

12:43 вечера EDT – Первое выступление, которое в прямом эфире публикуется сегодня в Hot Chips, принадлежит Тесле, который демонстрирует свои вычислительные и резервные решения для полностью автономного вождения автомобиля. Мы предполагаем, что это означает автомобиль 5-го уровня, поэтому будет интересно посмотреть, что там упоминается.

12:56 EDT – Похоже, мы начнем через минуту

13:00 по восточному поясному времени – Представлено бывшим архитектором AMD, который работал над бульдозером и дзен

01:01 вечера EDT – FSD = полностью самостоятельное вождение

01:01 вечера EDT – Требуется нестандартное оборудование для очень быстрого запуска CNN

01:01 вечера EDT – Уровень 5 – жесткая цель

01:01 вечера EDT – 100 Вт был пределом для компьютера

01:01 вечера EDT – FSD нужно было переоборудовать в автомобили HW2.x

13:02 ПО ВОСТОЧНОМУ ВРЕМЕНИ – Охлаждение в этих автомобилях ограничено

13:02 ПО ВОСТОЧНОМУ ВРЕМЕНИ – HW2.x был предварительно FSD

13:02 ПО ВОСТОЧНОМУ ВРЕМЕНИ – Посмотрел на рынок, ничего подходящего для соответствия уровням мощности и ограничения форм-фактора

13:02 ПО ВОСТОЧНОМУ ВРЕМЕНИ – Тесла должен был разработать собственный чип для достижения этих целей

13:03 ПО ВОСТОЧНОМУ ВРЕМЕНИ – Двойной резервный SoCs

13:03 ПО ВОСТОЧНОМУ ВРЕМЕНИ – Резервные источники питания

13:03 ПО ВОСТОЧНОМУ ВРЕМЕНИ – Обратная совместимость

13:03 ПО ВОСТОЧНОМУ ВРЕМЕНИ – перекрывающее поле камеры с избыточными путями

13:03 ПО ВОСТОЧНОМУ ВРЕМЕНИ – Четыре камеры на синем питании, четыре на зеленом питании

13:03 ПО ВОСТОЧНОМУ ВРЕМЕНИ – Вся информация отправляется на оба SoCs

13:04 ПО ВОСТОЧНОМУ ВРЕМЕНИ – оба могут обрабатывать все независимо

13:04 ПО ВОСТОЧНОМУ ВРЕМЕНИ – богатый набор датчиков

13:04 ПО ВОСТОЧНОМУ ВРЕМЕНИ – Камеры, радар, графические процессоры, карты, IMU, ультразвук, колесные тики, угол поворота

13:05 EDT – У двух SoC есть планы. Планы сравниваются, и когда они согласны, действия предпринимаются мастером, и он проверяется подчиненным SoC, и он повторяется

13:05 EDT – Как много ТОПов для рабочих нагрузок Тесла, 50 ТОПов были минимальной планкой

13:05 EDT – Высокая загрузка при размере партии один (видео)

13:06 EDT – Завершено с суб-40W / чип. Лучшая в своем классе энергоэффективность для вывода

13:06 EDT – Ведущие результаты задержки. Безопасность и защита получает специальные процессоры

13:06 EDT – Samsung 14FF

13:06 EDT – 260мм2, 6b транзисторы

13:06 EDT – AECQ100

13:07 EDT – 12 процессоров A72 справа, 1 процессор GPU

13:07 EDT – Два нейросетевых ускорителя, с нуля. Все остальное был отраслевой IP

13:07 EDT – Двойные NNA, каждый из которых имеет размер 96×96 MAC, могут сделать 36,8 TOP за каждую NNA

13:08 ПО ВОСТОЧНОМУ ВРЕМЕНИ – 32 МБ SRAM за экземпляр, оптимизирована пропускная способность

13:08 ПО ВОСТОЧНОМУ ВРЕМЕНИ – многие программы могут быть резидентными в SRAM

13:08 ПО ВОСТОЧНОМУ ВРЕМЕНИ – простая модель программирования

13:08 EDT – Создан для 2 ГГц +

13:08 ПО ВОСТОЧНОМУ ВРЕМЕНИ – 72 ТОПов для всего SoC на 2 ГГц

13:08 EDT – 14 месяцев от Арки до Ленты

13:08 EDT – Первый кремниевый успех

13:08 EDT – взял на себя некоторые расчетные риски по дизайну

13:09 EDT – Моделирование задач

13:09 EDT – Нужно сделать все правильно

13:09 EDT – Используется Verilator, в 50 раз быстрее, чем коммерческие симуляторы

1:10 вечера по восточному поясному времени – ННА Дизайн Мотивация. Решить сверточную нейронную сеть

1:10 вечера по восточному поясному времени – 99,7% операций – это MAC

1:10 вечера по восточному поясному времени – Ускорение MAC делает квалификацию / пул более чувствительной

01:11 вечера EDT – Выделенное квантование и пул HW для ускорения вещей

01:13 вечера EDT – 8-битные MUL с 30-битными ADD

01:15 EDT – Переходя через слайд. Основные вещи MatMul

01:20 вечера EDT – Поток управления чрезвычайно важен для производительности и мощности

01:20 вечера EDT – Большая часть энергии тратится на перемещение инструкций и данных

01:21 вечера EDT – FSD исключает чтение / запись DRAM

01:21 вечера EDT – Минимизируйте чтение SRAM

01:21 вечера EDT – Оптимизированная мощность переключения MAC

01:21 вечера EDT – Одночасовой домен

01:21 вечера EDT – DVFS мощность / тактовая частота

01:22 вечера EDT – Для вывода, когда вы сделали со слоем, он может быть разрушен и не сохранен

01:22 вечера EDT – Набор инструкций – здесь все операции

01:23 вечера EDT – Ограниченная поддержка OoO

01:24 вечера EDT – Инструкции от 32B до 256B (256B = свертка в одной инструкции)

01:24 вечера EDT – микроархитектура ННА

01:25 вечера EDT – 32 МБ SRAM с одним портом на банк

01:25 вечера EDT – 256B для чтения bw, 128B для записи bw

01:25 вечера EDT – 1 ТБ / с массы тела в SRAM

01:27 вечера EDT – Программируемый блок SIMD с 3 циклами

01:28 вечера EDT – FP16 и INT типы данных

01:28 вечера EDT – Предикативная поддержка для всех инструкций

01:29 вечера EDT – Максимальное объединение и среднее объединение

01:29 вечера EDT – требуется специальное оборудование для пула

13:30 по восточному поясному времени – 2,5-кратная производительность по платформе HW2,5 для 1,25-кратной мощности

13:30 по восточному поясному времени – Стоимость модуля снижена на 20%

01:31 вечера EDT – вопросы и ответы

01:31 вечера EDT – Q: Двойные резервные SoC. Понимание двойного аспекта? Вы разделяете нагрузку? О: У разработчиков программного обеспечения есть возможность использовать его в любом случае. Мы в первую очередь предназначены для безопасности.

01:32 EDT – Вопрос: 2 экземпляра Convolution Engine. Почему 2? A: Цель использования полосы пропускания 96×96 x2. Сладкое место для физического дизайна, области, физического дизайна.

01:32 EDT – В: 37 ТОПОВ? A: INT8

01:33 EDT – Вопрос: нестандартная модель или публичная? Обычай

01:35 EDT – В: Почему именно SoC, а не карта PCIe? A: Автомобильный должен пройти жизненный цикл. Карта PCIe не будет работать.

01:35 EDT – Вопрос: ведение журнала? A: да

01:36 EDT – В: Что, если два SoC не согласны? A: У нас высокая частота кадров. Но пропущенный кадр не влияет на производительность.

01:37 EDT – Вопрос: сырые топы? A: да

01:38 EDT – Q: Охлаждение? A: Зависит от автомобильной платформы. Воздух или вода. Но снижение мощности было ключевым для этой платформы

01:38 EDT – Это упаковка. Время перерыва, затем NVIDIA Multi-Chip

01:38 EDT -.

Add comment