Tehnografi.com - Технологические новости, обзоры и советы
[adinserter block="67"]

Apple создает преобразующую платформу для AR

Apple поделилась некоторыми подробностями, касающимися функций доступности, над которыми она работает, и намекнула на то, как она видит дополненную повседневную реальность. Увидим ли мы больше об этом на WWDC 2022 и как это будет применяться?

Делаем жизнь доступной, делаем данные реальности

Два из предстоящих улучшений специальных возможностей, кажется, предлагают подход Apple: обнаружение дверей и живые субтитры. Вот что они делают:

  • Обнаружение двери: Используя камеру iPhone, он обнаружит дверь, направит пользователя к этой двери, сообщит ему, открыта или закрыта дверь, подскажет, как открыть дверь, а также сможет понять и прочитать такие вещи, как номера дверей.
  • Живые субтитры: ваше устройство Apple будет прослушивать любой аудиоконтент и предоставлять вам расшифровку этого разговора в режиме реального времени.
  • Обе функции невероятные, но если их немного рассмотреть, они становятся совершенно удивительными. Я вижу это так: если устройство Apple может в режиме реального времени создавать расшифровку того, что оно слышит, почему оно не может переводить эту расшифровку на другие языки?

    Что это может означать

    Мы знаем, что у Apple есть технология для этого — мы используем ее каждый раз, когда переводим веб-страницу. Этот процесс очень быстрый, так почему бы просто не распространить этот перевод на транскрипцию, предоставленную вашим устройством Apple?

    Это также может работать двумя способами: ваше устройство говорит на языке, которого вы не знаете, что позволяет вам присоединяться к сложным разговорам на нескольких языках.

    Door Detection использует технологии, которые Apple изучает уже некоторое время. Вы можете легко использовать их самостоятельно — откройте «Фото» и найдите изображения «Фонарный столб», и вы сможете изучить каждую имеющуюся у вас фотографию, на которой есть фонарный столб.

    Не знаю, как вы, но если ваше устройство может распознавать объекты на фотографиях, оно должно быть способно распознавать их и в других местах, используя тот же интеллект машинного зрения.

    Видение + Интеллект + Контекст =?

    Это означает, что так же, как слепой человек или человек с плохим зрением может рассчитывать на использование обнаружения двери, чтобы найти и открыть дверь, разумно полагать, что он сможет использовать аналогичную технологию, чтобы распознать что-либо еще ИИ в Apple. устройства имеет имя для:

    «Привет, Siri, где апельсины в овощном магазине?»

    — Они в трех шагах справа от вас, в ложе, второй спереди. Они стоят 1 доллар».

    Обнаружение дверей говорит нам, что это произойдет, потому что уже существует технология, позволяющая это сделать. Это просто нужно построить.

    Итак, что революционного во всем этом? Это означает, что Apple уже собрала множество строительных блоков, которые позволяют ее технологиям распознавать окружающий мир и взаимодействовать с ним. Как только технологии поймут, что работает, они смогут направлять наши взаимодействия, дополняя наши решения информацией, которую мы можем использовать.

    Слепому или слабовидящему человеку, собирающемуся купить апельсин за 1 доллар, могут сказать, что тот же фрукт можно купить за половину этой цены дальше по улице. Или выездной сервисный инженер может обнаружить, что его устройство уже открыло руководство по устранению неполадок для оборудования, на которое он смотрит.

    [Also read: Apple calls out Meta for hypocrisy]

    Здесь мы имеем две технологии, якобы созданные для доступности, которые также дают устройствам компании интерактивное представление о зрении и звуке. Это понимание позволяет устройству предоставлять пользователю контекстно полезную информацию о том, что он видит и что слышит.

    Это может быть ответ на прямые вопросы или, отражая работу, которую Apple проделала с предложениями Siri, основанную на знании устройством того вида помощи, которую вы обычно запрашиваете.

    Увеличение человеческого опыта началось

    Вам не нужно быть корпоративным профессионалом, чтобы понять, что это открывает целый ряд возможностей для мощных инструментов и услуг для пользователей-потребителей, наряду с очень мощными корпоративными приложениями для интеллектуального машинного зрения и Индустрии 5.0 в различных секторах.

    Одна из замечательных особенностей этих приложений заключается в том, что, поскольку они основаны на технологиях доступности, они также позволяют тем, кто еще не представлен в некоторых областях в равной степени, как они должны быть, принимать более активное участие.

    Вот что я называю дополненной реальностью. И это то, о чем, я думаю, мы узнаем гораздо больше на WWDC 2022.

    Неудивительно, что Apple начала сливать информацию о демонстрации этих технологий директорам компаний и проблемах дизайна, которые возникли при разработке наиболее логичного средства для таких технологий — Apple Glass.

    Шаг за шагом строительные блоки этой многолетней работы теперь встают на свои места быстрее. Я уже слышу, как критики снова готовятся ошибаться.

    Авторское право © , Inc.