Logo ru.androidermagazine.com
Logo ru.androidermagazine.com

Что такое дуплекс Google?

Оглавление:

Anonim

На Google I / O 2018 мы увидели демо последней новинки Google, Duplex. 60-футовый экран на сцене показал, что выглядит как ваше приложение Google Assistant с построчным воспроизведением Assistant, звонящего по телефону парикмахеру и назначающего встречу, с паузами, мммм и аххх, а также Остальные идиосинкразии, которые сопровождают человеческую речь. Похоже, что человек, принимающий встречу, не знал, что разговаривает с компьютером, потому что он не похож на компьютер. Даже не немного.

Такая демонстрация выглядит потрясающе (и, возможно, немного жутко), но как насчет деталей? Что такое дуплекс? Как это вообще работает? У всех нас есть вопросы, когда мы видим что-то другое, и найти ответы, распространяющиеся по Интернету, - боль. Давайте рассмотрим то, что мы знаем о Google Duplex.

Что такое дуплекс Google?

По словам исследователей и разработчиков Google, это новый инструмент от Google, целью которого является использование искусственного интеллекта (ИИ) для «решения реальных задач по телефону». На данный момент это означает очень конкретные задачи, такие как назначение назначений, но технология развивается с учетом расширения в других областях. Тратить миллиарды на создание классного способа бронирования мест на ужин звучит как то, что сделал бы Google, но не трата времени и денег.

Дуплекс также больше, чем мы видели в демоверсии, и если он когда-либо выйдет, лаборатория будет намного больше, чем мы видим или слышим с нашей стороны. Существуют огромные банки данных и компьютеров для их обработки, которые не так хороши, как конечный результат. Но они необходимы, потому что заставить компьютер говорить и думать в реальном времени, как человек, сложно.

Разве это не похоже на речь в текст?

Нету. Даже не близко. И вот почему это большое дело.

Дуплекс предназначен для изменения способа, которым компьютер «разговаривает» по телефону.

Задача дуплекса - сделать так, чтобы все звучало естественно, а помощник мог думать на лету, чтобы найти подходящее время встречи. Если Джо скажет: «Да, насчет этого - у меня ничего не открыто до 10, это нормально?» Помощник должен понять, что говорит Джо, понять, что это значит, и подумать, сработает ли то, что предлагает Джо, для вас. Если в 10 вы заняты по всему городу, и вам понадобится 40 минут, чтобы доехать до гаража Джо, помощник должен уметь это понять и сказать, что 11:15 было бы хорошо.

Не менее важным для Google является то, что дуплекс отвечает и звучит как человек. Google сказал, что хочет, чтобы человек по телефону не знал, что они разговаривают с компьютером, хотя в конечном итоге решил, что будет лучше сообщить им. Когда мы говорим с людьми, мы говорим быстрее и менее формально (читай: бессвязное болтовня с точки зрения компьютера), чем когда мы разговариваем с помощником по телефону или с компьютером в DMV, когда мы звоним. Дуплекс должен понимать это и воссоздать его при ответе.

Наконец, и самое впечатляющее, что Duplex должен понимать контекст. Пятница, следующая пятница и пятница после следующей недели - все это термины, которые мы с вами понимаем. Дуплекс должен понимать их тоже. Если бы мы говорили так же, как мы печатаем, это не было бы проблемой, но мы не знаем, потому что это звучит просто так душно, да, это не похоже на путаницу, хотя мы слышали это всю свою жизнь и привыкли к этому так Нет, у нас нет проблем, вы знаете, понимаете это или ничего подобного.

Я введу первую помощь своему редактору после того, как вы это напечатаете, пока вы говорите это вслух, чтобы вы поняли, что это значит.

Как работает дуплекс?

Со стороны пользователя это так же просто, как сказать Ассистенту что-то сделать. На данный момент, как уже упоминалось, что-то ограничено назначением встреч, поэтому мы скажем: «Эй, Google, назначьте мне встречу для замены масла в гараже Джо на утро вторника», и (после того, как он напомнил нам сказать, пожалуйста), он позвонит вверх Джо Гараж и настроить вещи, а затем добавить его в свой календарь.

В продолжении разговоров используется та же технология, что и в дуплексном режиме.

Довольно изящный. Но то, что происходит вне камеры, еще лучше.

Дуплекс использует то, что называется рекуррентной нейронной сетью. Он построен с использованием технологии TensorFlow Extended от Google. Google обучил сеть всем тем анонимным сообщениям голосовой почты и разговорам Google Voice, которые вы согласились позволить ей прослушивать, если вы выбрали сочетание программного обеспечения для распознавания речи и возможность учитывать историю разговора и такие детали, как время суток и местоположение обеих сторон.

По сути, вся сеть мощных компьютеров перебирает данные в облаке и общается через помощника на вашем телефоне или другом продукте, на котором есть помощник.

Как насчет безопасности и конфиденциальности?

Все сводится к одной простой вещи: доверяете ли вы Google. Машинный интеллект на устройстве - реальная вещь, хотя он ограничен и относительно нов. Google разработал ML Kit, чтобы помочь разработчикам делать больше подобных вещей на самом устройстве, но все это зависит от вычислительной мощности. Таким образом, требуется невероятное количество вычислений, чтобы назначить встречу, и это невозможно сделать на вашем телефоне или в Google Home.

Вы должны доверять Google свои данные, чтобы использовать его умные продукты, и дуплекс не будет отличаться.

Google необходимо использовать большую часть ваших личных данных, чтобы выполнять специальные действия, которые помощник может выполнять прямо сейчас, а Duplex это не меняет. Что нового здесь, так это то, что теперь есть другая сторона, которая явно не давала Google разрешение слушать их разговор.

Если / когда Duplex станет настоящим потребительским продуктом для всех, ожидайте его критики и оспаривания в суде. И это должно быть; позволить Google решить, что лучше для нашей частной жизни, похоже на старую поговорку о двух лисах и курице, решающей, что на обед.

Когда у меня будет дуплекс на моем телефоне?

Ожидайте некоторые большие изменения в помощнике позже в этом году.

Никто не знает прямо сейчас. Это может никогда не произойти. Google взволнован, когда он может сделать такую ​​фантастическую вещь, и хочет поделиться ею с миром. Это не значит, что он будет успешным или когда-либо станет реальным продуктом.

На данный момент Duplex тестируется в закрытой и контролируемой среде. Если все пойдет хорошо, первоначальный экспериментальный выпуск для потребителей, чтобы зарезервировать столик в ресторане, назначить встречу в парикмахерской и назначить праздничные часы по телефону, появится позже в этом году с помощью Assistant только на телефонах.

Где я могу узнать больше?

Google на удивление открыто говорит о технологиях, которые он использует для создания дуплекса. Вы найдете соответствующую информацию на следующих веб-сайтах:

  • Блог Google AI (Google)
  • Deepmind
  • Tensorflow.org
  • Библиотека Корнельского университета
  • Google Research (Google)
  • Ключевое слово (Google)
  • ML Kit (Google)

Конечно, мы также внимательно следим за дуплексом, и вы услышите последние новости прямо здесь, как только они станут доступны.