Google выпустил некоторые подробности от команды безопасности и конфиденциальности о том, как Google Play курируется, и машинное обучение играет большую роль.
У Google есть две основные цели для приложений в Play Store: безопасность и экспозиция. Команда безопасности и конфиденциальности хочет отсеять приложения вредоносными программами, но они также обеспокоены приложениями, которые запрашивают широкие разрешения, которые могут не понадобиться. В свою очередь, когда найдены хорошие приложения, которые следуют передовым методам, команда хочет, чтобы они были добавлены в Play Store.
Машины создают группы сверстников, чтобы изучить, что могут делать приложения, и должны ли они это делать.
Один из способов сделать это - использовать так называемые «группы сверстников». Приложения с похожими возможностями группируются вместе. Такие приложения, как Spotify и Pandora (например), отличаются друг от друга, но имеют одинаковые базовые функции и предназначены для потоковой передачи музыки на ваш Android с использованием сведений из вашей учетной записи в каждой службе. То же самое касается Twitter и Facebook или приложений, таких как книжки-раскраски. Когда они делают одни и те же основные вещи, они смешиваются вместе. Это облегчает изучение того, что делают приложения, как они это делают, и должны ли они вообще это делать.
Затем они анализируются, чтобы увидеть, что они запрашивают с вашего устройства, когда речь заходит о личных данных. В идеале, каждое приложение в одноранговой группе будет запрашивать одинаковую информацию и иметь веские основания для этого. Но иногда один будет выделяться. Google приводит пример приложения-раскраски, которое запрашивает точные данные о местоположении с помощью GPS. Другие приложения-раскраски этого не делают, поэтому приложение, подлежащее проверке, будет подвергнуто дальнейшему рассмотрению командой безопасности и конфиденциальности.
В Google Play слишком много приложений, чтобы сделать это вручную.
В Google Play слишком много приложений для людей, чтобы делать это эффективно, поэтому Google применил некоторые методы машинного обучения для автоматизации большей части процесса. Алгоритмы глубокого обучения изучают язык в приложении, данные о том, что приложение делает и как оно выполняет, анализируются компьютером, и сами группы пиров строятся на этих машинах на основе таких вещей, как метаданные приложения и текстовые описания, а также таких метрик, как пользователь устанавливает.
Google делает все возможное, чтобы не допустить проникновения вредоносных программ на ваш телефон через Google Play, но это также помогает разработчикам узнать о сложной (очень) модели разрешений, которую использует Android. Это довольно крутой способ использовать компьютеры, которые помогают пользователям и разработчикам, и это здорово, что Google готов поделиться некоторой информацией о том, как это делается.