Использование Платформы подразумевает полный отказ от передачи исходных данных между участниками информационного взаимодействия.
Вычисления основаны на протоколе, в рамках которого стороны обмениваются только зашифрованными частями данных (секретами). Восстановить из них исходные данные невозможно.
Синтез новых лекарств, медицинские исследования, анализ ДНК, распознавание лиц, сверхточный кредитный скоринг, решения для Умного Города — вот далеко не полный список областей, в которых анализ закрытых для использования данных окажет существенное влияние на результат и конечную эффективность продуктов.
О базовой технологии
Безопасные совместные вычисления (Multi-Party Computations, MPC) охватывают область криптографии Data-In-Use и позволяют недоверяющим друг другу сторонам совместно вычислять математические функции по своим входам, сохраняя при этом конфиденциальность этих входов. Исследования в области MPC восходят к 1980-м годам, когда было представлено решение так называемой “проблемы миллионера”.
Предположим, что есть два богатых человека, жаждущих знать, кто богаче. Но никто из них не собирается раскрывать, сколько денег он лично имеет. На первый взгляд может показаться, что проблема не имеет решения. Однако существуют криптографические протоколы, которым миллионеры могут следовать, чтобы выяснить, кто из них богаче, не раскрывая ничего сверх этого. Более того, взаимодействие может быть построено таким образом, что не сами миллионеры, а только какая-нибудь третья сторона будет единственной, кто узнает результат, и этот результат — единственное, что она узнает. В этом и заключена суть технологии MPC.
MPC в данный момент является “горячей” областью исследований. Еще совсем недавно это была не более чем академическая головоломка, но сегодня такой подход начинает использоваться все чаще и чаще в коммерческих применениях. Как и любая другая криптографическая задача (как RSA, эллиптические кривые и т.д.), она обладает строгим математическим доказательством безопасности.
Этот факт выгодно отличает MPC от технологий сохранения конфиденциальности (таких как деперсонализация или эвристическая обфускация), которые не обладают гарантированной защитой и могут быть скомпрометированы. Напротив, протоколы MPC имеют четкую и точную гарантию безопасности. Существует большая разница между тем, что только кажется безопасным, и тем, что первоначально спроектировано защищенно (secure-by-design). Это дает MPС качественное преимущество для решения бизнес-задач. Актуальность технологии подчеркивает и исследование Gartner, в котором MPC указывается как одно из основных технологических направлений 2021 года и будущего десятилетия.
Сложности совместного использования больших данных
Потеря ценности данных
— Для поставщика данных – мгновенная потеря ценности данных при их передаче потребителю
— Для потребителя данных – краткосрочный характер полезности полученных данных
— При обмене данными – оба фактора для всех участников обмена
Ограничения использования данных
— Законодательные ограничения — 152-ФЗ, Банковская тайна, GDPR, будущие законы о больших данных
— Внутренние ограничения – административные ограничения обмена исходными данными внутри организаций или между ними
— Общее недоверие партнеров к участнику, аккумулирующему данные для анализа
Решение проблемы – платформа совместных вычислений UBIC Datahub
Исходные данные не передаются другим участникам вычислений
— Решения MPC подразумевают полный отказ от передачи исходных данных между участниками информационного взаимодействия. Вычисления и получение результата основаны на протоколе, в рамках которого стороны обмениваются только зашифрованными частями данных (секретами). Восстановить из них исходные данные невозможно.
Ядро платформы – вычислительные алгоритмы
— Основа среды — не данные, а вычислительные модели, которые их используют. От простых аналитических запросов до нейронных сетей.
Единая онтология и сквозной учет данных
— Общее пространство метаданных и система обновления связей – все участники системы и поставщики моделей работают в единой информационной среде.
Преимущества Платформы
- Нет доверенной стороны, аккумулирующей данные участников
- Безопасность вычислений математически доказана и основана на открытых протоколах
- Широкий спектр решаемых задач (от агрегации данных до машинного обучения)
- Подходит для решения задач в рамках GDPR, 152-ФЗ, банковской тайны
- Нет зависимостей от производителей оборудования
- Возможности быстрой кастомизации в сравнении с hardware-решениями
- Готовность к работе в пост-квантовом мире
Архитектура Платформы
Схема работы аналитика с Платформой