Оценка файлов пациентов без нарушения конфиденциальности

Оценка сопоставленных данных о пациентах без раскрытия какой-либо конфиденциальной информации о людях представляет собой значительную проблему. Команда, возглавляемая профессором д-ром Хансом Саймоном из Института информационной безопасности им. Хорста Горца при Рурском университете в Бохуме, разработала метод, который способствует именно этому.

Математики искажают данные таким образом, что отдельные пациенты остаются анонимными во время анализа. Тем не менее, самообучающиеся компьютерные программы способны обнаруживать корреляции в измененных данных почти так же хорошо, как и в исходных данных.Искаженные данныеВ принципе, искажение работает следующим образом: кости бросаются для каждого файла пациента; число на кубике добавляется ко всем значениям в файле.

Этот метод изменяет отдельные данные значительно и непредсказуемо, но, в лучшем случае, он не влияет на статистические сводки в большей степени, чем случайные колебания, которые присутствуют в данных в любом случае.Для целей своей работы исследователи кафедры теоретической информатики дали точное определение того, что в математических терминах означает, что пациенты должны оставаться анонимными. И что это означает, что, искаженные или нет, результаты не должны сильно отличаться друг от друга.

Чтобы соответствовать определенным требованиям, математики перевели задачу в геометрическое представление.Данные представлены в виде векторовКаждый файл пациента был представлен в виде вектора, то есть стрелки в геометрическом пространстве. Алгоритм оценки разрешал только задавать вопросы типа «да / нет», например: Курит ли пациент?

Пациент весит более 80 килограммов? Каждый из этих вопросов также был представлен в виде вектора. Вектор файла и вектор вопроса, образующие тупой угол, символизировали «Нет ответа»; острый угол означал ответ «да».Вместо того чтобы искажать исходные данные, исследователи выполнили этот шаг только после того, как преобразовали данные в векторы.

Таким образом, информация, относящаяся к отдельным пациентам, могла быть анонимной, и в то же время исследователи могли делать статистические заключения о сопоставленных данных всех пациентов.


Портал обо всем