상세 컨텐츠

본문 제목

데이터의 익명화가 당신의 완전한 익명성을 보장하지는 않는다.

IT, 인터넷 정보/IT, 컴퓨터

by 매너남 정원사박씨 2020. 4. 20. 23:28

본문

지난 가을 Adblock Plus 설립자 인 Vladimir Palant는 Avast Online Security, AVG Online Security, Avast SafePrice 및 AVG SafePrice 제품을 분석하고 Avast가 인기있는 안티 바이러스 소프트웨어를 사용하여 사용자 데이터를 수집하고 판매한다고 결론을 내 렸습니다. Avast 전무 이사 Ondrei Vlcek는 수집 된 데이터가 가능한 한 익명으로, 즉 특정 개인의 신원에 대한 어떠한 종류의 첨부도 박탈 당했다고 사용자들을 설득했기 때문에 과대 광고는 빨리 사라졌습니다.

 



"우리 회사는 광고주 또는 제 3자가 Avast 또는 제 3자가 특정 개인을 타겟팅 할 수있는 데이터를 통해 액세스하는 것을 허용하지 않습니다."

그러나 하버드 대학교의 학생들에 의해 수행 된 연구에 따르면 수집 된 정보의 개인화는“비속 화”에 대한 보호, 즉 데이터베이스의 데이터를 기반으로 개인의 신원을 공개하는 것과는 거리가 먼 것으로 나타났습니다. 젊은 과학자들은 태만, 해킹 또는 다른 종류의 유출로 인해 공개 액세스가 가능한 방대한 소비자 데이터 세트를 결합하는 도구를 만들었습니다.

2015 년부터 네트워크에 유출 된 모든 데이터베이스가 프로그램에 제공되었습니다. MyHeritage 계정의 데이터, Equifax, Experian 등의 사용자 데이터를 포함합니다. 이러한 데이터베이스 중 다수에 "익명"정보가 포함되어 있음에도 불구하고 학생들은 실제 사용자를 식별하는 것이 그리 어렵지 않았다고 말합니다.

작동 원리는 매우 간단합니다. 이 프로그램은 식별 정보 (이메일 또는 개인 이름) 목록을 가져온 다음 유출 된 모든 데이터베이스에서 지정된 매개 변수와 일치하는 정보를 검색합니다. 일치하는 항목이 있으면 학생은 해당 사람에 대한 자세한 정보를 얻습니다. 때로는이 정보만으로도이를 명확하게 식별 할 수 있습니다.

 

 

당신의 성격의 조각 수집

 

개별 누출은 퍼즐 조각과 같습니다. 그 자체로는 그다지 유용하지는 않지만 많은 누수가 수집되어 단일 데이터베이스로 바뀌면 개성에 대한 놀랍도록 명확한 그림을 얻을 수 있습니다. 사람들은 이러한 유출을 잊어 버릴 수 있지만 해커는 많은 시간이 지나면이 데이터를 사용할 수 있습니다. 퍼즐 조각을 몇 개 더 모으기 만하면됩니다.

한 회사는 사용자 이름, 암호, 전자 메일 주소 및 기타 기본 계정 정보 만 저장할 수 있지만 다른 회사는 탐색 및 검색 쿼리에 대한 정보 나 위치에 대한 데이터를 저장할 수 있다고 상상해보십시오. 이 정보만으로는 귀하를 식별 할 수는 없지만 가장 가까운 친구 나 가족조차 알지 못하는 수많은 개인 정보를 종합적으로 공개 할 수 있습니다.

학생 연구의 목적은 그러한 데이터 수집이 아무리 비인간적이든 여전히 사용자에게 잠재적 인 위협이되고 있음을 보여주는 것입니다. 한 소스의 데이터 세트는 두 세트 모두에 존재하는 라인을 통해 다른 소스에 쉽게 링크 될 수 있습니다. 즉, 데이터 수집 및 저장에 관련된 회사가 완전한 개인화를 보장하기 때문에 개인 정보가 안전하다고 생각해서는 안됩니다.

이에 대한 다른 증거가 있습니다. 예를 들어 영국의 한 연구에서 기계 학습 과학자는 15 가지 특성 만 사용하여 익명 데이터 세트에서 미국인의 99.98 %를 정확하게 식별 할 수있는 프로그램을 만들 수있었습니다. 매사추세츠 공과 대학 대표자들에 의한 또 다른 연구,4 개의 기본 매개 변수 만 사용하는 경우 90 %의 사례에서 사용자를 식별 할 수 있음을 보여 줍니다.

개별적으로 정보 유출은 다소 고통 스럽지만 집합 적으로는 실제 악몽이됩니다.

 

 

문제는 회사에서만이 아닙니다

그러나 회사만을 비난해서는 안됩니다. 거의 매주 현상이 된 기밀 데이터 유출과 관련된 수많은 스캔들에도 불구하고 대중은 이러한 유출 및 해킹이 개인 보안에 미치는 영향을 크게 과소 평가합니다. 따라서 기본 보안 조치를 무시합니다. 따라서 프로그램의 출력 데이터 세트 중 하나를 분석 한 후 하버드 학생들은 데이터베이스에 포함 된 96,000 개의 비밀번호 중 26,000 개만이 고유 한 것으로 나타났습니다.

즉, 사람들은 템플릿 암호를 사용하여 복잡한 것을 생각해 내기에는 너무 게으르다. 예를 들어, 이 주제에 대한 Habre 의 최근 간행물 입니다. 리더는 비밀번호“12345”및“123456”입니다. 이러한 보호를 통해 해킹으로부터 기술을 절약 할 수 없습니다. 자신이 아무런 노력을 기울이지 않으면 개인의 데이터를 보호하기가 어렵습니다.

뉘앙스가 있습니다. " 2013 년 9 월 5 일 Roskomnadzor 주문 적용 방법론 N 996" 러시아에서 개인 데이터 익명화 요구 사항 및 방법 승인 (Roskomnadzor 12/13/2013에 의해 승인 됨) 이 적용되고 있습니다. 그리고이 절차를 지키지 않으면 성명을 ID로 바꾸십시오 (모든 사람들은 Rosreestr의 전 러시아 검찰 총장 Artyom과 Igor Chaika의 자녀들의 이름이 얼마나 기적적 으로 LSDU3 및 YFYaU9 코드로 바뀌 었는지 기억합니다 ).

다른 무엇을 추가 할 수 있습니까? 고유 한 비밀번호를 사용하는 것의 중요성에 대해 많은 사람들이 말을 거듭했습니다. 또한 회사는 데이터를 계속 수집하여 가능한 한 모든 것을 개인화하지 않을 것을 약속합니다. 그러나 보시다시피 이러한 약속을 항상 신뢰할 수는 없습니다.

 

 

 

관련글 더보기

댓글 영역