G-B7N2H7TNZP
top of page

Kişisel Verilerin Anonimleştirilmesi Nedir?


1. ANONİM HALE GETİRME KAVRAMI


Kişisel Verilerin Silinmesi, Yok Edilmesi veya Anonim Hale Getirilmesi Hakkında Yönetmelik’in 10.maddesinde kişisel verilerin anonim hale getirilmesi, “kişisel verilerin başka verilerle eşleştirilse dahi hiçbir surette kimliği belirli veya belirlenebilir bir gerçek kişiyle ilişkilendirilemeyecek hale getirilmesidir” şeklinde tanımlanmıştır. Bir başka deyişle anonimleştirme; ilgili kişinin kimliğinin saptanabilmesinin engellenmesi ve bir grup içinde ayırt edilebilir olma özelliğinin bir gerçek kişi ile ilişkilendirilemeyecek şekilde kaybettirilmesi amacıyla bir veri kümesindeki tüm doğrudan ve dolaylı tanımlayıcıların değiştirilmesi veya çıkarılmasıdır. (1)

Ana kriter anonimleştirilen kişisel verilerin bir kişi ile ilişkilendirilip ilişkilendirilemeyeceği hususu olduğundan anonim hale getirme işleminin, yalnızca ilgili kişinin adı yerine takma isim veya numara belirlenmesinden ibaret bir işlem olmadığı açıktır. Zira kişilerin kimliklerinin tespit edilebilmesi kişilere takma ad veya numara atanmış olsa dahi mümkün olabildiğinden; verinin, kişisel veri niteliğini kaybettiği savunulamaz. (2) Kişisel verilerin anonimleştirilmesi ise; ilgili kişinin verilerinin, kişinin kimliğinin tespit edilmesine hiçbir surette mahal vermeyecek şekilde saklanması anlamına gelmektedir.


Ülkemiz mevzuatına 95/46/EC sayılı Yönergeyi ilga ederek yürürlüğe giren GDPR’nin öngördüğü “pseudonymisation” yöntemi, kişiyi tanımlayan verilerin, analitik amaçlar için belli bir algoritma ile farklılaştırılmasıdır. (3) İstenildiği zaman aynı algoritma kullanılarak orijinal verilere tekrar ulaşılabilmesi bu yöntemi anonimleştirme yönteminden ayırır.


2. KİŞİSEL VERİLERİN ANONİM HALE GETİRİLMESİ YÖNTEMLERİ


2.1. Değer Düzensizliği Sağlamayan Anonim Hale Getirme Yöntemleri

2.1.1. Değişkenleri Çıkartma

Değişkenlerden birinin veya birkaçının tablodan bütünüyle silinerek çıkartılmasıyla sağlanan bir anonim hale getirme yöntemidir. Değişkenin kamuya ifşa edilemeyecek kadar hassas bir veri olması, analitik amaçlara hizmet etmiyor olması veya daha uygun bir çözümün var olmaması gibi sebepler bu yöntemin kullanılması sebeplerinden birkaçını ifade eder.


2.1.2. Kayıtları Çıkartma

Diğer kayıtlarla ortak bir değer taşımayan, veri kümesi hakkında bilgi sahibi olan kişilerin tahmin yürütebileceği ve veri kümesinde tekillik içeren kaydı barındıran satırın çıkartılması ile yapılan bu yöntem ile veri kümesine dair varsayımlar üretebilme ihtimali azaltılır.


2.1.3. Bölgesel Gizleme

Kayda ait değerlerin yarattığı kombinasyonun çok az rastlanır olduğu ve bu nedenle ilgili kişinin ayırt edilebilme ihtimalinin yükseldiği durumda başvurulan bir yöntemdir. İstisnai durumu yaratarak veri kümesinin güvenilirliğini tehlikeye sokan değer “bilinmiyor” olarak değiştirilir ve veri kümesinin tahmin edilebilirliği azaltılır.


2.1.4. Genelleştirme

Kümülatif raporlar üretirken sıkça başvurulan bu yöntemde ilgili kişisel veri özel bir değerden daha genel bir değere çevrilerek elde edilen yeni değerden gerçek bir kişiye ulaşılması imkansız hale getirilir. Daha az tanımlanabilir hale getirmek maksadıyla bazı veriler kasıtlı olarak kaldırılır.


2.1.5. Alt ve Üst Sınır Kodlama

Belli bir değişken için bir kategori tanımlayarak bu kategorinin oluşturduğu küme içerisinde kalan değerler birleştirilerek oluşturulan yöntemdir.


2.1.6. Global Kodlama

Sayısal değerler içermeyen ve alt ve üst sınır kodlamanın uygulanmasının mümkün olmadığı değerleri içeren veri kümelerinde kullanılan bu gruplama yönteminde seçilen değerler için ortak yeni bir grup oluşturulur ve veri kümesindeki tüm kayıtlar bu tanımlama ile gruplandırılır.


2.1.7. Örnekleme

Anonim hale getirme yöntemlerinden bir diğeri ise örneklemedir. Bütün veri kümesi yerine, kümeden alınan bir alt küme açıklanarak yapılan bu anonimleştirme yöntemiyle kişilerin tahmin edilebilirliğinin azaltılması amaçlanmaktadır. Zira veri kümesinde yer aldığı bilinen kişinin paylaşılan örnek alt küme içinde bulunup bulunmadığı tespit edilemeyeceğinden kişilere dair isabetli varsayımlar yapmak oldukça güçleşecektir.


2.2. Değer Düzensizliği Sağlayan Anonim Hale Getirme Yöntemleri

2.2.1. Mikro Birleştirme

Bu yöntem ile veri kümesindeki bütün kayıtlar öncelikle anlamlı bir sıraya göre dizilip sonrasında bütün küme belirli bir sayıda alt kümelere ayrılır. Daha sonra her alt kümenin belirlenen değişkene ait değerinin ortalaması alınarak alt kümenin o değişkenine ait değeri ortalama değer ile değiştirilir. Böylece o değişkenin tüm veri kümesi için geçerli olan ortalama değeri de değişmeyecektir.


2.2.2. Veri Değiş Tokuşu

Genellikle kategorize edilebilen değişkenler için kullanılan bu yöntemde kayıtların arasından seçilen çiftlerin arasındaki bir değişken alt kümeye ait değerlerin karşılıklı yerleri değiştirilerek veri tabanı dönüştürülür.


2.2.3. Gürültü Ekleme

Temel olarak sayısal değer içeren veri kümelerinde uygulanan bu yöntemde belirlenen ölçüde bozulma her değere eşit ölçüde uygulanır.


2.3. Anonim Hale Getirmeyi Kuvvetlendirici İstatiksel Yöntemler

2.3.1. K-Anonimlik

Belli kombinasyonlarda tekil özellikler gösteren kişilere özgü bilgilerin ifşasına mani olmak amacıyla geliştirilen bu yöntemde; bir veri kümesindeki belirli alanlarda birden fazla kişinin bilgileri tanımlanır. Bu sayede bir veri kümesindeki değişkenlerden bir kısmının bir araya getirilmesiyle oluşturulan kombinasyonlara ait birden fazla kayıt bulunması halinde, oluşturulan kombinasyon içerisinde bulunan kişilerin kimliklerinin tespit edilebilmesi ihtimali azaltılır. Fakat bu yöntem kimliklerin ifşa edilmesine yönelik saldırılara karşı koruma sağlarken niteliklerin ifşa edilmesine yönelik saldırılara karşı koruma sağlayamamaktadır. (4)


2.3.2. L-Çeşitlilik

K-Anonimlik modelinin zayıflıklarının giderilmesi amacıyla oluşturulan bu yöntemde, anonimleştirilmiş grupların homojen değerlerden oluşmasını engellenir ve bir veri gösteriminin ayrıntı düzeyi azaltılarak veri kümelerinde gizliliğin korunması sağlanır.


2.3.3. T-Yakınlık

L- Çeşitlilik yaklaşımının yeterli korumayı sağlayamaması üzerine önerilen T-Yakınlık modelinde kişisel verilerin, değerlerin birbirlerine yakınlık dereceleri hesaplanır ve veri kümesi bu yakınlık derecelerine göre alt kümelere ayrılır. Buna göre her bir eşdeğer grup içerisindeki hassas nitelik dağılımının tüm tablo içerisindeki niteliklerin dağılımına olan uzaklığı “t” ile belirlenen eşik değerini geçmeyecektir. (5) T- Yakınlık yaklaşımı niteliklerin ifşasına karşı koruma sağlarken kimliklerin açığa çıkarılmasına karşı koruma sağlayamamaktadır.


KAYNAKÇA

(1) Baysal M, KVKK: Kişisel Verilerin Korunması Kanunu: El Kitabı (Seçkin Yayıncılık 2020)

(2)Kaya İS and Tolun Y, Uygulayıcılar Için Türkiye'de Ve Avrupa'da Kişisel Verilerin İşlenmesi KVKK-GDPR Karşılaştırması (Adalet Yayınevi 2020)

(3) Uysal EH and Karagöz B, Tüm Dokümanlarla KVKK Uyum Süreci (Seçkin Yayıncılık 2021)

(4) Vural Y, “Veri Mahremiyeti: Saldırılar, Korunma ve Yeni Bir Çözüm Önerisi ”(2018) 4 Uluslararası Bilgi Güvenliği Mühendisliği Dergisi 25

(5) Vural Y, “Veri Mahremiyeti: Saldırılar, Korunma ve Yeni Bir Çözüm Önerisi ”(2018) 4 Uluslararası Bilgi Güvenliği Mühendisliği Dergisi 25


Comments


bottom of page