Privacy-preserving machine learning over distributed data
Promotie: | A.R. (Ali Reza) Ghavamipour, MSc |
Wanneer: | 03 december 2024 |
Aanvang: | 14:30 |
Promotors: | F. (Fatih) Turkmen, Prof, D. (Dimka) Karastoyanova, Prof |
Waar: | Academiegebouw RUG |
Faculteit: | Science and Engineering |
Machine Learning met oog voor privacy
Machine Learning wordt zowel binnen als buiten de wetenschap grootschalig toegepast. Een computer 'leert' zelf op basis van een dataset, en om dat goed te doen zijn grote hoeveelheden data nodig. Maar hoe zit het eigenlijk met privacy en integriteit? Ali Reza Ghavamipour beoogde met zijn onderzoek methoden te ontwikkelen die zowel de vertrouwelijkheid en integriteit van gegevens beschermen als de effectiviteit en efficiëntie van ML-algoritmes in diverse omgevingen behouden. De centrale vraag van dit onderzoek was hoe ML-modellen op een privacybehoudende manier kunnen worden getraind over gedistribueerde data. Deze vraag is opgedeeld in deelvragen die verschillende aspecten van de uitdaging behandelen.
Aanvankelijk richtte Ghavamipour zich op de haalbaarheid van machine learning-operaties op versleutelde gegevens via Multi-Party Computation-technieken. Dit leidde tot verdere exploraties in federatief leren en het genereren van synthetische data. Ghavamipour introduceerde een innovatief framework dat homomorfe encryptie met differentiële privacy combineert, wat een praktische methode biedt voor het genereren van synthetische data in gedistribueerde instellingen. Verder introduceert hij beveiligde protocollen voor het efficiënt aggregeren van informatie uit gedistribueerde bronnen, ter verbetering van de beveiliging tegen semi-eerlijke en Byzantijnse tegenstanders.
De methodes zijn uitvoerig getest met diverse datasets en scenario’s, waarbij bleek dat ze effectief de privacy en veiligheid in gedistribueerde leeromgevingen verbeteren. De ontwikkelde protocollen integreren cryptografische technieken met ML-algoritmen, wat een significante stap voorwaarts markeert naar praktische, privacybeschermende machine learning. Deze bevindingen vormen een solide basis voor toekomstig onderzoek en toepassingen die big data voor ML willen benutten, met behoud van strenge privacy-eisen.
Ali Reza Ghavamipour voerde zijn onderzoek uit aan het Bernoulli Institute for Mathematics, Computer Science and Artificial Intelligence, afdeling Information Systems. Hij vervolgt zijn loopbaan als postdoc bij de Universiteit van Maastricht.