I dati sono un argomento delicato e naturalmente ne parlerai molto come data scientist. Ecco alcune regole da seguire sempre.
I dati sono estremamente preziosi e sfruttarli è facilmente una delle best practice per la maggior parte delle organizzazioni di oggi. Ma conoscere gli standard del settore in merito è necessario affinché i data scientist non sbaglino con i dati mentre le persone imparano di più sul loro valore.
Pertanto, i data scientist devono adottare pratiche sicure ed etiche e adottarne di standardizzate. Invece di considerare quanto siano preziosi solo i dati, è saggio mettere in discussione i metodi per ottenere ed elaborare i dati per qualsiasi scopo. Pertanto, ecco nove codici di condotta che ogni data scientist dovrebbe seguire.
1. Osservare i regolamenti
I data scientist devono conoscere le normative sulla protezione dei dati che si applicano a determinati lavori. Altrimenti, potresti inconsapevolmente violare la legge e mettere a rischio te stesso e gli altri. Quindi, questa conoscenza è fondamentale per garantire un lavoro etico e prevenire danni non intenzionali.
Pertanto, controlla le leggi pertinenti prima di intraprendere qualsiasi attività. Inoltre, non limitarti a osservare i regolamenti per seguire le regole; anche cercare una comprensione più profonda di loro. Per osservare correttamente le normative, devi sapere perché sono state poste e da cosa proteggono.
Alcune leggi sulla privacy degne di nota sono il regolamento generale sulla protezione dei dati dell'UE (GDPR) e il California Consumer Privacy Act (CCPA). Altri includono HIIPA, DPA, PIPEDA, LGPD e molte normative specifiche del settore.
2. Rispetta la Privacy
Indirizzi, e-mail e ID sono identificatori che non dovrebbero essere pubblici in quanto rappresentano un rischio reale per le persone. Quindi, assicurati di rendere questi dettagli il più privati possibile.
Se esposte, le vittime potrebbero subire furto di identità o frode. Potrebbero anche essere ricattati da persone che minacciano di divulgare le loro informazioni riservate. Inoltre, i professionisti possono subire danni alla reputazione e molestie online una volta che le loro preferenze personali vengono rese pubbliche. Questi possono influenzare le loro relazioni, le opportunità di carriera e la posizione sociale.
Quindi, con questo in mente, ricerca e seleziona modi efficaci per migliorare identità online sicure e de-identificare i dati. Ad esempio, puoi sostituire caratteri, rimuovere identificatori diretti o generalizzare. In questo modo proteggi i dati sensibili dai criminali informatici mentre aiuti le organizzazioni con le tue scoperte.
3. Elimina i pregiudizi
I data scientist si affidano alle statistiche per essere il più obiettivi possibile. Tuttavia, nonostante questi sforzi, il pregiudizio persiste perché l'idea che dati più grandi siano più accurati è uno dei più miti comuni della scienza dei dati.
C'è del vero in questo, ma sfortunatamente i dati di grandi dimensioni a volte contengono elementi e statistiche non necessari o fasulli. Quindi, piuttosto che concentrarti solo sui numeri, assicurati che i tuoi dati siano puliti e rappresentativi.
La pulizia o il filtraggio dei dati prima dell'uso sono metodi eccellenti per combattere i pregiudizi. Ad esempio, è possibile verificare la presenza di errori o utilizzare il campionamento stratificato per garantire dati rappresentativi.
4. Non fabbricare o inventare risultati
La fabbricazione è una forma di cattiva condotta relativa ai dati e di ricerca fraudolenta che comporta l'elaborazione di scoperte e la loro segnalazione come vere.
Ad esempio, uno scienziato dei dati può segnalare che un farmaco non ha effetti collaterali per la maggior parte dei membri di un determinato gruppo di età. Questi risultati sarebbero fabbricati se non ci fossero esperimenti medici iniziali e dati raccolti per sostenerli.
La fabbricazione ha conseguenze gravi e negative per i data scientist e per coloro che fanno affidamento sul loro lavoro. Potrebbe distruggere la tua credibilità, macchiare la reputazione della tua organizzazione, danneggiare il pubblico o esporti a rischi legali.
5. Non falsificare o manipolare le prove
La falsificazione è la manipolazione della realtà, i dati raccolti per adattarsi a un'agenda. Mentre i fabbricanti inventano risultati da dati inesistenti per supportare le loro affermazioni, i falsificatori lavorano per confutare dati reali ed esistenti per motivi personali. Per raggiungere questo obiettivo, possono manomettere le apparecchiature di ricerca, modificare o omettere completamente i dati.
La falsificazione può danneggiare il pubblico fornendo informazioni false che influenzano il processo decisionale in vari settori. Ad esempio, uno studio su un farmaco falsificato potrebbe esporre le persone a rischi inutili, trattamenti inefficaci o effetti collaterali dannosi. Può anche causare la perdita di denaro, tempo o materiali che potrebbero essere stati utilizzati per altri scopi.
La fabbricazione e la falsificazione sono pratiche senza scrupoli con effetti negativi e numerose sanzioni. Questi possono includere multe, revoca delle credenziali, perdita di fondi per la ricerca o incarcerazione.
6. Mostra trasparenza
Trasparenza per i data scientist significa essere onesti sui metodi applicati per raccogliere, analizzare e presentare i dati. I data scientist dovrebbero essere aperti e pronti a condividere le loro pratiche con altri data scientist e partecipanti allo studio.
Inoltre, è necessario ottenere il consenso dei partecipanti allo studio perché la pubblicazione dei risultati senza il consenso informato può mancare di rispetto o danneggiare i partecipanti in vari modi. Possono violare la loro dignità, privacy e autonomia o esporli a rischi dannosi e non necessari derivanti dallo studio.
La trasparenza crea fiducia con coloro che si affidano ai tuoi dati per ottenere informazioni dettagliate. Garantisce inoltre la qualità dei dati consentendo ad altri di rivedere i risultati.
Inoltre, l'apertura tra i data scientist promuove la collaborazione e l'apprendimento. Puoi aiutare a promuovere l'innovazione condividendo il tuo processo e comunicando il migliori metodi di visualizzazione dei dati e tecniche di scienza dei dati ai colleghi imparando da loro.
7. Raccogli i dati in modo sicuro
I data scientist devono confermare la sicurezza dei metodi utilizzati per raccogliere, analizzare e archiviare i dati. In questo modo si prevengono potenziali violazioni dei dati che possono influire sui data scientist e sui partecipanti allo studio.
Le violazioni dei dati mettono a repentaglio la sicurezza personale, minano la fiducia del pubblico ed espongono l'incompetenza organizzativa con conseguenti perdite finanziarie sconcertanti per l'azienda. Queste perdite potrebbero essere azioni legali delle vittime della violazione dei dati, un minor numero di clienti e altro ancora.
Alla luce di ciò, è necessario condurre una ricerca per trovare il file soluzioni di sicurezza dei dati più efficaci e applicarli. Ad esempio, puoi proteggere le connessioni con la crittografia TLS/SSL o utilizzare proxy a rotazione. Inoltre, è possibile applicare misure di controllo degli accessi e creare backup in caso di attacco. Quando trovi le soluzioni, non dimenticare di condividerle con gli altri per garantire la massima sicurezza.
8. Usa gli algoritmi in modo responsabile
Gli algoritmi non sono solo strumenti per l'analisi dei dati. Sono potenti influenze sulla vita, sui comportamenti e sulle opportunità delle persone. Tuttavia, sebbene aiutino a risolvere problemi ea fare previsioni innovative, sono anche imperfette.
Se non progettati, testati o implementati con cura, gli algoritmi hanno impatti sociali ed etici che possono danneggiare determinati gruppi di persone. Introducono anche pregiudizi se addestrati su dati che riflettono pregiudizi esistenti e possono essere imprevedibili. Pertanto, i data scientist devono progettarli e utilizzarli in modo responsabile.
Scegli sempre gli algoritmi appropriati, testane le prestazioni e spiega come funzionano. Inoltre, assicurati di identificare potenziali fonti di parzialità e di implementare meccanismi che aggiornino o correggano ove necessario.
9. Considera le implicazioni a lungo termine del tuo lavoro
Il tuo lavoro di data scientist avrà un impatto significativo su molti aspetti della società. Quindi, considera sempre come i tuoi modelli influenzano le persone.
Ad esempio, cerca di chiederti se il tuo lavoro può perpetuare pregiudizi e disuguaglianze o mettere a repentaglio la privacy in futuro. Quindi, affronta adeguatamente queste preoccupazioni.
Si noti che una prospettiva orientata al futuro è più importante di qualsiasi metodo correttivo e pensare ai giorni a venire è uno dei modi più efficaci per prendere decisioni eticamente valide.
Devi essere etico come Data Scientist
In qualità di data scientist, ricevi un potere che viene fornito con una responsabilità proporzionale. Le tue capacità sono rare, quindi ti siedi in prima linea nel processo decisionale organizzativo.
Le tue decisioni influenzano tutto, dai piani aziendali aziendali ai sistemi di giustizia penale. Quindi, non dovresti farli alla leggera. Sii sempre onesto, etico e meticoloso nel tuo lavoro per proteggere le persone dai dilemmi etici esistenti nel tuo settore e in altri campi tecnologici.