Podatki so občutljiva tema in seveda se boste kot podatkovni znanstvenik veliko ukvarjali s tem. Tukaj je nekaj pravil, ki jih morate vedno upoštevati.

Podatki so izjemno dragoceni in njihovo izkoriščanje je enostavno ena najboljših praks za večino današnjih organizacij. Vendar je poznavanje industrijskih standardov v zvezi s tem nujno, da se podatkovni znanstveniki ne bi motili s podatki, saj ljudje izvedo več o njihovi vrednosti.

Kot taki morajo podatkovni znanstveniki sprejeti varne in etične prakse ter sprejeti standardizirane. Namesto razmišljanja o tem, kako dragoceni so le podatki, se je pametno spraševati o metodah pridobivanja in obdelave podatkov za katerikoli namen. Tukaj je torej devet kodeksov ravnanja, ki bi se jih moral držati vsak podatkovni znanstvenik.

1. Upoštevajte predpise

Podatkovni znanstveniki morajo poznati predpise o varstvu podatkov, ki veljajo za določena delovna mesta. V nasprotnem primeru lahko nevede prekršite zakon in ogrozite sebe in druge. To znanje je torej ključnega pomena za zagotavljanje etičnega dela in preprečevanje nenamerne škode.

Zato preverite ustrezne zakone, preden se lotite kakršnih koli dejavnosti. Poleg tega ne upoštevajte le predpisov, da bi sledili pravilom; si prizadevajo tudi za njihovo globlje razumevanje. Za pravilno upoštevanje predpisov morate vedeti, zakaj so bili postavljeni in pred čim ščitijo.

Nekaj ​​omembe vrednih zakonov o zasebnosti je Splošna uredba EU o varstvu podatkov (GDPR) in kalifornijski zakon o zasebnosti potrošnikov (CCPA). Drugi vključujejo HIIPA, DPA, PIPEDA, LGPD in številne industrijske predpise.

2. Spoštujte zasebnost

Naslovi, e-pošta in ID so identifikatorji, ki ne bi smeli biti javni, saj predstavljajo resnično tveganje za ljudi. Zato poskrbite, da bodo te podrobnosti čim bolj zasebne.

Če bi bile žrtve izpostavljene, bi lahko bile žrtve kraje identitete ali goljufije. Lahko jih tudi izsiljujejo ljudje, ki jim grozijo, da bodo razkrili njihove zaupne informacije. Poleg tega lahko strokovnjaki utrpijo škodo za ugled in spletno nadlegovanje, ko so njihove osebne nastavitve javne. To lahko vpliva na njihove odnose, karierne priložnosti in družbeni položaj.

Torej s tem v mislih raziščite in izberite učinkovite načine za izboljšanje varne spletne identitete in deidentificirati podatke. Lahko bi na primer zamenjali znake, odstranili neposredne identifikatorje ali posplošili. S tem zaščitite občutljive podatke pred kibernetskimi kriminalci, hkrati pa pomagate organizacijam pri vaših ugotovitvah.

3. Odpravite pristranskost

Podatkovni znanstveniki se zanašajo na statistiko, da so čim bolj objektivni. Vendar kljub tem prizadevanjem pristranskost ostaja, ker je ideja, da so večji podatki natančnejši, ena najbolj pogosti miti podatkovne znanosti.

V tem je nekaj resnice, a na žalost veliki podatki včasih vsebujejo nepotrebne ali lažne elemente in statistiko. Torej, namesto da se osredotočate samo na številke, zagotovite, da so vaši podatki čisti in reprezentativni.

Čiščenje ali filtriranje podatkov pred uporabo sta odlični metodi za boj proti pristranskosti. Preverite lahko na primer napake ali uporabite stratificirano vzorčenje, da zagotovite reprezentativne podatke.

4. Ne izmišljujte si rezultatov

Izmišljotina je oblika napačnega ravnanja s podatki in raziskovalne goljufije, ki vključuje izmišljevanje ugotovitev in poročanje o njih kot resničnih.

Na primer, podatkovni znanstvenik lahko poroča, da je bilo ugotovljeno, da zdravilo nima stranskih učinkov za večino članov določene starostne skupine. Te ugotovitve bi bile izmišljene, če ne bi bilo začetnih medicinskih poskusov in zbranih podatkov, ki bi jih podprli.

Izdelava ima resne in negativne posledice za podatkovne znanstvenike in tiste, ki se zanašajo na njihovo delo. Lahko bi uničil vašo verodostojnost, omadeževal ugled vaše organizacije, škodoval javnosti ali vas izpostavil pravnim tveganjem.

5. Ne ponarejajte in ne manipulirajte z dokazi

Potvarjanje je manipulacija z resničnostjo, zbrani podatki, ki ustrezajo nekemu načrtu. Medtem ko izdelovalci izdelujejo rezultate iz neobstoječih podatkov v podporo svojim trditvam, si ponarejevalci prizadevajo ovreči resnične in obstoječe podatke iz osebnih razlogov. Da bi to dosegli, lahko posegajo v raziskovalno opremo, spremenijo ali v celoti izpustijo podatke.

Ponarejanje lahko škodi javnosti z zagotavljanjem napačnih informacij, ki vplivajo na odločanje v različnih sektorjih. Na primer, ponarejena študija zdravil bi lahko ljudi izpostavila nepotrebnim tveganjem, neučinkovitemu zdravljenju ali škodljivim stranskim učinkom. Lahko povzroči tudi izgubo denarja, časa ali materialov, ki bi jih lahko uporabili za druge namene.

Izmišljevanje in ponarejanje sta brezvestni praksi s škodljivimi učinki in številnimi sankcijami. To lahko vključuje denarne kazni, preklic poverilnic, izgubo financiranja raziskav ali zaporno kazen.

6. Pokaži preglednost

Preglednost za podatkovne znanstvenike pomeni poštenost glede uporabljenih metod za zbiranje, analizo in predstavitev podatkov. Podatkovni znanstveniki bi morali biti odprti in pripravljeni deliti svoje prakse z drugimi podatkovnimi znanstveniki in udeleženci študije.

Poleg tega morate pridobiti soglasje udeležencev študije, ker lahko objava rezultatov brez informiranega soglasja ne spoštuje ali škodi udeležencem na različne načine. Lahko kršijo njihovo dostojanstvo, zasebnost in avtonomijo ali jih izpostavijo škodljivim, nepotrebnim tveganjem, ki so posledica študije.

Transparentnost gradi zaupanje pri tistih, ki se za vpogled zanašajo na vaše podatke. Zagotavlja tudi kakovost podatkov, saj drugim omogoča pregled vaših rezultatov.

Poleg tega odprtost med podatkovnimi znanstveniki spodbuja sodelovanje in učenje. Lahko pomagate spodbujati inovacije tako, da delite svoj proces in komunicirate najboljše metode vizualizacije podatkov in tehnike podatkovne znanosti vrstnikom, medtem ko se od njih učite.

7. Varno zbiranje podatkov

Podatkovni znanstveniki morajo potrditi varnost metod, ki se uporabljajo za zbiranje, analizo in shranjevanje podatkov. S tem preprečite morebitne kršitve podatkov, ki lahko vplivajo na podatkovne znanstvenike in udeležence študije.

Kršitve podatkov ogrožajo osebno varnost, spodkopavajo zaupanje javnosti in razkrivajo organizacijsko nesposobnost, kar ima za posledico osupljive finančne izgube za podjetje. Te izgube so lahko tožbe žrtev kršitve podatkov, manjše število strank in drugo.

Glede na to morate opraviti raziskavo, da bi našli najučinkovitejše rešitve za varnost podatkov in jih uporabite. Povezave lahko na primer zaščitite s šifriranjem TLS/SSL ali uporabite rotirajoče proxyje. Prav tako lahko uveljavite ukrepe za nadzor dostopa in ustvarite varnostne kopije v primeru napada. Ko najdete rešitve, jih ne pozabite deliti z drugimi, da zagotovite največjo varnost.

8. Algoritme uporabljajte odgovorno

Algoritmi niso le orodja za analizo podatkov. Močno vplivajo na življenja, vedenje in priložnosti ljudi. Čeprav pomagajo reševati probleme in dajejo inovativne napovedi, so tudi nepopolni.

Če algoritmi niso skrbno zasnovani, preizkušeni ali uvedeni, imajo družbene in etične učinke, ki lahko škodijo določenim skupinam ljudi. Prav tako ustvarjajo pristranskost, če se usposabljajo na podatkih, ki odražajo obstoječe predsodke in so lahko nepredvidljivi. Zato jih morajo podatkovni znanstveniki načrtovati in uporabljati odgovorno.

Vedno izberite ustrezne algoritme, preizkusite njihovo delovanje in razložite, kako delujejo. Poskrbite tudi, da boste prepoznali morebitne vire pristranskosti in uvedli mehanizme, ki po potrebi posodabljajo ali popravljajo.

9. Razmislite o dolgoročnih posledicah svojega dela

Vaše delo podatkovnega znanstvenika bo pomembno vplivalo na številne vidike družbe. Zato vedno upoštevajte, kako vaši modeli vplivajo na ljudi.

Poskusite se na primer vprašati, ali lahko vaše delo ohranja predsodke in neenakost ali ogroža zasebnost v prihodnosti. Nato ustrezno obravnavajte te skrbi.

Upoštevajte, da je pogled, usmerjen v prihodnost, pomembnejši od katere koli korektivne metode, razmišljanje o prihodnjih dneh pa je eden najučinkovitejših načinov za sprejemanje etično zdravih odločitev.

Kot podatkovni znanstvenik morate biti etični

Kot podatkovni znanstvenik prejmete moč, ki prihaja s sorazmerno odgovornostjo. Vaše veščine so redke, zato sedite na čelu organizacijskih odločitev.

Vaše odločitve vplivajo na vse, od poslovnih načrtov podjetja do kazenskopravnih sistemov. Torej, ne bi jih smeli narediti zlahka. Pri svojem delu bodite vedno pošteni, etični in natančni, da zaščitite ljudi pred obstoječimi etičnimi dilemami v vaši industriji in na drugih tehnoloških področjih.