Duomenys yra jautri tema, ir jūs, kaip duomenų mokslininkas, natūraliai su jais susidursite. Štai keletas taisyklių, kurių visada turėtumėte laikytis.

Duomenys yra labai vertingi, o jų panaudojimas yra viena geriausių šiandienos daugelio organizacijų praktikų. Tačiau žinoti pramonės standartus šiuo klausimu būtina, kad duomenų mokslininkai neklystų su duomenimis, kai žmonės daugiau sužino apie jų vertę.

Todėl duomenų mokslininkai turi laikytis saugios ir etiškos praktikos ir taikyti standartizuotą praktiką. Užuot svarstyję, kiek vertingi tik duomenys, išmintinga suabejoti duomenų gavimo ir apdorojimo būdais bet kokiam tikslui. Taigi, čia yra devyni elgesio kodeksai, kurių turėtų laikytis kiekvienas duomenų mokslininkas.

1. Laikykitės taisyklių

Duomenų mokslininkai turi žinoti tam tikroms darbo vietoms taikomus duomenų apsaugos reglamentus. Priešingu atveju galite nesąmoningai pažeisti įstatymą ir kelti pavojų sau bei kitiems. Taigi šios žinios yra labai svarbios siekiant užtikrinti etišką darbą ir užkirsti kelią nenumatytai žalai.

instagram viewer

Todėl prieš pradėdami bet kokią veiklą peržiūrėkite atitinkamus įstatymus. Be to, ne tik laikykitės taisyklių, kad laikytumėte taisyklių; taip pat siekti gilesnio jų supratimo. Norėdami tinkamai laikytis taisyklių, turite žinoti, kodėl jie buvo įdėti ir nuo ko jie apsaugo.

Keletas dėmesio vertų privatumo įstatymų yra ES Bendrasis duomenų apsaugos reglamentas (GDPR) ir Kalifornijos vartotojų privatumo įstatymą (CCPA). Kiti apima HIIPA, DPA, PIPEDA, LGPD ir daugelį su pramone susijusių taisyklių.

2. Gerbkite privatumą

Adresai, el. pašto adresai ir ID yra identifikatoriai, kurie neturėtų būti vieši, nes kelia realią riziką žmonėms. Todėl pasirūpinkite, kad ši informacija būtų kuo privatesnė.

Jei bus atskleista, aukos gali nukentėti nuo tapatybės vagystės ar sukčiavimo. Juos taip pat gali šantažuoti žmonės, grasinantys atskleisti savo konfidencialią informaciją. Be to, profesionalai gali patirti žalą reputacijai ir priekabiauti internete, kai bus paviešinti jų asmeniniai pasirinkimai. Tai gali turėti įtakos jų santykiams, karjeros galimybėms ir socialinei padėčiai.

Taigi turėdami tai omenyje, tyrinėkite ir pasirinkite veiksmingus būdus, kaip pagerinti saugios internetinės tapatybės ir panaikinti duomenų tapatybę. Pavyzdžiui, galite pakeisti simbolius, pašalinti tiesioginius identifikatorius arba apibendrinti. Taip apsaugomi neskelbtini duomenys nuo kibernetinių nusikaltėlių, o organizacijoms padedama padaryti išvadas.

3. Pašalinkite šališkumą

Duomenų mokslininkai remiasi statistika, kad būtų kuo objektyvesnė. Tačiau nepaisant šių pastangų, šališkumas išlieka, nes nuomonė, kad didesni duomenys yra tikslesni, yra viena iš labiausiai paplitusių. paplitę duomenų mokslo mitai.

Tam tikros tiesos yra, bet, deja, dideliuose duomenyse kartais yra nereikalingų ar netikrų elementų ir statistikos. Taigi, užuot sutelkę dėmesį tik į skaičius, įsitikinkite, kad jūsų duomenys yra švarūs ir reprezentatyvūs.

Duomenų valymas arba filtravimas prieš naudojimą yra puikus būdas kovoti su šališkumu. Pavyzdžiui, galite patikrinti, ar nėra klaidų, arba naudoti stratifikuotą atranką, kad užtikrintumėte reprezentatyvius duomenis.

4. Nekurkite ir negalvokite rezultatų

Gamyba yra netinkamo duomenų tvarkymo ir sukčiavimo tyrimų metu forma, kai nustatomos išvados ir pranešama, kad jos yra tikros.

Pavyzdžiui, duomenų mokslininkas gali pranešti, kad daugumai tam tikros amžiaus grupės narių vaistas nesukelia šalutinio poveikio. Šios išvados būtų sukurtos, jei nebūtų atlikta pradinių medicininių eksperimentų ir būtų surinkti duomenys, kad būtų galima juos paremti.

Gamyba turi rimtų ir neigiamų pasekmių duomenų mokslininkams ir tiems, kurie pasitiki jų darbu. Tai gali sugriauti jūsų patikimumą, suteršti jūsų organizacijos reputaciją, pakenkti visuomenei arba sukelti teisinę riziką.

5. Neklastokite ir nemanipuliuokite įrodymais

Falsifikavimas yra manipuliavimas tikrove, surinktais duomenimis, kad atitiktų darbotvarkę. Nors gamintojai, siekdami pagrįsti savo teiginius, sukuria rezultatus iš neegzistuojančių duomenų, o klastotojai dėl asmeninių priežasčių stengiasi paneigti tikrus ir esamus duomenis. Norėdami tai pasiekti, jie gali sugadinti tyrimų įrangą, pakeisti arba visiškai praleisti duomenis.

Falsifikavimas gali pakenkti visuomenei, nes pateikiama klaidinga informacija, daranti įtaką sprendimų priėmimui įvairiuose sektoriuose. Pavyzdžiui, falsifikuotų vaistų tyrimas gali sukelti žmonėms nereikalingą riziką, neveiksmingą gydymą arba žalingą šalutinį poveikį. Taip pat gali būti prarasti pinigai, laikas arba medžiagos, kurios galėjo būti panaudotos kitiems tikslams.

Gamyba ir klastojimas yra nesąžininga praktika, turinti neigiamą poveikį ir daugybę sankcijų. Tai gali būti baudos, įgaliojimų panaikinimas, mokslinių tyrimų finansavimo praradimas arba įkalinimas.

6. Rodyti skaidrumą

Duomenų mokslininkų skaidrumas reiškia sąžiningumą dėl metodų, taikomų renkant, analizuojant ir pateikiant duomenis. Duomenų mokslininkai turėtų būti atviri ir pasirengę dalytis savo praktika su kitais duomenų mokslininkais ir tyrimo dalyviais.

Be to, turite gauti tyrimo dalyvių sutikimą, nes rezultatų paskelbimas be informuoto sutikimo gali negerbti arba įvairiais būdais pakenkti dalyviams. Jie gali pažeisti jų orumą, privatumą ir savarankiškumą arba kelti jiems žalingą, nereikalingą riziką, kylančią dėl tyrimo.

Skaidrumas didina pasitikėjimą tais, kurie pasikliauja jūsų duomenimis siekdami įžvalgos. Ji taip pat užtikrina duomenų kokybę, leisdama kitiems peržiūrėti jūsų rezultatus.

Be to, duomenų mokslininkų atvirumas skatina bendradarbiavimą ir mokymąsi. Dalindamiesi savo procesu ir bendraudami galite padėti skatinti naujoves geriausi duomenų vizualizavimo metodai ir duomenų mokslo metodus bendraamžiams mokantis iš jų.

7. Saugiai rinkti duomenis

Duomenų mokslininkai turi patvirtinti duomenų rinkimo, analizės ir saugojimo metodų saugumą. Taip išvengiama galimų duomenų pažeidimų, kurie gali turėti įtakos duomenų mokslininkams ir tyrimo dalyviams.

Duomenų pažeidimai kelia pavojų asmens saugumui, pakerta visuomenės pasitikėjimą ir atskleidžia organizacinę nekompetenciją, dėl kurios įmonė patiria didžiulius finansinius nuostolius. Šie nuostoliai gali būti duomenų pažeidimo aukų ieškiniai, mažiau klientų ir kt.

Atsižvelgdami į tai, turite atlikti tyrimą, kad surastumėte efektyviausi duomenų saugumo sprendimai ir pritaikykite juos. Pavyzdžiui, galite apsaugoti ryšius naudodami TLS/SSL šifravimą arba naudoti besisukančius tarpinius serverius. Taip pat galite taikyti prieigos kontrolės priemones ir sukurti atsargines kopijas atakos atveju. Radę sprendimus, nepamirškite jais pasidalinti su kitais, kad užtikrintumėte maksimalų saugumą.

8. Atsakingai naudokite algoritmus

Algoritmai yra ne tik duomenų analizės įrankiai. Jie daro didelę įtaką žmonių gyvenimui, elgesiui ir galimybėms. Tačiau, nors jie padeda spręsti problemas ir daryti naujoviškas prognozes, jie taip pat yra netobuli.

Jei algoritmai nėra kruopščiai sukurti, išbandyti ar įdiegti, jie turi socialinį ir etinį poveikį, kuris gali pakenkti tam tikroms žmonių grupėms. Jie taip pat pateikia šališkumą, jei mokomi remiantis duomenimis, kurie atspindi esamus išankstinius nusistatymus ir gali būti nenuspėjami. Taigi duomenų mokslininkai turi juos kurti ir naudoti atsakingai.

Visada pasirinkite tinkamus algoritmus, patikrinkite jų veikimą ir paaiškinkite, kaip jie veikia. Taip pat įsitikinkite, kad nustatote galimus šališkumo šaltinius ir įdiekite mechanizmus, kurie prireikus atnaujinami arba pataisomi.

9. Apsvarstykite ilgalaikes savo darbo pasekmes

Jūsų, kaip duomenų mokslininko, darbas turės didelę įtaką daugeliui visuomenės aspektų. Taigi, visada apsvarstykite, kaip jūsų modeliai veikia žmones.

Pavyzdžiui, pasistenkite suabejoti, ar jūsų darbas gali išlaikyti išankstinį nusistatymą ir nelygybę arba kelti pavojų privatumui ateityje. Tada tinkamai išspręskite šias problemas.

Atkreipkite dėmesį, kad į ateitį orientuotas požiūris yra svarbesnis už bet kokį korekcinį metodą, o mąstymas apie ateinančias dienas yra vienas iš efektyviausių būdų priimti etiškai pagrįstus sprendimus.

Jūs turite būti etiškas kaip duomenų mokslininkas

Kaip duomenų mokslininkas, jūs gaunate galią, susijusią su proporcinga atsakomybe. Jūsų įgūdžiai yra reti, todėl esate organizacijos sprendimų priešakyje.

Jūsų sprendimai turi įtakos viskam – nuo ​​įmonės verslo planų iki baudžiamosios justicijos sistemų. Taigi, neturėtumėte jų daryti lengvai. Visada būkite sąžiningi, etiški ir kruopštūs, kad apsaugotumėte žmones nuo esamų etinių dilemų jūsų pramonėje ir kitose technologijų srityse.