Tarmo Jüristo arutelul riigikogus: „Pensioni tulevikust – kes tasub memme vaeva?” Foto: Madis Veltman

Kui vaadata meie valikuid suurel skaalal, siis joonistuvad välja väga selged mustrid. Mõned neist on lihtsad ja kergesti nähtavad, põhinedes välistel mõjudel, laialt levinud harjumustel või hästi tuntud kalduvustel. Ent teised on üllatavad ja peaaegu märkamatud.

Nendele viimastele jälile jõudmiseks on vaja väga palju andmeid üle pika aja ehk suurandmeid. Hinnangute kohaselt produtseeris inimkond eelmisel aastal kokku umbes 40 zettabaiti (hoomatavuse huvides mälupulga-skaalale tooduna on see 40 triljonit gigabaiti) andmeid. Valdav osa sellest on muidugi tehnilises mõttes lihtsalt müra ja kassipildid. Struktureeritud andmed moodustavad sellest üüratust hulgast üksnes u 5%, kuid ka seda on tegelikult väga, väga palju.

2 triljonit gigabaiti aastas on andmeid, mille abil meie käitumist reaalselt mõjutada.

Suurte üldiste andmemassiivide põhjal on võimalik väga täpselt analüüsida, milliseid valikuid teevad inimesed tavaliselt mingites tingimustes. Kui see omakorda kõrvutada andmetega ühe konkreetse inimese kohta, saab tihtipeale vägagi täpselt ennustada, millise valiku ta selles olukorras langetab, enne kui ta seda isegi teadvustada pruugib.

Amazon juba teab

Seega registreeris e-kaubanduse hiid Amazon juba 2014. aastal patendi „ennetava kättetoimetamise” peale. Lühidalt öeldes: kui märgid näitavad piisava kindlusega, et klient sooritab lähemas tulevikus ostu, paneb Amazon paki teele juba enne, kui see juhtub, nii et klient saab saadetise kätte kohe pärast tellimist.

Kuid enamgi veel: kõike seda teades on võimalik neid valikuid mitte ainult ennustada, vaid ka muuta ja suunata. Selle lähenemise ilmselt kõige enam tähelepanu saanud manifestatsioon oli kolme aasta taguste Ameerika presidendivalimiste ja Cambridge Analytica juhtum. Ennekõike sotsiaalmeediast kogutud suurandmete baasil profileeritud valijarühmadele suunati motiveerivaid sõnumeid vastavalt siis kas valima minekuks või minemata jätmiseks.

Kui märgid näitavad, et klient sooritab lähemas tulevikus ostu, paneb Amazon paki teele juba enne, kui see juhtub.

Kui erasektor on suurandmete kasutamisel viimasel kümnendil pikki samme astunud, siis avaliku sektori lähenemine on, vähemalt läänemaailmas, olnud hillitsetum. Seda ka heal põhjusel, kuivõrd Hiina näide on ilmekas illustratsioon reaalsest ohust, mis kaasneb isiklike andmete kogumise ja kasutamise kombineerimisel poliitilise võimuga. Ometi on siin põhjust mõelda, milline on pikas perspektiivis sellise (osaliselt kahtlemata õigustatud) ettevaatlikkuse hind.

Rakendamisega on kiire

Selle raamistiku välja töötamise ja rakendamisega on meil kiire. Kiire vähemalt kahel põhjusel: esiteks seetõttu, et suurandmeid, sh meie endi kohta käivaid, koguneb iga päevaga aina rohkem ning moel või teisel neid ka kasutatakse iga päevaga aina rohkem. Meie kõigi huvides on, et see toimuks läbipaistval ja kontrollitud moel, mis austab meie privaatsust.

Ettevõtlikkusega ei saa minna liiale. On oluline silmas pidada, et võimalike privaatsusriivete ärahoidmise nimel ei jätaks me kõrvale kõiki neid võimalusi, mida suurandmed pakuvad. Näiteks ühe keskse, avatud ja turvalise andmetaristu positiivne efekt oleks tõenäoliselt mitu korda suurem kui Tallinna-Tartu neljarajalisel maanteel.

Artikkel on osa Eesti Päevalehe, Heateo SA ja Kodanikuühiskonna Sihtkapitali artiklisarjast „Mis sind närvi ajab?”. Ideed teravate ühiskondlike probleemide lahendamiseks on oodatud NULA inkubaatorisse kuni 23. märtsini.