Facebook/Cambridge analytica historien

Off topic - alt som ikke handler om musik eller studie.
Forumregler
Tænk dig om, tal pænt, men lad også være med at være meget sart. Hvis du skal bruge skældsord, så hold dig til noget Kaptajn Haddock ville have sagt.
Nyt svar
Medlemsavatar
Mike-air
Forum Donator
Indlæg: 10300
Sted: Oslo

Facebook/Cambridge analytica historien

Indlæg af Mike-air »

Hvis du er interesseret i baggrunden for nogle af alle de ting der florerer i nyhederne omkring FB, men med en mere kritisk vinkel, så vil jeg anbefale at læse denne artikel:

https://medium.com/@CKava/why-almost-ev ... 7f8af2d042

Personligt bliver jeg lidt irriteret ved at læse det, fordi det viser hvor ukritiske nyhedsmedierne (også de danske) er.

Medlemsavatar
ThomasRiem
Forum Donator
Indlæg: 285
Sted: Kjøbenhavnstrup

Indlæg af ThomasRiem »

Tak for et super-nyttigt og aktuelt link, Mike,

Hvad angår medier osv er der ikke noget, der kan forbavse mig negativt længere efter fire år på et meget seriøst dagblad for en del år siden. Folks ideer om pressens måde at fungere på er ret forskruede, kun overgået af journalisternes selvfedme om “den fjerde statsmagt”. Men det er en anden diskussion; :)

Hvad man så skal mene om Facebook er noget andet. Som bruger er jeg ret bekymret over, hvad en kombination af de data, der er tilgængelige for en udvikler (275.000 brugere) og det, man på basis deraf kan scrape (jeg tror faktisk stadig, det må være det rigtige ord), nemlig adgangen til millioner af menneskers feeds... jeg er begyndt at overveje #deletefacebook alvorligt...

Tak igen - og god påske...

Thomas
C'est magnifique. Mais ce n'est pas la guerre....

Default avatar
bredal187

Indlæg af bredal187 »

Jeg syntes at det største problem i hele debatten er at vi har haft en teknologisk udvikling for hurtigt til at alm. sund fornuft kan følge med.

At man frivilligt (jeg er også skyldig) fylder profiler ud online, med alle private oplysninger er jo hul i hovedet. Jeg har selv slettet alt hvad jeg har kunne finde på mig selv, men det er fandme svært.

Medlemsavatar
Hald
Forum Donator
Indlæg: 10829
Sted: Vind / Holstebro

Indlæg af Hald »

Jeg kan ikke helt finde ud af hvorfor man "bør være bange", men bliver dog skræmt lidt af ulven-kommer! fra medierne, der er jo ikke ændret ret meget i forhold til da man startede med at bruge Facebook.

Jeg er mest bange for Facebook og andre sociale medier fordi de stjæler vores tid hvis vi ikke kan kontrollere det, og der er godt nok mange mobil-junkier i dag, jeg er muligvis også en af dem..
"Knobs? Where we're going, we don't need knobs!" - 14 år med ørene i Lydmaskinen -

Medlemsavatar
Mike-air
Forum Donator
Indlæg: 10300
Sted: Oslo

Indlæg af Mike-air »

ThomasRiem skrev:Tak for et super-nyttigt og aktuelt link, Mike,
Var så lidt :)

Efter jeg læste den lidt mere kritiske artikel, syntes jeg at denne 'ekspertforklaring' fra DRs Nikolaj Sonne (som jeg nu ellers godt kan li) virker en smule søgt og antaget. Min bedre halvdel forsvarer dog jornalisterne med at de har super travlt og konkurrencen ofte går på hvem der først har nyheden ude.

Link:
https://www.dr.dk/nyheder/viden/teknolo ... f-facebook

Her er lige lidt FYI til dem der er interesserede:
Facebook har en API kaldet 'Graph' som giver adgang til data på facebook. Alt man skal gøre, er at registrere en app. Jeg har haft en sådan siden 2010, men først kendt til Graph-api'en fra 2015 og frem. Det var cirka et par måneder efter Graph API v 2.0 kom, og det var her, at adgang til personlige vægge etc. blev lukket ned. Ærligt tænkte jeg på daværende tidspunkt også at det var lidt øv.

Men ikke desto mindre ligger der stadig meget data tilgængeligt offentligt, hvis man har registreret sig som developer og har en eller flere app's. Det foregår sådan at man spørger ned i en database hvor nogle ting så er restricted, baseret på om ejeren har givet ens app adgang eller ej. Per default er der adgang til alle offentlige facebook-pages, eller offentlige (åbne) grupper. Og her kan man så hente data ud på et meget detaljeret niveau.

Her er et eksempel på en query på lydmaskinens facebook side:
Skærmbillede 2018-03-31 kl. 20.31.26.png
Hvis man vil, kan man grave helt ned i alle opslag der har været siden Holger oprettede den, og få fulde navne ud på alle der har kommenteret, delt eller reageret på et opslag (like, love, angry etc.).

For lydmaskinen er det ganske uskyldigt. Men hvis det nu var noget politisk relateret - så har man pludselig muligheden for at indsamle fulde navne (facebook alias) på alle som har tilkendegivet at de i en eller anden grad sympatiserer med siden (eller det modsatte). I DK er det måske ikke så giftigt - men der skal ikke meget fantasi til at tænke over andre lande hvor det kunne være ret så skidt.

Heldigvis er der dog GDPR, som træder i kraft fra den 25. Maj. Jeg er sku egentlig ret så spændt på hvordan facebook tackler disse regler, baseret på mit eksempel ovenfor :?:


Medlemsavatar
Mike-air
Forum Donator
Indlæg: 10300
Sted: Oslo

Indlæg af Mike-air »

De har vidst ikke gjort så meget alvor af det, som de giver udtryk for i teksten.
Her er igen et udtræk fra lydmaskinens facebook side, på kommentar-niveau:
Capture.JPG

Medlemsavatar
keen
Medlem
Indlæg: 1577
Sted: Aarhus, næsten.

Indlæg af keen »

Det er jo blot et API til at vise hvad folk har skrevet på facebook-siden? Noget som man allerede har grafisk adgang til.
Microsoft Certified og Apple fanboy!

Medlemsavatar
Hald
Forum Donator
Indlæg: 10829
Sted: Vind / Holstebro

Indlæg af Hald »

keen skrev:Det er jo blot et API til at vise hvad folk har skrevet på facebook-siden? Noget som man allerede har grafisk adgang til.
De har gjort det nemt at lave et udtræk af detaljeret data, så store computere kan lave en profil af en person som ikke fremgår af det Facebook selv åbenlys præsenterer. Skulle man derimod scrape data af diverse sider ville man misse en del af den information, da siderne er dynamiske men data'en er "statisk".
"Knobs? Where we're going, we don't need knobs!" - 14 år med ørene i Lydmaskinen -

Default avatar
Caspar9500
Medlem
Indlæg: 481

Indlæg af Caspar9500 »

Hej Hald,

Data fra facebook er bestemt ikke statisk, den ændrer sig hele tiden, der er selvfølgelig dele som er statisk, men interaktioner forandre data konstant.

@Mike hvilken page token benytter du?

Medlemsavatar
Hald
Forum Donator
Indlæg: 10829
Sted: Vind / Holstebro

Indlæg af Hald »

Jeg er enig Caspar, men hvis du f.eks. har en "bot" til at hive data fra en brugers nyhedsoversigt er den random hver gang du refresher, derfor vil det data den collecter være lige så random, med et API hvor du kan lave et kald og få alt data f.eks. fra periode A til periode B er det lidt mere "statisk" (var det jeg mente)
"Knobs? Where we're going, we don't need knobs!" - 14 år med ørene i Lydmaskinen -

Medlemsavatar
Mike-air
Forum Donator
Indlæg: 10300
Sted: Oslo

Indlæg af Mike-air »

keen skrev:Det er jo blot et API til at vise hvad folk har skrevet på facebook-siden? Noget som man allerede har grafisk adgang til.
Ja, altså - umiddelbart virker det ikke så skide farligt når det er offentligt tilgængeligt for enhver med en facebook profil.

Men i det øjeblik jeg kan lave en automatiseret dataindsamling med alt hvad du offentligt kan se (wall posts, comments, reactions, shares) på tværs af sider. Da kan jeg også gemme det, og til enhver tid efterfølgende køre analyser på person-niveau, på tværs af alle de sider jeg er interesseret i.

Her kan jeg udvælge sider relateret til forskellige emner, og på baggrund af personers adfærd på siderne, inddele dem i klynger hvis jeg vil.

Super nem måde at mappe ‘et godt gæt’ på folks politiske orientering, uden at have adgang til data på deres personlige profil (som sikkert ikke siger så meget om den slags alligevel).

@Casper: jeg bruger min personlige token til min app.

Default avatar
Caspar9500
Medlem
Indlæg: 481

Indlæg af Caspar9500 »

Aha :) det giver mening.

Der findes en del tredjepart software hvor du både kan pulle data fra FB (ud fra tilladelser i den token du benytter) hvilket giver mening reklame øjemed, da man som page admin har adgang til stort set alt data som foregår på den side du ejer. Men FB begrænser faktisk nogle typer af data hvis data ikke kan anynomiseres ud fra antallet af data hits (dvs for få hits og du får ikke lov til at pulle data).

Sagen med CA er jo at brugerne har givet adgang til at trække data ikke alene fra deres egne profiler, men også fra vennelisten på den pågældende person.

Det Mine laver querries på er offentlig tilgængelig oplysninger, men er du page admin havde du altså en lang række andre beføjelser til at trække noget mere detaljeret data.

Ændringerne som FB vil foretage kommer til at have stor betydning for de selskaber som tilbyder software til at poste, og trække data fra FB eller ved at reklamere på FB.

Edit:

Link til sheet for hvilke typer data der kan trækkes via Graph Api på page niveau

https://developers.facebook.com/docs/gr ... 2/insights
Senest rettet af Caspar9500 fre 6. apr 2018 11:46, rettet i alt 1 gang.

Medlemsavatar
Mike-air
Forum Donator
Indlæg: 10300
Sted: Oslo

Indlæg af Mike-air »

Se mit eksempel med clustering.

Default avatar
Caspar9500
Medlem
Indlæg: 481

Indlæg af Caspar9500 »

Mine hvordan vil du udvælge siderne?

Medlemsavatar
Mike-air
Forum Donator
Indlæg: 10300
Sted: Oslo

Indlæg af Mike-air »

Det er så simpelt som at mappe det politiske spektrum og finde relaterede facebook sider.

Default avatar
Caspar9500
Medlem
Indlæg: 481

Indlæg af Caspar9500 »

Jamen kan du ikke give et eksempel?

Jeg kan ikke følge dig her :) altså jeg har brugt en del års studier på vælgeradfærd (dog ikke på SoMe) og har arbejdet på en SaaS platform som var Facebook partner, og jeg vil vove den påstand at det vil være ret komplekst at opnå det du vil

Se fx her

Prøv at tjek nogle af de tweets han gav i forbindelse med den artikel du linkede til :)

EDIT: direkte link til Twitter tråden

Medlemsavatar
Mike-air
Forum Donator
Indlæg: 10300
Sted: Oslo

Indlæg af Mike-air »

Kort opsummeret er det muligt at lave en facebook query via GRAPH-Api’en, som for et sæt af facebook sider (tag eks. De danske partier), over en tidshorisont (kunne være fra sidernes oprettelse), henter alt kommunikation fra og til siden (væggen), samt alt feedback på på disse (comments, reactions, shares), så granuleret at man får id + navn på profilen som har interageret med siden.

Via ovenstående datasæt kan du lave analyser på person-niveau: lad os sige du er interesseret i folk som har en positiv adfærd (lad os simplificere og sige ‘love’ reaction) overfor posts som belyser et politisk emne fra en bestemt vinkel. Herefter kan du segmentere alle dine brugere, og pludseligt har du en liste med emner (facebook profiler med ID og fulde navn) som du kan bruge til eksepeltvis at diskriminere folk på baggrund af deres politiske holdning.

Jeg mener ikke facebook bør give adgang til andet end éns egen side fra Graph-api’en.

Mht. CA-sagen er hullet lukket, det er kun det eksisterende ‘’hul’’ jeg er bekymret for.

Medlemsavatar
Mike-air
Forum Donator
Indlæg: 10300
Sted: Oslo

Indlæg af Mike-air »

Jeg har lige lavet nogle tests, og fundet ud af at der er definitivt lukket for det jeg var nervøs for ovenfor. Det er i mine øjne super positivt! Det er blot graph-api explorer'en som giver access til andre pages, og det er limited til cirka 20 posts, plus du ikke kan navigere i tid på denne måde. Dette betyder derfor at man har mindre access via graph-api explorer'en end hvis man selv browsede siden igennem.

Nu skal man decideret hacke sig til disse data, hvis man vil gøre det jeg beskrev.

Medlemsavatar
SustainerPlayer
Medlem
Indlæg: 12411
Sted: På kanten

Indlæg af SustainerPlayer »

Med reference til Netflix dokumentaren - se her: http://www.lydmaskinen.dk/viewtopic.php ... 93#p689393

Så er der måske grund til at tage denne tråd op igen.

Jeg er interesseret i at høre, hvad folk mener, der skal/bør gøres, for at man undgår lignende i fremtiden?

Medlemsavatar
ThomasRiem
Forum Donator
Indlæg: 285
Sted: Kjøbenhavnstrup

Indlæg af ThomasRiem »

@Mike-air, du har forstand på det her: altså, jeg er helt med på, at det ikke er muligt for udenforstående eller for almindelige betalende kunder at stikke næsen i disse sager. Men det er vel stadig muligt for Facebook, deres nære samarbejdspartnere samt myndigheder (enten ad fordøren eller bagdøren)?
C'est magnifique. Mais ce n'est pas la guerre....

Medlemsavatar
Mike-air
Forum Donator
Indlæg: 10300
Sted: Oslo

Indlæg af Mike-air »

ThomasRiem skrev:@Mike-air, du har forstand på det her: altså, jeg er helt med på, at det ikke er muligt for udenforstående eller for almindelige betalende kunder at stikke næsen i disse sager. Men det er vel stadig muligt for Facebook, deres nære samarbejdspartnere samt myndigheder (enten ad fordøren eller bagdøren)?
For facebook selv, og for google selv, er det selvfølgelig muligt: de opererer lidt med en "God mode", selv om de lover at de "værner om" og ikke korrelerer personlig data :-P

Idag arbejder jeg ikke med disse ting længere, så jeg kan ikke sige så meget om hvordan mulighederne er for eksterne at hive data ud. Men jeg tror Google, Twitter, Youtube of FB passer utroligt godt på hvilken data de giver adgang til. Al segmentering til individualiseret/målrettet reklame foregår formentlig kun via deres platform, så de har en vis grad af kontrol med det.

Nogle tanker:

Det vigtigste i CA-sagen er ikke om de kunne forudse eller påvirke folks adfærd (forskning på området siger det er vanskeligt), det handler mere om at de fik fat i personlige data som var nok til at lave utrolig præcis målrettet markedsføring eller propaganda i dette tilfælde. Vi skal derfor værne om vores personlige data, reglerne i GDPR burde egentlig være menneskerettigheder.

Og så må vi være vidende om personaliseret markedsføring - det er selve forretningsmodellen for facebook, google, youtube og mange andre. Det kan de ikke ændre på fra den ene dag til den anden. Jeg vil derfor påstå at det stadig er muligt at påvirke befolkningen udemokratisk ved for eksempel at 'outspende' modstanderen.

Medlemsavatar
SustainerPlayer
Medlem
Indlæg: 12411
Sted: På kanten

Indlæg af SustainerPlayer »

Jeg har nogle tanker omkring det - nogle jeg nok har givet udtryk for før.

Selvom "vi" teoretisk kunne stole på, at Facebook og Google mfl. vil "værne" om vores data, så kan data jo stjæles og dermed havne "i de forkerte hænder", så alene derfor, skal data-indsamling begrænses via lovgivning. Indsamling skal ske med tydelig accept og kun inden for visse typer data.

Jeg har det også pænt stramt med "anonymiseret" data - jeg synes stadig det kun skal kunne bruges med forbrugerens fulde accept. Ingen accept = man må ikke bruge det del-data i det anonymiserede sæt. Hård straf hvis det overtrædes. Hvorfor? Fordi anonymiseret data stadig ret præcist kan ramme de anonyme - og fordi man før eller siden sikkert kan analysere i det man troede var anonymt - og så alligevel finde personer. Teknologien står jo ikke stille - og bliver stedse bedre.

Nu så man i Netflix-doku'en, hvordan man kultur/social-manipulerede en del af en befolkningsgruppe til ikke at stemme til et valg (og dermed give "modstanderen" magten). Og selvom den slags tricks ikke nødvendigvis behøver at være hængt op på big data, så er det noget, der skal have større fokus på specielt sociale medier. At "stemninger" og bevægelser ikke er "plantet" på den ene eller anden måde.

Sikkert noget der er skidesvært at gøre noget ved - men er af afgørende betydning for, om vi overhovedet kan afholde demokratiske valg som vi kender dem. At et valg kun er synspunkter og holdninger hos et antal partier/kandidater.

Jeg synes det er vigtigt, at befolkningen - både DK's - og hele verden - bliver oplyste om at disse ting sker - og vil ske. Manipulation fra fremmede magter, fra erhverslivet, fra lobbyer osv. Og vi er meget mere udsatte end vi selv ved - fordi det er så menneskeligt at tro, at man har styr på sig selv og sine meninger.

Medlemsavatar
Mike-air
Forum Donator
Indlæg: 10300
Sted: Oslo

Indlæg af Mike-air »

SustainerPlayer skrev: Selvom "vi" teoretisk kunne stole på, at Facebook og Google mfl. vil "værne" om vores data, så kan data jo stjæles og dermed havne "i de forkerte hænder", så alene derfor, skal data-indsamling begrænses via lovgivning. Indsamling skal ske med tydelig accept og kun inden for visse typer data.

Jeg har det også pænt stramt med "anonymiseret" data - jeg synes stadig det kun skal kunne bruges med forbrugerens fulde accept. Ingen accept = man må ikke bruge det del-data i det anonymiserede sæt. Hård straf hvis det overtrædes. Hvorfor? Fordi anonymiseret data stadig ret præcist kan ramme de anonyme - og fordi man før eller siden sikkert kan analysere i det man troede var anonymt - og så alligevel finde personer. Teknologien står jo ikke stille - og bliver stedse bedre.
Dette dækker GDPR - hvis du kan udpeges fra et anonymt sample, så er det ikke GDPR-compliant :)

Medlemsavatar
SustainerPlayer
Medlem
Indlæg: 12411
Sted: På kanten

Indlæg af SustainerPlayer »

Mike-air skrev:
Dette dækker GDPR - hvis du kan udpeges fra et anonymt sample, så er det ikke GDPR-compliant :)
Ja - men det er jo ikke fremtidssikret. Den klump data, der er anonym pt. er det jo ikke nødvendigvis om 2 eller 10 år.

Nyt svar