Archievenblad, uitgave van de Koninklijke Vereniging van Archivarissen in Nederland

 

Embed or link this publication

Description

Extra digitaal nummer, januari 2015, gewijd aan informatiefilosoof Luciano Floridi

Popular Pages


p. 1

Uitgave van de Koninklijke Vereniging van Archivarissen in Nederland archievenblad Informatiefilosofie van Luciano Floridi 2015

[close]

p. 2

03 Van de redactie René Spork n 09 ”The right people and the right forces need to get together.” Interview with Prof. Luciano Floridi 04 Korte inleiding op de informatiefilosofie van Luciano Floridi Arnoud Glaudemans n Arnoud Glaudemans, Rienk Jonker and Frans Smit n 19 Silicon Valley meets Muller, Feith en Fruin. Een beschouwing over informatie en ethiek Frans Smit n Inhoud 03 Van de redactie 04 09 19 Korte inleiding op de informatiefilosofie van Luciano Floridi, Arnoud Glaudemans ”The right people and the right forces need to get together.” Interview with Prof. Luciano Floridi, Arnoud Glaudemans, Rienk Jonker and Frans Smit Silicon Valley meets Muller, Feith en Fruin. Een beschouwing over informatie en ethiek, Frans Smit 2 n 2015 numm e r L- F

[close]

p. 3

Van de redactie In januari 2015 verschijnt er geen papieren versie van het Archievenblad, wel – net als in 2012 – bij wijze van nieuwjaarsgeschenk een digitale versie, in dit geval een special over de informatiefilosoof Luciano Floridi die in 2014 te gast was op de KVAN-dagen in Assen. Uitgebreide informatie over zijn loopbaan, achtergrond en ideeën zijn te vinden op http://www.philosophyofinformation.net. In juni 2014 verscheen bij de Oxford University Press zijn meest recente boek: The Fourth Revolution – How the Infosphere is reshaping Human Reality. Dit boek is een handzame en toegankelijke samenvatting van zijn concepten en standpunten over informatie en de maatschappelijke effecten van digitalisering. Onderstaande auteurs beogen in dit digitale tijdschrift een nadere introductie op zijn denken te geven. Over de auteurs: Frans Smit is senior beleidsadviseur Informatievoorziening van de Gemeente Almere. Daarnaast is hij docent en onafhankelijk adviseur. Arnoud Glaudemans is archiefinspecteur van het Streekarchief Gooi- en Vechtstreek en o.a. lid van de Adviescommissie archieven van de VNG. Rienk Jonker is gemeentearchivaris van Leeuwarden, ontvanger van de Van Wijn Penning en onder andere lid van de Commissie KVAN dagen. S@P-boek “Archives and Information Philosophy” De Stichting Archiefpublicaties is voornemens om in 2017 of 2018 een boek te publiceren over informatiefilosofie en archieven. In het boek worden informatiefilosofen uitgenodigd te reflecteren op archieven en op basisconcepten en paradigma’s uit de archieftheorie. De bedoeling van het boek is onder andere om een brug te slaan tussen de moderne informatiefilosofie en de (nationale en internationale) archiefgemeenschap. De redactie van het boek bestaat uit Rienk Jonker, Arnoud Glaudemans en Frans Smit. Geert Jan van Bussel is nauw betrokken als adviseur. n René Spork n hoofdredacteur Archievenblad December 2014 nummer L-F 2015 n 3

[close]

p. 4

Korte inleiding op de informatiefilosofie van Luciano Floridi Arnoud Glaudemans n Luciano Floridi Wat is Informatiefilosofie? De definitie van Floridi luidt: ‘The philosophy of information (PI) is the philosophical field concerned with (a) the critical investigation of the conceptual nature and basic principles of information, including its dynamics, utilization and sciences; and (b) the elaboration and application of informationtheoretic, and computational methodologies to philosophical problems.’1 Informatiefilosofie is dus een geheel van object (als wat beschouwen we de wereld) en methode (hoe benaderen we de wereld). De schets van object en methode vormt de hoofdmoot van dit artikel. Maar we beginnen met enige opmerkingen over de opbouw van de informatiefilosofie en de plaats ervan in de geschiedenis van de filosofie in termen van vier opeenvolgende revoluties of wendingen van het denken. rationeler handelen (ethics) en beslissingen nemen (politics) over hoe we dingen aanpakken. Om maar iets, voor archivarissen dicht bij huis, te noemen: waardering, privacy, auteursrecht en duurzame bewaring. Deze gelaagdheid komt terug in veel van Floridi’s begrippen: grondig filosofisch beargumenteerd, maar ook betrekking hebbend op aspecten van de lopende informatierevolutie en theoretisch niet complexer dan strikt noodzakelijk, opdat men er direct praktisch mee aan de slag kan. Situering in de geschiedenis Met de aanduiding van de fourth revolution wordt informatiefilosofie in de geschiedenis van het (westerse) denken geplaatst en ingebed.3 De revoluties of wendingen hebben als kenmerk dat zowel de wereld als hoe we ons daartoe denkend en handelend verhouden ‘in één beweging’ een fundamentele verandering ondergaat. Iets wat als vanzelfsprekend en uniek aan de mens werd aangenomen blijkt dat steeds niet te zijn. Met Copernicus (1543) werd duidelijk dat de aarde om de zon draait – niet andersom – en dat de mens dus niet in het centrum van de wereld staat. Met Darwin (1859) werd duidelijk dat mens wel een bijzonder succesvol dier is, maar zich niet fundamenteel onderscheidt van (andere) dieren. Met Freud (ca. 1900) werd duidelijk dat Descartes’ ‘Ik denk dus ik ben’ geen vanzelfsprekend gegeven is; dat ons bewustzijn (introspectie) gelaagd is en derhalve geen tempel van onproblematische rationaliteit. Opbouw Floridi’s uiteenzetting van de grondslagen van deze informatiefilosofie is opgezet in vier delen (tetralogy), die respectievelijk philosophy, ethics, politics en logic of information behandelen.2 De eerste twee zijn inmiddels af. Enerzijds beoogt Floridi een traditionele totaalfilosofie in de traditie van Kant, Marx en Hegel, anderzijds is zijn uitdrukkelijke doel het verschaffen van een goed beargumenteerd begrip van wat de actuele informatierevolutie nu eigenlijk inhoudt en impliceert. Op grond van kennis van wat zich op het vlak van informatie precies afspeelt (philosophy en logic) kunnen we 4 n 2015 numm e r L- F

[close]

p. 5

Met de opkomst van de computer ingeluid met het werk van Turing (ca. 1935) wordt in de fourth revolution gaandeweg duidelijk dat de mens weliswaar een informational organism (inforg) is, maar niet de enige informatiebe- en verwerkende agent. Onder agent is niet te verstaan een cyborg of een andersoortig humanoide computergebaseerd wezen. Het gaat erom dat er (steeds meer) sprake is van agents in de zin van autonoom functionerende informatieverwerking in (digitaal gebaseerde) technologie, bijvoorbeeld bij het landen van een vliegtuig, bij transacties op de aandelenbeurs, bij het activeren van bewakingscamera’s door bepaald als agressief gekenschetst geluid, the internet of things en ga zo maar door. tegenwoordig gewend zijn. Hij grijpt terug op Euclides’ oorspronkelijke begrip dedomena – Latijnse vertaling data – waarvan ons begrip van data afstamt.6 Floridi onderscheidt drie niveaus van data als diaphora: • In de gewone (ervarings)wereld (data de re), bijvoorbeeld zwart en donkerzwart gekleurd; • Staat van een systeem (data de signo, syntactisch), bijvoorbeeld een lege en halfvolle batterij; • Semiotische of symboolsystemen (data de dicto, semantisch), bijvoorbeeld ‘N’ en ‘P’. Het gaat om niveaus, niet soorten: Data de dicto zijn altijd ook data de signo en de re; Data de signo zijn altijd ook data de re. Soorten en maten van informatie Wat is informatie? Floridi hanteert een drieledige General Definition of Information (GDI). Is er iets – A – dat je in de wereld tegenkomt en dat aan alle drie de volgende voorwaarden voldoet, dan hebben we informatie (een infon):4 GDI A (an infon) is an instance of information, understood as semantic content, if and only if: • GDI.1: A consists of n data (d), for N >= 1; • GDI.2: The data are well-formed; • GDI.3: The well-formed data are meaningful. Well-formed wil zeggen dat de data zijn samengesteld volgens een syntaxis, een set van regels voor de samenhang ervan. Die zijn niet van alleen linguïstische aard maar zijn ruimer op te vatten als structuurregels, ook voor bijvoorbeeld het lineair perspectief voor beeld, en de visuele voorstelling van een bedrijfsarchitectuur. Meaningful wil zeggen dat een well-formed geheel van data een gegeven semantiek volgt, een set van semantische regels. Die zijn weer niet van alleen linguïstische aard. Zo is – toch maar even een linguïstisch voorbeeld – het woord ‘hjnendopa’ well-formed maar niet meaningful. Met bovenstaande hebben we de definitie van semantic content, maar nog niet van wat Floridi noemt semantic information: informatie, die juist is (truthful). In deze zin wordt de term informatie meestal gebruikt. Maar voordat we bij semantic information zijn moeten er nog wat andere dingen worden behandeld. In Information. A very short introduction schetst Floridi aard en samenhang van verschillende soorten informatie (mathematische, biologische, economische etc.). We bespreken die soorten hier niet, maar beperken ons tot het primaire onderscheid dat aan die verschillen ten grondslag ligt: environmental en semantic information. De laatste term ligt, zoals eerder al vermeld, het meest dicht bij wat meestal onder informatie wordt verstaan. Environmental information7 is – naar analogie met en voortvloeiend uit de opvatting van Data als diaphora – niet een waargenomen te constateren feit, bijvoorbeeld dat gras groen is. Environmental information is ‘slechts’ een correlatie of verband. Bijvoorbeeld bij een lakmoesproef: rood correleert met zuur, blauw met basisch. Het kleurensysteem (de verschillende data die je op kleurgebied onderscheidt) heeft een correlatie met het zuurgraadsysteem (de verschillende data die je op dat gebied onderscheidt). Niet alle environmental information is ook semantic information. Planten en dieren maken immers praktisch gebruik van environmental information (bijvoorbeeld licht – fotosynthese); dat gaat niet semantisch. Environmental information bestaat dus ook onafhankelijk van (menselijke) intelligentie en het is op te vatten als informatie de re. Niet alleen in de natuur, maar ook in technische contexten kan sprake zijn van environmental information, bijvoorbeeld in de correlatie van lichtsignalen en de mate waarin een batterij is opgeladen. Dan zijn we aangeland bij semantic information.8 De definitie daarvan is de definitie van semantic content aangevuld met een aanvullende voorwaardelijkheid: GDI* S is an instance of semantic information if and only if: • GDI.1: A consists of n data (d), for N >= 1; • GDI.2: The data are well-formed; • GDI.3: The well-formed data are meaningful. • GDI.4: The well-formed, meaningful data are truthful Dit is de definitie van informatie zoals dat woord meestal wordt gebruikt: informatie over feiten, die juist is. Evenals bij semantic content moet hier niet alleen worden gedacht aan linguïstische informatie maar ook aan bijvoorbeeld diagrammen, (mathematische) formules, video: vandaar de aanduiding truthful. De definitie impliceert dat onjuiste informatie (misinformation of disinformation) ‘eigenlijk geen informatie is’ dat wil zeggen: geen semantic information.9 Archieven bevatten dus niet altijd semantic information, maar wel altijd semantic content. Archieven kunnen immers onwaarheden bevatten, en ook >> onwaarheden kunnen meer of minder authentiek zijn. Wat zijn data? Wat data zijn (GDI.1) behoeft meer uitleg. Anders dan het algemene begrip van informatie sluit het begrip van data minder aan op wat tegenwoordig gangbaar is. Floridi definieert data niet primair als kleinste elementen waaruit iets is opgebouwd, maar als wat hij noemt diaphora, als distinctions that make a difference, meer precies:5 Dd datum = x being distinct from y, where x and y are two uninterpreted variables and the domain is left open to further interpretation. Het diaphoric karakter van de definitie maakt, dat een datum op geen enkele wijze gegeven is of een (ervarings)gegeven kan zijn. Het is, integendeel, primair een – meest impliciete – conclusie ‘dit is anders als dat’ in enigerlei opzicht, in enigerlei context over een of ander gegeven (lack of uniformity). Wat als datum (Dd) geldt is per definitie afhankelijk van een context (domain). Deze opvatting van Data is anders dan de meeste mensen nummer L-F 2015 n 5

[close]

p. 6

>> >> Wat is het verband met het aan Shannon en Weaver ontleende begrip van (gecommuniceerde) informatie?10 Over informatie wordt vaak gedacht in termen van het zender– ontvangermodel van het communiceren van informatie. Het idee is dat iemand een informatiepakketje verstuurt via een bepaald kanaal van A naar B (mens naar mens, machine naar machine) en dat komt dan wel of niet helemaal goed aan. Komt de boodschap niet goed aan, dan was die niet goed gecodeerd c.q. gedecodeerd of er zat ruis op de lijn die de boodschap (deels) veranderde. Het zender – ontvanger model grijpt terug op Shannon en Weaver’s mathematical theory of communication11 en veralgemeniseert die, als het ware. Die veralgemenisering leidt – ook volgens Shannon en Weaver zelf – tot misverstanden over de aard van informatie en de redenen van het wel of niet overkomen van een inhoudelijke boodschap. Shannon en Weaver’s theorie behandelt ten eerste informatie op alleen syntactisch niveau (code), niet op semantisch niveau; ten tweede gaat die alleen in op mathematische aspecten van het versturen van die syntactische elementen (codes) over een kanaal: kwantitatieve eigenschappen en relaties van bijvoorbeeld bandbreedte van het kanaal, ruis en redundantie van codering. Of die informatie (zie boven) well-formed, meaningful en wellicht truthful is en waarom dan wel, daarover gaat de theorie domweg niet. En of iemand ‘snapt wat is bedoeld’ hangt maar zeer ten dele af van codering, versturen over een kanaal met ruis, en decodering. Wat is het verschil tussen digitale (binair gecodeerde) en analoge data? Het verschil tussen binair gecodeerde en analoge data is in essentie een ander gebruik van het fysieke medium om semantische informatie vast te leggen: als respectievelijk middel tot (binaire) encoding respectievelijk (analoge) recording van data. Het eerste gebruik is altijd discreet (aan/uit, wel/niet, 0/1), het tweede altijd continu (meer of minder). Bij analoge recording worden de – op zichzelf analoge – fysieke eigenschappen en mogelijkheden gebruikt om syntactische en semantische data (tekens) vast te leggen: bijvoorbeeld letter op papier, toon op grammofoonplaat. Tekens en informatie zijn analoge objecten. Bij binaire encoding wordt een – op zichzelf analoge – fysieke staat van een of ander materiaal (licht, elektriciteit, magnetisme, geluid, fysieke vorm (putje, puntje)) genomen als een geheel van discrete binaire toestanden 0/ 1, uit/aan. De zo gecreëerde code-string betekent op zichzelf nog niets en levert pas met een bepaalde decodering tekens en informatie op. Deze tussenstap maakt de computer een universele (semiotische) machine, immers alle soorten tekens kunnen in principe binair worden gecodeerd en gedecodeerd, in tegenstelling tot analoge recording. Voor langetermijnarchivering levert de splitsing van digitale (binaire) codering en decodering problemen op die analoge recording niet heeft. Technieken van analoge recording zijn echter naar hun aard nooit universeel want altijd toegesneden op een bepaald type semantic content, en voor opslag daarvan geschikter dan (binaire) encoding. 6 n 2015 numm e r L- F

[close]

p. 7

Wat houdt de methode van levels of abstraction in?12 De definitie van informatiefilosofie aan het begin van dit artikel was tweeledig. Het wat is in hoofdlijnen hierboven geschetst, nu zijn we bij het hoe, de methode, aangeland. Het concept van levels of abstraction is op zichzelf heel eenvoudig, en eenvoudige dingen zijn lastig uit te leggen. Een poging. Het basisidee van levels of abstraction komt uit de theoretische computerwetenschap, meer specifiek het domein van de Formal Methods.13 Het gaat daar om de mathematische modellering van soft- en hardwaresystemen (specificatie, ontwikkeling, verificatie van een gegeven systeem tegen een set van functionele eisen). Floridi’s methode van levels of abstraction benadert, op gelijke wijze, data en informatie als een dergelijk systeem: als een complex aggregaat van op verschillende (aggregatie)niveaus en op verschillende manieren samenhangende elementen.14 Gegeven deze benadering als systeem kun je een level of abstraction zien als een interface, zoals dat kan bestaan tussen twee computersystemen. Zo een interface zet output van systeem A om in input voor systeem B, volgens een formele mapping van datatypes van systemen A en B. Systeem B vat de input uit systeem A als het ware op een bepaalde manier op. De stap richting een algemene methode van levels of abstraction binnen de informatiefilosofie wordt gemaakt door niet alleen computers als dergelijke systemen op te vatten, maar ook mensen en (delen of domeinen van) de werkelijkheid waarin we leven. Ook de mens wordt, dus, opgevat als een systeem met interfaces op andere systemen; een systeem dat interacteert en communiceert via interfaces c.q. levels of abstraction. Deze gelijkschakeling is even wennen; ben ik een soort van computersysteem dan? Echt waar? Als we de omslag van de fourth revolution erbij memoreren valt het alweer mee. De mens blijkt in onze huidige vierde revolutie immers wel inforg maar ook een informatiebe- en verwerkende agent; weliswaar een natural agent en geen artificial agent zoals als een digitaal systeem, maar desalniettemin: ook een agent. Terug naar de aanduiding van levels of abstraction als interfaces. De interface op systeem B (zeg een DMS) van systeem A (een mens, inforg) is ook: de opvatting, het model, de theorie, van systeem A over systeem B. Heel kort is een level of abstraction dus: ‘ik zie een DMS zus en zo’. Wat de theorie en formele structuren van levels of abstraction (LoAs) ten aanzien van die uitspraak normeren is de manier waarop je precies uitlegt, expliciteert, in een model vat, wat je nu precies bedoelt.15 Zodat wij – agents – elkaar goed kunnen verstaan, en wij inforgs snappen wat de artificial agents precies doen. Wat is de infosphere?16 Voor de term infosphere geldt bij uitstek wat eerder in dit artikel over Floridi’s begrippen werd gesteld: grondig filosofisch beargumenteerd, maar ook betrekking hebbend op aspecten van de lopende informatierevolutie, en theoretisch niet complexer dan strikt noodzakelijk. In praktisch opzicht duidt infosphere de opkomst, aanwending, doordringing en toenemende dominantie van ICT aan in alle domeinen van het maatschappelijke en persoonlijke leven. De grenzen van het virtuele domein en de echte wereld vervagen zodanig dat het onderscheid niet meer zo bestaat: we leven onlife.17 Daarnaast heeft de infosphere een nauwelijks te overschatten invloed op hoe we onszelf zien. In het boek The Fourth Revolution – How the infosphere is reshaping human reality wordt een aantal thema’s op dit ethisch en politiek vlak besproken. Naarmate de fourth revolution zich voltrekt is de vraag steeds meer, wat er nog overblijft naast deze infosphere. In theoretisch, filosofisch opzicht is infosphere een aanduiding van hoe we de wereld moeten zien waarin we leven en waarvan we deel uitmaken. De stuff waaruit de wereld bestaat is de informatie zoals die in het eerste deel van dit artikel in hoofdlijnen is geschetst. Het werk Philosophy of Information is goeddeels een diepgaande en uitgebreide beargumentering van deze opvatting: informational structural realism. Deze opvatting staat filosofisch, wat betreft objectbenadering en methode, in de Kantiaanse traditie.18 Daarnaast spreekt het klassieke Griekse scepticisme19, dat op zich een doorslaggevende invloed had op de gehele moderne filosofie vanaf Descartes (ca. 1625), maar waar Floridi hernieuwd op teruggrijpt20, een stevig woordje mee. Floridi’s aanpak is er daardoor van doordesemt dat de dingen (data) nooit en te nimmer voor zich spreken maar dat wij – inforgs en andere agents – het zijn die ze maken tot wat ze zijn, door onze benadering en opvatting ervan, en vervolgens onze praktische omgang ermee vanuit die benadering >> en opvatting. Of we dat nu willen of niet. n nummer L-F 2015 n 7

[close]

p. 8

>> Verder lezen 1. Een uitgebreide inleiding op de informatiefilosofie (220 pp.) is beschikbaar op de website van de Society for the Philosophy of Information, http://www.socphilinfo.org/ teaching/book-pi-intro 2. Webcasts van voordrachten: http://www.oii.ox.ac.uk/ people/?id=327#tab_webcasts (online beschikbaar). 3. Artikelen (vaak erg technisch): http://www.philosophyofinformation.net/articles (deels online beschikbaar) 4. Boeken van Floridi op het terrein van de informatiefilosofie zijn: The Fourth Revolution – How the infosphere is reshaping human reality (4R) (Oxford University Press, 2014). The Ethics of Information (EoI) (Oxford University Press, 2013). The Philosophy of Information (PoI) (Oxford University Press, 2011). Information – A Very Short Introduction (VSI) (Oxford University Press, 2010). Zie ook: http://www.philosophyofinformation.net/books 1. Op de website van Floridi http://www.philosophyofinformation.net/ staat nog meer informatie. 2. The Stanford Encyclopedia of Philosophy: http://plato. stanford.edu/index.html Noten 1 n PoI, p.14. 8 n 2015 numm e r L- F 2 n Zie voor een grafisch overzicht: http://www.philosophyofinformation.net/research. 3 n 4R, p. 87 ev. 4 n PoI p. 84, zie ook VSI, p.21. 5 n PoI p. 85 ev, zie ook VSI p. 22 ev. 6 n Een vertaling in het Engels uit 1804 van Euclides’ tekst over Data is beschikbaar via https://archive.org/stream/ elementseuclida00euclgoog#page/n367/mode/2up, p.355 ev. 7 n VSI, p. 32 ev. 8 n PoI, p. 104 ev.; zie ook VSI, p. 48 ev. 9 n PoI, p. 80-106 (HS 4). 10 n VSI, p. 38-43. 11 n De tekst is online beschikbaar via http://cm.bell-labs. com/cm/ms/what/shannonday/paper.html. 12 n PoI, p. 46-79 (HS 3). 13 n Zie bijvoorbeeld http://en.wikipedia.org/wiki/ Formal_methods. 14 n Vgl. de multileveldescriptionrules van de ISAD(G). 15 n Naast PoI p. 46-79 (HS 3) levert de inleiding op de informatiefilosofie beschikbaar op de website van de Society for the Philosophy of Information uitgebreidere uitleg (http://www.socphilinfo.org/teaching/book-pi-intro). 16 n VSI, p. 14-18, 4R p. 25-58 (HS 2), EoI, p. 1-18 (HS 1). 17 n Voor informatie over het online initiative, zie https://ec.europa.eu/digital-agenda/en/onlife-initiative. 18 n Zie bijvoorbeeld http://plato.stanford.edu/entries/kant. 19 n //plato.stanford.edu/entries/skepticism-ancient. 20 n Floridi publiceerde over het Griekse scepticisme twee boeken, zie http://www.philosophyofinformation.net/books.

[close]

p. 9

”The right people and the right forces need to get together” Interview with Prof. Luciano Floridi June 16th 1014, Assen Arnoud Glaudemans, Rienk Jonker, Frans Smit n Luciano Floridi The Right to be Forgotten en de uitspraak van de Court of Justice In mei 2014 heeft het Europese Hof uitspraak gedaan in een zaak die een Spaanse man had aangespannen tegen Google. Hij wilde dat Google de links zouden verwijderen naar een aantal krantenartikelen uit 1998. Het Europese Hof heeft hem in het gelijk gesteld op grond van de EU Privacyrichtlijn 95/46. Het Hof oordeelde dat in dit specifieke geval de privacy van de persoon in kwestie boven het economische belang van Google en het maatschappelijke belang van het recht op informatie prevaleert. De uitspraak gaat, zoals Floridi in het interview uitlegt, om het verwijderen van links, en niet om het verwijderen van de informatie zelf. De uitspraak levert stof tot nadenken omdat oude wetgeving zo goed en zo kwaad als dat gaat op een nieuwe situatie wordt toegepast. De toegepaste wetgeving gaat uit van een intrinsiek verband van accessability en availability. De zaak waar uitspraak werd gedaan betreft digitale informatie, waar dat intrinsieke verband niet meer bestaat. Reflectie op de digitale werking en verhouding van accessability en availability is nodig om bij issues van privacy, maar ook van bijvoorbeeld auteursrecht, tot een werkbare oplossing te komen. Zie voor meer juridische achtergronden van de Google-zaak bijvoorbeeld de website van Houthoff Buruma: http://www.houthoff.com/nl/popular-topics/maandelijkse-updates/nieuws/europees-hof-van-justitie-doet-right-to-beforgotten-herleven/show nummer L-F 2015 n 9

[close]

p. 10

Right to be forgotten Q. Professor Floridi, lately a lot of attention has been paid to the issue of the Right to be Forgotten and the response of Google to the ruling of the European Court of Justice. Google invited you to become a member of a new Advisory Board. Did you already have the time to reflect on all the media attention? A. The impact on the media has been a surprise to me. It started by receiving the invitation, which I did not expect. From that moment on the events were full of surprises. I knew that the recent decision by Google and the EU ruling on the Right to be Forgotten were going to attract debate. I expected that there was going to be a scholarly, academic debate between experts. What I did not expect was the attention of the mass media. I think there are several explanations for this sudden turn. One of them is the almost immediate polarization of the debate. It is easy to portray this as a matter of Politics versus Business, of Privacy versus Freedom of Speech, of Corporate interests versus Social interests. These are simplifications that do damage and have no value whatsoever. However they make an easy story for a journalist. A lot of journalists would be happy to portray this debate as a boxing match, with winners and losers. On two occasions it happened that the journalist did not want to interview when I indicated that I did not want to portray the issue as a fight. One even asked me to give names of people who would. I didn’t. To find a solution here it takes two to tango and not two to fight. This debate is not a zero sum game. There is also another explanation for this attention of the mass media. It might have an enormous effect on the media world themselves. There is a tension here between the right of an individual to get protection and the need of society to have clear rules, for example about publishing. The ruling in this case was about the publication of some perfectly legal content in Spain. The European Court ruled that the content must not be removed. The links however should be removed. The mass media got this attention because of the fact that this happened to legal content, and the tension of public and private interests in the ruling. Q. We saw you said something about the ‘Right to be contrarian’ in the committee. and Growth. It must be possible to make a business model or economic model in which human rights are respected and which at the same time makes sense financially. It is not an Either - Or. We have to be a bit more intelligent. This must be possible even though I do not have the solution right now. We have done this before. For example with intellectual property rights there have been some intelligent solutions. Consider Netflix. Immense illegal downloading does not mean that humanity suddenly had turned into billions of criminal people. We all knew that lots of content was not accessible or too expensive. The old model of the content-providers, ‘my piece of junk, you pay for it’ obviously did not work anymore. The moment Netflix was introduced in Canada, peer-to-peer downloading crashed down by 50 percent. Netflix introduced a very successful business model. Another example is from the Art Gallery DoriaPamphilj in Rome, which hosts a wonderful privately held collection of paintings by for example Caravaggio, Velasquez and Tiziano. Making photographs there was forbidden. However in the era of smartphones taking a picture cannot be prevented anymore. The gallery found an obvious and trivial solution. When visitors pay 5 euro at the entrance, they are allowed to take all the pictures they want for private use. So now everybody can make their own selfies in front of a beautiful Velasquez painting. The customers are happy, the gallery increased its exposure and makes more money now. Q. So new technology is driving us to constantly think out-of-the-box? A. That was a concern of one of the members of the Google advisory board. The members will work pro bono. They have to, since objective and independent evaluation is necessary. This is something very British: you do not only have to be independent, but you also have to be perceived as independent. Google really wants to understand exactly what the problem is, from a European perspective. I want to look at the strategies that can be devised for solving the problem without compromising on both human rights and economic visibility. It is easy to compromise on one of the two sides. But you want to find a way in between. This is very important from a European perspective, for example in the context of the European Agenda on Innovation A. Exactly. Nobody can tell me that this is not a win-win example. The owners are happy. The customers are happy. It proves there are ways to get rid of the hassle of the old ways to solve the matter and move forward. Q. Would this conflict of interests between the privacy of the individual and the need for information by society, be solvable by a really smart idea, or would it take a change at the conceptual level? A. The first step is acknowledging that the problem is not going 1 0 n 2015 numm e r L- F

[close]

p. 11

to go away. It stays with us. The second step is acknowledging that it may require some legal rethinking of the whole game. As in the case of the art gallery, if you have a smart idea or smart technology then suddenly all the forces will start pulling and pushing the right way forward towards a solution. Today I do not have it. The ruling in the Google case gives us only a very partial solution. The solution is not to be found in pushing all the problems on the shoulders of the users. That would be something like a false victory. It may look like a great move but it is not a solution. It is saying: we collect all the data and then it is up to you, user, to say what you don’t want to see linked. It is better than nothing but if you do not go online often, or you are not so familiar with social media then you might not be able to do what is in your interest. So this is not the solution. It still comes short of a fully satisfactory strategy. Take for example the train. If I take the train, I assume that the company takes care of my safety during the journey. That kind of solution is not present yet. Q. The idea of a human as an informational agent 1, is that a part of a possible solution? When you are on a train, people can see you. Online it is the same thing. People can see you. You cannot be invisible in this environment on the basis of privacy. Like you cannot be invisible in a train. ‘Availability’ en ‘accessibility’ Het onderscheid tussen de Engelstalige begrippen accessibility en availability is lastig te maken. Daarom komt het vertalen daarvan ook precies. Het gaat om het onderscheid tussen (1) informatie die er is en waarvan dat bekend is (available) en (2) aanwezige informatie die vindbaar, benaderbaar en te gebruiken is (findable, accessible en usable). De begrippen accesibility en availability ‘drijven’ bij digitale informatie uit elkaar. Iets wat beschikbaar is hoeft daarmee niet ook toegankelijk te zijn. Bijvoorbeeld een link naar een gegeven kan worden verwijderd terwijl het gegeven zelf er nog wel is. Ze is dan echter niet meer vindbaar en dus ook niet bruikbaar. Iets wat toegankelijk is zou ook beschikbaar moeten zijn. Anders is de link niet meer dan een ‘herinnering’ aan iets wat er niet meer is. Beschikbare informatie is dus informatie die er is. Niet beschikbare informatie bestaat niet, want zij is niet waarneembaar. Wanneer zij na een periode van beschikbaarheid niet meer beschikbaar is, is er sprake van entropie (destruction). Beschikbare informatie kan toegankelijk zijn. De mate en manier waarop informatie toegankelijk is kan variëren. Dit is afhankelijk van het belang dat aan die informatie is of wordt toegekend. Een hyperlink naar informatie van een zoekmachine is een vorm van toegankelijkheid. Dus het verbreken van deze link verandert iets aan de mate van toegankelijkheid en indirect iets aan de mate van beschikbaarheid. Maar desondanks blijft die niet gelinkte informatie beschikbaar. A. There is something to be said for your remark. Whether we like it or not, we have stepped into a new stage of human history. Lots of stuff will stay with us. We cannot get out of this recording age, but I am not saying we just have to get used to the fact. On the other hand the solution is not to put everything away. We want to keep things from the past too, also things that infringe upon privacy. We have it because we like to have it. We are developing a new sensitivity on what is private and what is not private. That will make the problem very different to future generations. But it will not disappear. Q. A lot of good history books would not have been written if privacy, as we view it now, would have been respected in older days. A. At the same time those bits of information were not up there when these people were alive. It was possible to say: used it when I am not alive anymore. The philosophically interesting question that the ruling of the European Court of Justice has brought to light is that this sort of special mix, this special link, of availability and accessibility has been broken fundamentally. As in the case of having to visit the Vatican to access a manuscript available to the public there. With the digital you start detaching availability from accessibility. This detachment goes even further when it concerns the accessibility of a digital copy of the original. The detachment is really hard to handle then. The ungluing of accessibility and availability means that you can remove the link to something that is there perfectly legally. Nowadays you can, on the one hand, print a t-shirt with a text from legal content without a problem. But on the other hand you cannot have a link from a search engine to that same text. That is a new and very strange situation. It has never happened before. It is a big mistake to think that it is about removing information. It is about removing the link from the search engine to the information. The information itself is kept, and it is kept for perfectly good reasons. It is kept in the archive, in the newspaper, nobody is going to burn it, and no one is going to remove it. And that will apply to other similar rulings. What people misunderstand is that if you have for instance a photograph, it is legal content that may be kept in one of the archives in the Netherlands. The ruling does not concern the photograph itself. It is concerned about search engines like Google having a link to it. You remove the link, and not the content. Q. How far can this go? For example we have copyrighted digital material in the archive that is very useful for the public. Can we just make it available online to the public and let remove the link by Google? A. Generalizing this case the problem lies in the fact that the ruling is for Europe only. The thing is that you might have to remove the link in a search engine from a European domain. So you might not find some information anymore through Google.nl. However, if you use Google.com there is no problem since that is not a domain based in Europe. That’s what it takes. The removal of a link of particular search engine is the scope of the ruling of the European Court of Justice. The scope is not even >> nummer L-F 2015 n 11

[close]

p. 12

>> a search engine of a newspaper, since that is perfectly allowed to have its own search and therefore show the information in question. That’s why I have some dissatisfaction about the rules with which we have to operate at the moment. It becomes rather hypocritical to say: we remove the link. But from where? Only from European based search engines. Still the European Court of Justice could not have done much more. Q. So this is an ‘old world solution’ ? Archives in the infosphere Q. As archivists we are familiar with a specific concept of an archive. An archive can be seen as essentially an object to take care of, and coming after that, this object has a meaning. This meaning is not something given but will occur in all kinds of (future) contexts of interpretation. Will there be a place for such an “archive” in the infosphere in the future and if so, what will its digital manifestation be? A. Exactly, and that is why I am not satisfied. People are wrong if they think I am dissatisfied because it has to do with for example censorship. Not at all. I used the following analogy to a journalist that did not quite understand it. However, you as specialists will. Here it is. We gave to the European Court of Justice the ingredients and the recipe for an omelette. They cooked the best omelette they could. However, I wanted to have a steak. I am very disappointed, but not because it is a bad omelette. It is a great omelette, but I wanted a steak!. With the current legislation this is what the European Court of Justice could possibly do. They were not to judge about presence or absence of content. That had already been decided by the Spanish court, which ruled that the content need not be removed. But is this the best we can hope for? Not at all. I am in favour of finding better solutions for our infosphere, to use one of my favourite words2. Because that environment deserves clear thinking about the novelties and we have reached the stage where the old stuff does not stretch anymore. It does not stretch to cover this. Q. From an archivist’s point of view there are so many dilemmas concerning use of information. One is: how far can one go to protect oneself, and how far can archivists go to protect the interests of people that are (or might) be harmed by the accessibility of this information? A. Let’s first start with a qualification of what infosphere means. The concept is flexible which can make it a bit slippery sometimes. In a lighter sense one might understand infosphere as “the world of information”. I am happy to use it that way. Another sense is more philosophical: a sense that I use for heavy duty metaphysics. And that’s when I try to understand the whole of reality as being informational in nature. Instead of talking about a material world, we talk then about an informational world. At that point everything is information: this glass, this table, as well as you, me, this computer, etcetera. Through the heavy duty concept of infosphere the whole of reality is understood informationally. We don’t have to use the metaphysical concept of the infosphere. But starting from the lighter sense of “the world of information” and looking at scientific developments, in biology for instance, the question is more and more: is there actually any other area, not included in informational space? If we use the concept in the simpler sense: the sphere is represented by bits of information that is present in for example an archive, a library or documents online. As to the question of archives in a digital infosphere, I would actually say, counter to the tendency today, there will be much need for archives in the future, for several reasons. One of the reasons, which is highly underestimated, is that digital information is hugely and immensely fragile. People working in archives are aware of that, but people usually assume exactly the opposite. They think that digital information is very robust because it is for example so easily clonable. But it isn’t robust at all. It is rewritable, it is often inaccessible because of outdated technology, and it is easily corruptible. The physical support of the stuff we have has a very short life. Maybe only 7-9 years. In 10 years all these beautiful digital documents in your archives may have disappeared. It will be as if you never had it. People in general don’t understand this. Q. It can be said that the situation is one of autodestruction turned on permanently? A. This is a very interesting point. We are now in a unique stage of human history. It never occurred, and it will never happen again. The next generation will have their pictures on Facebook. I did not because when I was 18 there was no Facebook to make a fool of myself. The 18-years-old now who makes a fool of himself now on Facebook will be the businessman or businesswoman in 30 years who then, when faced with silly pictures, will know that everybody in his generation will have done the same. It is not to trivialize everything. But there is a generation gap now. Hopefully next generations will be a bit more tolerant in respect of all this information recorded in the past. In general the gap that we see these days will go away. When the next generation appears on stage a new sensitivity about what to do and do not on social media will arise. The gap of generations is also a social media gap. It will disappear with time. Other problems will undoubtedly arise, though. A. Yes. If you think the digital information is there forever: in which universe do you live? Mine does not work that way. Digital information has a very short lifespan. It is very massively distributed, easily clonable but extremely fragile. Another reason for the importance of archives that people don’t think about is that the 35 zeta bytes of information is something of a baby boom. They came to history in one step. If they collapse, they collapse in one step. If you look at the manuscript tradition, with which I am well acquainted, this took millennia 1 2 n 2015 numm e r L- F

[close]

p. 13

to come. As for digital information, we are building on very fragile foundations here. It does not take much to wipe out the information. If you take for example analogue music recordings and films from the past, we lost immensely already. It takes a lot to restore them, they are deteriorating quickly. This might also easily happen in the digital world. People are confused on this point, and not aware of the problem. Adding to that, the fact is that there is no unlimited space for all the information. What we see are policies implemented, perhaps by the “less important persons” in the organization, with the result that older information is thrown away when there is a space problem for new information. Since documents acquire their meaning through time it is very difficult to determine what will be meaningful tomorrow. Those terracotta clay tablets from Ur were not very meaningful at the time but now they are super precious elements through which we reconstruct a whole civilization. Q. But do you think we should still keep certain information? You might say that in our new information era there is no need any more to save anything. The question is: why should we have an archive? we cannot save everything. Somewhere, somehow someone must make the decision that for instance only a third level of the web pages are being saved, or all the website of a politician but not all the comments, et cetera. Q. Do you have to appraise in detail? That is very difficult, not possible even. A. That points to the fact that what we are facing in terms of our past experience is yet an unsolvable problem. We never faced this problem. We don’t have a best practice for this yet. What I think will happen – which is not what I hope will happen –, is that people do what they always do: just go ahead and think afterwards. Hopefully someone is brilliant enough to save some stuff that historians in a hundred years will need. When they discovered those papyri in the villa near Naples people thought they were just blocks of charcoal, the locals used it as burning material. And then years later they found a way of unpacking the stuff. That takes a very developed technology, it is very time consuming and very expensive. From a block of charcoal the experts could reconstruct big chunks of manuscripts. It’s a piece of human history. The locals were unaware of that and are not to blame. I think we will see more of that. Important stuff that is saved by accident. Hopefully there will be some good initiatives though. Q. Thinking about appraising and keeping stuff, archivists are looking either for short terms to save information, or to save information permanently. It is for tomorrow of for eternity, nothing in between. I think that does not work anymore. What do you think? A. The reasons stay the same. If you were convinced in the past that you should keep records – for preventing mistakes, to understand ourselves and to enrich our experience – there is no reason to change your view. It is not only a matter of utility but also a matter of flourishing, of understanding more, of enriching culture. If that was true yesterday, I think it is even more so in the future because we no longer deal with paper. We would wish the digital stuff to last a hundred years. Q. Apart from the technical problem concerning keeping digital information there is also the question how much we should keep from all these zeta bytes. A. We would not have the space anyway to save everything forever. Q. Isn’t it so that we should understand the value of information for good recordkeeping strategies? Make choices? A. It is very difficult to find good policies of curation. In the upcoming new era of information that is something we should think about. Now we are doing it out of necessity, the digital shelves getting full, but without more thought. This always had the premise so far that the technology would develop at the same pace. This problem would disappear when there is a breakthrough in recording techniques. If someone, somewhere, a company we haven’t heard of, or a genius of some kind, shows that you can save the whole world of information say on a grain of sand forever, we would have solved the problem. Short of that, we will have to deal with what to put away and what not. A. This, I think, is yet unsolvable. From 2 millennia before Christ until yesterday, the choice was made for us. Everything was lost unless it was saved. Loss was default, saving was the option. Today is exactly the opposite. Saving is the default. Since there is not enough space, there should be a policy of deletion. It is yet very unclear which policy of deletion should be implemented with regard to these vast quantities of information. For example: the presidential campaigns of Obama for a great part used social media like Facebook and Twitter. That information could disappear in one day. President elected? Switch off! There is a strong movement in the US to preserve that information. Q. In the Netherlands there is an institute, at the University of Groningen, that collects this kind of information. Archives, Big Data and Open Data Q. So when there is a technical solution, there is a problem solved. However the next problem would be the value of all these saved data. How might we value this information in terms of “being true” in the sense of telling what really happened. This is one of the basic functions of an archive. How would we have to conceive of this “being true” in a zeta byte, Big Data world? Will this work differently, for instance statistically? >> A. That is important, still it does not solve the problem we discussed earlier, which is: how much should we keep? Because nummer L-F 2015 n 13

[close]

p. 14

annotations from Nietzsche you can see exactly when he read it, when he stopped, what notes he had, even the material nature of the notes makes a difference. Q. So a difference between archives and Big Data is the reusability of the latter, stemming from its unstructured nature? A. Yes, the word for that is repurposing. Repurposing is what Big Data can do again and again. Think about Big Pharmaceutical Companies. A lot of cutting edge, life saving research is done by them. Should we collect and share biomedical Big Data on a European level? There is no Yes-No answer to that. On the one hand you do not want to prevent life saving research based on repurposing. On the other hand you do not want to give everything in the hands of the corporate world which then squeezes all the value out of it and develops, say, a potion to look younger but doesn’t care about a cure for Alzheimer. This situation requires thinking about limits and constraints. One of the problems is that the dealings with Big Data are not transparent. >> A. When we speak about Big Data, by definition they are unstructured. The nature of Big Data is that there is no particular context; it is very liquid and it can be manipulated for whatever purpose. For example data of a phone company of who called who. It is remarkable how quickly we are getting used to the concept of information as something liquid: unstructured, malleable, manipulable, and thus to be used for any kind of purpose. It is a sort of information very different from information that is crystallized into a particular structure, coming with a clear meaning or scope of meaning, that has a particular semantics in it. When I was studying old manuscripts in the archives, one important thing was to know who owned these manuscripts. It was crucial for me to understand for my research. One cardinal just bought a whole collection, while others collected manuscripts very carefully. It made a huge difference as to their meaning. All this contextuality disappears completely in Big Data. It is a big reservoir of data points that can make or not make a certain story. Depending on how you connect the data points they tell a completely different story. That is also worrisome for people on the philosophical side because you can make them tell different stories. This is terrible in two ways. In statistical analysis it is well known that if you massage the data a little bit the story can change. What we are now exposed to, since the material is unstructured and so large, is that it contains almost any story. What you get out of the material is very much up to you. Now this is good for business. It only takes a bright application to extract value out of it. In terms of history it is dangerous. You can map anything to anything. To invent something on the spot: a story on buyers of Mexican food in Amsterdam. The malleable, flexible nature of this information has as a consequence that it loses constraints that come with structured archives. There are more constraints the more physical the stuff of information gets. If you have for example a book with Q. Wouldn’t it be better if it had to be made transparent what exactly is done with it, by companies for instance, so the public can know and keep control? A. The openness of Big Data was at issue when the discussion about Governments and Open (Big) Data began. However it was not about being “open” as in open source but about “open” as in disclosure: to show what is done with the taxpayer’s money. I think what we are moving towards is some kind of cultural trust which is also supported by legal constraints. I am happy to trust a big company but I am happier to know that there are these legal constraints. As we speak, many governments have Open Data initiatives. They give access to data to whoever wants them based on the view that it could facilitate innovation, research and development leading to growth. It is a good move but there is an extra step to be taken. The important point is that there is a huge difference in the access of single individuals to governments’ open data, and big companies that squeeze value out if it. Those data come with a price. Someone had to collect them, curate them, etcetera. Let me give an example. The UK government sold the post office. They forgot, however, to detach from the sale of the post office the database of the postal codes. This database contains a map of every house in the UK, which is highly valuable information for any business. They forgot this and sold it for too low a price. That was public value that has been given away. It could have been sold at a high price, or just been kept in public hands. This is the kind of mistakes we should not make. In the 21st century, where information is everything, you are not selling the post office as a building, or a collection of stamps. Probably the most valuable part of the package to sell was overlooked. It is a shame they gave away information that for a lot of business is pure gold. Q. What does the British archival law say about this? Can it be that it prohibits the selling of this information? 1 4 n 2015 numm e r L- F

[close]

p. 15

A. To my knowledge mapping the postal codes was already a paid service from the post office. They sold the whole package, including this service. It is a lot of extra value that one could have obtained. Back to my original point, when we talk about Big Data provided by the government, we should not have any illusions about how free Big Data is. It isn’t. We are talking about the tax service starting to think about using its data for commercial purposes. The debate is open at the moment. I am always optimistic and there will always be a way to do this properly and nicely but I can also see the risks, because the data have come at some cost. When the government gives it away for free, if a business takes advantage of that resource, I think it would be fair to charge something, so revenues come back to the society. I think that is just normal use of public resources. Something economically viable could be thought out there. The difference is in the possibilities of its use for me as an individual and for a big business. The latter can squeeze money out of this open data. Of course it is a resource and I like the idea that it supports innovation and growth. The model I like is the Norwegian oil model. Oil in Norway is handled nationally, it is a national resource. Why give it away? It is to the advantage of everybody in society. It is a good way of exploiting national resources. We might look at governmental open data the same way. Q. Can we conclude that Open Data is a naive way of thinking? We give it away and create inequality? Opportunities stemming from the rising importance of information and its valuing. Threats in the liquid concept of information as in Big Data. How do you view the relevance and role of archivists in present information society, and their concern for reliable, structured information? A. This is about much more than just the archivists. It is about the more general question whether the world is actually going towards an asymmetrical relationship between structured and unstructured data. As always there is a difference between what is happening and what we think should happen. As of now what is happening is that we are in fact moving towards a society in which unstructured data is more important than structured data; a world in which you don’t have to structure data, but where you just do searches and that’s that. This situation does not make archivists redundant, but it means that archivists need to “adapt”, to change their way of thinking. At the same time I think there will be value in not so much resisting but in complementing that tendency towards unstructured data and a search interface. The work of the archivist is essential in the structuring of information, in assembling and caring for the semantic artifacts. The real curation happens there. Curation is not about stashing away trillions of data points. It is about choosing which data to apply and which not, and about the requirements that businesses, customers etcetera will have in the longer run, even though they do not know that right now. This is a kind of sedimentation of information that is more than just piling up things. A proper archive with a proper structure seems to me the best way forward. It is an expensive enterprise though. That is why people want to have shortcuts; simply put data on a hard disk instead of carefully catalogue it, link it, structure it, etcetera. That takes human time. It is not done automatically. Curation is a tailored human enterprise. Our machines can give us a hand but they are not in charge here. As I said earlier the tendency towards unstructured data is growing. It is a matter of cutting costs. A point I would like to make here as to unstructured data is that, in mathematical logic, it is well known that there are structures that are irreversible. I will explain. Imagine you have a box which gets input and processes output. Suppose I do not know the input but I know the output. When the structuring is irreversible you cannot go back from output to input; you cannot recover the information on the input side. This is the case when the box is a simple adding machine: when the output is 5, the input could have been 1+4, 2+3 etcetera. There is no way to recover the input. Thus not taking the opportunity to organize the collection and structuring of information in a recoverable way, leads to losing memory. This irrecoverability I find disturbingly more and more common in our culture. The case of the Right to be forgotten, from a philosophical point of view, is an instance of a more general trend towards a culture of reversibility, of “anything can be undone”. That is what we can learn from those machines. It is the way we act in our lives as well. There is a lot of reversibility to enjoy in life, for example to stop or smoking or lose 5 kilos weight. But it is not the default position in life. That would be a mistake: life does not work that way. There is enough grey hair A. There are several good reasons for Open Data. The first is transparency. Of course being transparent is not only done with Big Data but with other kinds of information as well. Another good reason is to enable young entrepreneurs in starting up new companies. On the other hand the fact remains that simply giving the data away is naive. It makes no sense. Only someone with the right infrastructure, background and economic interest can actually take advantage of these trillions of data somewhere. You, me, even the university could not do it. So if you look at for example research at the university, we buy access to Big Data from for example Twitter. It comes at a price. So why should the government give away data for free? Q. We should treat our archives as national property and reason in this way. A. Yes, it is a national resource which has to be given back to the nation. Not only to business, but to the whole nation. That is maybe a European way of thinking. Imagine there is a party where everybody pays the same amount of money but one person eats ten times more than the rest. That is a bit unfair. You eat more, you pay more. Archivists and information ethics Q. Let’s go back to the archives or perhaps more specific: the archivists. There are a lot of threats and opportunities. >> nummer L-F 2015 n 15

[close]

Comments

no comments yet