Voor elk boek is een gebruiker

From Mondothèque

Revision as of 09:10, 5 July 2016 by FS (talk | contribs)

THIS IS A DRAFT


  • SVP = Sylvia Van Peteghem
  • DM = Dries Moreels
  • FS = Femke Snelting

Gent, 28 januari 2016


FS: Ik wilde graag met u spreken naar aanleiding van ons avontuur met het Mundaneum, de instelling die het archief van onder andere Paul Otlet beheert. Ik ben nieuwsgierig naar de manier waarop archief- en bibliotheekinstellingen, een aantal jaren nadat ze de eerste contracten met Google afsloten, daarop terugkijken. Ik dacht misschien te beginnen met wat er gebeurde op het moment dat jullie de laatste leveringen opstuurden. Zijn jullie doorgegaan met dat contract?

SVP: Mag ik eerst even terugkomen op uw Mundaneum verhaal? Want we hebben eigenlijk een link met het Mundaneum. Toen Google hier bij ons kwam, helemaal in het begin, hebben wij ook de link gelegd met waarom wij als Gentse universiteit ja zeiden op zo'n vraag van Google. En in een Belgische context, dan kom je eerst bij onze hoofdbibliothecaris terecht, die daar op de kast staat; Ferdinand van der Haegen. In de 19e eeuw heeft hij ooit de opmerking gemaakt heeft “Ça sert a quoi, de collectionner” als je niet vertaalt wat je hebt. De grote droom van Van der Haegen was: een wereldcatalogus te maken. Wat hij voorstelde was: u bent van de British Library, u van Parijs, ik van Gent. We maken allemaal dubbels van onze fiches en sturen die naar elkaar op. Ze hebben daar een test van gemaakt maar natuurlijk ... je hebt zélf al zoveel fiches te klasseren, daar komen de anderen nog eens bij. Dat stapelt op en dat werkt niet. Dus wat hij wou doen was een catalogus maken, zodat iedereen weet wat je hebt.

Hij kende de jonge Paul Otlet, voor Otlet was hij een beetje een éminence grise. Otlet heeft ooit een aanvraag gedaan voor een budget van de staat voor zijn project. De minister vroeg aan Van der Haegen: moeten we dit doen. En Van der Haegen, die eigenlijk wel sympathie had voor het idee, die heeft vooral gereageerd vanuit: “Been there, done that”.

RC : Il y a des concepts qu’il avait déjà compris. Maintenant, en fonction de l’époque, il n’a pas pu tout mettre en place mais, il y a des choses qu’il avait comprises dès le départ. Par exemple, standardiser les choses pour pouvoir les changer. Ça il le comprend dès le départ, c’est pour ça, la rédaction des fiches, c’est standardisé, vous ne pouvez pas rédiger n’importe comment. C’est pour ça qu’il développe la CDU, il faut un langage qui soit utilisable par tous. Il imagine avec les moyens de communications qu’il a à l’époque, il imagine déjà un moment pouvoir les combiner, sans doute parce qu’il a vu un moment l’évolution des techniques et qu’il pense pouvoir aller plus loin. Il pense à la dématérialisation quand il utilise des microfilms, il se dit « attention la conservation papier, il y a un soucis. Il faut conserver le contenu et donc il faut le passer sur un autre support ». D’abord il va essayer sur des plaques photographiques, il calcule le nombre de pages qu’il peut mettre sur une plaque et voilà. Il transforme ça en autre support.

Dus in de 19e eeuw wil Van der Haegen de catalogus, en Otlet de bibliografie. Google heeft dat dus allemaal, plus de gescande boeken die ieder op elk woord opvraagbaar zijn. Dat is in feite de droom van zowel Van der Haegen als Otlet verderzetten en mogelijk maken. Dus vanuit die filosofie zijn wij meegegaan. Ik moet eerlijk zeggen dat ik me nooit afgevraagd of dat wel een goed idee was. We hebben wel aan de groep die over het contract ging gevraagd: waarom doen jullie dat? En er was er één die zeer geëmotioneerd zei: “Because it's in the heart of the founders”. Moesten wij Van der Haegen en Otlet niet kennen dan denk je, ja laat maar zitten. Maar eigenlijk was het gewoon een verderzetting van hun idee, vandaar dat het Google contract zo logisch was.

Ik weet niet of u weet hoe we aan het contract geraakt zijn?

FS: Ik heb begrepen dat ze mensen van jullie bibliotheek ergens ontmoet hebben.

SVP: Minister Fientje Moerman gaat vaak op economische missies naar Amerika. Ze had een adres nodig van Herbert Van de Sompel en ze belt daarvoor en zegt dat ze ook naar Seattle gaan, en ik zeg voor de grap: als je iemand nodig hebt om je koffers te dragen, laat het me weten. 10 minuten later krijg ik een telefoon van het kabinet. Als ik wilde kon ik mee. Ik zag dat er ook nog doctoraatbesprekingen in Stanford waren die er interessant uitzagen. Ik ben niet zo goed in aardrijkskunde dus ik dacht dat Stanford en Seattle met een bus gedaan werd. Ik stond daar dus in Seattle met een jetlag tot en met, en Wim De Waele van iMinds was daar ook bij. We stonden samen een koffie te drinken, en hij vroeg me waar we mee bezig waren hier in de boekentoren. We hadden toen juist 40.000 foto's gedigitaliseerd en online gezet, dus dat vertelde ik. Hij zei dat hij die avond ging eten met iemand van Google Books en dat hij met hem er over ging praten. We zaten toen net in Monumentenstrijd, een televisieprogramma. Hij belde me en zei dat mensen van Google mij wilden spreken. Ik was zo naïef om te denken: we zitten met dat programma, we hebben daar geen tijd voor. Dus hebben we dat uitgesteld, tot Wim me in februari weer belde en hij kwam terug op dat voorstel. Ik haalde Monumentenstrijd weer aan, waar we ondertussen in de finale zaten. Wim zei me toen: “Het is nu of nooit. Als je nu nee zegt bel ik niet meer terug”. Dus ik dacht: hij wordt boos dus zullen we dat maar doen. Er is dan een man gekomen van Google Parijs, Philippe Colombet. We hadden geluk, want Wim had een heel programma uitgeschreven, met IBBT en van die dingen, maar die man stapte binnen en zei meteen: “I would like to visit the building first”.

Hij vond de collectie interessant, en zei “Ik ga dat doorgeven naar Amerika. Het zal wel een jaar duren voor je reactie krijgt”. Maar hij belde 's anderdaags al op: ze waren in Europa en wilden op bezoek komen.

We mochten er niet over praten, we waren maar met twee die er over wisten, Veerle Van Conckelberge en ik. Ze waren met zeven, allemaal met een Google-rugzakje. We hebben dan een presentatie gegeven over waar we mee bezig waren, we zijn er mee de toren ingegaan en gaan lunchen. Na de lunch zag ik dat ze met elkaar aan het praten waren en toen we terugkwamen heeft één van de meest onopvallende van hen het woord genomen en zei “We like your collection, we love your team and we adore your building so from our side it is a deal”. Meer dan dat was het niet.

Daarna hebben we het idee aan de universiteit moeten verkopen omdat we personeel nodig hadden om alles klaar te krijgen. En zij waren zo fier om met de collectie in dezelfde rij te mogen staan als Oxford en Stanford, dus zij waren meteen mee.

Ik kreeg wel mails vanuit Frankrijk dat we onze ziel aan de duivel hadden verkocht, en van de KBR. Maar we zijn geen rijksuniversiteit meer. Moest dat wel het geval zijn geweest hadden ze kunnen zeggen: “Dit of dit kan niet”, maar we zijn onafhankelijk.

FS: Jullie zijn een overheidsinstelling, of een publieke instelling?

SVP: We zijn een overheidsinstelling, niet? Vlaamse gemeenschap? We zullen het straks eens moeten opzoeken.

FS: Kennelijk is er op een bepaald moment in de kamer de vraag gesteld waarom de KBR niet hetzelfde contract is aangegaan.

SM : La politique de numérisation de l’Université de Gand, je pense, est plus en lien avec ce que Google imagine. C’est-à-dire quelle est la plus value que ça leur apporte de pouvoir travailler à la fois une bibliothèque universitaire telle que la bibliothèque de l’Université de Gand, et le fait de l’associer avec le Mundaneum ?

SVP: Maar je kan niet bij Google gaan aankloppen, Google kiest jou. Wij hebben wel hun aandacht getrokken voor het Mundaneum.

Als Google België iets doet proberen ze ons altijd te betrekken, omdat wij nu eenmaal een universiteit zijn. U heeft het Mundaneum gezien, het is een zeer mooi archief, maar dat is het ook. Voor ons zou dat enkel een stuk van een collectie zijn.

Ze worden ook op een totaal andere manier gesteund door Google dan wij. Bij ons heeft de universiteit meteen gezegd dat het niet ging investeren in de digitalisering. Google heeft daar wél heel sterk in geïnvesteerd. Dit is een terugkerend verhaal: dat er ofwel geïnvesteerd wordt door de instelling door op andere dingen te besparen, of door te zeggen: dit is iets wat we willen, maar we kunnen het niet betalen.

De ontsluiting van de gehele collectie is enkel mogelijk door ze te scannen, maar de investering is echter gigantisch. Als je de vraag stelt: zou je dat overwegen, zouden heel veel mensen eens goed lachen om zo'n investering.

RC : Il faut déjà au minimum avoir un inventaire. Il faut que les pièces soient numérotées, sinon c’est un peu difficile de retracer tout le travail. Parfois, ça passe par une petite phase de restauration parce qu’on a des documents poussiéreux et quand on scanne ça se voit. Parfois, on doit faire des mises à plat, pour les journaux par exemple, parce qu’ils sont pliés dans les boîtes. Ça prend déjà un petit moment avant de pouvoir les numériser. Ensuite, on va scanner le document, ça c’est la partie la plus facile. On le met sur le scanner, on appuie sur un bouton, presque.

From X = Y:
According to the ideal image described in "Traité", all the tasks of collecting, translating, distributing, should be completely automatic, seemingly without the necessity of human intervention. However, the Mundaneum hired dozens of women to perform these tasks. This human-run version of the system was not considered worth mentioning, as if it was a temporary in-between phase that should be overcome as soon as possible, something that was staining the project with its vulgarity.

Ik ben verschillende keren naar de Google scan-plants geweest om te zien hoe zij werken. Niemand van ons team zou dat kunnen. Zelfs al zou het over 1000 boeken gaan dan zou het personeel gek worden, omdat het gewoon de hele dag blaadjes omdraaien is. Bij Google werkt een wisselend team mensen die ongelooflijk blij zijn om dit te kunnen doen. Ze werken er een beperkt aantal jaren, deels zodat Google geen vaste contracten moet geven, maar dat terzijde.

Daarnaast: Stel dat we hier een scanner krijgen, en OCR software om dit te kunnen doen, moesten er nu problemen zijn met deze apparaten dan liggen we stil, maar bij Google wordt dat meteen hersteld en verbeterd. De manier hoe zij daar aan werken is een expertise. Wij mogen daar niet over praten, helaas, maar niemand van ons heeft die expertise.

FS: Is het opbouwen van een dergelijke expertise niet op termijn van belang voor u als collectiebeheerder?

SVP: We hebben een vaste ploeg, twee mensen die voltijds scannen, maar daarmee raak je nooit aan 250.000 boeken.

We proberen het team ook bezig te houden door unieke en interessante boeken mee te geven, je wilt niet een hele dag gewoon boeken scannen. Toen we al onze fiches hebben laten inscannen enkele jaren terug heb ik heel veel medelijden gehad met de meisjes die daar aan werkten.

FS: Tussen de expertise die Google heeft op industrieel niveau, en de meer kleinschalige manier waarop jullie werken, is daar uitwisseling over, leren jullie daarvan?

SVP: Nee, dat is een totaal andere methodiek.

Onze scans zijn state of the art. Bij Google gaan ze voor content, content is natuurlijk ook kapitaal. Maar als je in Google Books zoekt wordt je toch nooit overladen door reclame en zo? OK, Google kan commercieel zijn in andere takken, maar ik vind dat bij Google Books ... ik heb nooit het gevoel dat we met iets radicaal fouts bezig zijn.

FS: U begon met te vertellen dat jullie samen met Google het ideaal om alle kennis van de wereld te verzamelen en te indexeren verderzetten. Dit was voor het Mondotheek-team de aanleiding om in actie te komen: voor ons ging de gelijkstelling van Otlet's Mundaneum met Google een stap te ver. Die vergelijking laat veel ongezegd over het project dat Google feitelijk in gang heeft gezet.

SVP: Bedoelt u het project dat ze voorstellen met het Mundaneum? Ik weet niet wat ze met het Mundaneum willen verwezenlijken; ik weet dat ze heel graag het archief Otlet gescand willen hebben. Als je daarover meer wilt weten, moet je Bill Echickson spreken. Hij werkt niet meer voor Google maar hij heeft wel de contacten gelegd met het Mundaneum. Het was een oud-journalist voor de Washington post, hij heeft het hele verhaal Mundaneum.

Het probleem was dat de Waalse gemeenschap niet wou dat het archief gescand werd door Google uit angst dat ze de monopolie over de content zouden kwijt raken. Ze moeten bang gemaakt zijn door iets of iemand. Ik ben ook een keer bij een Waals minister van cultuur geroepen om te praten over ons contract met Google en wat voor gevaar dat zou kunnen geven, dat scannen.

U weet dat een deel van wat Mundaneum heeft aan scans, hier gebeurd is? Wouter van Acker was een doctoraalstudent architectuur in Gent en het is voor zijn onderzoek dat we de scans aangevraagd hebben, een paar duizend. We hebben het materiaal dat Wouter nodig had hier gescand en de kopieën doorgegeven aan het Mundaneum.

FS: Wie weet zijn die hier gemaakt uiteindelijk op de site van het Google Cultural Institute terecht gekomen?

SVP: Voordien was het zo dat je al een heel goede neus moest zijn om een doos te mogen opendoen in het Mundaneum.

Dat is echt wel het unieke van het Google Books project: de boeken staan zonder beperkingen online, volledig doorzoekbaar. Een curator kent de collectie natuurlijk, maar met een collectie die zo groot is alsde onze zijn er bepaalde dingen die natuurlijk vergeten worden. Wat bepaalde zaken nu eenmaal zijn, waar ze mee samen hangen. Wie was dat dan, die auteur, in de 19e eeuw? Je kan natuurlijk als bibliotheek op zoek gaan naar gebruikers van die collecties maar dat is bijlange niet zo efficiënt als Google Books. Google Books zorgt ervoor dat voor elk van die 250.000 boeken die daar in zitten minstens één pagina gelezen of toch gezien wordt per jaar. Wij kunnen zelf niet voor elkaar krijgen dat elk van die twee miljoen boeken die we hier hebben elk jaar elk een keer wordt vastgenomen.

Ik ben op zoek naar iets, staat het in dit boek waar ik naar zoek?” Zelfs dat al, die initiële appreciatie is een super belangrijk gebruik van de collectie. Wat Google Books doet voor heel veel onderzoekers, met name voor onderzoek naar de 19e eeuw, dat maakt het. Vroeger moest je al de kranten, boeken, tijdschriften, revues allemaal grondig één voor één van voor naar achter doorlezen. Je had een levenswerk voor de boeg om te begrijpen wat de receptie was van een bepaalde levensloop, een idee.

The introduction of full-text search has created an environment in which all machine-readable online documents in reach are effectively treated as one single document. For any text-sequence to be locatable, it doesn't matter in which file format it appears, nor whether its interface is a database-powered website or mere directory listing. As long as text can be extracted from a document, it is a container of text sequences which itself is a sequence in a 'book' of the web.

FS: Maar het gaat toch ook over de manier waarop jullie toegang bieden, de bibliotheek als interface? Online laten jullie dat nu over aan Google.

SVP: De toegang gaat niet meer gaat over: “deze instelling heeft dit, deze instelling heeft iets anders”, al die instellingen zijn via dezelfde interface te bereiken waardoor je niet meer gehinderd wordt door oceanen en wat nog. Je kan doorheen al die collecties zoeken en dat is ook weer een stukje van die originele droom van Otlet en van der Haeghen, het idee van een wereldbibliotheek. Voor elk boek is er een gebruiker, de bibliotheek moet die maar gaan zoeken.

Wat ik intrigerend vind is dat alle boeken één boek geworden zijn doordat ze op hetzelfde niveau doorzoekbaar zijn, dat is ongelooflijk opwindend. Dat is een andere manier van lezen die zelfs Otlet zich niet had kunnen voorstellen. Ze zouden zot worden moesten ze dit weten.

FS: Als ik jullie boeken terug zie in Google Books dan vraag ik me af: bibliotheken zijn ook specifieke verzamelingen, ze hebben histories. Er zijn boeken die in verschillende collecties op verschillende plekken zitten, en die krijgen daardoor een andere betekenis. In Google Books is de context waar alle boeken vandaan komen minimaal aangeduid; ik zag dat er sinds kort gelukkig een vermelding is van de herkomst.

SVP: Dat is door ons. Toen ons het contract voorgelegd werd, hebben we dat aan onze juridische dienst gegeven. Die heeft daar enkele dagen over gedaan en kwam terug met een zeer lange lijst van dingen die niet konden. We hebben dat dan naar Philippe Colombet en Wim De Waelen doorgestuurd. Wim belde kwaad, hij zei: “Ben je niet goed? Ze hebben net gebeld van Google: “We are not amused””.

Om dat op te lossen gingen Colombet, Wim, Veerle en ik naar een hotel in Brussel, een hotelkamer met een salon. Wim had ons op voorhand gezegd: “Haal uit al die opmerkingen vijf dingen waarvan je er vier van wil winnen en één kunt verliezen. Dat gaan we voorleggen maar al de rest moet er uit.” Dus dat hebben we gedaan. We hebben er toen eentje tussen gestoken die er nog niet in stond, dat we eisten dat bij elk boek van ons, 'Universiteit Gent' moest komen te staan, want anders ben je echt niet te zien, je verdwijnt dan. Ze hebben dat aanvaard; het enige wat ze bedwongen hebben is dat geschillen voor de rechtbank van Californië zouden voorkomen en niet die van België. Dus dan was dat op een half uur geklaard.

Zo kregen we een aantal jaren geleden een bericht van de conservator van de collectie van Monteignes bij Bordeaux. Ze zei: “We hebben een paar 1000 werken in de collectie van Monteignes maar we zitten met het probleem dat er een aantal boeken kwijt zijn geraakt doorheen de eeuw”. En af en toe keek ze bij antiquariaten en bij Google Books en ze vond er één terug in onze collectie, inderdaad met het handschrift van Monteignes zélf erin. Wij dachten dat ze zou vragen om het terug te bezorgen; we weten ook niet hoe het ooit bij ons terecht gekomen is. Ze heeft laten weten dat dit niet de bedoeling was, maar ze wist nu waar het zich bevond. Het zou het enige boek van hem zijn dat ooit gedigitaliseerd en online gezet was.

De collectie op Google Books zijn natuurlijk enkel onze boeken van vóór 1875.

FS: Waar komt die datum eigenlijk vandaan?

SVP: Zij stellen: je kan acht jaar geweest zijn of tien toen je het boek schreef, en negentig jaar geworden zijn en dan nog eens zeventig jaar copyright hebben, een heel grote veiligheidsmarge. Moesten we kunnen bewijzen van bepaalde werken dat de auteur echt gestorven is, dan kunnen we het er wel in krijgen, maar dat is natuurlijk veel opzoekwerk. Toen we met de verhuis zaten is daar weinig tijd voor vrijgemaakt en is daar weinig van gekomen. Alles van vóór 1875, ook onze oude drukken, is meegegaan.

Helemaal in het begin, bij de eerste kar die vertrokken is, was er een journalist die een boek van de kar nam, een Nederlandse bloemlezing. Hij zei me: “Dat is toch een waardevol werk met prachtige bloemgravures?” dus ik bood aan het samen eens op te zoeken, ik denk dat het boek iets van een 140.000 euro waard was. Dat stond dus ook op de kar voor Google, er was er ook eentje met een gravure van Rembrandt er in. Dat gaat gewoon mee, en komt terug. Één keer zijn ze iets vergeten: De boeken staan op van die speciale karren en dat moet dan opgevuld worden met bubbel-wrap. Één keer zijn ze teruggekomen uit het scan-atelier waar ze dat vergeten waren, en dus alle boeken lagen door elkaar, dat is alles dat er ooit gebeurt is, verder niets. Ze werken zoals u het noemt 'op industriële schaal', maar ook met zorg.

Al die boeken die zijn gescand zijn vanaf nu ook op een speciale manier beveiligd. Want je kan heel duidelijk zien: bladzijde 174 heeft een ezelsoor, en hier is er een vlekje. Dus moest dat boek antiquarisch worden aangeboden dan weten we dat het van ons is, dat is zoals een vingerafdruk.

En er is nog iets waar ik vast van overtuigd ben. In 2000 hebben we de opdracht gekregen om een plan te maken voor de bibliotheekwerking van de universiteit en dat ging dan vooral over het fuseren van bibliotheken en de verantwoordelijkheid van de faculteitsbibliotheken. Toen heeft de beheerder tegen mij gezegd: “Gij met uw erfgoed. Die toren mag van mij afbranden want daar gaat het niet om. Het gaat over dienstverlening van de wetenschapper vandaag.” Maar ik vond altijd: het is met erfgoed dat je verschil maakt.

Omdat Google ons heeft gekozen, excelleert onze collectie opeens over andere collecties in België. Leuven is twee keer platgebrand en heeft de verdeling Leuven Vlaams en Leuven Frans achter de rug. De Koninklijke Bibliotheek die bewoog niet, dus daar moesten ze niet aan beginnen. Ook binnen onze eigen universiteit was het van: “Tiens, we hebben precies toch iets dat iemand anders niet heeft”. Daardoor hebben we een jaar budget gekregen voor het ondergronds depot en een paar jaar nadien ook voor het personeel, voor het depot, heel de 40 kilometer. De behandeling, de stofzuigers, het zuurvrij verpakken.

Wat digitaliseren nu vooral erfgoed, omdat dat unieke stukken zijn. Boeken zijn niet uniek per definitie. Dus we scannen heel veel architectuurplannen, maar ook afbeeldingen, kaarten en affiches. De wereldtentoonstelling 1913, de eerste wereldoorlog, zaken waar je ook soms van voelt: Het gaat de verjaardag zijn van dit of dat … ze gaan dat binnenkort aanvragen, dus we beginnen alvast met digitaliseren.

FS: Dat 'excelleren' dat komt eigenlijk vooral door de manier waarop jullie die samenwerking met Google hebben weten zichtbaar te maken?

SVP: We zijn daar gewoon heel eerlijk in geweest. Vanderhaeghen en Saint Genois, de twee heren die die daar achter u op de kast staan staan, die hebben ongelooflijke collecties verzameld. We zijn ook geboren uit de Franse revolutie: kloosters en abdijen die niet meer mochten bestaan, stukken die bij elkaar gebracht werden en die naar Parijs zouden gaan en die Van Notem hier gehouden heeft. Dat is al een basiscollectie die zeer rijk is. In de 19e eeuw waren de hoofdbibliothecarissen heel verweven met heel het kunstleven in Gent, ze kregen ook van kunstenaars van alles en nog wat van schenkingen, en hadden ook een visie op wat ze aankochten qua literatuur en architectuur. Dat is een rijkdom dat je weinig zo samen vindt.

FS: Google Books verwijst maar minimaal naar het verhaal van de collectie, de specificiteit van een excellente verzameling boeken die in de loop van de tijd wordt bijeengebracht, verloren, hersteld; een bijzonder gebouw ... Zou er een manier kunnen zijn waarop die rijkdom ook in een digitale vorm zichtbaar gemaakt zou kunnen worden?

SVP: Ik moest ooit eens mensen aan elkaar praten op een conferentie in Antwerpen. Ik kreeg de vraag van iemand of ze even het woord kon nemen, een Franse uit Lyon dacht ik. Die kwam met een gigantisch boeket bloemen en ze zei: “Kijk, jullie hebben in Gent precies dat pakket boeken gedigitaliseerd wat ik en mijn onderzoekers nodig hebben om ons onderzoek te doen; je kan je niet voorstellen wat een rijkdom dat is, boeken die we anders niet gevonden zouden hebben vanuit Lyon. We zouden een lang verblijf in Gent nodig gehad hebben om alles door te kijken, maar dat hebben we nu gewoon in Google Books”.

Ik denk niet dat wij nu moeten gaan stellen van: “Dit is onze collectie”. Het zijn de onderzoekers en onderzoeksgroepen die daar iets van maken. Ze gebruiken boeken van bij ons, maar ook van bij de New York Public Library.

Het mooie is, het is bijna een buffet waarbij je kan zeggen: ik neem iets vegetarisch, en ik neem iets met vlees. Die dingen heb ik nodig, en ik stel samen wat ik zelf eigenlijk wil. Toen ik zelf aan dat doctoraat bezig was, deed ik onderzoek naar een Nederlandse journaliste die in 1890 of zo vanuit Amsterdam naar Antwerpen gekomen is, en die heel veel geschreven heeft. Wat heb ik afgezien om alles te vinden wat die geschreven heeft. Het is een droom dat al die dingen nu gedigitaliseerd zijn!

DM: En dat is denk ik echt het verschil in het DNA van een bibliotheek en een museum of een archief bijvoorbeeld. We spreken weliswaar over een collectie, maar de collectiewerking in een museum is iets helemaal anders. Een bibliotheek heeft eerst nog altijd een dienstverlenende functie. Die bibliotheek is er om die boeken te laten gebruiken door onderzoekers, mensen die daar iets mee willen doen, terwijl in een museum of een archief de collectievorming een heel andere dynamiek heeft.

Ik kan me dus wel inbeelden dat als ik een museumconservator zou zijn, en iemand 250.000 items uit mijn bezit haalt, die scant en andere weer niet, gebaseerd op een arbitrair criteria, een vormvoorwaarde als 'het boek is gepubliceerd vóór een bepaald jaar' of 'het moet in een bepaalde kist passen', dat zou knettergek zijn. Voor een bibliotheekcollectie blijft dat nog steeds knettergek, maar dat hindert niet, integendeel. Ieder boek dat weer gelezen wordt is er één.

Als je nu alle linkerpanelen van de triptieken zou beginnen digitaliseren, dat zou echt nergens op slaan, je kunt met dat linkerpaneel niks doen, je moet het geheel waarnemen. Maar voor een boek is dat niet hetzelfde.

FS: Jullie hebben ook materiaal op Europeana gepubliceerd?

SVP: Dat was een heel gedoe met Europeana!

Europeana vroeg op een bepaald moment of wij onze Google boeken in Europeana wilde stoppen. Het was me eerst niet duidelijk dat het om enkel om een verwijzing ging, ik dacht dat ze ze gewoon allemaal wilden downloaden.

DM: Europeana is eigenlijk een databank met bookmarks. Je vindt iets, en als je klikt kom je bij de instelling terecht waar het boek staat. De instelling moet zelf de beelden hosten, je moet dat zelf allemaal doen. En dat was het vreemde natuurlijk, want de afspraak met Google Books is dat zij het materiaal op hun server hebben staan. Dus wat we voor Europeana gemaakt hebben is een manier waardoor je op onze pagina's de Google Books player kunt zien. De mensen die vanaf Europeana komen kunnen dus onze institutionele kaders zien, met daarbinnen een Google Books viewer.

FS: Zo krijg je niet alleen veel beter zicht krijg op de institutionele context waarin het boek bewaard wordt, maar ook over de legale status van het boek. Één van de dingen die me stoort aan de interface van Google Books, is dat er enkel wordt vermeld dat een boek 'gratis' is, met een standaard verwijzing naar de Google gebruiksvoorwaarden. En niet bijvoorbeeld: 'Dit boek is in het Publieke Domein'.

SVP: In het begin van Europeana was Google echt de vijand.

Europeana is er gekomen omdat de Franse president op een bepaald moment Google wilden evenaren. Ze wilden eigenlijk een Europese Google maken. Ze zijn beginnen lobbyen bij de Europese commissie in Luxemburg, waar het geld voor erfgoed zit. Gelukkig waren er een paar mensen in Brussel die daar iets slimmere ideeën over hadden en die wisten dat dat niet ging lukken, en dan zijn ze zich gaan concentreren op thesissen en Open Access en dergelijke; Leo Waaijers heeft ons daarin betrokken. Maar toen hadden ze al over gans Europa internet connecties gemaakt, en een soort van software ontwikkeld. Maar wat ze niet hadden, was content en ze wilden die halen uit nationale bibliotheken, en de Koninklijke Bibliotheek die was niet mee. De universiteitsbibliotheken die zijn er pas later bijgeroepen omdat ze niet genoeg materiaal hadden.

Ze vroegen ons of we de gescande boeken van Google wilden doorgeven, er was nog niks van Google in Europeana. We hebben Google Amerika gecontacteerd, de Sillicon Valley mensen, en we waren de eerste bibliotheek die gegevens van Google Books hebben doorgegeven. Maar dat mocht niet van Europeana, er mocht niet naar Google gelinkt worden.

Het was niet Google die lastig deed. We mochten van Europeana niet linken naar Google, het logo van Google mocht er niet op staan. We hebben er dus zelf bijgezet 'dit boek is door Google gedigitaliseerd'. Ik stond daar op, Google heeft verdorie die boeken gedigitaliseerd, en ze zouden anders onzichtbaar zijn in Europeana. En dan is Spanje gevolgd. En elke keer als Jill Cousins van Europeana uitleg geeft, dan zegt ze dat Europeana Google een kopje kleiner gemaakt heeft.

FS: Kunt u zich voorstellen waarom ze dat zegt?

SVP: Wees eens eerlijk. Wie kent Google Books. En wie kent Europeana?

FS: Toch vind ik het niet gek dat Europese landen zélf zorg willen dragen voor het verspreiden van gedigitaliseerd materiaal. Ik het zorgwekkend dat de infrastructuur en de kennis rond digitalisering niet meer de verantwoordelijkheid is van overheden.

SVP: De verantwoordelijkheid van overheden … De Europeana mensen worden betaald door Europa. Ze klopten aan de deur van universiteiten, dat was nog onder Neelie Smit Kroes, omdat er gewoon geen content was en omdat ze ondermaats presteerden. Als je kijkt naar de attitude van Europeana tegenover de attitude van Google – en dat heeft natuurlijk ook met dat commerciële te maken – dan heeft Google ons ongelofelijk veel teruggeven, ze hebben ongelofelijk veel voor ons gedaan, dat was een samenwerking. Aan Europeana moeten we alleen maar geven en geven. Het verdwijnt in een totaliteit die we zelf eigenlijk bijna niet gebruiken.

Ik sta wel achter het idee, maar ik heb er niet altijd een goed gevoel bij.

FS: En Wikisource? Wikibooks? Archive.org? Initiatieven die los van overheidsinstellingen toegang proberen te bieden tot met name Publiek Domein materiaal?

DM: We werken veel met Internet Archive. We financieren mee aan het project en we zorgen al jaren mee dat er webcontent gearchiveerd wordt.

FS: Jullie online collectie was lang de enige plek waar de Traité de Documentation van Paul Otlet digitaal beschikbaar was.

SVP: Dat mochten we eigenlijk niet doen, dat hebben we zelf gedaan, maar Boyd Rayward die zei: Foert.

FS: Jullie OCR uit 2008 was helaas niet al te best, maar de mensen van Wikisource hebben die perfect gecorrigeerd in 2015, toen het boek in het Publieke Domein terecht kwam. Hoe zit dat met boeken die van Google terugkomen, kunnen jullie ze corrigeren, de tekst beschikbaar stellen?

SVP: We gaan niet al die boeken bekijken, maar soms is er wel eens iemand die zegt, die pagina die is vaag. Maar bij Google zijn er al twee of drie controles van de scan. Het gebeurt natuurlijk wel dat er een fout is, dat er een pagina te snel gedraaid wordt, of stukken die niet opengeplooid worden natuurlijk. Dat kunnen wij signaleren en we kunnen de pagina's zelf scannen en dat aanpassen, dat is een paar keer gebeurd.

DM: Of de metadata bijvoorbeeld. We kunnen ook als onze eigen informatie over een auteur bijvoorbeeld aanpassen en opnieuw doorsturen. De OCR zelf, dat weet ik eigenlijk niet of we die kunnen aanpassen.

SVP: Naar Europeana hebben we alleen de metadata doorgegeven. Google zet daar wel een poot op omwille van het feit dat ze niet willen dat er andere zoekmachines mee aan de slag gaan.

DM: We hebben van alle boeken een kopie, dus ook van de OCR maar de afspraak met Google is dat wij die niet zelf verder distribueren.

Alles wat we zélf produceren komt integraal beschikbaar als Open Data. Elke hoge resolutie scan die we zelf maken komt integraal beschikbaar op het web, onder een Creative Commons licentie die vraagt om attributie en die vraagt dat je het materiaal onder dezelfde voorwaarden beschikbaar maakt, 'share-alike'. Wij zorgen dat die content open is, en dat iemand anders dat niet mag sluiten. Je mag ermee doen wat je wilt, behalve het opnieuw gaan sluiten.

Dat is een discussie met Europeana, die vindt dat we alles als CC-0 zouden moeten vrijgeven. Maar net die twee dingen zijn voor ons heel belangrijk, dat wat open is, ook open blijft en dat er een ketting gebouwd wordt, dat je blijft verwijzen naar de bronnen die je gebruikt hebt. Voor ons als universiteits-bibliotheek is bronverwijzing heel belangrijk. Met de Wikipedia-familie hebben we dan soms wat toestanden omdat die licenties niet goed op elkaar aansluiten.

SVP: Er was ooit een jongeman die op een European Library Meeting in Amsterdam zich voorstelde als 'Wikipedian in residence van de British Library'. De British Library had van alles gedigitaliseerd, maar uiteindelijk werden die dingen niet gebruikt. Dat is ook iets waar wij mee zitten; de dingen die we zélf hebben gedigitaliseerd worden niet zo goed bezocht als de dingen die door Google zijn gedigitaliseerd. Ze zijn dus in de British Library begonnen de collecties en de handschriften enzovoorts gewoon in een Wikipedia artikel te beschrijven, gelinkt naar de collectie. En ineens werd het gebruik veel en veel groter. Wij willen dat ook doen, als we eenmaal verhuisd zijn. Om in de vorm van workshops een aantal collecties in Wikipedia te steken. We moeten dan natuurlijk kijken naar de licenties en hoe je dat precies doet; we zouden dat bijvoorbeeld zeker kunnen doen met de Roelant collectie, waar we al gigantisch veel van gedigitaliseerd hebben. Dat zijn architectuur plannen.

DM: We zijn al wat experimenten aan het doen met Wikidata maar het is nog een beetje wachten hoe dat zich gaat ontwikkelen. We zijn de metadata rond onze auteurs aan het verrijken zodat je meer linken kan gaan leggen, gaan bouwen en exploreren.

SVP: Dat is voor ons natuurlijk altijd een ding, het openstellen van data. Als je ziet wat Wikipedia teweeg kan brengen, dat is ook een goede reclame voor je collectie die enorm veel goodwill creëert. Toen we bijvoorbeeld een grote tentoonstelling hadden rond Piranesi samen met het MSK, en de tekeningen van Piranesi stonden in hoge resolutie online, dat heeft ons ook geholpen om met hulp steun van de Koning Boudewijnstichting een xxx aan te kopen.

FS: Hebben jullie het idee dat er met jullie materiaal ook nieuwe dingen gemaakt worden?

SVP: De vereniging historische huizen Gent hier op het Sint Pietersplein vroeg of ze bepaalde stukken van afbeeldingen mochten gebruiken voor hun merchandising. Dat hebben we dan maar toegestaan. Het is wel leuk dat ze het vragen.

DM: Zo weet je wat er mee gebeurd is. Iedereen kan met de afbeeldingen die we gescand hebben zijn boeken kaften, en hoeft daar ons niets over te zeggen, maar het is wel leuk als we dan een exemplaar krijgen.

Het probleem met dingen openzetten zonder beperking is dat je natuurlijk ook niet precies weet wat er mee gebeurt. Als het om onderzoek gaat, dan heb je nog referenties waarin uitdrukkelijk verwezen wordt naar welke bronnen zijn gebruikt. Andere soorten gebruik zijn minder goed te volgen.

FS: Ik heb nog een vraag over jullie contract met Google. Vergelijkbare contracten met de Koninklijke Bibliotheek in Den Haag en de British Library in Londen zijn vanwege de openbaarheid van bestuur uiteindelijk gepubliceerd. Bij jullie is dat niet gebeurd. Is die geheimhouding niet een beetje bizar?

SVP: Ze hebben ons altijd gezegd dat die contracten niet openbaar gemaakt konden worden.

Google Books is zo'n integere, correcte partner dat we alles wat ze ons hebben gevraagd zoals niet vertellen over de manier van scannen en het niet vrijgeven van het contract, hen te contacteren voordat we dingen doorgeven enzovoort, dat we dat altijd gehonoreerd hebben.

DM: Voor een universiteit is het ook niet zo uitzonderlijk om geheime contracten te hebben, we tekenen allerlei contracten met bedrijven.

FS: Dus niemand heeft er om gevraagd?

SVP: Er is verschillende keren om gevraagd.

Het niet publiceren van die contracten heeft weinig te maken met wat daar instaat. Dat is gewoon om een hoop geëmmer uit de weg te gaan.

FS: Dat geëmmer is natuurlijk ook deel van een transparant bestuur.

SVP: Ik weet niet of je nu meer weet door die contracten te lezen.

Bij Elsevier, daar wil ik wel weten wat er in die contracten staat, omdat ik wil weten wat anderen voor hun abonnementen moeten betalen. Bij Google staat er gewoon niks in dat de moeite waard is.

Als alle universiteiten aan hun juridische adviseurs gaan vragen of dat in orde is, dan duurt dat ik weet niet hoe lang. En als dat in Vlaanderen en Wallonië is, dan is dat zeker dat dat contract niet getekend gaat worden. En ik begrijp zeer goed dat ze zeggen: Moeit u er maar niet mee!

FS: Ik ga er maar van uit dat de inhoud van jullie contract ongeveer hetzelfde is als dat van de British Library en de Koninklijke Bibliotheek? Als je die contracten naast elkaar legt, zie je dat ze bijna hetzelfde zijn.

In beide staat helemaal vooraan in het hoofdstuk 'definities' dat Google het recht heeft om scans van hetzelfde boek dat op verschillende plekken te vinden is, samen te voegen in de digitale versie. Het digitale object is dus niet altijd een getrouwe kopie van het origineel, maar is soms een collage. Zijn jullie zoiets ooit tegengekomen?

SVP: Ik kan me niet herinneren. En het zou me ook niet kunnen schelen eigenlijk. Ze zullen dat wel op de een of ander manier zichtbaar maken.

DM: Als een blad is uitgescheurd, en ze voegen dat op de een of andere manier digitaal toe … is dat dan erg? Ik heb het eerlijk gezegd nog nooit zo gezien. De afspraak met ons was dat ze alles zouden scannen, ook boeken waaruit bladzijden ontbreken. Als je ziet dat er een stuk ontbreekt, kun je dat samenvoegen met een andere scan zodat het boek toch nog nuttig is?

FS: Voor mij is dat geen detail. We gaan uit van een directe relatie tussen de scan en het fysieke object. Het digitale bestand verwijst naar een specifiek boek, op een specifieke plek. Doordat Google Books niet alleen met jullie werkt, maar ook met heel veel anderen, ontstaat de mogelijkheid een hybride digitale bibliotheek te maken.

SVP: Duiden ze dat dan aan, dat het om een hybride object gaat? Dat zal dan waarschijnlijk iets zijn waar iemand ooit over gestruikeld is. Ik denk niet dat dat er bij ons instaat.

DM: Dat kennen we ook van andere massa-digitaliseringsprojecten. Het is belangrijk de flow van het digitaliseren niet te onderbreken. Het zou natuurlijk zo moeten zijn dat als er een bladzijde ontbreekt, dat er dan een belletje rinkelt en dat er dan iemand moet komen kijken, maar dan ligt die straat stil. Dus aan de scan-tafel bestaat dat concept niet, dat een bladzijde ontbreekt.

Tegelijkertijd is er natuurlijk wel de zorg: we zijn nu data aan het produceren, en die gaan we nu opslaan en post-produceren en waarom zouden we dat gaan doen als we weten dat het niet klopt? Je kunt het vergelijken met het digitaliseren van video-tapes. Waarom zou je doorgaan als het beeld zwart is? En dat is dus de afweging: ga je tijdens het proces eens kijken en als het beeld zwart is, op stop duwen, of heb je een operator die gewoon meerdere tapes bedient en tape één en tape twee en tape drie start en er verder niet naar omkijkt.

FS: Hoe gaan jullie om met boeken en publicaties die al vanaf het begin digitaal zijn? Verzamelen jullie e-books?

DM: We kopen e-books en e-tijdschriften en maken die beschikbaar voor onderzoekers. Maar dat zijn hele andere omgevingen, omdat die content niet fysiek binnen onze muren komt. We kopen toegang tot servers van uitgevers of de aggregator. Die content komt nooit bij ons, die blijft op hun machines staan. We kunnen daar dus eigenlijk niet zoveel mee doen, behalve verwijzen en zorgen dat het evengoed vindbaar is als de print.

FS: Jullie kunnen dus geen zorg dragen voor dit deel van de digitale bibliotheek?

SVP: Trekken we ons daar nu veel van aan of het digitaal of papier is? Het staat gewoon in de catalogus.

DM: Of wij nu de viewer aanbieden of een ander, als we een e-book kopen, in de catalogus komt wel een fiche.

FS: Maar op het moment dat het abonnement afloopt of dat de service wordt opgeheven dan is het niet meer aan jullie om te zorgen dat het materiaal beschikbaar blijft?

DM: Dat hangt er van af. Er zijn ook contracten met archiefrechten, uitgevers hebben dan afspraken gemaakt met een bepaalde archiefinstelling zoals de KB in Den Haag, of Portico. Er zijn zo een aantal projecten die voor uitgevers borg staan, en die zorgen voor een digitale kopie. Dus als we materialen kopen met archiefrecht, dan weten we dat we dat als die server uitvalt dat we naar die andere plaatsen kunnen doorverwijzen. Dat is een infrastructuur die er voor zorgt dat er een achtergrondkopie is op een aantal plaatsen, dus als om de één of andere manier de uitgever niet beschikbaar is, dan word je vanzelf doorverwezen naar die digitale archieven. Dat is technisch complex, maar dat bestaat wel. Men zorgt wel enkel voor wetenschappelijke tijdschriften dat de toegang er ook in de toekomst blijft.

FS: Het betekent dus dat kennis niet meer in bibliotheken wordt opgeslagen.

DM: Niet meer enkel in onze eigen bibliotheek. Elsevier wordt geborgd door de Koninklijke Bibliotheek (KB) in Den Haag. We kunnen bij Elsevier 'eeuwige toegang' kopen, omdat we goed begrijpen dat er een kopie bij de KB is en dat die goed bewaard wordt. Voor onze eigen content hebben we een heel zwaar preservatie systeem. Voor de scans die we maken moeten wij zelf voor instaan dat die in de toekomst nog beschikbaar blijven. Dat is al complex genoeg. Als we er die van Elsevier nog eens zouden moeten bijnemen, dat zou niet zo simpel zijn. Vandaar dat daar een aantal gespecialiseerde mensen mee bezig zijn. Want digitale preservatie op schaal, dat is niet gemakkelijk.

FS: Digitalisering zorgt voor meer verschillende entrees tot hetzelfde materiaal, maar in de preservatie lijkt centralisatie op te treden.

DM: Je hebt een aantal centraliserende initiatieven, maar zoiets als LOCKS is een helemaal decentraal systeem. Maar dat is weer iets heel anders.

FS: Is jullie samenwerking met Google nu afgelopen?

SVP: Nee, zolang ze blijven scannen kunnen we nog altijd materiaal van voor 1875 voor hen klaarmaken. Maar ondertussen is zijn de contracten van personeel van bij ons dat daar voor zorgt allemaal afgelopen dus ik denk niet dat er nog heel veel dingen zullen gebeuren.

Ik heb ook het gevoel dat Google Books nu aan het afbouwen was, na al die grote projecten en die moeilijke processen in Amerika, ik zie niet onmiddellijk een revival. Een universiteitsbibliotheek blijft een universiteitsbibliotheek, of je nu 200 jaar geleden binnenkwam of nu. Maar Google ontwikkelt steeds nieuwe ideeën, die ontwikkelt veel sneller, werkt steeds aan iets anders. Voor hen is het succesverhaal van Google Books, dat is er. Maar om daar nu alle tijd en energie in te steken. Ik heb een beetje het gevoel: ze hebben het gehad.

FS: En wat gebeurt er als Google Books overmorgen sluit?

DM: Dat staat in het contract. Op dat moment mogen wij een soortgelijke dienstverlening opzetten.

FS: En kunnen jullie dat, hebben jullie daar de middelen voor?

SVP: Één van de dingen die we in het contract uit de wacht gesleept hebben, is dat er altijd een gratis kopie van onze boeken online moet blijven. Of ze dat gaan doen, dat weet ik natuurlijk niet.

FS: Jullie hebben dus eigenlijk bedongen dat Google Books er nooit meer mee op kan houden!

SVP: Richard Ovenden, hij is nu hoofdbibliothecaris van de Oxford library, heb ik voor het eerst gecontacteerd toen Google bij ons aan de deur klopte, ik vroeg hem: “Jij hebt zoveel jaar geleden het contract met Google ondertekend, wat zou je doen als ze weer bij je aanklopten?” Hij zei: “I would not doubt, I would say yes immediately”. En hij blijft nog altijd zeer positief over de samenwerking, de dingen die ze met hen gedaan hebben, en de zichtbaarheid enzovoort.

En ik zeg het ook in ieder gesprek dat ik over Google heb: Neen, ik werd en word niet door Google betaald om dit te zeggen.

Last Revision: 5·07·2016