Voor elk boek is een gebruiker

From Mondothèque

Voor elk boek is een gebruiker

  • SVP = Sylvia Van Peteghem
  • DM = Dries Moreels
  • FS = Femke Snelting


Gent, 28 januari 2016

FS: Ik wilde graag met u spreken naar aanleiding van ons avontuur met het Mundaneum, de instelling die het archief van onder andere Paul Otlet beheert. Ik ben nieuwsgierig naar de manier waarop archief- en bibliotheekinstellingen, een aantal jaren nadat ze de eerste contracten met Google afsloten, daarop terugkijken. Ik dacht misschien te beginnen met wat er gebeurde op het moment dat jullie de laatste leveringen opstuurden. Zijn jullie doorgegaan met dat contract?

SVP: Mag ik eerst even terugkomen op uw Mundaneum verhaal? Want we hebben eigenlijk een link met het Mundaneum. In een Belgische context is het vrij normaal dat je ja zegt op een Google contract. Het begint bij de Gentse hoofdbibliothecaris, die daar op de kast staat; Ferdinand vander Haeghen. In de 19e eeuw heeft hij ooit de opmerking gemaakt “Ça sert à quoi, de collectionner” als je niet toont en beschrijft wat je hebt. De grote droom van Vander Haeghen was om een wereldcatalogus te maken. Wat hij voorstelde was: u bent van de British Library, u van Parijs, ik van Gent. We maken allemaal dubbels van onze fiches en sturen die naar elkaar op. Ze hebben daar een test van gemaakt, maar natuurlijk ... je hebt zélf al zoveel fiches te klasseren, daar komen de andere nog eens bij. Dat stapelt op en dat werkt niet. Dus wat hij wou doen was een catalogus maken, die toont wat er in elke collectie zit.

Hij kende de jonge Paul Otlet, voor wie hij een beetje een éminence grise was. Otlet wou als wetenschapper vooral weten wat er in zijn onderzoeksdomein verschenen was, een bibliografie. Otlet heeft ooit een aanvraag gedaan voor een staatsbudget voor zijn project. De minister vroeg advies aan Vander Haeghen die eigenlijk wel sympathie had voor het idee, maar die het onhaalbaar achtte en toch afkeurde vanuit zijn “Been there, done that”.

Dus in de 19e eeuw wou Vander Haeghen een catalogus, en Otlet een bibliografie. En vandaag heeft Google alles samen met de volledige tekst erbij die dan nog op elk woord doorzoekbaar is. Dat is de droom van zowel Vander Haeghen als Otlet méér dan verder zetten. Vanuit die gedachte zijn wij vanzelfsprekend meegegaan. We hebben aan de Google onderhandelaars gevraagd: waarom doet Google dit? Het antwoord was: “Because it's in the heart of the founders”. Moesten wij de idealen van Vander Haeghen en Otlet niet als voorbeeld hebben gehad, dan was er misschien twijfel geweest, maar nu niet.

Ik weet niet of u weet hoe we aan het contract geraakt zijn?

FS: Ik heb begrepen dat ze mensen van jullie bibliotheek ergens ontmoet hebben.

SVP: Minister Fientje Moerman ging op een economische missie naar Amerika. Ze vroeg ons de contactgegevens van Herbert Van de Sompel en vertelde terloops dat ze ook naar Seattle ging, en ik zeg voor de grap: als je iemand nodig hebt om je koffers te dragen, laat het me weten. 10 minuten later krijg ik een telefoon van het kabinet. Als ik wilde kon ik mee en ook voor de universiteit was dit een opportuniteit omdat er ook met Belgische onderzoekers in Stanford zou gepraat worden. Ik ben niet zo goed in aardrijkskunde dus ik dacht dat de afstand van Stanford en Seattle een busreis was. Neen dus. Ik stond daar dus in Stanford met een jetlag tot en met, en ontmoette er Wim De Waele, toen IBBT. Hij vroeg me waar we mee bezig waren in de Boekentoren. We hadden toen juist 40.000 foto's gedigitaliseerd en online gezet, dus dat vertelde ik. Hij ging die avond eten met iemand van Google Books en zei dat hij hem over onze initiatieven zou spreken. Enkele weken later belde hij om verslag uit te brengen over dat gesprek en vroeg of we iemand van Google Books konden ontvangen. We zaten toen met de Boekentoren in het televisieprogramma Monumentenstrijd en dat slorpte alle energie op. Ik was zo naïef om te zeggen dat we op dat ogenblik echt geen tijd konden vrijmaken voor Google, niet beseffend hoe uitzonderlijk Google aandacht wel is. Maar we hebben het toch uitgesteld. In februari kwam Wim terug op het voorstel en kregen we Philippe Colombet van Google Parijs, op bezoek. Hij vond de collectie interessant en zou contact opnemen met Silicon Valley, wat best een jaar kon duren. Maar hij belde 's anderdaags al op: ze waren in Europa en wilden op bezoek komen.

We mochten er niet over praten. Ze kwamen met zeven, allemaal met een overduidelijk Google-rugzakje, niet meteen anoniem dus. We vertelden hen waar we op dat ogenblik aan werkten, gingen lunchen en bij het teruglopen zag je dat ze overlegden met elkaar. Terug in de vergaderzaal zei de tot dan toe minst opvallende persoon: “We like your collection, we love your team and we adore your building so from our side it is a deal”. Meer dan dat was het niet.

Daarna moesten we ook de universiteit overtuigen dat er een budget moest vrijgemaakt worden om personeel aan te werven die de boeken selecteerden en beschreven. Uiteraard was de UGent fier om op eenzelfde lijn te komen staan als Stanford en Oxford, dus dat verliep vrij vlot.

Ik kreeg wel mails vanuit Frankrijk dat we onze ziel aan de duivel hadden verkocht, en ook de KBR brommelde wat ...

FS: Kennelijk is er op een bepaald moment in de kamer de vraag gesteld waarom de KBR niet hetzelfde contract is aangegaan.

SVP: Maar ... je kan niet bij Google gaan aankloppen, Google kiest jou. Wij hebben wel hun aandacht gevraagd voor het Mundaneum met de link tussen Vander Haeghen en Otlet.

Als Google België iets organiseert, proberen ze ons altijd te betrekken, omdat wij nu eenmaal een universiteit zijn. U heeft het Mundaneum gezien, het is een zeer mooi archief, maar dat is het ook. Voor ons zou dat enkel een stuk van een collectie zijn. Ze worden ook op een totaal andere manier gesteund door Google dan wij.

De grondige ontsluiting van de gehele collectie (veertig kilometer Boekentoren!) is enkel mogelijk door ze te scannen, maar de investering is echter gigantisch. Het digitaliseren op zo een grote schaal is ook niet meteen de core-business van een universiteit. Google heeft daar net wél heel sterk in geïnvesteerd.

Ik ben verschillende keren naar de Google scan plants geweest om te zien hoe zij werken. Niemand van ons als publieke instelling zou dat kunnen.

Daarnaast: Stel dat we hier een scanner krijgen en OCR software om boeken te digitaliseren, en er komen problemen met de software, dan moeten we – afhankelijk van het budget – wellicht verder werken met een software die niet deugt. Bij Google wordt er meteen een heel team op gezet om het te herstellen en te verbeteren. Wij hebben zwijgplicht over hun methode, maar hun expertise is uitzonderlijk.

FS: Is het opbouwen van een dergelijke expertise niet op termijn van belang voor u als collectiebeheerder?

From X = Y:
According to the ideal image described in "Traité", all the tasks of collecting, translating, distributing, should be completely automatic, seemingly without the necessity of human intervention. However, the Mundaneum hired dozens of women to perform these tasks. This human-run version of the system was not considered worth mentioning, as if it was a temporary in-between phase that should be overcome as soon as possible, something that was staining the project with its vulgarity.

SVP: Wij scannen op een totaal andere manier. Bij Google gaat het om massa-productie. Wij kiezen zelf voor kleinere projecten. We hebben een vaste ploeg, twee mensen die voltijds scannen en beelden verwerken, maar daarmee begin je niet aan een project van 250.000 boeken. We doen wel een scan-on-demand of selecteren volledige collecties.

Toen we al onze 2.750.000 fiches enkele jaren geleden door een externe firma lieten scannen had ik medelijden met de meisjes die de hele dag de invoerscanner bedienden. Hopeloos saai.

FS: Tussen de expertise die Google heeft op industrieel niveau en de meer kleinschalige manier waarop jullie werken, is daar uitwisseling over, leren jullie daarvan?

SVP: Nee, dat is een totaal andere methodiek.

Onze scans zijn state of the art. Bij Google gaan ze voor massa’s content, en content is natuurlijk ook kapitaal. We digitaliseren nu vooral de unieke stukken zelf. Boeken zijn niet uniek per definitie. Dus we scannen bijvoorbeeld heel veel architectuurplannen, maar ook afbeeldingen, kaarten en affiches. De wereldtentoonstelling 1913, de eerste wereldoorlog, zaken waar je ook soms van voelt: Het gaat de verjaardag zijn van dit of dat ... ze gaan dat binnenkort aanvragen, dus we beginnen alvast met digitaliseren.

FS: U begon met te vertellen dat jullie samen met Google het ideaal verderzetten om alle kennis van de wereld te verzamelen en te indexeren. Dit was voor het Mondotheekteam de aanleiding om in actie te komen: voor ons ging de gelijkstelling van Otlet's Mundaneum met Google een stap te ver. Die vergelijking laat veel ongezegd over het project dat Google feitelijk in gang heeft gezet.

SVP: Bedoelt u het project dat ze voorstellen met het Mundaneum? Ik weet geen details over hun plannen met het Mundaneum. Ik weet dat ze heel graag het archief Otlet willen scannen. Bill Echickson, oud-journalist voor de Washington post en oud Google België medewerker weet daar, denk ik, meer over.

Het probleem is ook dat de Waalse gemeenschap bang is dat ze het monopolie over de Otlet-content zouden kwijt raken als Google het scant. Ik ben ooit bij de Waalse minister van cultuur geroepen om te praten over ons contract met Google. Vergeet niet dat het in onze collectie om copyright-vrije boeken gaat en in het Mundaneum om een uniek archief. Dat is een verschil.

Jaren geleden scanden we een deel van het Otletarchief hier in Gent. Dat kaderde in het onderzoek van Wouter Van Acker, een ingenieur architect die over Otlet doctoreerde.

FS: Wie weet zijn die hier gemaakt uiteindelijk op de site van het Google Cultural Institute terecht gekomen?

SVP: Ja, waarom niet?

Voordien was het zo dat je al van goede huize moest zijn om een doos te mogen opendoen in het Mundaneum. Het beschikbaar maken voor een groter publiek zou een goede zaak zijn.

Dat is echt wel het unieke van het Google Books project: de boeken staan zonder beperkingen online, volledig doorzoekbaar. Een curator kent de collectie natuurlijk, maar met een collectie die zo groot is als de onze kan je nooit een volledig overzicht hebben. Google Books zorgt ervoor dat voor elk van die 250.000 boeken minstens één pagina gelezen of toch gezien wordt per jaar. Wij kunnen zelf niet voor elkaar krijgen dat elk van die twee miljoen boeken die we hier hebben elk jaar een keer wordt vastgenomen. Probeer je daarbij ook voor te stellen wat een logistiek dat zou vergen: uithalen, terugplaatsen, om dan ook niet te denken aan de lange rijen bezoekers.

Ik ben op zoek naar iets, staat het in dit boek waar ik naar zoek?” Zelfs dat al, die initiële appreciatie is een super belangrijk gebruik van de collectie. Wat Google Books doet voor heel veel onderzoekers, met name voor onderzoek naar de 19e eeuw, dat maakt het waardevol. Vroeger moest je al de kranten, boeken, tijdschriften, revues grondig één voor één van voor naar achter doorlezen en je zag zeker dingen over het hoofd.

The introduction of full-text search has created an environment in which all machine-readable online documents in reach are effectively treated as one single document. For any text-sequence to be locatable, it doesn't matter in which file format it appears, nor whether its interface is a database-powered website or mere directory listing. As long as text can be extracted from a document, it is a container of text sequences which itself is a sequence in a 'book' of the web.

FS: Maar het gaat toch ook over de manier waarop jullie toegang bieden, de bibliotheek als interface? Online laten jullie dat nu over aan Google.

SVP: De toegang gaat niet meer over: “deze instelling heeft dit, deze instelling heeft iets anders”, al die instellingen zijn via dezelfde interface te bereiken. Je kan doorheen al die collecties zoeken en dat is ook weer een stukje van die originele droom van Otlet en Vander Haeghen, het idee van een wereldbibliotheek. Voor elk boek is er een gebruiker, de bibliotheek moet die maar gaan zoeken.

Wat ik intrigerend vind is dat alle boeken één boek geworden zijn doordat ze op hetzelfde niveau doorzoekbaar zijn, dat is ongelooflijk opwindend. Dat is een andere manier van lezen die zelfs Otlet zich niet had kunnen voorstellen. Ze zouden zot worden moesten ze dit weten.

FS: Als ik jullie boeken terug zie in Google Books dan vraag ik me af: bibliotheken zijn ook specifieke verzamelingen, ze hebben histories. Er zijn boeken die in verschillende collecties op verschillende plekken zitten, en die krijgen daardoor een andere betekenis. In Google Books is de context waar alle boeken vandaan komen minimaal aangeduid; ik zag dat er sinds kort gelukkig een vermelding is van de herkomst.

SVP: Dat is al een tijdje zo hoor. Toen ons het contract voorgelegd werd, heeft onze juridische dienst opmerkingen opgelijst en dat waren er zeer veel. Philippe Colombet uit Parijs was onze contactpersoon en liet via Wim De Waele weten: “We are not amused”. Om dit te deblokkeren stelde Wim voor de opmerkingen te beperken tot vijf. Vier die we wilden winnen, eentje dat we mochten verliezen. Wat we zeker wilden verkrijgen was dat bij elk van onze boeken vermeld werd dat het origineel uit de Universiteit Gent komt. Ze hebben dat aanvaard; het enige wat ze bedwongen hebben is dat geschillen voor de rechtbank van Californië zouden voorkomen en niet die van België. Dus dat was op een half uur geklaard.

Enkele jaren gelden kregen we een bericht van de conservator van de bibliotheek van Michel de Montaigne bij Bordeaux. Ze zei: “We hebben een paar duizend werken in de collectie van Montaigne maar we zitten met het probleem dat er een aantal boeken kwijt zijn geraakt doorheen de eeuwen”. Af en toe keek ze bij antiquariaten en bij Google Books en ze vond er één terug in onze collectie, inderdaad met het handschrift van Montaigne zélf erin. Wij dachten dat ze zou vragen om het terug te bezorgen; we weten ook niet precies hoe het ooit bij ons terecht gekomen is. Dat was dan toch haar bedoeling niet, ze weet nu waar het boek zich bevindt en het is meteen het enige boek uit die collectie dat ooit gedigitaliseerd en online gezet is.

De collectie op Google Books zijn helaas beperkt tot vóór 1876.

FS: Waar komt die datum eigenlijk vandaan?

SVP: Google heeft een rekensom gemaakt: je kan misschien tien jaar geweest zijn toen je het boek schreef, en honderd geworden zijn en dan nog eens zeventig jaar copyright erbij, een heel grote veiligheidsmarge dus. Als we kunnen bewijzen van bepaalde werken dat de auteur echt gestorven is, dan kunnen we het er wel in krijgen, maar dat is natuurlijk veel opzoekwerk. Toen we met de verhuis van de Boekentoren zaten is daar weinig tijd voor vrijgemaakt en is daar weinig van gekomen. Alles van vóór 1876, ook onze oude drukken, is meegegaan.

Helemaal in het begin, bij de eerste kar die vertrokken is, was er een journalist die een boek van de kar nam, Nederlandsch Bloemwerk. Hij zei me: “Dat is toch een waardevol werk met prachtige bloemgravures?” dus ik bood aan het samen eens op te zoeken, ik denk dat het boek iets van 40.000 euro waard was. Dat stond dus ook op de kar voor Google, er was er ook eentje met een gravure van Rembrandt er in. Dat gaat gewoon mee, en komt terug. Één keer zijn ze iets vergeten: De boeken staan op speciale karren waarvan de legplanken opgevuld worden met bubbel-wrap. Één keer zijn ze teruggekomen uit het scan-atelier waar ze dat vergeten waren. Alle boeken lagen door elkaar, maar dat is dan ook maar één keer gebeurd. Ze werken zoals u het noemt 'op industriële schaal', maar ook met grote zorg.

Alles wat gescand is, is vanaf nu ook op een speciale manier beveiligd. Want je kan heel duidelijk zien: bladzijde 174 heeft een ezelsoor, en hier is er een vlekje. Dus moest dat boek antiquarisch worden aangeboden dan weten we dat het van ons is, dat is zoals een vingerafdruk.

En er is nog iets waar ik vast van overtuigd ben. In 2000 hebben we de opdracht gekregen om een plan te maken voor de bibliotheekwerking van de universiteit en dat ging dan vooral over het fusioneren van bibliotheken en de verantwoordelijkheid van de faculteitsbibliotheken. Alle aandacht moest naar dienstverlening werking gaan maar ik vond altijd dat je met erfgoed het verschil kan maken.

Omdat Google ons koos, excelleerde onze collectie opeens over andere collecties in België. Leuven is twee keer platgebrand en heeft de verdeling Leuven Vlaams en Leuven Frans achter de rug. De Koninklijke Bibliotheek heeft de belangrijkste collectie, maar is niet erg actief. Door alle aandacht voor het project begreep onze eigen universiteit ook plots dat we iets hebben dat elders niet aanwezig is. Daardoor hebben we het extra budget gekregen voor het bouwen van het ondergronds depot en nadien ook voor het personeel om alle boeken in het depot, de hele 40 kilometer te behandelen voor de verhuis: stofzuigers, zuurvrij verpakken enzovoort.

FS: Dat 'excelleren' dat komt eigenlijk vooral door de manier waarop jullie die samenwerking met Google hebben weten zichtbaar te maken?

SVP: Het is eerder zo dat Google zichtbaar maakte wat wij bezitten en toont hoe belangrijk het is. Vander Haeghen en de Saint Genois, de twee heren die die daar achter u op de kast staan staan, die hebben ongelofelijke collecties verzameld. We zijn ook geboren uit de Franse revolutie: kloosters en abdijen die niet meer mochten bestaan, stukken die bij elkaar gebracht werden en die naar Parijs zouden gaan werden door Van Hulthem hier gehouden. Dat is al een basiscollectie die zeer rijk is. In de 19e eeuw waren de hoofdbibliothecarissen sterk verweven met heel het kunstleven in Gent, ze kregen ook van kunstenaars diverse schenkingen, en hadden een visie op wat ze aankochten qua literatuur en architectuur. Dat is een rijkdom die je weinig zo samen vindt.

FS: Google Books verwijst maar minimaal naar het verhaal van de collectie, de specificiteit van een excellente verzameling boeken die in de loop van de tijd wordt bijeengebracht, verloren, hersteld; een bijzonder gebouw ... Zou er een manier kunnen zijn waarop die rijkdom ook in een digitale vorm zichtbaar gemaakt zou kunnen worden?

SVP: Ik modereerde ooit een conferentie in Antwerpen. Ik kreeg de vraag van een Franse onderzoekster uit Lyon of ze even het woord kon nemen. Ze kwam met een gigantisch boeket bloemen en zei: “Kijk, jullie hebben in Gent precies dat pakket boeken gedigitaliseerd dat belangrijk is voor ons onderzoek. Je kan je niet voorstellen wat een rijkdom dat is, boeken die we anders niet gevonden hadden. We zouden een lang verblijf in Gent nodig hebben om alles door te nemen, maar dat hebben we nu gewoon in Google Books”.

Ik denk niet dat wij de collectie scherp moeten stellen. Het zijn de onderzoekers en onderzoeksgroepen die daar iets van maken. Ze gebruiken boeken van bij ons, maar ook van bij de New York Public Library.

Het mooie is, het is bijna een buffet waarbij je kan zeggen: ik neem iets vegetarisch, en ik neem iets met vlees. Die dingen heb ik nodig, en ik stel samen wat ik zelf eigenlijk wil. Toen ik zelf doctoreerde, deed ik onderzoek naar een Nederlandse journaliste die rond 1890 vanuit Amsterdam naar Antwerpen gekomen is, en die heel veel geschreven heeft. Wat heb ik afgezien om alles te vinden. Het is een droom dat veel nu al gedigitaliseerd is, maar helaas nog niet genoeg.

DM: En dat is denk ik echt het verschil in het DNA van een bibliotheek en een museum of een archief bijvoorbeeld. We spreken weliswaar over een collectie, maar de collectiewerking in een museum is iets helemaal anders. Een bibliotheek heeft vooral een dienstverlenende functie. De bibliotheek is er om die boeken te laten gebruiken door onderzoekers, mensen die daar iets mee willen doen, terwijl in een museum of een archief de collectievorming een heel eigen dynamiek heeft.

Ik kan me dus wel inbeelden dat als ik een museumconservator zou zijn, en iemand 250.000 items uit mijn bezit haalt, die scant en andere weer niet, gebaseerd op een aantal arbitraire criteria, een vormvoorwaarde als bijvoorbeeld als 'het boek is gepubliceerd vóór een bepaald jaar' of 'het moet in een bepaalde kist passen', dat zou knettergek zijn. Voor een bibliotheekcollectie blijft dat nog steeds arbitrair, maar dat hindert niet, integendeel. Ieder boek dat weer gelezen wordt is er één.

Als je nu alle linkerpanelen van de triptieken zou beginnen digitaliseren, dat zou echt nergens op slaan, je kunt met dat linkerpaneel niks doen, je moet het geheel op een bepaalde manier waarnemen. Maar voor een boek is dat niet hetzelfde.

FS: Jullie hebben ook materiaal op Europeana gepubliceerd?

SVP: Ja, op twee manieren. Datgene wat we zelf digitaliseren en ook dat wat door Google gedigitaliseerd werd en dat laatste was een heel gedoe!

Europeana vroeg op een bepaald moment of wij onze Google boeken in Europeana wilden linken.

DM: Europeana is eigenlijk een databank met bookmarks. Je vindt iets, en als je klikt kom je bij de instelling terecht waar het boek staat. De instelling moet zelf de beelden hosten, je moet dat zelf allemaal doen. En dat was het vreemde natuurlijk, want de afspraak met Google Books is dat zij het materiaal op hun server hebben staan. Dus wat we voor Europeana gemaakt hebben is een manier waardoor je op onze pagina's de Google Books player kunt zien. De mensen die vanaf Europeana komen kunnen dus onze institutionele kaders zien, met daarbinnen een Google Books viewer.

FS: Één van de dingen die me stoort aan de interface van Google Books, is dat er enkel wordt vermeld dat een boek 'gratis' is, met een standaard verwijzing naar de Google gebruiksvoorwaarden. En niet bijvoorbeeld: 'Dit boek is in het Publieke Domein'. In Europeana krijg je niet alleen veel beter zicht op de institutionele context waarin het boek bewaard wordt, maar ook op de legale status van het boek.

SVP: In het begin van Europeana was Google echt de vijand.

Europeana is er gekomen omdat Frankrijk en Duitsland op een bepaald moment een Europese zoekmachine wilden, dus Google wilden evenaren. Ze zijn beginnen lobbyen bij de Europese commissie in Luxemburg. Gelukkig waren er een paar mensen in Brussel die daar iets slimmere ideeën over hadden en die zich zijn gaan concentreren op thesissen en wetenschappelijke publicaties in Open Access; het Driver-project. Leo Waaijers heeft ons daarin betrokken. Maar toen hadden ze al over gans Europa een elektronisch netwerk, hardware dus en een software. Enkel de content ontbrak. Die wilden ze in eerste instantie uit de nationale bibliotheken halen. De universiteitsbibliotheken zijn er pas later bijgeroepen omdat Europeana niet genoeg materiaal had.

Ze vroegen ons of we de gescande boeken van Google Books wilden doorgeven, er was nog niks van Google in Europeana. We hebben Google Amerika gecontacteerd en we waren de eerste bibliotheek die gegevens van Google Books hebben doorgegeven. Het was niet Google die lastig deed. Europeana verbood ons te linken naar Google, het logo van Google mocht er niet op staan enzovoort. We hebben dan maar in onze metadata vermeld: 'dit boek is door Google gedigitaliseerd'. Ik stond daar op, Google heeft verdorie enorm geïnvesteerd, en ze zouden anders onzichtbaar zijn in Europeana. En dan is Spanje gevolgd.

FS: Toch vind ik het niet gek dat Europese landen zélf zorg willen dragen voor het verspreiden van gedigitaliseerd materiaal. Ik vind het zorgwekkend dat de infrastructuur en de kennis rond digitalisering niet meer de verantwoordelijkheid is van overheden.

SVP: De verantwoordelijkheid van overheden ... De Europeana mensen worden betaald door Europa. Ze klopten aan de deur van universiteiten, dat was nog onder Neelie Kroes, omdat er gewoon geen content was en omdat ze ondermaats presteerden. Als je kijkt naar de attitude van Europeana tegenover de attitude van Google – en dat heeft natuurlijk ook met dat commerciële te maken – dan heeft Google ons ongelofelijk veel teruggeven, ze hebben ongelofelijk veel voor ons gedaan, dat is een echte samenwerking. Aan Europeana moeten we alleen maar geven. Het verdwijnt in een totaliteit die we zelf weinig gebruiken.

Ik sta wel achter het idee, maar ik heb er niet altijd een goed gevoel bij.

FS: En Wikisource? Wikibooks? Archive.org? Initiatieven die los van overheidsinstellingen toegang proberen te bieden tot met name Publiek Domein materiaal?

DM: We werken veel met Internet Archive. We financieren mee aan het project en we zorgen al jaren mee dat er webcontent vanuit Vlaanderen mee gearchiveerd wordt.

FS: Jullie online collectie was lang de enige plek waar de Traité de Documentation van Paul Otlet digitaal beschikbaar was.

SVP: Dat mochten we misschien niet doen, maar we hebben het toch gescand, vooral omdat het Boyd Rayward, de biograaf van Otlet zei: "We hebben dat boek nodig."

FS: Jullie OCR uit 2008 was jammer genoeg niet al te best, maar de mensen van Wikisource hebben die perfect gecorrigeerd in 2015, toen het boek in het Publieke Domein terecht kwam. Hoe zit dat met boeken die van Google terugkomen, kunnen jullie ze corrigeren?

SVP: We gaan niet al die boeken bekijken, maar soms is er wel eens iemand die zegt, die pagina die is vaag. Maar bij Google zijn er al twee of drie controles van de scan. Het gebeurt natuurlijk wel dat er een fout is, dat er een pagina te snel gedraaid wordt, of stukken die niet opengeplooid worden. Dat kunnen wij signaleren en we kunnen de pagina's zelf scannen en dat aanpassen, dat is een paar keer gebeurd.

DM: Of de metadata bijvoorbeeld. We kunnen ook als onze eigen informatie over een auteur bijvoorbeeld aanpassen en opnieuw doorsturen. De OCR zelf, dat weet ik eigenlijk niet of we die kunnen aanpassen.

SVP: Naar Europeana hebben we alleen de metadata doorgegeven. Google zet daar wel een beperking op omwille van het feit dat ze niet willen dat andere zoekmachines er zomaar mee aan de slag gaan.

DM: We hebben van alle boeken een kopie, dus ook van de OCR, maar de afspraak met Google is dat wij die niet zelf verder distribueren.

Alles wat we zélf produceren komt integraal beschikbaar als Open Data. Elke hoge resolutie scan die we zelf maken komt beschikbaar op het web, onder een Creative Commons licentie die vraagt om attributie en die vraagt dat je het materiaal onder dezelfde voorwaarden beschikbaar maakt, 'share-alike'. Wij zorgen dat die content open is, en dat iemand anders dat niet mag sluiten. Je mag ermee doen wat je wilt, behalve het opnieuw gaan sluiten.

Dat is een discussie met Europeana, die vindt dat we alles als CC-0 zouden moeten vrijgeven. Maar net die twee dingen zijn voor ons heel belangrijk, dat wat open is, ook open blijft, en dat er een ketting gebouwd wordt, dat je blijft verwijzen naar de bronnen die je gebruikt hebt. Voor ons als universiteitsbibliotheek is bronverwijzing heel belangrijk. Met de Wikipedia-familie hebben we dan soms wat toestanden omdat die licenties niet goed op elkaar aansluiten.

SVP: Er was ooit een jongeman die zich op een European Library Meeting in Amsterdam voorstelde als 'Wikipedian in residence van de British Library'. De British Library had van alles gedigitaliseerd, maar uiteindelijk werden die dingen niet gebruikt. Dat is ook iets waar wij mee zitten; de dingen die we zélf hebben gedigitaliseerd worden niet zo goed bezocht als de dingen die door Google zijn gedigitaliseerd. Ze zijn dus in de British Library begonnen de collecties en de handschriften gewoon in een Wikipedia lemma te beschrijven, gelinkt naar de collectie. En ineens werd het gebruik veel en veel groter. Wij willen dat ook doen, als we eenmaal verhuisd zijn. Om in de vorm van workshops een aantal collecties in Wikipedia te steken. We moeten dan natuurlijk kijken naar de licenties maar we zouden dat bijvoorbeeld zeker kunnen doen met de collectie architectuurplannen, waarvan we al gigantisch veel gedigitaliseerd hebben.

DM: We zijn al wat experimenten aan het doen met Wikidata maar het is nog een beetje zoeken hoe dat zich kan ontwikkelen. We zijn de metadata rond onze auteurs aan het verrijken zodat je meer linken kan gaan leggen ... we zijn volop aan het exploreren wat er kan.

SVP: Dat is voor ons natuurlijk belangrijk, het openstellen van data. Als je ziet wat Wikipedia teweeg kan brengen, dan is materiaal delen meteen ook een goede reclame voor je collectie, iets dat enorm veel goodwill creëert.

FS: Hebben jullie het idee dat er met jullie materiaal ook nieuwe dingen gemaakt worden?

SVP: De vereniging historische huizen Gent hier op het Sint Pietersplein vroeg of ze bepaalde stukken van afbeeldingen mochten gebruiken voor hun merchandising. Dat hebben we toegestaan. Het is wel leuk dat ze het vragen.

DM: Iedereen kan met de afbeeldingen die we gescand hebben zijn boeken kaften, en hoeft daar ons niets over te zeggen, maar het is wel leuk als we dan een exemplaar krijgen.

Het probleem met dingen openzetten zonder beperking is dat je natuurlijk ook niet precies weet wat er mee gebeurt. Als het om onderzoek gaat, dan heb je nog referenties waarin uitdrukkelijk verwezen wordt naar welke bronnen zijn gebruikt. Andere soorten gebruik zijn minder goed te volgen.

FS: Ik heb nog een vraag over jullie contract met Google. Vergelijkbare contracten met de Koninklijke Bibliotheek in Den Haag en de British Library in Londen zijn vanwege de openbaarheid van bestuur uiteindelijk gepubliceerd. Bij jullie is dat niet gebeurd. Is die geheimhouding niet een beetje bizar?

SVP: Ze hebben ons altijd gezegd dat die contracten niet openbaar gemaakt mochten worden.

Google Books is zo'n integere, correcte partner dat we alles wat ze ons hebben gevraagd zoals niet vertellen over de manier van scannen en het niet vrijgeven van het contract, hen te contacteren voordat we dingen doorgeven enzovoort, dat we dat altijd gehonoreerd hebben.

DM: Voor een universiteit is het ook niet zo uitzonderlijk om geheime contracten te hebben, we tekenen allerlei contracten met bedrijven.

FS: Dus niemand heeft er om gevraagd?

SVP: Er is verschillende keren om gevraagd.

Het niet publiceren van die contracten heeft weinig te maken met wat daar instaat. Dat is gewoon om een hoop geëmmer uit de weg te gaan.

FS: Dat geëmmer is natuurlijk ook deel van een transparant bestuur.

SVP: Ik weet niet of je nu meer weet door die contracten te lezen.

Bij Elsevier, daar wil ik wel weten wat er in die contracten staat, omdat ik wil weten wat anderen voor hun abonnementen moeten betalen. Bij Google staat er gewoon niks in dat wereldschokkend is.

Als alle universiteiten aan hun juridische adviseurs gaan vragen of dat in orde is, dan duurt dat ik weet niet hoe lang. En als dat in Vlaanderen en Wallonië is, dan is dat zeker dat het contract niet getekend wordt. En ik begrijp zeer goed dat ze zeggen: Moeit u er maar niet mee!

FS: Ik ga er maar van uit dat de inhoud van jullie contract ongeveer hetzelfde is als dat van de British Library en de Koninklijke Bibliotheek? Als je die contracten naast elkaar legt, zie je dat ze bijna hetzelfde zijn.

In beide staat helemaal vooraan in het hoofdstuk 'definities' dat Google het recht heeft om scans van hetzelfde boek dat op verschillende plekken te vinden is, samen te voegen in de digitale versie. Het digitale object is dus niet altijd een getrouwe kopie van het origineel, maar is soms een collage. Zijn jullie zoiets ooit tegengekomen?

SVP: Ik kan me dat niet herinneren. En het zou me ook niet kunnen schelen eigenlijk. Ze zullen dat wel op de een of ander manier zichtbaar maken.

DM: Als een blad is uitgescheurd, en ze voegen dat op de een of andere manier digitaal toe ... is dat dan erg? Ik heb het eerlijk gezegd nog nooit zo gezien. De afspraak met ons was dat ze alles zouden scannen, ook boeken waaruit bladzijden ontbreken. Als je ziet dat er een stuk ontbreekt, kun je dat samenvoegen met een andere scan zodat het boek toch nog nuttig is?

FS: Voor mij is dat geen detail. We gaan uit van een directe relatie tussen de scan en het fysieke object. Het digitale bestand verwijst naar een specifiek boek, op een specifieke plek. Doordat Google Books niet alleen met jullie werkt, maar ook met heel veel anderen, ontstaat de mogelijkheid een hybride digitale bibliotheek te maken.

SVP: Duiden ze dat dan aan, dat het om een hybride object gaat? Dat zal dan waarschijnlijk iets zijn waar iemand ooit over gestruikeld is. Ik denk niet dat dat er bij ons instaat.

DM: Dat kennen we ook van andere massa-digitaliseringsprojecten. Het is belangrijk de flow van het digitaliseren niet te onderbreken. Het zou natuurlijk zo moeten zijn dat als er een bladzijde ontbreekt, dat er dan een belletje rinkelt en dat er dan iemand moet komen kijken, maar dan ligt die straat stil. Dus aan de scan-tafel bestaat dat concept niet, dat een bladzijde ontbreekt.

Tegelijkertijd is er natuurlijk wel de zorg: we zijn nu data aan het produceren, en die gaan we nu opslaan en post-produceren en waarom zouden we dat gaan doen als we weten dat het niet klopt? Je kunt het vergelijken met het digitaliseren van video-tapes. Waarom zou je doorgaan als het beeld zwart is? En dat is dus de afweging: ga je tijdens het proces eens kijken en als het beeld zwart is, op stop duwen, of heb je een operator die gewoon meerdere tapes bedient en tape één en tape twee en tape drie start en er verder niet naar omkijkt.

No industry in the present demonstrates more the asymmetries of control over the conditions of production of knowledge than the academic publishing. The denial of access to outrageously expensive academic publications for many universities, particularly in the Global South, stands in stark contrast to the super-profits that a small number of commercial publishers draws from the free labour of scientists who write, review and edit contributions and the extortive prices their institutional libraries have to pay for subscriptions.

Actuellement, aucune industrie ne montre plus d'asymétries au niveau du contrôle des conditions de production de la connaissance que celle de la publication académique. Refuser l'accès à des publications académiques excessivement chères pour beaucoup d'universités, en particulier dans l'hémisphère sud, contraste ostensiblement avec les profits énormes qu'un petit nombre d'éditeurs commerciaux tirent du travail bénévole de scientifiques qui écrivent, révisent et éditent des contributions et avec les prix exorbitants des souscriptions que les bibliothèques institutionnelles doivent payer.

FS: Hoe gaan jullie om met boeken en publicaties die al vanaf het begin digitaal zijn?

DM: We kopen e-books en e-tijdschriften en maken die beschikbaar voor onderzoekers. Maar dat zijn hele andere omgevingen, omdat die content niet fysiek binnen onze muren komt. We kopen toegang tot servers van uitgevers of de aggregator. Die content komt nooit bij ons, die blijft op hun machines staan. We kunnen daar dus eigenlijk niet zoveel mee doen, behalve verwijzen en zorgen dat het evengoed vindbaar is als de print.

FS: Jullie kunnen dus geen zorg dragen voor dit deel van de digitale bibliotheek?

SVP: Trekken we ons daar nu veel van aan of het digitaal of papier is? Het staat gewoon in de catalogus.

DM: Of wij nu de viewer aanbieden of een ander, als we een e-book kopen, in de catalogus komt wel een fiche.

FS: Maar op het moment dat het abonnement afloopt of dat de service wordt opgeheven dan is het niet meer aan jullie om te zorgen dat het materiaal beschikbaar blijft?

DM: Dat hangt er van af. Er zijn ook contracten met archiefrechten, uitgevers hebben dan afspraken gemaakt met een bepaalde archiefinstelling zoals de KB in Den Haag, of Portico. Er zijn zo een aantal projecten die voor uitgevers borg staan, en die zorgen voor een digitale kopie. Dus als we materialen kopen met archiefrecht, dan weten we dat we dat als die server uitvalt dat we naar die andere plaatsen kunnen doorverwijzen. Dat is een infrastructuur die ervoor zorgt dat er een achtergrondkopie is op een aantal plaatsen, dus als om de één of andere manier de uitgever niet beschikbaar is, dan word je vanzelf doorverwezen naar die digitale archieven. Dat is technisch complex, maar dat bestaat wel. Men zorgt wel enkel voor wetenschappelijke tijdschriften dat de toegang er ook in de toekomst blijft.

FS: Het betekent dus dat kennis niet meer in bibliotheken wordt opgeslagen.

DM: Niet meer enkel in onze eigen bibliotheek. Elsevier wordt geborgd door de Koninklijke Bibliotheek (KB) in Den Haag. We kunnen bij Elsevier 'eeuwige toegang' kopen, omdat we goed begrijpen dat er een kopie bij de KB is en dat die goed bewaard wordt. Voor onze eigen content hebben we een heel zwaar preservatie systeem. Voor de scans die we maken moeten wij er zelf voor instaan dat die in de toekomst nog beschikbaar blijven. Dat is al complex genoeg. Als we er die van Elsevier nog eens zouden moeten bijnemen ... Vandaar dat daar een aantal gespecialiseerde mensen mee bezig zijn. Want digitale preservatie op schaal, dat is ook weer zo’n aparte expertise.

FS: Digitalisering zorgt voor meer verschillende entrees tot hetzelfde materiaal, maar in de preservatie lijkt centralisatie op te treden.

DM: Je hebt een aantal centraliserende initiatieven, maar zoiets als LOCKSS is een helemaal decentraal systeem.

FS: Is jullie samenwerking met Google nu afgelopen?

SVP: Nee, zolang ze blijven scannen kunnen we nog altijd materiaal van voor 1876 voor hen klaarmaken. Maar ondertussen is zijn de contracten van de extra catalografen gestopt dus ik denk niet dat er nog heel veel dingen zullen gebeuren.

Ik heb ook het gevoel dat Google Books nu aan het afbouwen is, na al die grote projecten en die moeilijke processen in Amerika, ik zie niet onmiddellijk een revival. Een universiteitsbibliotheek blijft een universiteitsbibliotheek, of je nu 200 jaar geleden binnenkwam of nu. Maar Google ontwikkelt steeds nieuwe ideeën, die ontwikkelt veel sneller, werkt steeds aan iets anders. Voor hen is het succesverhaal van Google Books, dat het er is. Maar om daar nu alle tijd en energie in te steken. Ik heb een beetje het gevoel: ze hebben het gehad.

FS: En wat gebeurt er als Google Books overmorgen sluit?

DM: Dat is geregeld in het contract. Op dat moment mogen wij een soortgelijke dienstverlening opzetten.

FS: En kunnen jullie dat, hebben jullie daar de middelen voor?

SVP: Één van de dingen die we in het contract uit de wacht gesleept hebben, is dat er altijd een gratis kopie van onze boeken online moet blijven. Of ze dat gaan doen, dat weet ik natuurlijk niet.

FS: Jullie hebben dus eigenlijk bedongen dat Google Books er nooit meer mee op kan houden!

SVP: Richard Ovenden, hij is nu hoofdbibliothecaris van de Bodleian Library in Oxford, heb ik voor het eerst gecontacteerd toen Google bij ons aan de deur klopte, ik vroeg hem: “Jij hebt zoveel jaar geleden het contract met Google ondertekend, wat zou je doen als ze weer bij je aanklopten?” Hij zei: “I would not doubt, I would say yes immediately”. En hij blijft nog altijd zeer positief over de samenwerking, de dingen die ze met hen gedaan hebben, en de zichtbaarheid enzovoort.

En ik zeg het ook in ieder gesprek dat ik over Google heb: Neen, ik werd en word niet door Google betaald om dit te zeggen.