maandag 11 januari 2010

Scannen van boeken: een heilloze weg

Vandaag presenteerde de respectabele Koninklijke Bibliotheek het plan voor de digitalisering van alle Nederlandstalige publicaties sinds 1470. Alle boeken, tijdschriften en kranten worden dan via internet toegankelijk. In 2013 moeten zo'n 73 miljoen pagina's zijn gescand, zo'n 10 procent van het totaal. Daaraan besteedt de KB ongeveer drie miljoen euro. En in 2030 moeten 600 miljoen pagina's zijn gescand. Dit meldt de NRC vandaag.

Wat een diep bedroevende zaak! Alle boeken digitaal en via Internet beschikbaar te hebben  lijkt een democratische daad te zijn van groot cultureel belang. Lijkt.
Een paar argumenten waarom dit niet zo is:
  • het scannen van oude boeken (van vóór de 18e eeuw) lijkt werken "toegankelijk" te maken, maar deze zijn echter uitsluitend door specialisten te lezen of te begrijpen. De doorsnee internetter heeft daar helemaal niets aan;
  • het scannen zelf zal, gezien de hoeveelheid, ongetwijfeld slordig worden uitgevoerd (bij voorbeeld in derdewereldlanden) waardoor het werk, eenmaal gescand, waardeloos wordt. Ik geef hier onder zo voorbeelden van;
  • de toegankelijkheid van deze enorme berg informatie zal veel te wensen over te laten. Alleen het beschikbaar stellen van boeken als pdf of op het beeldscherm brengt nog geen orde en betekenis aan. Voor bijzondere boeken zal altijd een deskundige bibliothecaris of archivaris nodig zijn die kennis en inzicht heeft over het betreffende corpus van boeken over dit vakgebied.
Google Books is al een paar jaar bezig om "alle boeken in de wereld" te scannen. Afgezien van het feit dat hen dit nooit zal lukken, is hetgeen ze tot nu toe gepresteerd hebben buitengewoon slecht. Ik zoek weleens in Google Books, bij voorbeeld om een 18e of 19e eeuws boek te vinden waarin ik geïnteresseerd en dat in het origineel een vermogen kost.
Huiver en lach.

Het boek Pompeiana van William Gell, oorspronkelijk gepubliceerd in 1817-1818, was het eerste uitvoerige engelstalige boek over Pompeii. Google Books heeft tientallen, willekeurig gekozen, edities van zijn boek ingescand. Hele boeken, halve boeken. Geen enkele duiding. Een wirwar aan titels.
Toen ik na lang zoeken en klikken meende het oorspronkelijke werk gevonden te hebben, kwam ik ondere andere dit tegen (en ik zou van deze en andere werken tientallen andere voorbeelden kunnen geven):

* een half omgeslagen bladzijde, waardoor de illustratie op de volgende pagina aan het zicht ontrokken wordt (klik op de plaatjes voor een vergroting):



En deze dan, de Indiase (of weet-ik-veel-waar-die-vandaan-kwam) was net te langzaam bij het scannen van deze pagina:




Zijn harige vingers staan in het boek waar mijn interesse naar uit ging en dat nu totaal onbruikbaar is.
Wie zou er nou in een antiquariaat een boek willen kopen waar de resten van de vorige gebruiker nog  zichtbaar zijn? Wie wil een boek lezen waarin bladzijden ontbreken?
Getver, jakkes. Bij Google Books en straks ook bij onze Nationale Bilbiotheek is het allemaal mogelijk. Gratis.
Weet je waarom gratis gratis heet? Omdat het voor niets is. Het is niets geweest en het zal nooit iets worden.

Het enige dat er toe doet is het eigenlijke ding, het boek. Fysiek contact. Dimensies, vorm, geur. Bladeren. Toevalligheden vinden. Verrassingen. Wat boeken betreft ga ik nooit digitaal, over mijn lijk!

7 opmerkingen:

Anoniem zei

Je hebt helemaal gelijk!!! Getver en jakkes. Al ben ik gèèn lezer [zoals je weet] hihihi. Ik moet er niet aan denken, dat er geen mooie 'thuis'bibliotheken meer zouden zijn. INERNET LEZEN,zo onpersoonlijk...en zo ver van de mens afstaand. Zo word het bibliofilo gevoel in 1 klap naar de maan geholpen. Want dat moet ik je na geven....jij bent ècht een echte boekengek in hart en nieren.Het gevoel wat een boek jou geeft,is de kick van de verrassing, van het pakket, het uitpakken, het voelen, het ruiken en het beleven.[ik ben vast nog iets vergeten]Help!! hoe krijg je een boekengek, gek?
Door DIGITAAL op INTERNET gaan!!! HELP!!!!
XPX

Anoniem zei

Helemaal mee eens. Het is allemaal wel mooi en "democratisch", maar geef mij maar het echte boek, papier, geur,....

Robert Koopman zei

Ze gooien de boeken toch niet weg na het scannen :-)

Ik ben er een groot voorstander van!
Of het zinvol is om oude boeken op het internet te zetten?
Tuurlijk wel.

Anoniem zei

Het lezen, en zeker het begrijpen van de hele tekst, van het boek zal er niet door bevorderd worden. Je ziet het al vaak in de krant of op TV: politici of journalisten die wat tekst bij elkaar "googelen" en ze hebben weer een mening of een stukje.

Jenny Mateboer, Koninklijke Bibliotheek zei

Beste Boekengek,

namens de Koninklijke Bibliotheek wil ik graag kort reageren op wat je hier schrijft.
1e) De KB digitaliseert pre-1800 boeken inderdaad in eerste instantie voor de wetenschap, maar dat is dan ook een belangrijke doelgroep. Onderzoekers hebben veel belangstelling voor het digitaal kunnen werken met oude teksten. Natuurlijk zijn wij er ook voor het bredere publiek, en dat zal ongetwijfeld dankbaar gebruik maken van andere teksten die wij digitaliseren, zoals bijvoorbeeld de 8 miljoen krantenpagina's waar momenteel aan gewerkt wordt.
2e) Het scannen zelf gebeurt door gerenommeerde Nederlandse of andere Europese bedrijven, en volgens strenge procedures en normen die de KB bewaakt. Niet slordig dus, de resultaten van Google zijn ons bekend, maar wij streven een hoger kwaliteitsniveau na.
3e) Alle teksten die de KB scant, worden ook ge-ocrd, dus op woordniveau doorzoekbaar. De KB gebruikt programmatuur die slimme zoekacties mogelijk maakt.
Met vriendelijke groet,
Jenny Mateboer,
Senior adviseur, afdeling Communicatie Koninklijke Bibliotheek

Marc van Oostendorp zei

Wat zou ik, omgekeerd, blij zijn als die hele collectie nu al voorhanden was! Natuurlijk zullen er problemen zijn, en natuurlijk zullen er, ondanks de strengere normen van mevrouw Matenboer hierboven, af en toe fouten worden gemaakt. Maar dan nog krijg je ineens zoveel moois uit vroeger tijden voorhanden! Natuurlijk is het prettiger om een echt oud boek zelf in handen te hebben, maar zoals Koopman hierboven al schrijft: die boeken verdwijnen toch niet ineens? Wat is er tegen als er een dimensie wordt toegevoegd aan onze ervaringen van het boek? Uw drie argumenten vind ik alledrie (met permissie) niet zo sterk:

* dat oude boeken alleen toegankelijk zijn voor mensen die zich in de materie verdiepen, is ongetwijfeld waar, maar op deze manier is het materiaal in ieder geval bereikbaar voor iedereen die dat wil (en niet alleen voor degenen die bijvoorbeeld toevallig in de buurt van Den Haag wonen).

* dat het scannen 'ongetwijfeld' slordig zal worden uitgevoerd is uw aanname, die niet per se door de feiten wordt gestaafd. Bovendien: er kan altijd verbeterd worden aan de gemaakte kopieën en ocr'en.

* Dat er ervaren bibliothecarissen en archivarissen nodig zullen blijven, is misschien waar; maar deze kunnen ook online hun werk doen.

Ik respecteer uw liefde voor het papieren boek, maar ik begrijp niet zo goed waarom dit ertoe moet leiden om het scannen van boeken tot een 'diepbedroevende zaak' te verklaren.

Bibliofilos zei

Omdat boeken, net als dieren, kunnen uitsterven, omdat ze kunnen verdwijnen in privè-bibliotheken en niet meer toegankelijk zijn voor de leek, omdat het gedrukte woord niet verloren mag gaan, ben ik een voorstander van het inscannen van boeken.
Ik prefereer ook het gedrukte woord, maar dat dit medium gebruikt wordt om boeken in te scannen juich ik alleen maar toe.