Nasjonalbiblioteket er nå i gang med en ny runde i innhøstingen fra domenet .no. I løpet av to uker har maskinene som ”støvsuger” denne delen av nettet samlet inn nærmere 150 millioner filer. Og antallet øker for hvert sekund som går.
Det er svimlende datamengder som akkurat nå lastes ned på Nasjonalbibliotekets servere. Ingen vet nøyaktig hvor mange sider det finnes på domenet .no, men NBs innhøstere har fram til nå identifisert nærmere 330 millioner URL-er. Alle skal etter hvert inn i Nasjonalbibliotekets digitale sikringsmagasin, for på den måten å bevares og gjøres tilgjengelig på lik linje med andre digitale dokumenter.
Digital kulturarv
- Nasjonalbiblioteket har ansvaret for å samle inn offentlig tilgjengelige dokumenter, sikre dem for ettertiden og gjøre dem tilgjengelige for forskning og dokumentasjon. Pliktavleveringsloven gjelder for disse dokumentene så vel som for trykte dokumenter – også nettsidene er en viktig del av vår kulturarv, opplyser avdelingsleder Kjersti Rustad. I arbeidet med å høste inn de norske sidene fra Internett har hun blitt vant med å forholde seg til høye tall.
Effektiv innhøsting
- Under den forrige innsamlingen av domenet samlet vi inn 45 millioner sider i løpet av 8 måneder. Nå har vi valgt andre tekniske løsninger; vi bruker tre maskiner i stedet for en, og antall sider ble doblet bare i løpet av en uke, sier Rustad.
Det er ikke Nasjonalbibliotekets intensjon at tjenesteytere på nett skal belastes unødig på grunn av innhøstingen. Dersom noen opplever at normal drift blir forstyrret av innhøstingen, ber vi om at disse tar kontakt med Nasjonalbiblioteket.
Her kan du lese mer om innhøstingen: http://www.nb.no/fag/nasjonalbibliotekets_samling/nettdokumenter__1