gahetNA in het Nationaal Archief

Archiefinventarissen en scans van Archieven

Een groot deel van de archiefinventarissen en scans van archieven zijn beschikbaar als open data met een open licentie of verklaring. De wijze waarop over dit materiaal beschikt kan worden verschilt.

Archiefinventarissen

Open data informatie voor archiefinventarissen
CollectiegegevensWaarde
CollectieonderdeelArchiefinventarissen
AantalCa. 6400
Percentage Open Data98 % (van de 6600 digitale archiefinventarissen) 
LicentieCC0
TechniekOAI-PMH
FormaatEAD/XML

OAI-PMH

De html en de XML van de individuele archiefinventaris bevat een duidelijke vermelding van de CC0 licentie die op het werk rust. Een beperkt percentage (2%) valt hier nog niet onder, omdat deze in het verleden door derden zijn gemaakt waardoor formeel het auteursrecht nog bij hen ligt.

Via OAI-PMH kunnen straks de archiefinventarissen opgevraagd worden; hierbij wordt EAD/XML teruggeleverd. De OAI-PMH werkt als volgt, de base url is:

Het opvragen van de identificatie gegevens van een OAI-PMH repository werkt met het ‘verb’: Identify:

Het opvragen van welke sets een OAI-PMH repository bevat werkt met het ‘verb’: ListSets:

De NA OAI-PMH repository bevat 4 sets: naa1, naa2, naa3 en naa4, corresponderend met de toegangen uit de 1.xx-serie, de 2.xx-serie, de 3.xx-serie en de 4.xx-serie

Het opvragen van de metadata formats waarin de data door een OAI-PMH repository worden aangeboden werkt met het ‘verb’: ListMetadataFormats:

De NA OAI-PMH repository levert de data in 3 metadata formats aan: oai_dc (Dublin Core/XML), oai_ead (summiere EAD/XML) en oai_ead_full (volledige EAD/XML)

Het opvragen van de identifiers van de records van een set van een OAI-PMH repository werkt met het ‘verb’:ListIdentifiers, in combinatie met de set-naam en het metadata format:

Dit verzoek vraagt om de archiefinventarisnummers (identifiers) van de 4.xx-serie toegangen (set: naa4)

Het opvragen van alle records van een set van een OAI-PMH repositorye werkt met het ‘verb’: ListRecords, in combinatie met de set-naam en het metadata format:

Dit verzoek vraagt om de zeer summiere EAD/XML informatie (metadata format: oai_ead) van alle 1.xx-serie toegangen (set: naa1)

Het opvragen van de inhoud van een record van een OAI-PMH repository werkt met het ‘verb’: GetRecord, in combinatie met de identifier en het metadata format:

Dit verzoek vraagt om archiefinventarisnummer 3.18.20 (identifier: 3.18.20) in volledige EAD/XML weergave (metadata format: oai_ead_full)

Scans van Archieven

Open data informatie voor scans van archieven
CollectiegegevensWaarde                                      
CollectieonderdeelScans van Archieven
AantalCa. 500.000
Percentage Open Data50% (van de ca. 1000.000 archiefscans)
LicentiePublic Domain en CC0
TechniekOpen Search Api
FormaatXML en JPEG 1280 pixels (lange zijde), 72 DPI

Api

Een flink aantal scans die horen bij de verschillende archiefinventarissen zijn beschikbaar via de Open Search Api:

Niet beschikbaar zijn de scans van de Surinaamse Archieven (1.05.11.15, 1.05.11.16 en 2.10.19.01), de scans bij het Schaduwarchiefbestand van Afscheid van Indië (2.22.21) en de Sailing Letters (2.22.24). Deze duplicaten zijn gemaakt van archieven die zich niet in Den Haag bevinden. 

De scans die wel met een open data licentie beschikbaar zijn kunnen worden opgeroepen via de URL van de Open Search Api. Het description document van de Api geeft aan welke velden doorzocht kunnen worden.

Wanneer de scans van de Abdij van Rijnsburg (archiefinvenaris 3.18.20) als voorbeeld worden genomen ziet de URL er als volgt uit.

http://www.gahetna.nl/beeldbank-api/opensearch/?q=3.18.20&count=100&startIndex=1

De API geeft per keer maximaal 100 records terug (&count=100) en start met het tonen ervan op pagina 1 (&startIndex=1). Wanneer er meer records dan 100 zijn (<opensearch:totalResults>) kan de pagina worden opgeplust tot het laatste resultaat is bereikt. Een record is in het geval van Scans van Archieven een inventarisnummer. Een record kan meerdere scans in zich herbergen.
Via het veld <field name="Inventarisnummer"> kunnen de records weer gemakkelijk gekoppeld worden aan de XML van de Archiefinventarissen.

Het is ook mogelijk om de scans van één individueel inventarisnummer via de API aan te roepen. Door de logische bestandsnaamopbouw van archiefinventaris en inventarisnummer is bijvoorbeeld het eerste inventarnummer 1.4 uit archiefinventaris 3.18.20 te vertalen naar 3.18.20_1.4 als URL ziet er dan als volgt uit:

http://www.gahetna.nl/beeldbank-api/opensearch/?q=3.18.20_1.4&count=100&startIndex=1

Bron en Licentievermelding

In het geval van een CC-BY-SA licentie dient bij hergebruik de bron (BY) en licentie (Share Alike) correct vermeld te zijn. Hiervoor hebben we richtlijnen. In het geval van Public Domain en CC0 verklaring is dat niet verplicht maar stellen we een bronvermelding wel op prijs. 

De kern van de bronvermelding bestaat uit het Nationaal Archief als instelling plus de naam en locatie van het stuk. Per collectie kan dat verschillen. 

Bron en licentievermelding open data per collectieonderdeel

Collectieonderdeel

Bron en Licentievermelding

Verplicht

Archiefinventarissen

Nationaal Archief, Den Haag, [archiefnaam], [periode], nummer toegang [xx.xx.xx], inventarisnummer [xxx]

of verkort

NL-HaNA, [verkorte archiefnaam + periode], [nummer toegang xx.xx.xx], inv.nr. [xxx]

Niet verplicht in verband met strekking CC0, wordt wel op prijs gesteld

Scans van Archieven

Nationaal Archief, Den Haag, [nummer toegang xx.xx.xx], inv.nr. [xxx] 

Niet verplicht in verband met strekking PD (Public Domain), wordt wel op prijs gesteld

Meer informatie

via @timmietovenaar of via info@nationaalarchief.nl

Uitgebreid
Zoek in collecties
Zoek in