Soubory k aktualizaci lokálních bází
Soubory změn a kumulace na ftp serveru v adresáři autorit, určené ke stahování
Soubory se nacházejí na ftp.nkp.cz v adresáři au/download. Jsou k dispozici všem účastníkům kooperačního projektu, dle dohody dalším zájemcům. Jedná se o autority jmenné i věcné (aktualizace jsou ve společném souboru).
O přidělení loginu pro přístup na ftp je třeba
požádat Petru Šťastnou. Loginem je vždy sigla knihovny s písmenem a na konci (např. aba001a).
Potřebné informace - sigla knihovny, heslo (6-8 znaků; pokud již má
knihovna přístup pro zasílání záznamů do souborného katalogu, může používat totéž heslo).
1. export celé báze / jednotlivých typů autorit + kumulované změnové soubory
Pro knihovny
se systémem Aleph se vytváří na požádání export celé báze ve formátu MARC21,
kódování UTF-8 – aut.dat.
Pro ostatní knihovny se vytvářejí soubory podle typu autority (pouze věcné autority) - aut_ch, aut_fd, aut_ge, aut_ph. Formát je řádkový MARC21/UNIMARC
(přípona „_uni“), kódování UTF-8. Soubory jsou aktualizovány každý měsíc
a obsahují všechny platné a zrušené autority k příslušnému datu.
Před stažením doporučujeme zkontrolovat datum a podle potřeby doplnit
aktualizovanými záznamy (viz 2).
Každý měsíc jsou aktualizovány kumulované změnové soubory - auj_oz, auj_zr,auj_oc, auv_oz, auv_zr, auv_oc. Formát je řádkový MARC21/UNIMARC (přípona „_uni“), kódování UTF-8. Začátkem každého roku jsou vystaveny změnové soubory za uplynulý rok - auj_oz_..., auj_zr_... atd.
Začátkem
roku jsou dále vystaveny soubory nově
vytvořených věcných autorit (podle typu autority) za uplynulý rok - aut_ch_...,
aut_fd_..., aut_ge_..., aut_ph_…. Formát je řádkový MARC21/UNIMARC (přípona
„_uni“), kódování UTF-8.
2. soubory
záznamů nových/aktualizovaných autorit za poslední týden
(export každou sobotu)
Soubory jsou určeny knihovnám s jinými systémy než Aleph, které si chtějí aktualizovat své vlastní lokální báze autorit a/nebo opravit záhlaví ve svých bibliografických bázích. Počítá se s vazbou na identifikační číslo autority, které se až na zcela výjimečné případy nemění (identifikační čísla, která bylo nutno změnit, většinou z důvodů duplicity způsobené lidskou chybou, jsou potom obsažena ve zvláštním souboru). Soubory začínají w (=weekly) a jsou označeny pořadovým číslem týdne (např. wakt_49, wakt_u_49, wakt_m_49). Jde vždy o řádkový MARC.
Typy souborů podle formátu a kódování:
- bez speciální přípony (např. wakt_49) - UNIMARC, CP-1250
- s příponou „_u“ před číslem týdne (např. wakt_u_49) - UNIMARC, UTF-8
- s příponou „_m“ před číslem týdne - MARC21, UTF-8
Druhy souborů:
a/ podle
systémového údaje o založení/poslední aktualizaci záznamu
wnew, wnew_u, wnew_m - celé nové záznamy (= v daném období poprvé
uloženy do systému)
wakt, wakt_u, wakt_m - celé aktualizované záznamy (=
záznamy aktualizované online i dávkově; může se jednat o jakkoli nepatrnou
změnu v záznamu, např. opravu překlepu; tytéž záznamy se dostanou do souboru
wnew i wakt, pokud jsou během téhož týdne opakovaně aktualizovány)
b/ podle stavového kódu a data v poli 906 ukládaného katalogizátorem
woz, woz_u, woz_m - záznamy s opravovaným záhlavím - obsahují pole 001 a 200
wzr, wzr_u, wzr_m - zrušené záznamy - obsahují pole 001 a 901 (=číslo záznamu, k
němuž byl zrušený záznam duplicitou)
woc, woc_u, woc_m - záznamy se změněným identifikačním číslem - obsahují
pole 001 (=nové IČ) , 200 a
OPR (=původní IČ); je třeba prověřit výskyt tohoho IČ ve vlastní autoritní bází
a provést ruční opravu
wvt,wvt_u,wvt_m - záhlaví, kde došlo ke změně
odkazu viz na viz též, což je třeba zkontrolovat a ručně opravit v BIB
bázích (vytvářejí se od 08/2009)
Předběžně počítáme s periodicitou mazání cca 1 měsíc.
3. soubory
záznamů nových/aktualizovaných za příslušný den
(export denně kromě neděle)
Soubory jsou určeny knihovnám Aleph, které si udržují kopii báze. Jsou označeny datem (např. akt_20020120). Formát je ALEPH sekvenční soubor, MARC21, kódování UTF-8. Soubory se ponechávají nejméně 14 dní.
Druhy
souborů:
přípona m21 se již nepoužívá!!!
akt_RRRRMMDD
- společně nové a aktualizované záznamy dle systémových
údajů
oz_RRRRMMDD - opravená záhlaví
(=záznamy s polem COR/MOR)
zr_RRRRMMDD - zrušené záznamy
Pro aktualizaci lokálních kopií báze a zároveň opravu v záhlavích připojených
bibliografických bází se používá speciální program - o poskytnutí programu a
další informace je třeba se obrátit na distributora (ÚVT).
4. Konspekt
Záznamy konspektu nejsou skutečné autority a jejich stahování přes Z39.50 je problematické, protože obsahují speciální znaky, které Z39.50 klienty většinou neumějí zpracovat správně. Protože se mění jen výjimečně, doporučujeme ne-alephovským knihovnám stažení celého souboru a naimportování záznamů do lokální báze autorit.
Soubory jsou aktualizovány nepravidelně, k dispozici jsou následující soubory:
-
řádkový
MARC21/UNIMARC:
konsp, konsp_uni (kódování
UTF-8)
konsp_w, konsp_uniw (kódování CP-1250)
-
podle ISO
2709:
konsp.iso, konsp_uni.iso (kódování UTF-8)
konsp_w.iso, konsp_uniw.iso (kódování CP-1250)
-
ALEPH
sekvenční formát:
konsp.dat, konsp_uni.dat (kódování UTF-8)
konsp_w.dat, konsp_uniw.dat (kódování CP-1250)
Změny v záznamech konspektu budou oznamovány v rámci informací věcných autorit.
Kontakt pro otázky spojené se soubory
vystavovanými na ftp: Radovan Zahořík