Osobní nástroje
Nacházíte se zde: Úvod Kooperace Soubory k aktualizaci lokálních bází
Akce dokumentů

Soubory k aktualizaci lokálních bází

Soubory změn a kumulace na ftp serveru v adresáři autorit, určené ke stahování

Soubory se nacházejí na ftp.nkp.cz v adresáři au/download. Jsou k dispozici všem účastníkům kooperačního projektu, dle dohody dalším zájemcům. Jedná se o autority jmenné i věcné (aktualizace jsou ve společném souboru).

O přidělení loginu pro přístup na ftp je třeba požádat Petru Šťastnou. Loginem je vždy sigla knihovny s písmenem a na konci (např. aba001a). 
Potřebné informace - sigla knihovny, heslo (6-8 znaků; pokud již má knihovna přístup pro zasílání záznamů do souborného katalogu, může používat totéž heslo).

1. export celé báze / jednotlivých typů autorit + kumulované změnové soubory

Pro knihovny se systémem Aleph se vytváří na požádání export celé báze ve formátu MARC21, kódování UTF-8 – aut.dat.

Pro ostatní knihovny se vytvářejí soubory podle typu autority (pouze věcné autority) - aut_ch, aut_fd, aut_ge, aut_ph. Formát je řádkový MARC21/UNIMARC (přípona „_uni“),  kódování  UTF-8. Soubory jsou aktualizovány každý měsíc a obsahují všechny platné a zrušené autority k příslušnému datu.
Před stažením doporučujeme zkontrolovat datum a podle potřeby doplnit aktualizovanými záznamy (viz 2).

Každý měsíc jsou aktualizovány kumulované změnové soubory - auj_oz, auj_zr,auj_oc, auv_oz, auv_zr, auv_oc. Formát je řádkový MARC21/UNIMARC (přípona „_uni“),  kódování UTF-8. Začátkem každého roku jsou vystaveny změnové soubory za uplynulý rok - auj_oz_..., auj_zr_... atd.

 Začátkem roku jsou dále vystaveny soubory nově vytvořených věcných autorit (podle typu autority) za uplynulý rok - aut_ch_..., aut_fd_..., aut_ge_..., aut_ph_…. Formát je řádkový MARC21/UNIMARC (přípona „_uni“), kódování  UTF-8.

2. soubory záznamů nových/aktualizovaných autorit za poslední týden
(export každou sobotu)

Soubory jsou určeny knihovnám s jinými systémy než Aleph, které si chtějí aktualizovat své vlastní lokální báze autorit a/nebo opravit záhlaví ve svých bibliografických bázích. Počítá se s vazbou na identifikační číslo autority, které se až na zcela výjimečné případy nemění (identifikační čísla, která bylo nutno změnit, většinou z důvodů duplicity způsobené lidskou chybou, jsou potom obsažena ve zvláštním souboru). Soubory začínají w (=weekly) a jsou označeny pořadovým číslem týdne (např. wakt_49, wakt_u_49, wakt_m_49). Jde vždy o řádkový MARC.

Typy souborů podle formátu a kódování:

  • bez speciální přípony (např. wakt_49) - UNIMARC, CP-1250
  • s příponou „_u“ před číslem týdne (např. wakt_u_49) - UNIMARC, UTF-8
  • s příponou „_m“ před číslem týdne - MARC21, UTF-8


Druhy souborů:

a/ podle systémového údaje o založení/poslední aktualizaci záznamu
wnew, wnew_u, wnew_m - celé nové záznamy (= v daném období poprvé uloženy do systému)
wakt, wakt_u, wakt_m - celé aktualizované záznamy (= záznamy aktualizované online i dávkově; může se jednat o jakkoli nepatrnou změnu v záznamu, např. opravu překlepu; tytéž záznamy se dostanou do souboru wnew i wakt, pokud jsou během téhož týdne opakovaně aktualizovány)
b/ podle stavového kódu a data v poli 906 ukládaného katalogizátorem
woz, woz_u, woz_m - záznamy s opravovaným záhlavím - obsahují pole 001 a 200
wzr, wzr_u, wzr_m - zrušené záznamy - obsahují pole 001 a 901 (=číslo záznamu, k němuž byl zrušený záznam duplicitou)
woc, woc_u, woc_m - záznamy se změněným identifikačním číslem - obsahují pole 001 (=nové IČ) , 200 a OPR (=původní IČ); je třeba prověřit výskyt tohoho IČ ve vlastní autoritní bází a provést ruční opravu
wvt,wvt_u,wvt_m - záhlaví, kde došlo ke změně odkazu viz na viz též, což je třeba zkontrolovat a ručně opravit v BIB bázích (vytvářejí se od 08/2009)

Předběžně počítáme s periodicitou mazání cca 1 měsíc.

3. soubory záznamů nových/aktualizovaných za příslušný den
(export denně kromě neděle)

Soubory jsou určeny knihovnám Aleph, které si udržují kopii báze. Jsou označeny datem (např. akt_20020120). Formát je ALEPH sekvenční soubor, MARC21, kódování UTF-8. Soubory se ponechávají nejméně 14 dní.

Druhy souborů:
přípona m21 se již nepoužívá!!!

akt_RRRRMMDD - společně nové a aktualizované záznamy dle systémových údajů
oz_RRRRMMDD - opravená záhlaví (=záznamy s polem COR/MOR)
zr_RRRRMMDD - zrušené záznamy

Pro aktualizaci lokálních kopií báze a zároveň opravu v záhlavích připojených bibliografických bází se používá speciální program - o poskytnutí programu a další informace je třeba se obrátit na distributora (ÚVT).

4. Konspekt

Záznamy konspektu nejsou skutečné autority a jejich stahování přes Z39.50 je problematické, protože obsahují speciální znaky, které Z39.50 klienty většinou neumějí zpracovat správně. Protože se mění jen výjimečně, doporučujeme ne-alephovským knihovnám stažení celého souboru a naimportování záznamů do lokální báze autorit.

Soubory jsou aktualizovány nepravidelně, k dispozici jsou následující soubory:

-         řádkový MARC21/UNIMARC:
konsp, konsp_uni (kódování UTF-8)
konsp_w, konsp_uniw (kódování CP-1250)

-         podle ISO 2709:
konsp.iso, konsp_uni.iso (kódování UTF-8)
konsp_w.iso, konsp_uniw.iso (kódování CP-1250)

-         ALEPH sekvenční formát:
konsp.dat, konsp_uni.dat (kódování UTF-8)
konsp_w.dat, konsp_uniw.dat (kódování CP-1250)

Změny v záznamech konspektu budou oznamovány v rámci informací věcných autorit.

Kontakt pro otázky spojené se soubory vystavovanými na ftp: Radovan Zahořík

« listopad 2024 »
Ne Po Út St Čt So
12
3456789
10111213141516
17181920212223
24252627282930