Päivitetty viimeksi 19.7.2019.

Yleistä tietoa

Library of Congress julkaisee päivitetyt versiot MARC 21 -yhtenäisformaateista kaksi kertaa vuodessa (keväällä ja syksyllä). Edelliseen versioon tehdyt muutokset on merkitty niissä punaisella värillä. Bibliografisten, auktoriteetti- ja varastotietojenlisäksi MARC 21 -yhtenäisformaatteihin kuuluvat myös MARC 21 Format for Classification Data ja MARC 21 Format for Community Information, joita ei ole käännetty suomeksi.

Tietueen rakenne

Formaatin avulla tallennetut MARC-tietueet ovat siirrettävissä järjestelmästä toiseen ISO 2709 -standardin mukaisina. Tietueen rakenne koostuu nimiöstä, hakemistosta ja kentistä.

Nimiö on 24 merkin pituinen kiinteä kenttä, joka on ensimmäisenä kaikissa MARC-tietueissa. Nimiö sisältää koodi- ja numeromuotoista tietoa, jota tarvitaan tietueen käsittelyssä.

Hakemisto muodostuu 12 merkin mittaisista jaksoista, jotka kuvaavat kunkin tietueessa esiintyvän kentän tietoja: kenttäkoodi (3 merkkiä), kentän pituus (4 merkkiä) ja kentän aloituskohta (5 merkkiä). Hakemisto päättyy kentän loppumerkkiin (ASCII 1E hex).

Kentät tunnistaa kolminumeroisesta kenttäkoodista. Jokainen kenttä päättyy kentän loppumerkkiin (ASCII 1E hex). MARC-tietue päättyy tietueen loppumerkkiin (ASCII 1D hex). Kenttiä on kahta laatua:

Kiinteämittaiset kentät, joiden kenttäkoodi on muotoa 00X. Näissä kentissä ei ole indikaattoreita eikä osakenttäkoodeja. Numero- ja koodimuotoisten tietoelementtien merkitys määräytyy niiden merkkipaikan perusteella.

Vaihtuvamittaiset kentät, joiden kenttäkoodit vaihtelevat välillä 01X-8XX. Näissä kentissä käytetään indikaattoreita ja osakenttäkoodeja:

Indikaattorit merkitään kentän kahteen ensimmäiseen merkkipaikkaan ja niiden avulla voidaan tulkita tai täydentää kentän muita tietoja. Tyhjämerkkiä (ASCII 20 hex), jota kuvataan tässä dokumentissa risuaitamerkillä (#), käytetään määrittelemättömän indikaattorin paikalla. Joissakin tapauksissa tyhjämerkillä on oma merkitys.

Osakenttäkoodit ovat kaksi merkkiä, jotka edeltävät jokaista kentän erikseen käsiteltävää tietoelementtiä. Osakenttäkoodi koostuu erotinmerkistä (ASCII 1F hex), jota kuvataan tässä dokumentissa kaksoisristillä (‡), ja tietoelementin tunnuksesta, jotka ovat pienaakkosia tai numeroita. Jokaisen kentän osakenttäkoodit on määritelty toisistaan riippumattomasti, vaikka myös yhtenäisyyttä niiden kesken esiintyy. Osakenttien järjestys määräytyy luettelointisääntöjen mukaan.

Joidenkin koodattujen dataelementtien (nimiö, 007 ja 008) sisältö määritellään formaatissa, mutta muiden tietoelementtien sisältö määräytyy yleensä muiden standardien, kuten luettelointisääntöjen, mukaan.

Useat kirjoitusjärjestelmät

MARC 21 -tietue voi sisältää tietoja usealla eri kirjoitusjärjestelmällä. Yhtä kirjoitusjärjestelmää voidaan pitää ensisijaisena, vaikka sisältöjä olisi kuvattu muillakin kirjoitusjärjestelmillä. Huom. tietueen rakenteellisissa elementeissä ja koodimuotoisissa tiedoissa käytetään ASCII-merkkejä.

Kenttien ja osakenttien toistettavuus

Teoriassa kaikki kentät ja osakentät ovat toistettavia. Tietojen luonne kuitenkin usein estää toistamisen. Tietueessa voi olla esimerkiksi vain yksi 1XX-kenttä; bibliografinen kenttä 100 voi sisältää vain yhden osakentän ‡a (Henkilönnimi), mutta voi sisältää useamman osakentän ‡c (Muut nimeen tehtävät lisäykset). Kenttien ja osakenttien toistettavuus ja ei-toistettavuus on merkitty formaatteihin merkinnöillä (T) ja (ET).

Kenttien ja osakenttien pakollisuus

Kooditietojen, kenttien, indikaattoreiden ja osakenttien pakollisuus määräytyy suomalaisten luettelointisääntöjen mukaan. Niissä määritellään kuvailun vähimmäistason, välitason ja kansallisbibliografiatason elementit. Luettelointisääntöjen mukaiset eri tasojen pakollisuudet pyritään merkitsemään tähän formaattiin tulevaisuudessa tavalla tai toisella.

Osakenttien tallennusjärjestys

Vaihtuvamittaisissa kentissä osakenttien tallennusjärjestys määräytyy suomalaisten luettelointisääntöjen mukaan. Osakentät selityksineen on listattu kunkin kentän kohdalla aakkosjärjestyksessä, mutta esimerkeissä näkyy niiden luettelointisääntöjen mukainen tallennusjärjestys, joka ei aina ole aakkosjärjestys.

Välimerkitys

MARC 21 -formaatissa tietoelementtien (osakenttien) väliset välimerkit tallennetaan yleensä tietueeseen. Joissakin tapauksissa välimerkitys voidaan tuottaa automaattisesti myös kirjastojärjestelmän avulla, ks. kohta Vakionäytöt. Välimerkitys määräytyy suomalaisten luettelointisääntöjen mukaan, joiden mukaan suomenkielisen MARC 21 -formaatin esimerkit on pääosin laadittu.

Täyttömerkki ja muut siihen liittyvät arvot

Täyttömerkkiä (ASCII 7C hex), jota kuvataan tässä dokumentissa putkimerkillä (|), voidaan käyttää kun formaatti vaatii jotakin koodia käytettäväksi mutta luetteloija haluaa olla tallentamatta mitään koodia. Täyttömerkkiä ei kuitenkaan saa käyttää missään nimiön merkkipaikassa, kenttäkoodeissa, indikaattoreissa tai osakenttäkoodeissa.

Koodia u (tuntematon tai määrittelemätön) käytetään kun luetteloija haluaa täyttää koodin, mutta ei pysty määrittelemään, mikä on sopiva koodi.

Koodia n (soveltumaton) käytetään kun kaikki muut ko. merkkipaikan koodit ovat soveltumattomia kyseiseen kohteeseen tai tietueeseen.

Vakionäytöt

Vakionäyttö on tietojen ymmärrettävyyttä parantamaan lisätty termi, fraasi ja/tai välimerkitys, joka voidaan tuottaa kirjastojärjestelmän avulla. Vakionäyttöteksti ei sisälly tietueeseen, vaan se tuotetaan kenttäkoodin, indikaattorin, osakenttäkoodin tai koodimuotoisen dataelementin perusteella. Ehdotuksia vakionäyttöteksteistä sisältyy jokaiseen MARC 21 -formaattiin, mutta niiden käytöstä päättää jokainen organisaatio ja järjestelmä erikseen.

Typografiset käytännöt

MARC 21 -yhtenäisformaatissa noudatetaan seuraavia typografisia käytäntöjä:

Sivun alkuun