Skráning efnis á Internetinu. Hlutverk bókavarða?






Erindi flutt á Landsfundi BVFÍ í Munaðarnesi 20.-21. september 1996


Internetinu hefur á einum stað verið líkt við risastórt illa skipulagt bókasafn, þar sem skráin hefur verið eyðilögð, og titilblöð og efnisyfirlit verið rifin úr flestum bókunum.


Framleiðsla og notkun upplýsinga hefur margfaldast með tilkomu þessa risastóra upplýsingasafns. Fræðimenn og skólanemendur leita nú jafnt eftir heimildum á hvers konar rafrænum miðlum og í bókum. Einkum hefur þó heimur upplýsinganna opnast fyrir því fólki sem áður sá ekki mikla þörf fyrir þær.


Bókasafns- og upplýsingafræðingar um allan heim hafa spurt sig hvernig þeir gætu öðlast vald yfir þessu mikla upplýsingamagni, flokkað það, skráð og metið og varðveitt fyrir komandi kynslóðir. Ekki verður séð að aðrar stéttir manna hafi menntun eða reynslu til að taka á þessu verkefni af einhverju viti og ábyrgð okkar er því mikil.


Þegar rætt er um skráningu efnis á Internetinu verðum við að byrja á að gera okkur grein fyrir í hvaða tilgangi þetta efni er sett fram, tækninni á bak við birtingu þess og hverjir standa að henni.


Efni á rafrænu formi má skipta í tvo flokka eftir því hvort það er stöðugt eða breytilegt.


Hið fyrrnefnda, þ.e. hið stöðuga, er geymt á geisladiskum eða öðrum diskum eða böndum. Þetta efni ætti ekki að vera erfitt að skrá fremur en annað efni í hlutbundnu formi.


Hið síðarnefnda, hið breytilega, og það sem hér um ræðir, er erfiðara að höndla. Þetta er ýmiss konar efni, sem hægt er að nálgast og fá sent í gegnum tölvuna. Það geta verið gögn sem geymd eru á svonefndum f.t.p. miðlum eða öðrum tölvum, tölvuráðstefnur og net um ákveðið efni, gagnabankar, rafræn tímarit og efni á heimasíðum eða góferum á veraldarvefnum. Efnið getur verið stöðugt í ákveðinn tíma en er síðan breytt eða fjarlægt. Með nýjustu útgáfum af skipanamálum eins og t. d. Java eða HTML er mögulegt að notandinn geti sjálfur breytt efninu eða aukið við, efnið verður m.ö.o. gagnvirkt. Erfiðleikum getur valdið að sama skjalið er stundum til í margskonar formi.


Það sem einkennir þetta efni er sem sagt óstöðugleiki. Það er ekki hægt að taka ákveðið plagg og setja á ákveðinn stað þar sem það geymist óendanlega lengi og finnst þar ef á þarf að halda. Skjölin eða upplýsingarnar liggja dreifðar í tölvum út um allt land eða allan heim, engar reglur eru um það hvenær þær breytast eða hverfa. Birtingarleiðirnar eru líka oft aðrar en á hefðbundum safngögnum. Mikið af efninu er sett fram af einstaklingum eða af fyrirtækjum í auglýsinga- eða gróðaskini. Annað er sett fram í menntunar- eða upplýsingatilgangi og er stundum háð lögum um höfundarrétt. Eftir því sem útgefendum vex fiskur um hrygg á þessum nýja markaði eykst hættan á því að val þess sem birt er, fari eftir því á hverju útgefendur geta grætt.


Þessar staðreyndir krefjast nýrrar hugsunar – það er sjaldnast hægt að beita hefðbundnum aðferðum við skráningu efnisins og varðveislu. ( nema við ætlum að reyna að prenta það allt út). Sennilega verðum við að sætta okkur við það að við getum aldrei náð fullkominni bókfræðilegri stjórn á þessu óstöðuga efni.


Við þurfum því líka að spyrja okkur sjálf hvort þörf sé á að skrá allt eða hvort við þurfum yfirleitt að vera að skipta okkur af þessu. En ef við teljum að svo sé, hvernig getum við þá nýtt þekkingu okkar og komið henni á framfæri.


Við gætum t.d. reynt að gera okkur í hugarlund hvaða áhrif það muni hafa á bókmenntarannsóknir hér á landi í framtíðinni ef ekki er nokkur leið að nálgast frumritsmíðar tilvonandi stórskálda, sem eitt sinn birtust á veraldarvefnum. Einnig er hægt að velta því fyrir sér hvort bókmenntafræðingar framtíðarinnar muni kunna okkur nokkrar þakkir fyrir að geyma hvaða leirburð sem er, þó hann hafi einhvern tíma birst á sama stað.


Við getum líka reynt að setja okkur í spor fræðimanna framtíðarinnar sem eru að setja fram vísindalega tilgátu en vita ekki að það var búið að því fyrir 20 árum á netinu. Enginn hafði þá hugsun á að geyma heimildirnar eða a.m.k. veit enginn hvar þær eru geymdar eða voru einu sinni geymdar. Reyndar má líka velta því fyrir sér hvort það efni sem á annað borð hefur varðveislugildi verði ekki áfram birt á einhverjum stöðugum miðlum eins og pappír eða geisladiskum.


Eins og áður sagði er efni á Internetinu birt í ákaflega misjöfnum tilgangi. Bókasafnsfræðingar hallast nú æ meir að því að það sé mögulegt og æskilegt að velja úr því, það sem nauðsynlegt er að skrá.


Ef við komumst að þeirri niðurstöðu að einnig hér á landi þurfi að velja úr þessu efni, og að einhverjum beri skylda til að flokka það, skrá og jafnvel varðveita eitthvað af því, hver á þá að sjá um það. Varla eru það einhverjar leitarvélar út í heimi þar sem fáir kunna íslensku.


En hvaða aðferðir nota menn nú einkum til að fá aðgang að efni á Internetinu. Skipulega nálgun efnis á Internetinu má skipta annarsvegar í leit þar sem notast er við netleitarvélar og hinsvegar í leit í tölvukerfum bókasafna, netsafna eða -gagnagrunna, en hún byggir á skráningu sem er hliðstæð hefðbundinni skráningu efnis á bókasöfnum, þótt nota þurfi annað skráningarform a.m.k. að nokkru leiti.


Netleitarvélarnar eða kerfin eru nota ýmist einfalda orðaleit eða fyrirfram efnisflokkuð leitarkerfi eða blöndu af hvoru tveggja. Þessi mismunandi kerfi þurfa bókaverðir að þekkja og kunna að beita mismunandi aðferðum við leit. Það þarf að læra á hverja leitarvél fyrir sig, því það er mismunandi hvernig þær vinna.


Stór bókasöfnin úti í heimi eru í auknum mæli að koma efni af Internetinu inn í sínar eigin tölvuskrár og og farið er að gera ráð fyrir því í nýjum útgáfum tölvukerfa fyrir bókasöfn.


Aflmiklar leitarvélar eins og Lycos, Yahoo eða Alta Vista leita sjálfkrafa á netinu og finna efni eftir leitarorðum. Notandi skrifar inn orð, eitt eða fleiri og vélin finnur efnið og raðar því í forgangsröð eftir því hve orðið eða orðin koma oft fyrir í fyrirsögn eða hluta texta. Þess konar leit gefur oft góða raun til að finna út hvað mikið er til um ákveðið efni. Hins vegar geta svör við fyrirspurnum orðið ákaflega yfirgripsmikil og tilviljanakennt hvaða svör fást eftir því hvernig spurt er. Fundvísi leitarvélanna fer líka mjög eftir því hvernig skjölin eru ofin, þ.e. vefarinn þarf að vera meðvitaður um hvaða upplýsingar er nauðsynlegt að skrá inn til þess að vefur hans finnist auðveldlega. Það má líkja þessu við það þegar skráningarfærsla er birt á baktitilsíðu rits sem síðan er skráð á bókasafni á faglegan hátt. Munurinn er sá að hér er það höfundur síðu eða vefs sem býr til færsluna og sjálfvirkar vélar sem þefa hana uppi.


Þessar sjálfvirku vélar eru nauðsynlegar vegna þess hve hér er um mikið magn efnis að ræða og er vafasamt að mannshöndin geti nokkurn tíma komið í stað þeirra. Hægt er að finna íslenskt efni með hjálp þessara stóru erlendu leitarvéla, ef það er í leitarhæfu ástandi.


Þegar um er að ræða efnisflokkuð kerfi er búið að flokka upplýsingarnar fyrirfram og menn geta leitað eftir efnisorðum eða rennt í gegnum ákveðna efnisflokka. Stundum er þar um að ræða valið efni. Einnig getur verið mismunandi hvort allar tegundir efnis eru teknar með eða bara ein eða tvær ákveðnar tegundir.


Það er líka mismunandi hve yfirgripsmikil kerfin eru og hve mikið og hvaða efni þau ná yfir. Annaðhvort er gert ráð fyrir að fólk skrái efnið sjálft og getur það þá verið tilviljanakennt hvað kemst inn eða val efnis fer fram af starfsfólki þjónustufyrirtækis eða stofnunar.


Sem dæmi um leitartæki fyrir ákveðnar gerðir efnis má nefna Archie sem leitar í FTP þjónum og Veronicu sem leitar í Góferum.


Við uppbyggingu efnisflokkaðra leitarkerfa getur kunnátta bókasafnsfræðinga komið að miklu gagni. Hjá stórum metnaðarfullum netleitarfyrirtækjum erlendis eru þegar margir bókasafnsfræðingar við störf. Mikil þörf er á að samræma þessi kerfi og koma á ákveðinni stöðlun við skráningu upplýsinganna.


Hér á landi eru það einkum INTIS og seljendur Internettenginga til einstaklinga, ásamt Íslenska menntanetinu og Reiknisstofnun Háskólans sem hafa reynt að bjóða upp á einhverskonar flokkun á efni, íslensku og erlendu, ásamt aðgangi að erlendum leitarvélum. Auk þess er eitt fyrirtæki, Íslenska síðusafnið sem býður upp á leit í íslenskum heimasíðum sem hafa verið skráðar þar.


INTIS (Internet á Íslandi) sem rekur ISnet, þ.e. íslenska hluta netsins hefur þar til nýlega verið eini aðilinn sem hefur getað veitt grunnaðgang að Internetinu en Póstur og sími fór nýlega út á sömu braut. Um 150 fyrirtæki og stofnanir eru nú tengd Isnet. 18 fyrirtæki endurselja svo einstaklingum aðgang að Internetinu.


Ef skoðuð er efnisflokkun þessara 18 fyrirtækja sem selja Internettengingar, (T.d. Centrum, Miðheimar, Skima, o.s.frv.) kemur í ljós að hún er ákaflega mismunandi og tilviljanakennt hvað þar er tekið með, fer sjálfsagt mest eftir því hverjir viðskiptavinirnir eru. Flokkun íslenska menntanetsins er heldur ekki sérlega ítarleg og er gert ráð fyrir að a.m.k. stofnanir skrái sínar síður sjálfar til þess að vera teknar með. Reiknistofnun H.Í. miðar sitt val og flokkun mest við skólann sjálfan og er ákaflega takmörkuð.


Bókasöfn, stofnanir og aðrir aðilar hér á landi hafa svo auðvitað sett upp hvers konar tengla á síðum sínum, sem í sumum tilfellum mætti kalla efnisflokkuð kerfi. Nokkur íslensk bókasöfn hafa sem kunnugt er sett upp heimasíður sem yfirleitt miðast við safnategund, þar sem boðið er upp á tengla í ýmsar áttir og virðast gæði þeirra fara mest eftir því hvort þar er einhver klár bókavörður sem gerir þetta af hugsjón. Mér vitanlega er engin ákveðin stefna eða samvinna milli bókasafnanna í þessu efni. Ég veit ekki til þess að hérlend bókasöfn hafi leitast við að skrá efni af Netinu í tölvukerfi sín.


Allt er þetta nú ákaflega ruglingslegt og mjög erfitt að treysta á einhverja ákveðna leitarþjónustu eða fyrirtæki þegar leitað er að íslensku efni. Það virðist því mikil þörf á því að einhver aðili, t.d. Landsbókasafn eða Menntanetið geri skipulega úttekt á þessum málum og komi upp almennilegu efnisflokkuðu leitarkerfi yfir íslenskt efni og skráningu, þar sem allt sem er einhvers virði er tekið með án tillits til þess hvort framleiðendur þess hafa vit á að skrá það sjálfir eða ekki.


Okkur ætti ekki að skorta upplýsingar eða leiðbeiningar til að takast á við þau verkefni sem við okkur blasa í ringulreiðinni á Netinu. Ýmsar nefndir eru starfandi á Norrænum-, Evrópskum- , Amerískum- eða alþjóðlegum vettvangi til að fjalla um þessi mál og mun ég hér telja upp nokkur verkefni og aðila. (nánari upplýsingar má finna á Internetinu.


Í Evrópu hefur CoBRA, sem er samstarfshópur nokkurra þjóðbókasafna m.a. stuðlað að umræðum útgefenda og þjóðbókasafna um skylduskil á rafrænum gögnum. Einnig má þar nefna GEDI eða Group on Electronic Document Interchange.


DESIRE er einnig verkefni á Evrópuvettvangi, þar sem unnið er að því að bæta aðgang að og skráningu efnis á Internetinu. Það er innan Telematics for research, hófst í janúar 1996 og í því taka þátt 22 aðilar frá 8 löndum.


Á Norðurlöndum má nefna að Nordic Net Center er starfrækt á vegum NordInfo og þar má finna Nordic Web Index sem enn er á tilraunastigi.


Hjá Danmarks Biblioteks Center, er nú unnið að tilraunaverkefni, þar sem stefnt er að því að ná bókfræðilegri stjórn á „den nationale produktion af dynamiske elektroniske elementer.“, þ.e. óstöðugum eða hreifanlegum rafrænum gögnum.


Við háskólan í Lundi hefur Lund University Electronic Library gert athyglisverða tilraun til að koma upp rafrænni upplýsingamiðstöð. Fleiri slíkar miðstöðvar eru víða um lönd t.d. í Bretlandi.


Í Bandaríkjunum hefur The Commission on Preservation and Access og The Research Libraries Group gefið út skýrslu um tæknileg vandamál við skráningu rafrænna upplýsinga.


American Library Association gaf út árið 1994 The Guidelines for Bibliograhic Description of Interactive Multimedia.


Alls konar stöðlunarvinna fer fram sem snertir skráningu efnis á netinu beint eða óbeint. Unnið er að endurskoðun á alþjóðlega staðlinum ISBD (CF) og margar þjóðir eru að endurskoða MARCsnið sín með tilliti til þessa efnis. Þegar það hefur verið gert opnast leið til að skrá þetta efni inn í bókasafnakerfin á réttan hátt. Í USMARC staðalinn hefur verið bætt inn sérstöku sviði, 856 sem heitir „Electronic location and access“. Í nokkur bókasafnskerfi hefur verið sett inn notendasvið fyrir þetta 856 svið, Þannig að notandi getur valið hvort hann vill sjá skjalið sjálft og kerfið lætur þá Netskoðara leita að því og birta. Þessi þáttur mun t.d. verða í næstu útgáfu Libertas kerfisins sem Gegnir notar og þar með hluti af okkar skráningarstaðli. Við þurfum þá líklega að hafa tilbúnar reglur á íslensku til að fara eftir við skráninguna.


AACR2 skráningarreglurnar frá 1988 innihalda leiðbeiningar sem má yfirfæra á þetta efni (kafli 9) og er þörf á að endurskoða þann kafla.


Skráningarfærslan þarf m.a. að innihalda tilvísun til staðsetningar efnisins eða URL (Uniform Resource Locator). Þar sem líftími URLsins er oft stuttur er nú verið að þróa svokallað URN (Uniform Resource Name) sem vinnur líkt og ISBN.


OCLC hefur unnið að myndun gagnabanka yfir efni á netinu sem fjölmörg bókasöfn taka þátt í og senda inn efni. Í hinum nýja Netfirst gagnagrunni fer fram strangt gæðamat á heimildum og skráningarfærslur innihalda fullkomna bókfræðilega lýsingu, efnisorð og flokkstölur og jafnvel efnisúrdrætti. Hjá þeim hefir verið gefin út skýrslan „Building a catalogue of Internet Resources“, þar sem sett er fram ákveðið form skráningarfærslu sem kallast „The Dublin Core“ sem vakið hefur verðskuldaða athygli. Í færslunni eru 13 svið: Efni, titill, höfundur, útgefandi, aðrir ábyrgðaraðilar, dagsetning, tegund efnis, form, einkenni (identifier), tengsl, heimild, tungumál, staðsetning og ending (coverage). Hægt er einnig að vefa upplýsingarnar sem fram eiga að koma í Dublinarfærslunni inn í höfðuð HTML skjala, í svokallaða „metadata“ skipun til þess að leitarvélar eigi auðveldara með að finna skjölin. SGML og HTML staðlarnir fela einnig í sér ákveðna stöðlun við gerð netskjala sem eiga að nýtast við leit og skráningu ef rétt er farið að.


Margar þjóðir eru nú að endurskoða lög um skylduskil til að reyna að ná tökum á þessu óstöðuga efni. Þetta er ekki farið að ræða hér af neinni alvöru svo mér sé kunnugt um. Í sumarskóla NVBF hér í Reykjavík í júní voru kynnt drög að nýjum lögum Dana um skylduskil. Þar er m.a. fjallað um útgáfu efnis á netinu. Þar segir m.a. (í lauslegri þýðingu minni): „Útgáfa telst Það einnig að tilkynnt sé almenningi að verk sé framleitt og því dreift eftir pöntun, eða að það sé aðgengilegt í gagnabönkum, þar sem notandi getur sótt sér eintak.“


Einnig segir þar að við útgáfu verks í gagnabanka skuli tilkynna það skylduskilasafni og gefa upplýsingar um aðgang að því. Afhendingarskyldan er uppfyllt með því að veita þessar upplýsingar.


Eins og hér hefur komið fram er víða unnið að því að ná bókfræðilegri stjórn á rafrænum upplýsingum og mikið hefur verið skrifað um þessi mál. Ég tel að hér á landi hafi ekki nægilega verið rætt og ritað um þetta efni.


Íslenskir bókaverðir bera vissa ábyrgð á að almenningi, þar með nemendum og fræðimönnum hér á landi sé veittur góður aðgangur að íslenskum upplýsingum á netinu og að þær eða a.m.k. skráning á völdum upplýsingum sé varðveitt fyrir komandi kynslóðir. Við getum nýtt þekkingu okkar á margan hátt. t.d. með því að reyna að skipuleggja val og flokkun á efninu og að stuðla að því að beitt sé alþjóðlegum stöðlum og reglum við skráningu þess. Við þurfum einnig að beita okkur fyrir endurskoðun á lögum um skylduskil.


Mín skoðun er sú að við þurfum nú þegar að stofna til samvinnu milli bókasafna- og jafnvel stofnana og fyrirtækja um skráningu valins efnis á Internetinu. Ég tel að stærstu bókasöfnin gætu haft frumkvæði að slíkri samvinnu og fengið með sér t.d. fulltrúa frá Íslenska Menntanetinu og Reiknistofnun H.Í. Sem dæmi um hugsanlega samvinnu sem bókasöfnin hér á landi gætu tekið sér til fyrirmyndar, má nefna The Finnish Virtual Library Project sem nokkur Háskólabókasöfn í Finnlandi taka þátt í. Markmið þess er að bæta og auka notkun upplýsinga á Netinu, sérstaklega tengt æðri menntun. Söfnin setja t.d. upp skilyrði um efnisval, skrá um leitarvélar, þróa skráningu efnis, notendaviðmót, o.fl. Söfn á hinum ýmsu efnissviðum bjóða upp á aðgang að efni hvert á sínu efnissviði, bæði fullum texta (greinum o.þ.h.) og tilvísanir. Mörg söfn hér á landi hafa nú þegar vísi að netsöfnum á heimasíðum sínum og gætu áreiðanlega byrjað á að samræma þessar upplýsingar.


Við, íslenskir bókasafns- og upplýsingarfræðingar verðum sjálf að taka málin í eigin hendur og fá yfirvöld á sveif með okkur. Þörf er á að sameina kraftana og hefjast strax handa, til þess að dragast ekki afturúr.
Ólöf Benediktsdóttir



Helstu heimildir:


Ardö, Anders o.fl.: Improving resource discovery and retrieval on the Internet. Nordinfo nytt 1994, 4: 13-24.


Burkard, Jakob: Alverdens bibliotekskataloger. Bibliotekskataloger på Internettet taber til søgemaskiner og digital information. DF. Revy 18(1996), temanummer: 286-289.


Clausen, Helge: Internet og forskningsbibliotekerne – et projekt. DF.Revy 19(1996), 3: 69-72.


CoBRa. Computerised Bibliographic Record Actions. Factsheet. Heimasíða.


Forslag til Lov om pligtaflevering af udgivne værker til offentlige biblioteker. [Óútgefið ljósrit?].


Hakala, Juha: Scholarly electronic publishing and libraries. DF. Revy 18(1996), temanummer: 278-285.


Heikkinen, Risto Vesa: Finnish Virtual Library Project. Bréf af póstlista NordElib- [email protected]


Heimbürger, Anneli: Towards network publishing: Highlights from the third International World Wide Web conference. Nordinfo nytt 1995, 1-2: 20-27


Hjerpe, Roland: Muddling through flux, challenges and charge for libraries and archives. Nordinfo nytt 1995, 4: 23-29.


Holt, Paul: På vej mod det nationale elektroniske bibliotek. DF. Revy 19(1996), 3: 51- 54.


ISnet – Internet á Íslandi. Heimasíða.


Koch, Traugott: Improving resource discovery and retrieval: existing approaches and the EU project DESIRE. 1996. URL: http://www.ub2.lu.se/tk/demos/BFD9602– en.html


Lindow, Susanne: Elektroniske tidsskrifter. Referat fra Temadag om elektroniske tidsskrifter… DF. Revy 19(1996), 3: 55-58.


Miller, Paul: Metadata for the masses. Paul Miller describes Dublin Core and means by which it can be implemented. http://www.ukoln.ac.uk/ariadne/issue5/dublin.html


Munson, Kurt I.: World Wide Web indexes and hierarchical lists. Finding tools for the Internet. Computers in Libraries. June 1996: 54-57.


Skogmark, Göran: Elektroniska dokumentleveranser och elektronisk publicering. DF. Revy 18(1996), temanummer: 290-295.


Tomaiuolo, Nicholas G. and Joan G. Packer: An analysis of Internet search engines. Assessment of over 200 search queries. Computers in Libraries. June 1996: 58-62.