Diakritiske tegn, spesialtegn og ikke-latinsk skrift

2022-03-31

Registering av diakritiske tegn, spesialtegn og ikke-latinsk skrift 

Det finnes flere metoder for å taste inn tegn fra ikke-latinske alfabeter i Alma. Diakritiske tegn registreres direkte fra tastaturet når det er mulig. I noen tilfeller trenger man eget tastatur. Ved transkribering må mange bokstaver gjengis med spesialtegn, men fordi spesialtegnene ikke inngår i nasjonal rettskriving, finnes ikke alle nødvendige tegn på et samlet tastatur. Dette gjelder f.eks. tegnene: macron  ˉ  caron  ˇ  breve  ˘  cedille  ̧  ogonek  ˛ dobbel akutt aksent  ̋. Metoder for å skrive spesialtegn og tekst på andre språk: 

For Windows: 

  • Endre språkinnstilling på fysisk tastatur og ev. bruk skjermtastatur (On-screen keyboard). Fremgangsmåte avhenger av Windows-versjon.  
  • En del spesialtegn har hurtigtaster, f.eks. for å skrive «©», tast «Alt+0169». Appen «Tegnkart» i Windows gir oversikt over tegnene og hvilke som har hurtigtaster. Bruk fonttypen Arial. OBS. Hvis man bruker Alt + number Tab navigation i Metadata Editor (innført i februar 2023), vil ikke disse tastekombinasjonene virke. Man må altså velge om man vil bruke Tab navigation eller bruke hurtigtastene for å skrive spesialtegn. For å slå av Tab navigation: Gå til UI preferences – Shortcuts customization og skru av Alt + number Tab navigation. Logg ut og inn igjen for at endringene skal vises.
  • Man kan også trykke på windows-logoen på tastaturet + punktum. Da får man opp et vindu med symboler og spesialtegn som man kan velge fra.
  • Unicode Input 2.1 CRX er en nettleserutvidelse for Chrome som tillater direkte inntasting av Unicode-koder i Alma. Når utvidelsen er installert kan man f.eks. taste inn «00a9» i Alma, klikke «Insert» for tegnet «©». 

For Mac: 

  • For spesialtegn legg til tastaturet Unicode Hex Input. Dette gjør det mulig å bruke hurtigtaster for å skrive inn Unicode-symboler ved å holde alt-tasten nede og skrive den firesifrede Unicode-koden. Eks.: alt+0104 = Ą (Stor A med ogonek). 

Aktuelle nettsteder for transkribering: 

MARC21-felt 880 – opplysninger med alternativ skrift 

880-feltet brukes til opplysninger med alternativ skrift i Alma. (Editing actions -> Add Alternate Graphic Representation). I den bibliografiske posten er det 245, 246, 250, 264 og 800/810/830 som skal registreres med 880. Opplysninger i 1XX-felt bør fortrinnsvis hentes fra autoritetsregisteret BARE.

Registrering av dokumenter med andre skriftsystemer i Alma 

Dokumenter med andre skriftsystemer registreres som tidligere i transkribert form. I følge RDA kreves det ikke skarpe klammer rundt transkripsjonene (RDA 1.4). Det er feltene 245, 246, 250, 264 (unntak hvis utgivelsessted er hentet utenfor dokumentet) og 800/810/830 som skal registreres i transkribert form. Øvrige metadata registreres på norsk.

Originalskrift i notetekst kommet fra import

For å kunne beholde innholdsnoter og noter med sammendrag med originalskrift uten å måtte translitterere hele teksten, er disse to løsningene tillatt i konsortiet:

1)  Noteteksten registreres med ønsket skrift i et 880-felt med de indikatorene og delfelt som må til for å koble 880-feltet til korrekt marcfelt i posten. (Se https://www.loc.gov/marc/bibliographic/bd880.html og https://www.loc.gov/marc/bibliographic/ecbdcntf.html)

Eksempel på innholdsnote på japansk: 880 0 # $$6 505-00 / $1 $$a <notetekst om innhold>
Eksempel på sammendrag på japansk: 880 ## $$6 520-00 / $1 $$a <notetekst om sammendrag>

2)  Noteteksten kan registreres med ønsket skrift direkte i et det aktuelle marcfeltet (505/520) uten bruk av 880. Ulempen med dette er at det blir færre metadata som kan si noe om hvilket skriftsystem det er snakk om, men det er en enklere løsning for katalogisatorer som ikke er godt kjent med registrering av alternative skriftsystemer i Alma.

Originalskrift i BARE-poster 

Ved behov kan det også registreres originalskrift i autoritetsposter. Navneformen registreres da som se-henvisning i et 4xx-felt. Vi bruker ikke 880-felt i autoritetsposter. 

Eksempel: 

100 1# $$a Murakami, Haruki 

400 1# $$a 村上春樹 

Transkribering 

De bibliografiske opplysningene transkriberes etter gjeldende regler.  BIBSYS-konsortiet benytter i hovedsak de samme transkripsjonene som Library of Congress. Tekstene finnes fritt tilgjengelig på internett og gjengir tabeller fra 1997-utgaven av ALA-LC, Romanization Tables: Transliteration Schemes for Non-Roman Scripts, godkjent av Library of Congress og American Library Association. 

Arabisk: LC
Armensk: LC
Georgisk: LC
Gresk: LC
Hebraisk: LC
Japansk: LC
Kinesisk: Pinyin
Koreansk: LC
Persisk: LC 

Kyrillisk 

BIBSYS-konsortiet følger ISO-R9/, 2. utg. 1968 for kyrillisk. 

Transkribering for russisk tilsvarer tabell 1 i ISO-R9, og transkribering for de andre slaviske språkene tilsvarer tabell 2 i standarden. 

Transkribering i konsortiet opererer med enkelte unntak fra standarden. 

Transkriberingen og unntakene er oppsummert og unntakene merket i denne tabellen: https://www.ub.uio.no/bibliotekene/uhs/uhs/samlinger/transkribering/transkr-kyrillisk.html 

Kinesisk 

BIBSYS har valgt å bruke pinyin. Hvis translitterering til pinyin ikke kan verifiseres (spesielt bøker utgitt før 1979), brukes den navneformen som står i boka. For forfattere fra Hong Kong/Taiwan brukes Wade-Giles, når det er foretrukket form fra forfatterens side. (Disse forfatterne vil også være søkbare ved bruk av pinyin.) 

Når det gjelder inndeling av stavelser, har vi imidlertid en litt annen praksis enn LC. Hos oss er ikke utgangspunktet at det er mellomrom mellom hvert tegn, dvs. hver stavelse (som ALA-LC), men at stavelser som naturlig hører sammen (i ett ord) settes sammen uten mellomrom. 

MERK!  LC brukte tidligere Wade/Giles, men gikk over til pinyin i 2000. 

Gresk  

LCs transkripsjonstabell brukes for det greske alfabet. Det gjøres imidlertid oppmerksom på at LC kan ha avvikende praksis for personnavn som innførsel. 

Koreansk 

Til transkribering av koreansk benyttes systemet McCune–Reischauer (se tabellen fra LC), men i realiteten transkriberes koreanske navn på svært mange ulike måter, bl.a benyttes Revised Romanization of Korean, Sør-Koreas offisielle transkripsjonssystem. Alle varianter bør registreres for at brukerne skal få treff. 

Parallellregistrering av opplysninger i originalskrift (Kyrillisk, Gresk, Hebraisk, Arabisk, Kinesisk,) 

De MARC-feltene som inneholder data i transkribert form, bør suppleres med opplysningene i originalskrift. Dette gjøres på følgende måte i Alma: 

Plasser markøren i det feltet som skal suppleres 

Editing actions -> Add Alternate Graphic Representation -> [velg korrekt skriftsystem] 

Dette oppretter en ny linje som er en kopi av linjen over og som inneholder en usynlig MARC-kode. Denne MARC-koden består av 880 etterfulgt av et lenkefelt ($6) med informasjon om hvilket MARC-felt 880-feltet er en alternativ representasjon av, og hvilket skriftsystem som er brukt. 

Fyll inn opplysningene med originalskrift. 

Hvis navn i 1XX-felt ikke finnes i autoritetsregisteret i form av se-henvisning eller parallellregistrering (880), må også disse suppleres med 880-felt med navn i originalskrift.