Berigelse af fysisk post

Indledning

Det er muligt at uploade digitaliseringer til Alma og få dem vist i Primo (og Alma). Hvis det er digitale tekstdokumenter, kan de også gøres fuldtekstsøgbare. Selve digitaliseringen foregår ikke i Alma, og kvaliteten af fuldtekstindekseringen afhænger fuldt ud af, hvor godt teksten kan trækkes ud af den digitale fil (også det foregår udenfor Alma). Denne vejledning viser et eksempel på hvordan man går frem, med en use case med en PDF-fil, der er en registrant over et arkiv..


Vejledning trin-for-trin

Det skal du bruge:

  • En digital tekstfil som PDF.
  • En enkel tekst-editor (fx Notepad, Notepad++, Textpad, el.lign.)
  • Alma-rollen "Digital Inventory Operator"  og "Collection Inventory Operator". Det er din afdelingsleder, der afgør om og har ansvaret for at du har denne rolle. Rent praktisk skal du kontakte din /wiki/spaces/ALMAWIKI/pages/5641316.
  • En idé om hvilken Collection / Sub-collection, din fil hører til i.  Dette er en mappestruktur for digitale poster; mere om dette nedenfor. Tal med din afdelingseder, hvis du er i tvivl.


Trin 1: Digital Representation

Når du har den rigtige rolle (se over) har du menu-punktet Add Digital Represenation under Resources → Create Inventory.  Klik på denne.

Trin 2: Descriptive information 

Det første du skal tage stilling til er den bibliografiske information. Du kan enten oprette en ny post med det samme, eller du kan koble den digitale fil til en eksisterende post. 

New bibliographic record

Vælger du New, skal du som minimum angive titel og materialetype, men sikkert også creator, date og description? Det er disse oplysninger, der danner din bibliografiske post

Existing bibliographic record

Du kan også vælge at tilknytte til en eksisterende post - så skal du blot søge den frem og vælge. (Det er også muligt at bruge avanceret søgning). 

Når du vælger denne mulighed, benyttes selvsagt blot de bibliografiske oplysninger, fra den eksisterende post.

Collection

Uanset hvad, skal du angive en Collection, som dokumentet skal indgå i. Enhver digital repræsentation skal indgå i en Collection, men en collection kan også indeholde andet end digitale repræsentationer. Den kan også indeholde fysiske materialer og e-bøger, fx. 

Du kan søge dig frem til og vælge den rigtige Collection, ligesom man søger alt andet i Alma. Men du skal jo vide hvad det er for en, og den skal være oprettet. Collections og Sub-collections fungerer i praksis som en mappestruktur for fælles emner. Pt. har vi fx

  • Musiksamlingen
    • Musiksamlingens registranter
  • Håndskriftsamlingen
    • Håndskriftsamlingens registranter
  • Dansk Vestindien 

Når registranterne ligger som Sub-collections skyldes det en forventning om, at man måske vil have behov for andre typer digitale repræsentationer under hhv Musik- og håndskritsamlingen, som ikke er registranter.

Strukturen kan laves om, og der kan selvsagt også tilføjes nye. Det kræver rollen "Collection Inventory Operator Extended".

New

Existing

Search for a collection:



Trin 3: Representation Details

Her udfylder du flere detaljer om repræsentationen. (Jeg har har valgt "New" i Trin 2.) Det kan virke unødvendig her, men skyldes selvsagt, at man kan have flere repræsentationer på den samme post, og så skal man kunne skelne dem fra hinanden. 

Sørg for at "Remote" ikke er krydset af.


Trin 4: File details - Upload file

Så kommer vi til selve filen. Vælg "Add files" og find din PDF fra din maskine. 

FIlen uploades i systemet og lægger sig i listen. Det er muligt her at ændre filens "Label" - altså hvordan den fremstår for brugeren. Som default  benyttes fil-navnet.

Det er muligt at lægge flere filer ind på den samme repræsentation, hvis der er behov for det. 

Ellers tryk "Save"

 

Trin 5: Review / Edit

Der er nu oprettet en post; den indgår i en Collection, og den har en digital repræsentation. 

Man kan redigere den bibliografiske post i Metadata Editor, eller man kan klikke på repræsentationen for at redigere dens oplysninger. 

Klik "Display in Discovery" for at se posten i Primo. (Her bliver det fx tydeligt, at jeg nok skal ændre sprogkoden i den bibliografiske post...) 



Trin 6 : Fuldtekst

Dette trin er meget afhængig af, hvilken tekst, du kan få ud af din PDF-fil. Fremgangsmåden for at få fuldtekst ud er som følger:

  1. Åbne din PDF-fil (på din computer)
  2. Marker alt + Copy
  3. Sæt ind i din text editor - fx Notepad, Notepad++, eller andet (jeg bruger TextWrangler fordi jeg er på en mac)
  4. Gem filen med denne suffix: .text.plain

(Hvis du har tilgang på teksten på anden måde, fx som et word-dokument, behøver du selvsagt ikke trække den ud af PDF'en. Så sætter du bare teksten ind som i pkt. 3)

Kvaliteten af den tekst, du kan få ud af din PDF kan variere meget, specielt hvis det er en ældre scanning.


I Alma: Klik på repræsentationen i visningen i Trin 5.

Vælg fanebladet "Files List"

Under Action-knappen (med de tre prikker) vælger du Fulltext

Vælg Upload, og Format: Plain, og find den tekstfil, du lige gemte.


Når du har uploaded filen, kan du se, at den er tilknyttet din repræsentation/fil. (Du kan selvfølgelig også slette den igen, hvis du vil uploade en anden/bedre fuldtekstfil)

Posten kan nu søges frem i Primo på baggrund af tekst fra din fuldtekstfil.


 


 


Mere dokumentation og vejledning