Datamanagement tjekliste
- Bolette Ammitzbøll Jurik
- Jesper Boserup Thestrup
- Katrine Hofmann Gasser
- Knud Åge Hansen
Indledning
En datamanagement plan er en vigtig del i din håndtering af de data, som du skaber, behandler eller indsamler i dit forskningsprojekt. Disse data er værdifulde og du vil sikkert gerne bevare dem i en længere periode. Måske vil du også gerne dele dine data – helt eller delvis - med andre forskere. Denne tjekliste er ment som en hjælp til at udarbejde en plan for din håndtering af data.
Tjeklisten kan bruges til at:
- Dokumentere hvordan du håndterer dine data
- Identificere områder, som udgør potentielle risici eller konflikter, som måske skal håndteres i samarbejde med din forskergruppe, samarbejdspartnere, kolleger eller ledelse.
Tjeklisten er nemmest at udfylde, hvis du er bekendt med Dansk Code of Conduct: http://ufm.dk/publikationer/2014/the-danish-code-of-conduct-for-research-integrity
Om tjeklisten
Du vil få mest gavn af tjeklisten, hvis den udfyldes i begyndelsen af projektet. Tjeklisten vil som nævnt kunne hjælpe dig med at udarbejde en datamanagement plan. Denne plan bidrager til at afklare behov for f.eks. hardware, software, relationer til samarbejdspartnere mm. Planen beskriver bl.a. hvordan data skal bevares og deles under hensyntagen til etiske og juridiske forhold.
Her er to steder, hvor du kan læse mere om data management planer og se eksempler på både tjeklister og planer:
- Rigsarkivet: https://www.sa.dk/aflevering-arkivet/private-og-forskere/haandtering-af-forskningsdata-datamanagement
- Digital Curation Centre: http://www.dcc.ac.uk/resources/data-management-plans.
Gode råd om håndtering af den udfyldte tjekliste og din datamanagementplan
- Bevar en kopi af den komplette tjekliste og din datamanagement plan sammen med dine forskningsdata.
- Tjeklisten vil være god at have ved hånden under samtaler med kolleger, samarbejdspartnere, ledelse m. fl. og andre om behov i forbindelse med data management.
- Ændring i politikker, lovgivning osv. sker jævnligt. Metoderne i projektet udvikles og justeringer sker derfor ofte. Det kan derfor blive nødvendigt at ændre data managementplanen i takt med at vilkårene ændrer sig.
JURA?
Definition af data
Når du udarbejder din datamanagement plan er det nødvendigt, at du beskriver hvordan du vil håndtere dine data i løbet af forskningsprocessen. Da forskere ikke altid har de fornødne rettigheder til at bruge og dele deres data ubegrænset har vi i forbindelse med denne tjekliste være nødt til at bruge nedenstående definitioner for at sikre en dækkende datamanagement plan.
I sammenhæng med datamanagementplaner opereres med fire typer af data:
- Kildedata/eksisterende data /originaldata er data, som eksisterede før forskningsprojektet startede, som f.eks. Statsbibliotekets kulturarvsdata.
- Forskningsdata/afledte data er nye data, som bliver skabt i forskningsprojektet, f.eks. indsamlede primærdata, indekser over eksisterende data, statistikker eller grafer, måleresultater, eller evt. algoritmer, som ud fra givne kildedata og indekser, kan foretage statistisk bearbejdning.
- Metadata er dokumentation for og beskrivelse af de nyskabte data. De letter overblikket over data og gør det muligt for samarbejdspartnere og andre at finde og forstå dine data. Det er en fordel at bruge internationalt udbredte standarder for metadata. Metadata indeholder eksempelvis oplysninger om hvilken software og hardware, der skal bruges til åbne en given fil, hvem der må åbne data etc.
- Ikke- digitale data. Hvis der bliver skabt ikke-digitale data skal disse også behandles i planen.
Mere om tjeklisten
Tjeklisten er inddelt i følgende fem dele:
- Første del vedrører basale oplysninger om projektet. Det vil sige titel, deltagende forskere, kontaktoplysninger etc.
- Anden del indeholder dels oplysninger om hvem der ejer data samt hvem, der skal have adgang til disse under og efter forskningsprojektets afslutning; dels jeres etiske overvejelser om indsamling, brug, bevaring og eventuel deling af data anvendt i og/eller skabt i løbet af forskningsprojektet.
- Tredje del rummer oplysninger om data, som jeres forskningsprojekt eventuelt bygger videre på. Det vil sige kilde-data/eksisterende data/originaldata.
- Fjerde del indeholder oplysninger om data, som skabes løbende i forskningsprojektet, men som ikke nødvendigvis skal arkiveres eller skal kunne tilgås efter forskningsprojektets ophør. Det vil sige forskningsdata/afledte data.
- Femte del vedrører de kilde-data/eksisterende data/originaldata som skal bevares. Altså oplysninger om udvælgelse af data til bevaring, i hvor lang tid og om data skal kunne deles – hvordan, i hvilket omfang og med hvem.
I forbindelse med de enkelte dele vil der være felter, hvor oplysningerne allerede er givet tidligere, men da de enkelte faser behandler forskellige institutioner og arbejdsprocesser, er gentagelserne nødvendige for at sikre et fyldestgørende billede. Men hvis oplysningerne er helt de samme, kan I bare henvise til tidligere udfyldte felter.
Bygger datamanagementplanen på eksisterende standarder eller procedurer?Hvis ja, hvilke? Har den institution, som projektet hører under, særlige regler for. datasikkerhed?Hvis ja, hvilke (evt.som links)? Stiller samarbejdspartnere, bevillingsgivere eller andre krav til. datamanagement?Hvis ja, hvilke (evt. som links)?
Stamoplysninger | ||
---|---|---|
Projektnavn | Hvis du har søgt en bevilling, brug samme navn som i bevillingsansøgningen | Probing a Nation's Web Domain |
ID | Et relevant ID, eventuelt bestemt af bevillingsgiver og/eller institution | |
Bevillingsgiver | Navn på bevillingsgiver, hvis det er relevant | Kulturstyrelsen, DEIC, Netlab |
Bevillingsnummer | Reference til en bevillingsskrivelse, hvis det er tilgængeligt | FPK.2015-0049 |
Projektbeskrivelse | Fortæl kort, hvilken type studie, der er tale om, sådan så andre kan forstå formålet med at skabe dine forskningsdata: | Forskningsspørgsmål: Hvordan har .dk domænet udviklet sig over tid fra 2005-2015 |
Hvilken type forskningsprojekt er der tale om? | internet-forskning, digital humaniora | |
Med hvilket formål bliver data skabt? | For at analysere dem, og besvare forskning-spørgsmål | |
Reference til projekt-ansøgning, hvis den er tilgængelig | links | |
Primærforsker | Navnet på projektets primærforsker(e) | Niels Brügger, Associate Professor, Head of the Centre for Internet Studies, and of NetLab/DigHumLab Janne Nielsen, PhD fellow, NetLab/DigHumLab Ditte Laursen, Senior Researcher, SB/Netarkivet |
ForskerID | F.eks. ORCID | |
Kontaktperson | Navn (hvis andet end primærforskere), tlf.nummer, e-mailadresse | Niels Brügger |
Organisationer | Involverede organisationer | Netlab, AU, IKK, Center for Internetforskning, SB, Netarkivet |
Version | Projektets tidsmæssige længde | open-ended, lige nu med finansiering til udgangen af 2016 |
Dato for den første version af projektets datamanagementplan | 14/9-2015 | |
Dato for senest ændrede version af projektets datamanagementplanen | 14/3-2016 | |
Dato for næste planlagte version af projektets datamanagementplanenen | IFT. DMP projektet 8/4-2016. | |
Relaterede politikker | Hvis der stilles krav til din datamanagement plan - fra bevillingsgivere, institutioner, dataejere, samarbejdspartenere osv. kan du angive dem her: | |
Bygger datamanagementplanen på eksisterende standarder eller procedurer? Hvis ja, hvilke? | Ja, den bygger på den Tjekliste, som SB opbygger i forbindelse med DMiP-projektet. | |
Har den institution, som projektet hører under, særlige regler for. datasikkerhed? Hvis ja, hvilke (evt.som links)? | Der er en række involverede institutioner. Netarkivet stiller særlige krav for datasikkerhed, da der er tale om potentielt personfølsomt og ophavsret-beskyttet data. Her skal vi nok have en reference. Stiller SB nogen krav i forbindelse med brug af Kulturarvscluster? | |
Stiller samarbejdspartnere, bevillingsgivere eller andre krav til. datamanagement? Hvis ja, hvilke (evt. som links)? | Nej. | |
Data Management | Anslået pris for data management gennem og efter projektet. Eksempelvis pris for opbevaring af data. | 0 |
Data | ||
---|---|---|
Hvilke eksisterende data tænkes anvendt? | Digitale data (samlinger) der eksisterer før forskningsprojektet går i gang. | |
Samlingens navn | Netarkivet | |
Hvad påtænkes disse data anvendt til ? (uddybende beskrivelse af forskningsspørgsmål og -mål) | Der skal analyseres på arkiv-data fra Netarkivet Der skal analyseres på 10 tværsnitshøstninger - 1 for hvert år. Da en tværsnitshøstning i sig selv fylder mere end 30Tbytes er der ikke råd til at lave komplette udtræk af data til langtidsbevaring som forskningsdatasæt og der skal derfor tænkes i baner af eksempelvis at lave et index over en tværsnitshøstning som så kan gemmes som et datasæt en fremtidig forsker kan genbruge for at lave nye analyser på samme datasæt eller for at kontrollere forskningen i dette projekt | |
Hvem har ansvaret for disse data? | Original-data bor hos Netarkivet på SB og KB, som er data-ansvarlige. | |
Er der særlige juridiske forhold? (personfølsomme oplysninger, patenter, ophavsret...) | Data i Netarkivet kan være personfølsomme og det er ophavsret-beskyttet, og der er derfor meget begrænset adgang. | |
Hvem kan få adgang til data? (betingelser) | Man skal have en individuelt udstedt tilladelse for at kunne få adgang. | |
Hvor befinder disse data sig? | SB og KB | |
Hvor store datamængder tænkes behandlet (fx antal Gb / Tb samt antal objekter/filer) | Der skal behandles meget store mængder data (10 x 5-30Tbytes) - måske 200 Tbytes | |
Hvilke filformater indgår i samlingen? (TEI, JP2, MP3, …) | Principielt kan samlingen indeholde alle kendte fil-formater- pga. Internettets natur er det ikke til at sige. Original-data fra Netarkivet er lagret i ARC og WARC-filer hvilket betyder at der skal anvendes software der kan forstå disse formater. Crawllogs, andre metadata-filer, som skal kunne forstås. | |
Hvilke værktøjer anvendes (navn, version og systemkrav)? (gerne link til værktøjet) Hvilken platform og versionsnummer anvendes (windows, linux, mac)? | Per / Kulturarvscluster | |
Hvilke forsknings-data tænkes genereret som en del af projektet? | Hvad er forholdet mellem eksisterende data og de nye forskningsdata ? | Nye data vil bestå af indexer over bestemte corpora udtrukket af Netarkivet. Den første udfordring vil derfor være at få defineret dette index-format samt at få lave værktøjer der givet en række parametre kan lave et passende udtræk af "en tværsnitshøstning" (som også skal defineres både intellektuelt samt teknisk) |
Skal alle datasæt bevares? | Indeks skal bevares. Procedurebeskrivelse skal bevares + beskrivelse af anvendte værktøjer.Output indeholder kun afledte data. | |
Hvad påtænkes de nye data anvendt til ? (uddybende beskrivelse af forskningsspørgsmål og tilgangsvinkel) | De nye data skal bruges til at lave deskriptiv statistik af indholdet i netarkivet. I projektet laver vi 4 probes. Vi henviser til dokumentet “Probes — The Cook Book” for en teknisk forklaring af disse probes. Vi forventer også at data skal danne grundlag for yderligere forskning indenfor Digital Humaniora. | |
Hvor store mængder nye data er der tale om ? (størrelse og antal objekter/filer) | Under 5 TB | |
Har forskningsdata værdi efter projektets afslutning, således at de bør bevares? (i givet fald hvilken værdi og for hvem) | Da projektet bruger mange ressourcer på at udvikle udtræks-algoritmer mm. tænkes de nye datasæt at repræsentere en stor værdi for fremtidige forskere der vil kigge på nogle af de samme afgrænsninger (hele tværsnit af .dk-domænet) | |
Hvilke kendte værktøjer tænkes anvendt på de nye data? (gerne link til værktøjet) | R, til deskriptiv statistik (https://www.r-project.org) | |
Overvejes udvikling af nye værktøjer? | Ja, det påtænkes at udvikle et værktøj, der kan udstille data på clusteret, hvilket sørger for ETL-processen (Extract-Transfer-Load). Værktøjet/værktøjerne ejes af??? Open Source??? | |
Filformat af forskningsdata | Filformater bør opfylde følgende kriterier:
|
|
Hvilke filformater tænkes de nye data at blive lagret i ? | Et bud på et index-format kunne være det såkaldte CDX-format som i forvejen anvendes som index under WayBack-maskinen. Men der er også andre kandidater (IA har en hel tool-suite der anvender 4 forskellige afledte dataformater: CDX, WAT, WANE, LGA-data) | |
Er der specielle software eller hardware krav for at benytte disse data? Hvis ja, hvilke? | Nej, de kan processeres af alm. software/hardware. | |
Organisation af forskningsddata under projektet | Hvilke standarder og metoder vil du anvende? | Uafklaret |
Hvordan vil du strukturere og navngive dine mapper og filer? | Uafklaret | |
Hvordan vil du håndtere versionering (f.eks. benytte versionsstyringsværktøj)? | Uafklaret | |
Hvordan vil du kvalitetssikre dine data (f.eks. review hos kollega)? | Uafklaret | |
Ikke digitale data | Hvor opbevares evt. ikke digitale forskningsdata sikkert? | Der er ingen ikke-digitale forskningsdata. |
Hvor lang tid vil ikke digitale forskningsdata blive bevaret sikkert? | Se ovenstående. | |
Dokumentation og metadata | ||
Hvilken form for dokumentation og metadata vil følge dine data? | Hvilke informationer er nødvendige for at dine data kan læses og forstås i fremtiden? | Beskrivelsen af index-filen og beskrivelse af procedure for, hvordan man viser data. |
Hvordan vil du skabe den nødvendige dokumentation og metadata? | Dokumentationen vedligeholdes løbende på NetLabs wiki på SBProjects, hvor projektet har sit eget område. De dokumenter, som hører til metadata skal til sidst lægges i et passende format (e.g. en readme-fil) og gemmes sammen med metadata. | |
Hvilke metadatastandarder vil du bruge og hvorfor? | Uafklaret | |
Beskriv den type dokumentation der vil følge dine data, sådan at udenforstående kan forstå og genanvende dine data. Som minimum skal der være nogle grundlæggende oplysninger, som vil hjælpe med at finde data, inklusive hvem der har skabt data, en titel, en dato og evt. adgangsbegrænsninger. Dokumentationen skal også gerne inkludere oplysninger om metode, analyse, variabeldefinitioner, vokabularer, målingsenheder, antagelser samt format- og filtype. Overvej hvordan og hvor du vil redegøre for disse oplysninger. Det er en god idé at følge eksisterende standarder. | Tekstbehandlingsdokumenter, artikler etc. Disse opdateres løbende på projektets wiki-sider. |
Etiske og lovgivningsmæssige forhold | ||
---|---|---|
Hvordan vil du håndtere etiske overvejelser? | Etiske spørgsmål kan have betydning for hvordan du håndterer dine data. Både i forhold til hvordan de opbevares, hvem der har adgang til dem og hvor længe de er bevaret. Du bør vise, at du er opmærksom på evt. etiske problemstillinger, og at du har taget hensyn til retningslinjer udstukket af din institution (også dem der går ud over de rent lovmæssige forhold) | |
Har du tilladelse til at gemme og dele data?: | Ja vi må gemme data, men ikke dele data. Se ovenfor. Deling af data og resultater skal overholde persondata- og ophavsret. | |
Hvordan vil du sikre anonymitet for evt. deltagere i forskningsprojektet? | Målet er ikke at behandle følsomme data. Skulle det ske, skal disse data ikke trækkes ud. | |
Hvordan vil du håndtere personfølsomme oplysninger, så du sikrer at de er opbevaret sikkert? | ||
Hvordan vil du håndtere evt. spørgsmål om copyright og intellektuel ejendomsret? | Hvem skal spørges om lov, hvis data skal genanvendes? | |
Er der nogen adgangsbegrænsninger i forhold til genanvendelse af tredjepart? | ||
Vil datadeling blive forsinket på grund af publikationer eller patenter? | ||
Beskriv hvem og hvor mange der skal spørges om lov i tilfælde af, at en tredjepart vil genanvende data | ||
Er der dansk copyright på data? | ||
Er der udenlandsk copyright på data? | ||
Ejerskab af data | Ejerskab af kilde-data | |
Ejerskab af data skabt i projektet (f.eks. et indeks) | ||
Ejerskab af metadata skabt i projektet | ||
Tredje parts data | Hvis andre ejer data, hvordan kom projektet i besiddelse af disse data og hvilke vilkår gælder der for tilgang til disse data. | |
Reference nummer til købte eller licenserede data | ||
Reference nummer til data, der er opnået gennem en open access licens | ||
Beskrivelse af vilkår for data opnået på anden vis |
5: Backup, bevaring og deling af data | ||
---|---|---|
Både undervejs i og efter et forskningsprojekts afslutning er bevaring af data centralt. Både for at dokumentere og bevare resultater, med henblik på genanvendelse – og til brug for meritering og fagfællebedømmelse. Det handler det følgende om. | ||
5.1: Hvordan vil du opbevare og sikre backup af data under dit forskningsprojekt? | ||
Hvordan vil du foretage backup for at sikre mod datatab? |
| Under “Active DM” ingen backup af nye forskerskabte data. I øjeblikket er der ingen backup at clusteret. |
Hvor er data backup placeret? |
|
|
Er lagerplads til backup tilstrækkelig? |
|
|
Er der sikret mulighed for genskabelse af data i tilfælde af et uheld og hvem er ansvarlig for dette? | Hvis ja, angiv kort hvorledes. | Algoritmer til at hente data fra Netarkivet over på clusteret er under backup og kan køres igen. Algoritmer lagret på forsker-maskiner kan ligeledes køres igen på Kulturarvsclusteret. |
5.2: Hvordan vil du håndtere adgang og sikkerhed? | ||
Er der foretaget risikoplanlægning i forhold til datasikkerhed? | Hvis ja, beskriv kort. | Nej |
Hvorledes vil adgangskontrol blive sikret? | Det gælder både uautoriseret adgang og dine samarbejdspartneres adgang. | Håndteres af Kulturarvsclusteret (SB). |
Hvorledes vil indsamlede data blive overført på sikker måde? |
|
|
Hvis dine data er særligt følsomme kan du redegøre uddybende for alle sikkerhedsforanstaltninger og formelle standarder. |
|
|
5.3: Langtidsopbevaring | ||
Ofte vil data skulle opbevares i længere tid. Det kan gælde alle data eller kun udvalgte datasæt. I det følgende har du mulighed for at beskrive dette nærmere. | ||
Hvilke data skal bevares og/eller deles? | Vurder hvilke forskningsdata, der har værdi efter projektets afslutning og som derfor bør, bevares. Overvej også gerne hvilke genanvendelsesmuligheder dine data har, både i forhold til at validere dine resultater, til at frembringe nye videnskabelige resultater og til brug i forbindelse med undervisning. | Procedurer for at skabe indeks, altså algoritmer skal bevares og deles. Korpus metadata i CSV-format skal bevares og deles. Beskrivelsen af index-filen og beskrivelse af procedure for, hvordan man viser data skal bevares og deles. |
Hvilke data skal bevares eller slettes på grund af lovmæssige, kontraktmæssige eller andre lignende forhold? |
| Indekser over korpus vil kunne indeholde personhenførbare informationer, og kan derfor ikke deles. Indekser skal i stedet slettes. |
Hvor længe skal data bevares? |
| 10 år |
Stilles der særlige krav om klargøring af data til langtidsbevaring? | Angiv kort. |
|
5.4: Datadeling | ||
Du bør overveje betingelser for datadeling, både med hvem, internt og eksternt, i hvilket omfang og hvorledes anerkendelsen af dig som ophav til data kan sikres. | ||
Deling: | Vil du dele dine data? Ja/nej. | Ja. Nogle data kan deles, også eksternt. |
Er der restriktioner på deling af data? | Hvis ”ja” til datadeling, hvilke problemer og hvilke løsninger ser du? . | Nej. De data som er udvalgt til bevaring kan også deles. |
Hvis der er et ønske om eneadgang, hvor længe har du behov for eneadgang til data og hvorfor? |
|
|
Eksisterer der en formel aftale om deling af data? | Ja/nej. | Hvis nej: er der behov for en sådan aftale? |
Hvordan vil mulige brugere af dine data kunne finde og dele dem? | Vil du eksempelvis dele data gennem et repository, eller vil du selv stå for delingen? | Deling forventes at foregå gennem SB's “Research Data Repository” |
Vil du søge at få en persistent identifikation (F.eks. DOI) til dine data? |
| Ja, tildeles af repository. |
Delingsmetode | Hvordan vil andre modtage/kunne hente og evt. dele dine data? | Data vil kunne downloades fra repository. |
Datakontrol | Hvordan vil du kontrollere adgang til data? | Adgang til data administeres af repository. |
1: Basisoplysninger om projektet | ||
---|---|---|
Projektnavn | Hvis du har søgt en bevilling, brug samme navn som i bevillingsansøgningen |
|
Projekt-ID | Hvis en bevillingsgiver og/eller institution har bestemt et ID, kan du oplyse det her. |
|
Bevillingsgiver | Navn på bevillingsgiver, hvis det er relevant. |
|
Bevillingsnummer | Reference til en bevillingsskrivelse, hvis det er tilgængeligt. |
|
Projektbeskrivelse | Fortæl kort, hvilken type studie, der er tale om, sådan så andre kan forstå formålet med at skabe dine forskningsdata: |
|
| Reference til projektansøgning, hvis den er tilgængelig. Om muligt med links. |
|
Varighed | Projektets tidsramme |
|
Primærforsker(e) | Den eller de hovedansvarlige forsker(e). |
|
Primærforsker(e)s forsker-ID | Dette kan være bestemt af bevillingsgiver og/eller institution. . Et evt. ORCID kan også benyttes. |
|
Primær kontaktperson | Kontaktoplysninger på den valgte primære kontaktperson |
|
Institutioner, bevillingsgivere og andre | Her kan angives Involverede institutioner mm. |
|
1.1: Relaterede politikker | ||
Hvis der stilles krav til din datamanagement plan - fra bevillingsgivere, institutioner, dataejere, samarbejdspartenere osv. kan du angive dem her: | ||
Krav til Datamanagementplanen | Bygger datamanagementplanen på eksisterende standarder eller procedurer? Hvis ja, hvilke? |
|
| Har den institution, som projektet hører under, særlige regler for. datasikkerhed? Hvis ja, hvilke (evt.som links)? |
|
| Stiller samarbejdspartnere, bevillingsgivere eller andre krav til. datamanagement? Hvis ja, hvilke (evt. som links)? |
|
1.2: Omkostninger ved håndtering af data | ||
Omkostninger i forbindelse med håndteringen af dine forskningsdata | Anslået pris for data- management under og efter projektet. F.eks. pris for opbevaring af foreløbige data, kuratering, arkivering osv. |
|
Opfølgning på din data management plan | Det kan blive nødvendigt at revidere datamanagementplanen. F.eks. pga. ændringer i data, indsamlings- og analysemetoder mm.De følgende spørgsmål kan bruges til et overblik. | |
| Dato for første version af projektets datamanagementplan. |
|
| Dato for seneste reviderede version af projektets datamanagementplan. |
|
| Dato for næste planlagte revision af projektets datamanagementplan. |
|
Hvem har ansvaret for datamanagement? | Hvem er ansvarlig for implementering, opfølgning og revision af datamanagement planen? Det vil oftest være primærforsker(e) |
|
| Hvem er ansvarlig for de enkelte datamanagementaktiviteter? Det vil ofte være primærforskere, men det kan være andre deltagere. |
|
1.3: Har du de fornødne ressourcer til at gennemføre din plan? | ||
Vurder, om du samlet set råder over de fornødne ressourcer som eksempelvis software, hardware og teknisk ekspertise. | ||
Har du brug for eksterne ressourcer eller bistand, f.eks. hardware, software, særlig ekspertise? | Hvis ja, til hvilke dele af projektet? |
|
Hvor meget koster det at bevare data på bevaringsstedet? | Dette kan allerede være angivet under 1.2. |
|
2: Juridiske og etiske forhold omkring til data | ||
---|---|---|
2.1: Juridiske -: | ||
I forhold til forskningsdata er det nødvendigt at afklare, hvem der ejer og hvem der skal have adgang til data. | ||
Hvilken ophavsret gælder i forhold til dine data? | Gælder dansk og/eller udenlandsk ophavsret tildine data? |
|
Hvem har ophavsret til eventuelle data, der eksisterer inden forskningsprojektstarter? | Det kan være institutioner, fonde. firmaer og forskere, der har ejendomsretten til data i denne fase. |
|
Hvem har ejerskab/ophavsret til data, der skabes under forskningsprojektet |
|
|
Hvis andre har ophavsretten, hvordan kom projektet i besiddelse af disse data og hvilke vilkår gælder der for tilgang til disse data? | Beskriv hvordan du fik adgang/rettigheder til at bruge data. Angiv eksempelvis referencenummer til købte eller licenserede data, til data, der er opnået gennem en open acces licens etc. |
|
Hvem har ophavsret til data efter projektets afslutning? |
|
|
Hvordan skal spørgsmål om ophavsret til nye data, herunder tilladelse til genanvendelse håndteres? | Hvem give tilladelse til evt. genanvendelse af data? |
|
Hvordan må tredjepart – eventuelt - bruge dine data? | Er der adgangsbegrænsninger i forhold til tredjeparts genanvendelse? |
|
Indeholder dine data personfølsomme oplysninger? | Hvis data indeholder personfølsomme data stilles der særlige krav til deling af og adgang til data. Senere vil dette spørgsmål blive berørt mere uddybende. | Ja: Nej: |
Indeholder dine data, oplysninger, der skal bruges i forbindelse med patentansøgninger? | Hvis du forventer at dine data skal indgå i en patentansøgning stiller det særlige krav til deling og opbevaring af data. Senere vil dette spørgsmål blive berørt mere uddybende. | Ja: Nej: |
Hvem har adgang til data før, under og efter forskningsprojektet? | Af data sikkerhedsmæssige grunde er det ofte nødvendigt at definere, hvem der har adgang til data før, under og efter forskningsprojektet. Angivv hvem og hvor mange, der skal spørges om lov i tilfælde af tredjepart vil genanvende data. |
|
2.3: Etiske forhold Kan evt. flyttes en tak op, da det refererer til kildedata/eksisterende data | ||
Spørgsmål om bevaring, adgang og deling indebærer etiske overvejelser – ud over de juridiske. Du bør vise, at du er opmærksom på mulige etiske problemer og, at du følger din institutions eller relevant myndigheds retningslinjer. | ||
Har du tilladelse til at gemme og dele data? | Angiv gerne kilde(r). |
|
Hvordan vil du sikre anonymitet for f.eks. deltagere i forskningsprojektet, svarpersoner o.l.? | Beskriv kort. |
|
Hvordan vil du opbevare personfølsomme oplysninger, sikkert? | Beskriv kort. |
|
3: Oplysninger om eksisterende data, der tænkes anvendt | ||
---|---|---|
Ofte baserer et forskningsprojekt sig på allerede eksisterende data (samlinger, databaser eller andet). | ||
3.1: Juridiske forhold i forhold til indhold og adgang | ||
Indeholder samlingen personfølsomme data? | Hvis ja, angiv hvilke typer data. |
|
Indeholder samlingen oplysninger, der skal anvendes i forbindelse med en påtænkt patentansøgning? |
|
|
Hvem har ophavsret til de eksisterende data? |
|
|
Hvem kan få adgang til disse data? Og under hvilke betingelser? | Angiv også under hvilke betingelser, hvis relevant. |
|
3.2: Oplysninger om data i samlingen eller basen | ||
Hvor befinder disse data sig? | Angiv institution, evt. url e |
|
Hvor store datamængder tænkes behandlet? | Angiv for eksempel antal Gb / Tb evt. antal objekter/filer |
|
Hvilke filformater indgår i samlingen? | Angiv filformater f.eks. TEI, JP, MP3 og lignende. |
|
Hvilket operativsystem anvendes? | Angiv om der er tale om Windows, Linux, MACOS og hvilken version |
|
Hvilken software anvendes til at behandle data? | Angiv gerne navn, version og systemkrav (om muligt med link til værktøjet) |
|
4: Oplysninger om forskningsdata, der skabes og behandles i løbet af forskningsprojektet | ||
---|---|---|
I løbet af et forskningsprojekt skabes en række data. I de følgende punkter bedes du beskrive disse. | ||
Hvad er forholdet mellem eksisterende data og de nye forskningsdata? | Hvis dine forskningsdata bygger på eksisterende data, så beskriv forholdet mellem disse og de data du forventer at skabe. Det kan være opdatering, korrektion osv. |
|
Skal alle datasæt bevares? | I løbet af et forskningsprojekt skabes der løbende data . Skal alle bevares undervejs i projektet? |
|
4.1: Oplysninger om de data, der skabes i løbet af forskningsprojektet | ||
Hvor store mængder nye data er der tale om? | Angiv for eksempel antal Gb / Tb samt om muligt antal objekter/filer |
|
Hvilken software anvendes til at behandle data? | Angiv gerne navn, version og systemkrav (om muligt med link til værktøjet |
|
Overvejes udvikling af ny software? |
| Ja Nej |
4.2: Hvilke filformater anvendes der og skabes | ||
Hvilke filformater tænkes de nye data at blive lagret i? | Filformater kan opfylde et eller flere af disse kriterier: Godkendt som en international eller national standard, Almindelig brugt, Accepteret som best practice inden for fagområdet. Angiv gerne format og kriterie. |
|
Hvilken software anvendes til at behandle data? data?
| Angiv gerne navn, version og systemkrav (om muligt med link til værktøjet) |
|
Er der specielle krav til software eller hardware? | Hvis ja, hvilke? |
|
4.3: Organisation af forskningsdata under projektet | ||
Hvis du forventer at skabe store datamængder eller mange filer er det en fordel at overveje, hvordan du vil organisere dine data i løbet af forskningsprojektet | ||
Hvilke standarder og metoder vil du anvende? | Angiv kort. |
|
Hvordan vil du strukturere og navngive dine mapper og filer? | Angiv kort. |
|
Hvordan vil du kvalitetssikre dine data? | Kollegialt review? Andet? |
|
Hvordan vil du håndtere evt. versionering (f.eks. benytte versionsstyringsværktøj)? | Angiv kort. |
|
4.4: Ikke-digitale data | ||
Ofte anvendes eller skabes ikke-digitale data. Hvordan forventes disse behandlet? | ||
Hvor opbevares ikke digitale forskningsdata sikkert? Der er to spørgsmål her: Hvor? Og om det er sikkert? Er begge nødvendige? |
|
|
Hvor lang tid vil ikke-digitale forskningsdata blive bevaret sikkert? |
|
|
4.5: Dokumentation og metadata | ||
Overvej hvorledes dine data er dokumenteret, således, at at udenforstående kan forstå og evt. genanvende dine data. Som minimum skal der være nogle grundlæggende informationer, som kan hjælpe med at finde data, deres ophav og muligheder for at tilgå disse. Dokumentationen skal også gerne inkludere oplysninger om indsamlings- og analysemetode(r), variabeldefinitioner, vokabularer, måleenheder, samt format- og filtype. Bemærk at det er bedst at benytte så simple filformater som muligt aht. langidsbevaring (eks. PDF/A til tekster) Anvend gerne eksisterende standarder. Du kan have angivet dele af disse informationer tidligere i skemaet. | ||
Hvilke informationer er nødvendige for at dine data kan læses og forstås i fremtiden? |
|
|
Hvordan vil du skabe den nødvendige dokumentation og metadata? |
|
|
Hvilke metadatastandarder vil du bruge og hvorfor? |
|
|
5: Backup, bevaring og deling af data | ||
---|---|---|
Både undervejs i og efter et forskningsprojekts afslutning er bevaring af data centralt. Både for at dokumentere og bevare resultater, med henblik på genanvendelse – og til brug for meritering og fagfællebedømmelse. Det handler det følgende om. | ||
5.1: Hvordan vil du opbevare og sikre backup af data under dit forskningsprojekt? | ||
Hvordan vil du foretage backup for at sikre mod datatab? |
|
|
Hvor er data backup placeret? |
|
|
Er lagerplads til backup tilstrækkelig? |
|
|
Er der sikret mulighed for genskabelse af data? genskabe data i tilfælde af et uheld og hvem er ansvarlig for dette? | Hvis ja, angiv kort hvorledes. |
|
5.2: Hvordan vil du håndtere adgang og sikkerhed? | ||
Er der foretaget risikoplanlægning i forhold til dataskkerhed? | Hvis ja, beskriv kort. |
|
Hvorledes vil adgangskontrol blive sikret? | Det gælder både uautoriseret adgang og dine samarbejdspartneres adgang. |
|
Hvorledes vil indsamlede data blive overført på sikker måde? |
|
|
Hvis dine data er særligt følsomme kan du redegøre uddybende for alle sikkerhedsforanstaltninger og formelle standarder. |
|
|
5.3: Langtidsopbevaring | ||
Ofte vil data skulle opbevares i længere tid. Det kan gælde alle data eller kun udvalgte datasæt. I det følgende har du mulighed for at beskrive dette nærmere. | ||
Hvilke data skal bevares og/eller deles? | Vurder hvilke forskningsdata, der har værdi efter projektets afslutning og som derfor bør, bevares. Overvej også gerne hvilke genanvendelsesmuligheder dine data har, både i forhold til at validere dine resultater, til at frembringe nye videnskabelige resultater og til brug i forbindelse med undervisning. |
|
Hvilke data skal bevares eller slettes på grund af lovmæssige, kontraktmæssige eller andre lignende forhold? |
|
|
Hvor længe skal data bevares? |
|
|
Stilles der særlige krav om klargøring af data til langtidsbevaring? | Angiv kort. |
|
5.4: Datadeling | ||
Du bør overveje betingelser for datadeling, både med hvem, internt og eksternt, i hvilket omfang og hvorledes anerkendelsen af dig som ophav til data kan sikres. | ||
Deling: | Vil du dele dine data? Ja/nej. | Hvis ja: Intern deling: Ekstern deling: |
Er der restriktioner på deling af data? | Hvis ”ja” til datadeling, hvilke problemer og hvilke løsninger ser du? . |
|
Hvis der er et ønske om eneadgang, hvor længe har du behov for eneadgang til data og hvorfor? |
|
|
Eksisterer der en formel aftale om deling af data? | Ja/nej. | Hvis nej: er der behov for en sådan aftale? |
Kan SB anvende resultaterne fra forsknings-projektet i andre sammenhænge? | Skal nok ud |
|
Hvornår vil du gøre data tilgængelige? | Er det ikke lidt overflødig? Skal nok ud |
|
Hvordan vil mulige brugere af dine data kunne finde og dele dem? | Vil du eksempelvis dele data gennem et repository, eller vil du selv stå for delingen? |
|
Vil du søge at få en persistent identifikation (F.eks. DOI) til dine data? |
|
|
Delingsmetode | Hvordan vil andre modtage/kunne hente og evt. dele dine data? | Email: Fysiske medier (DVD, USB, osv.): Specialiserede data overførselsværktøjer (FTP, Hermes osv.): Beskrivelse af andre metoder: |
Datakontrol | Hvordan vil du kontrollere adgang til data? | Datatilgang kræver password Data er krypterede – kræver nøgle Data er fysisk sikrede - f.eks. i aflåst skab Andet: |