Avoin tiede

Avoin tiede on tapa edistää vastuullista tiedettä ja tieteen vaikuttavuutta yhteiskunnassa.

Avoimen tieteen ja tutkimuksen keskeisimpänä tavoitteena on kehittää uusia tapoja luoda ja levittää uutta tietoa. Turun yliopistossa avoin tiede on koko yliopistoyhteisöä hyödyttävä voimavara.

Avoin tiede ja tutkimus on merkittävä tapa tehdä tieteestä toistettavaa ja läpinäkyvää sekä lisätä tieteellisen tutkimuksen yhteiskunnallista vaikuttavuutta. Avoimen tieteen kehittymiseen vaikuttaa vahvasti digitaalinen kehitys ja sen lisäksi sekä kansalliset että kansainväliset linjaukset ja suositukset.

Mitä avoin tiede antaa tutkijoille ja miten tutkijat voivat avata tiedettä

Videolla tutkija Smriti Mehta, University of California, puhuu avoimesta tieteestä ja avoimen tieteen käytänteistä. Videon kieli englanti, tekstitys englanniksi.

Avoin tiede on mullistanut tieteellisen julkaisutoiminnan kenttää ja avoimen julkaisemisen (OA) eri muodot ovat hiljalleen kehittyneet aikojen saatossa. Avoin julkaiseminen tuo tutkimustiedon saataville ilman kustannuksia toisin kuin tietteellisten julkaisuen perinteinen tilausmalli, jossa lukijat saavat pääsyn tieteelliseen tietoon maksamalla tilausmaksun.

Open science has revolutionized the field of scholarly publishing and open access (OA) publishing in its various forms has been in development already for a long time. Open access publishing is a model for scholarly communication that makes research information available to readers at no cost, as opposed to the traditional subscription model in which readers have access to scholarly information by paying a subscription.

Avoin julkaiseminen (OA) tekee kaikenlaisesta tieteellisestä kirjallisuudesta maksutta saatavilla olevaa ja sisältää usein vähemmän rajoittavia tekijänoikeus- ja lisensointirajoituksia kuin perinteisesti julkaistut teokset, niin käyttäjille kuin tekijöillekin. Sen sijaan, että avoimet julkaisut rahoittaisivat toimintaansa keräämällä tilausmaksuja, ne yleensä tuottavat tuloja kirjoittajilta perittävistä maksuista, joita kutsutaan artikkelinkäsittelymaksuiksi (APC). Näin ollen lehden toimituskustannukset siirtyvät lukijoilta, tai käytännössä tieteellistä kirjallisuutta tilaavilta akateemisilta kirjastoilta, kirjoittajille. On kuitenkin hyvä pitää mielessä, että suurin osa avoimista julkaisuista rahoittaa toimintaansa jollain muulla tavalla kuin APC-maksuilla. Yleensä lehdet julkaistaan ja rahoitetaan tieteellisten yhdistysten, yliopistojen ja korkeakoulujen tai muiden akateemisten organisaatioiden toimesta.

Vuosien varrella on kannatettu täydentäviä mutta rinnakkaisia OA-muotoja. Jotkut tutkimusrahoittajat antavat suosituksia ja rajoituksia niihin liittyen rahoitusehdoissaan. Lisäksi useilla mailla on erillisiä kansallisia suosituksia ja tutkimusorganisaatioilla voi olla omia ohjeistuksiaan eri OA-julkaisemisen muotoihin liittyen. Tällä hetkellä tutkijat voivat valita seuraavista OA-julkaisemisen muodoista:

Green OA -julkaiseminen viittaa julkaistujen tai ennakkopainosten itsearkistointiin maksutta julkiseen käyttöön. Tekijät tarjoavat pääsyn preprintteihin tai postprintteihin (kustantajan luvalla) institutionaalisessa tai tieteenalakohtaisessa arkistossa.

Gold OA -julkaiseminen viittaa teoksiin, jotka on julkaistu avoimessa lehdessä ja joihin pääsee lehden tai kustantajan verkkosivuston kautta. APC-maksut maksaa kirjoittaja.

Hybrid OA tarjoaa kirjoittajille mahdollisuuden tehdä artikkeleistaan avoimia maksua vastaan. Hybrid OA -lehtiä tarjoavat lehdet ovat edelleen pohjimmiltaan tilauslehtiä, joissa on avoimen pääsyn vaihtoehto yksittäisille artikkeleille. Ne eivät ole todellisia avoimia lehtiä.

Diamond OA -julkaiseminen kuvaa lehtiä, jotka ovat täysin ilmaisia sekä julkaista että lukea. Lehden ylläpito- ja julkaisukustannukset kantaa yleensä lehteä sponsoroiva organisaatio. Diamond OA -status ei vaikuta lehden vertaisarviointiprosessiin. Tekemällä artikkeleista täysin ilmaisia sekä julkaista että lukea, Diamond OA lähestyy parhaiten akateemisen tutkimuksen demokratisoinnin ja laajan jakelun tavoitteita.

Tutkimusjulkaisujen itsearkistointi on yksi maksuton vaihtoehto avoimuuteen, ja useimmat kustantajat sallivat hyväksytyn käsikirjoituksen version itsearkistoinnin. Kuitenkin, kun artikkeli itsearkistoidaan julkaisuarkistoon, monet kustantajat haluavat asettaa sille embargon, vaikka itsearkistoitu versio olisi lopullinen luonnos lopullisesta vertaisarvioidusta käsikirjoituksesta. Nämä embargot vaihtelevat yleensä 6:sta 36:een kuukauteen. Jotkut kustantajat eivät käytä embargoja lainkaan. Tällöin artikkeli voidaan itsearkistoida heti julkaisun jälkeen.

Vaikka OA-julkaisemista on yleisesti pidetty hyödyllisenä, OA-julkaisemisen kehitys on lisännyt haitallisten, kyseenalaisten ja jopa petollisten kustantajien määrää markkinoilla. Nämä kustantajat ovat mukana vain kerätäkseen suuria kirjoittajamaksuja, ja yleensä niiden vertaisarviointiprosessi ei täytä yleisesti hyväksyttyjä vaatimuksia. Näitä kustantajia kutsutaan usein saalistajakustantajiksi.

Open access publishing makes all types of scholarly literature accessible free of charge and often carries less restrictive copyright and licensing barriers than traditionally published works, for both the users and the authors. Instead of financing their operations by collecting subscription fees, open access journals generally generate income from fees charged to the authors, also known as article processing charges (APCs). Hence, the costs of editing the journal are passed on from readers, or in practice from academic libraries that subscribe to scholarly literature, to authors. It is good to keep in mind, however, that most open-access journals are financing their operation in some other way than by APCs. Usually, the journals are published and funded by scientific associations, universities and higher education institutions or other academic organizations.

Over the years, complementary but parallel forms to OA have been advocated. Some research funders give recommendations and restrictions related to them in their funding terms. Also, several countries have separate national recommendations and research organizations may also have their own policy guidelines in relation to different forms of OA publishing. Currently researchers can choose from the following forms of OA publishing:

Green OA publishing refers to the self-archiving of published or prepublication works for free public use. Authors provide access to preprints or post prints (with publisher’s permission) in an institutional or disciplinary archive.

Gold OA publishing refers to works published in an open access journal and accessed via the journal’s or publisher’s website. APCs are paid by the author.

Hybrid OA offers authors the option of making their articles open access, for a fee. Journals that offer hybrid OA are still fundamentally subscription journals with an open access option for individual articles. They are not true open access journals.

Diamond OA publishing describes journals that are completely free to publish and to read. The costs of maintaining and publishing the journal are usually borne by the organization that sponsors the journal. Diamond OA status has no impact on the journal’s peer review process. By making articles completely free both to publish and to read, Diamond OA best approaches the goals of democratizing and widely distributing academic scholarship.

The self-archiving of research publications is one cost free option that achieves openness, and most publishers allow the self-archiving of the accepted version of a manuscript. However, when an article is self-archived in the publication archive, many publishers want to place an embargo on it even if the self-archived version is the final draft of the final peer-reviewed manuscript. These embargoes vary usually from 6 to 36 months. Some publishers do not use embargoes at all. In such a case, the article can be self-archived immediately after publication.

Although OA publishing has generally been seen as beneficial, the development of OA publishing has increased the number of harmful, questionable and even fraudulent publishers on the market. These publishers are only in it for collecting large author fees and usually their peer review process does not fulfil the generally accepted requirements. These kinds of publishers are often called predatory publishers.

Syyt avoimeen julkaisemiseen ovat moninaiset. Yksi tärkeimmistä avoimen saatavuuden eduista on, että se lisää akateemisten tutkimustulosten näkyvyyttä. Avoin julkaiseminen parantaa myös tutkimuksen tehokkuutta ja vaikuttavuutta sekä edistää yhteistyötä, tieteidenvälistä keskustelua ja tutkimukseen perustuvia innovaatioita. Näin ollen avoin julkaiseminen mahdollistaa ammattilaisten, käytännön toimijoiden ja liike-elämän yhteisöjen sekä kiinnostuneen yleisön hyötymisen tutkimuksesta. Mitä laajempi yleisö pääsee käsiksi uusimpiin tutkimuksiin ja voi rakentaa niiden pohjalta, sitä todennäköisemmin tutkimus hyödyttää koko yhteiskuntaa.

Tutkijan näkökulmasta avoimen julkaisemisen suurin etu on se, että se mahdollistaa tutkimustulosten nopean ja laajan levittämisen. Julkaisemalla avoimesti tutkijat voivat tehdä tutkimustuloksensa vapaasti saataville välittömästi ja saada näin palautetta akateemiselta yhteisöltä nopeammin. Lisäksi avoimissa julkaisuissa esitetyt tutkimustulokset voivat toteutua tehokkaammin politiikkojen, rahoituspäätösten ja muiden päätösten muodossa kuin maksullisten julkaisujen tulokset. Laaja saatavuus tarkoittaa myös enemmän lukijoita, enemmän potentiaalisia yhteistyökumppaneita ja enemmän viittauksia.

The reasons for OA publishing are diverse. One of the most important advantages of open access is that it increases the visibility of academic research results. OA publishing also improves efficiency and efficacy of research and facilitates collaboration, interdisciplinary conversation and research-based innovations. Accordingly, OA publishing allows the professional, practitioner and business communities, and the interested public, to benefit from research. The wider the audience that can access and build upon the latest research, the more likely research benefits the whole society.

From a researcher’s perspective, the greatest benefit of OA publishing is that it enables rapid and wide dissemination of research results. By publishing in open access, researchers can make their research results freely accessible immediately in principle and thus receive feedback from academic community more quickly. Furthermore, research results presented in OA publications may become more efficiently actualized in the form of policies, treatments, funding allocations, and decisions than results published behind paywalls. Wide availability also means more readers, more potential collaborators and more citations.

Niiden, jotka ovat kiinnostuneita avoimesta julkaisemisesta (OA), on hyödyllistä huomioida seuraavat seikat:

  • Avoin julkaiseminen kattaa kaikki vertaisarvioidut julkaisut, sekä lehtiartikkelit että kirjat (monografiat).
  • Ole tietoinen rahoittajasi vaatimuksista, jotka liittyvät avoimeen julkaisemiseen. Monet rahoittajat vaativat välitöntä avointa saatavuutta ja avoimien lisenssien käyttöä.
  • Digitaalinen objekti tunniste (DOI) on ainutlaatuinen merkkijono, jota käytetään digitaalisten objektien, kuten lehtiartikkeleiden, tunnistamiseen. Varmista, että saat DOI:n myös esipainoksellesi.
  • Aseta työsi avoimen sisällön lisenssin, kuten Creative Commons -lisenssin, alaiseksi, jos julkaiset ne avoimesti, jotta ne ovat laajalti uudelleenkäytettävissä.
  • Erilaisten työkalujen ja käytännön resurssien avulla voit tunnistaa luotettavat lehdet ja kustantajat. Saatavilla on useita tietokantoja, jotka auttavat valitsemaan luotettavan julkaisukanavan, esim. Directory of Open Access Journals (DOAJ), Directory of Open Access Books (DOAB), Web of Science ja Scopus.
  • Käytä avoimia institutionaalisia tai tieteenalakohtaisia arkistoja/tietovarastoja itsearkistointiin ja käytä sosiaalista mediaa ja tutkijoiden sosiaalisia verkostoja levittääksesi linkkejä tutkimustyöhösi avoimissa arkistoissa.

For those who are interested in open access (OA) publishing, it would be useful to note the following points: 

  • Open access publishing covers all types of peer-reviewed publications, both journal articles and books (monographs).
  • Be aware of your funder’s requirements related to open access. Many funders require immediate open access and use of open licenses.
  • A digital object identifier (DOI) is a unique text character sequence that is used to identify digital objects, such as journal articles. Make sure that you receive a DOI also for your preprint.
  • Place your works under an open content licence, such as a Creative Commons licence, if you publish them in Open Access to make them widely reusable. 
  • Through a range of tools and practical recourses you may identify trusted journals and publishers. There are various databases available to assist in choosing a reliable publication channel, e.g., Directory of Open Access Journals (DOAJ), Directory of Open Access Books (DOAB), Web of Science and Scopus.
  • Use open institutional or discipline-specific archives/repositories for self-archiving and use social media and social networks for researchers to disseminate the links to your research work in open archives.

Tutkimusdata on tieteellisen tiedon perusta ja siksi laajasti tunnustettu myös arvokkaaksi tutkimuksen tulokseksi. Se tukee tieteellisen tutkimuksen tuloksia ja mahdollistaa teoreettisten tai sovellettujen löydösten muodostamisen. Avoimen tutkimusdatan kysyntä on kasvanut nopeasti, kun erilaiset rahoittajat, julkaisijat ja instituutiot vaativat yhä enemmän tutkijoita avaamaan tutkimusdataansa. Lisäksi tutkimusdatan mekaaninen, hallinnollinen ja tekninen käsittely on yhä tärkeämpi osa tutkijan työtä, aivan kuten menetelmällinen tai analyyttinen datankäsittely. Siksi datan avaamiseen liittyy useita erilaisia kysymyksiä, jotka tutkijoiden tulisi ottaa huomioon koko tutkimuksen elinkaaren ajan.

Research data is the foundation of scientific knowledge and therefore widely also acknowledged to be a valuable outcome of research. It underpins the results of scientific research and enables derivation of theoretical or applied findings. The demand for open research data has grown rapidly as various funders, publishers and institutions increasingly require researchers to open their research data. Also, more mechanical, managerial, and technical handling of research data has increasingly become as important a part of a researchers work as methodological or analytical data processing.  Therefore, there are several different issues associated with opening data, which researchers should consider during the entire research life cycle.

Puhtaimmillaan avoin tutkimusdata tarkoittaa dataa, joka on tehty vapaasti ja julkisesti saatavilla olevaksi, muokattavaksi, uudelleen jaeltavaksi ja uudelleenkäytettäväksi kenelle tahansa ja mihin tahansa tarkoitukseen ilman teknisiä, taloudellisia ja oikeudellisia esteitä. Kaikkea tutkimusdataa ei kuitenkaan voida tehdä saatavilla olevaksi ilman rajoituksia. Datan arkaluonteisuus ja tunnistettavuus, tekijänoikeudella suojattu sisältö ja aikomukset kaupallistaa tutkimustuloksia ovat joitakin asioita, jotka on otettava huomioon ennen datan julkaisemista. Siksi datan jakamista on parasta ohjata nyt laajasti tunnustetun ja omaksutun periaatteen “niin avoin kuin mahdollista ja niin suljettu kuin tarpeellista” mukaisesti.

Asianmukainen tutkimusdatan hallinta kaikissa tutkimusprojektin vaiheissa on tärkein edellytys uudelleenkäytettävälle avoimelle datalle. Tutkimusdatan hallinnan ja sen ennakkosuunnittelun tarkoitus datanhallintasuunnitelmassa (DMP) on varmistaa, että data pysyy saatavilla, luotettavana, turvallisesti suojattuna ja uudelleenkäytettävänä koko elinkaarensa ajan. DMP helpottaa kaikkien datanhallinnan kannalta olennaisten näkökohtien huomioon ottamista, mukaan lukien datan käsittely, organisointi, dokumentointi, tallennus ja varmuuskopiointi sekä datan avaaminen. Erityisen kriittinen vaihe datan uudelleenkäytettävyyden varmistamisessa on riittävä dokumentointi ja sen sisällön ja keräysmenetelmien kuvaus, eli metadata. Kontekstuaalinen metadata tarjoaa tarvittavat tiedot datan ymmärtämiseksi, mukaan lukien sen, miten sitä voidaan tai ei voida käyttää. Lisäksi standardoitu ja koneellisesti luettava metadata helpottaa datan löydettävyyttä. Huono dokumentointi voi tehdä muuten julkisesti saatavilla olevasta datasta käyttökelvotonta jatkotutkimuksille, mukaan lukien tutkijan oman jatkotutkimuksen.

FAIR-dataperiaatteet on suunniteltu helpottamaan datanhallinnan suunnittelua datan uudelleenkäytettävyyden näkökulmasta, ja ne on nyt omaksuttu monien rahoittajien ja tutkimusorganisaatioiden datanhallintavaatimusten kulmakiveksi. FAIR tarkoittaa löydettävää, saatavilla olevaa, yhteentoimivaa ja uudelleenkäytettävää. Jokainen kohta sisältää käytännön sovellusohjeita, jotka tarjoavat ohjeita näiden saavuttamiseksi datanhallinnan kautta. On kuitenkin tärkeää erottaa FAIR-data “avoimesta datasta”. FAIR-dataperiaatteet on tarkoitettu modulaarisiksi siinä mielessä, että niitä voidaan noudattaa eri yhdistelminä olosuhteista riippuen. Jos dataa ei voida tehdä julkisesti saatavilla olevaksi esimerkiksi sen arkaluonteisuuden vuoksi, sitä voidaan silti pitää FAIR-datana, jos datanhallinta on muuten hoidettu asianmukaisesti ja metadata on tehty julkisesti saatavilla olevaksi.

At its purest, open research data refers to data that has been made freely and publicly accessible, modifiable, redistributable, and reusable for anyone and for any purpose free from technical, financial and legal barriers. However, not all research data can be made accessible and available without restrictions. Sensitivity and identifiability of the data, copyrighted content, and intentions to commercialize research results are some of the issues to consider with caution before publishing data. Therefore, data sharing is best to be guided by the now widely recognized and adopted principle of ‘as open as possible and as closed as necessary’.

Proper research data management through all stages of a research project is the most important prerequisite for reusable open data. The purpose of research data management and its advance planning in a data management plan (DMP) is to ensure that the data remains accessible, reliable, securely protected, and reusable through its entire lifecycle. A DMP facilitates the consideration of all relevant aspects of data management, including the handling, organization, documentation, storage and backup, and opening of the data. An especially critical step in securing the reusability of data is sufficient documentation and description of its content and collection procedures, that is, metadata. Contextual metadata provides the necessary information to understand the data, including how it can or cannot be used. Furthermore, standardized and machine-readable metadata facilitates discoverability of the data. Poor documentation may render otherwise publicly available data useless for any further research, including one’s own.

FAIR Data principles have been designed to facilitate data management planning from the perspective of the reusability of data and are now adopted as the cornerstone of data management requirements of many funders and research organizations. FAIR stands for Findable, Accessible, Interoperable and Reusable. Each item is accompanied by practical application instructions that provide guidance on how to achieve these through data management. However, it is important to distinguish FAIR data from ‘Open data’. FAIR Data principles are intended to be modular in the sense that they may be followed in various combinations depending on the circumstances. If the data cannot be made publicly available, for instance because of its sensitivity, it can still be considered FAIR if data management is otherwise taken care of accordingly and metadata are made publicly accessible.

The core arguments for open research data are straightforward. Opening and sharing research data according to the FAIR principles supports transparency of research enabling its verification, replication, reproduction, and refinement, and advances reuse of data, which can potentially accelerate scientific progress. Open research data also benefits stakeholders outside academia and ensures greater returns from public investment in research. This way open data brings great benefits to society. Open data also reduces fraud in science and, on the other hand, increases the public’s trust in science.

From a researcher’s perspective, opening research data may enhance researchers’ recognition and visibility in the field. Also, researchers may maximize the usefulness of the data itself and increase their own efficiency in conducting research. Properly managed research data creates a competitive edge and is an important part of a high-quality research process. When research data are open and reproducible, researchers can build on previous knowledge, achieve better and diverse conversations across research fields, make unexpected discoveries and increase opportunities for new collaborations.  Managing and opening research data according to FAIR principles improve its long-term availability even for researcher’s own purposes. Consequently, it is important that research data is openly available so that it is possible to return to it with new methods or different points of view. With constantly evolving new methods, it is possible to make sure that there are no errors in the previous analysis.

Avoimen tutkimusdatan tuottamisesta ja jakamisesta kiinnostuneiden, olisi hyödyllistä huomioida seuraavat seikat:

Aineistonhallinnan suunnittelu

  • Tutkimusdatan hallinta (RDM) on prosessi, johon on investoitava aikaa ja resursseja, ja se koostuu useista osista, kuten datan tuntemisesta ja kuvaamisesta, eettisten ja oikeudellisten periaatteiden noudattamisesta sekä datan suojaamiseen, tallentamiseen, jakamiseen, arkistointiin, avaamiseen ja julkaisemiseen liittyvien työnkulkujen ymmärtämisestä, jotka on otettava huomioon tutkimusprosessin eri vaiheissa.
  • Aineistonhallintasuunnitelma (DMP) on hyödyllinen työkalu, joka auttaa suunnittelemaan, keräämään ja arkistoimaan dataa tehokkaasti ja systemaattisesti.
  • Kun tuotat avointa tutkimusdataa, yritä asettua toisen asemaan, jotta datasi on hyvin dokumentoitu muiden ja tulevan itsesi käyttöä varten.
  • Jotta tutkimus olisi toistettavissa, jäljitettävissä tai uudelleenkäytettävissä, tutkimusdatan tulisi olla mahdollisimman avointa ja FAIR (löydettävää, saatavilla olevaa, yhteentoimivaa ja uudelleenkäytettävää), samalla kun otetaan huomioon eettiset, kaupalliset ja yksityisyyteen liittyvät rajoitukset arkaluonteisen tai omistusoikeudellisen datan osalta.
  • Joskus dataa ei voida avata esimerkiksi siksi, että tutkija ei ole datan omistaja alun perin, tai data on liian arkaluonteista julkaistavaksi. Vaikka syy olisi mikä tahansa, on aina mahdollista avata datan kuvaus (metadata), koska datan olemassaolon tunteminen on olennaista avoimen tieteen kannalta.

Eettiset ja oikeudelliset näkökohdat

  • On hyvä huomata, että “tutkimusdata” tarkoittaa eri asioita eri tieteenaloille, eikä kaikkea tutkimusdataa voida tehdä saatavilla ilman rajoituksia.
  • Ihmisiin kohdistuvassa tutkimuksessa ilmoita suunnitelmasi datan avaamisesta osallistujainformaatiossa ja hanki osallistujien nimenomainen suostumus datan säilyttämiseen ja jakamiseen suostumuslomakkeella.
  • Datan anonymisointi auttaa suojaamaan arkaluonteista dataa, ja anonymisoitu data ei ole suojelumääräysten alainen.

Pitkäaikainen säilyttäminen ja jakaminen

  • Lisenssejä, kuten Creative Commons (CC), voidaan soveltaa mihin tahansa materiaaliin (esim. ääni, teksti, kuva, multimedia, ohjelmisto), jossa on olemassa käyttöoikeuksia, ja olisi tärkeää käyttää standardoituja lisenssejä myös tutkimusdataasi.
  • Suositeltu tapa tallentaa ja jakaa dataa on tallettaa se luotettavaan verkkotietovarastoon, joka takaa tutkimusdatan pysyvän saatavuuden ja säilytyksen.
  • Sekä tieteenalakohtaisia että poikkitieteellisiä datavarastoja on olemassa. Joitakin laajalti käytettyjä yleisiä datavarastoja ovat esimerkiksi Zenodo ja Open Science Framework (OSF).

For those who are interested in generating or sharing open research data, it would be useful to note the following points:

Data Management Planning

  • Research data management (RDM) is a process in which need to be invested time and resources and it consists of several components such as knowing and describing your data, following ethical and legal principles, and understanding the workflows related to securing, storing, sharing, archiving, opening, and publishing your data, which must be considered at different stages of the research process.
  • A data management plan (DMP) is a useful tool that helps you to plan, collect and archive your data efficiently and systematically.
  • When generating open research data, try to put yourself in someone else’s shoes so in the end your data will be well documented for the further use of others and your future self.
  • To make research replicable, reproducible or reusable research data should be as open and FAIR (findable, accessible, interoperable and reusable) as possible, while considering for ethical, commercial and privacy constraints with sensitive data or proprietary data.
  • Sometimes the data cannot be opened for example because the researcher is not the owner of the data in the first place, or the data is too sensitive to being published. Even though, whatever the reason is, it is always possible to open the description of the data (metadata) because the fact that the existence of the data is known is essential from the point of Open Science.

Ethical and legal considerations

  • It is good to note that ‘research data’ means different things to different disciplines and not all research data can be made available without restrictions.
  • In research involving human participants, disclose your plans of opening the data in the participant information sheet, and obtain the participants’ express consent to retain and share the data with the consent form.
  • Data anonymization helps you to protect sensitive data and the anonymized data is not subject to protection regulations.

Long-term preservation and sharing

  • Licenses, such as Creative Commons (CC), can be applied to any material (e.g., sound, text, image, multimedia, software) where some exploitation or usage rights exist, and it would be important to use standardized licenses also to your research data.
  • The recommended way to store and to share data is to deposit in a trustworthy online repository permanent accessibility and storage of the research data.
  • Both discipline-specific and cross-disciplinary data repositories exist. Some examples of widely used generic data repositories are e.g., Zenodo and Open Science Framework (OSF).
  • When selecting a repository for your data, prefer certified repositories and ensure that repository of your choice provides data with a persistent identifier (PID), such as digital object identifier (DOI), which facilitates searching, discovery, reuse, and citing of your research data.

Be mindful of your institution’s policies and recommendations regarding the preferred repositories and long-term preservation and sharing your research data.

Miksi avoin tiede on tärkeää: tutkimusdatan avoimuus

Videolla Turun yliopiston kirjaston palvelupäällikkö Jukka Rantasaari kuvailee avoimen tieteen tärkeyttä ja tutkimusaineistojen avoimuutta. Videon kieli suomi, tekstitys englanniksi.

Tietotekniikan edistysaskeleet ovat luoneet mahdollisuuksia jakaa digitaalisia tieteellisiä objekteja tavoilla, jotka eivät aiemmin olleet mahdollisia. Viime vuosina avoimen tieteen painopiste on ollut erilaisten tutkimustulosten, ensisijaisesti julkaisujen ja datan, saatavuuden laajentamisessa. Kuitenkin, kun uudet tekniset työkalut ja internet vapauttavat tutkijoita perinteisten tutkimusartikkelien viestinnällisistä rajoituksista, yhä enemmän huomiota kiinnitetään tutkimustyönkulkujen läpinäkyvyyteen ja uudelleenkäytettävyyteen.

Advances in information technology have created possibilities to share digital scholarly objects in ways that were not feasible before. In recent years, much of the focus of the Open Science movement has been on broadening the access to different research outputs, primarily publications and data. However, as new technical tools and internet are increasingly liberating researchers from the communication limitations of a traditional research paper, more and more attention is being given to the transparency and reusability of research workflows.

Yleisesti ottaen työnkulku voidaan ymmärtää järjestettynä sarjana vaiheita, jotka on suunniteltu tietyn tuloksen saavuttamiseksi. Tutkimustyönkulku viittaa toimenpiteisiin, rutiineihin, päätöksiin ja työkaluihin, joita käytetään tutkimusprojektin aikana. Avoimet tutkimustyönkulut tarkoittavat sitä, että tutkijat omaksuvat ja laajentavat avoimen tieteen periaatteet koko tutkimusjaksolle ja järjestävät ja suorittavat työnsä läpinäkyvällä, toistettavalla ja jäljitettävällä tavalla. Läpinäkyvät ja toistettavat työnkulut edellyttävät, että jokainen tutkimusprosessin vaihe dokumentoidaan kattavasti ja esitetään selkeästi, jotta tulosten ja niiden taustalla olevan päättelyn varmistaminen ja ymmärrettävyys helpottuvat, käytettyjen menetelmien ja datan uudelleenkäytettävyys paranee ja tutkimuksen toistettavuus ja jäljitettävyys paranevat.

Sen sijaan, että avoin tiede olisi yksi käytäntö, avoimet työnkulut voidaan ymmärtää vaihtelevina käyttäytymiskokoelmina, joiden yhteisenä tavoitteena on tehdä tutkimusprosessi läpinäkyväksi jokaisessa vaiheessa. On kuitenkin tärkeää huomata, että avoimet työnkulut eivät tarkoita tutkimuksen paljastamista. Vaikka kaikkien tutkimusten lopullisena tavoitteena tulisi olla työnkulun jaettavuus yleisölle, monissa tapauksissa esimerkiksi datan tai materiaalien jakaminen ennen julkaisua ei tule kysymykseen. Avoimien työnkulkujen keskeisiä tekijöitä ovat selkeä ja perusteellinen dokumentointi siitä, miten tutkimus suoritetaan, sekä pääsyn tarjoaminen tietoihin ja materiaaleihin, joita tarvitaan menettelyjen ja analyysien toistamiseen ja tehtyjen valintojen ymmärtämiseen. Työnkulun osat vaihtelevat tieteenalojen ja kontekstien mukaan, mutta esimerkkejä ovat instrumentit, data, työkalut, menetelmät, koodi ja skriptit. Vaikka avoimia työnkulkuja lähestytään eri tavoin tieteenalasta ja kontekstista riippuen, yleinen ajatus prosessin järjestelmällisestä kirjaamisesta ja sen vaiheiden merkityksellisestä viestimisestä muille on sovellettavissa mihin tahansa tutkimukseen kaikilla tieteenaloilla.

Työnkulun hallintaan on olemassa lukuisia työkaluja. Nämä työkalut mahdollistavat julkisen tai yksityisen projektisivun perustamisen, jossa on pilvitallennustilaa erilaisille projektitiedostoille. Niiden muita tärkeitä ominaisuuksia ovat versionhallinta ja digitaalisten objektien aikaleimaus sekä mahdollisuus jakaa projekti muiden kanssa ja hallita, kenellä on pääsy sisältöön. Lisäksi verkkotyönkulkuvarastoille voidaan antaa oma DOI (digitaalinen objektitunniste), mikä mahdollistaa projektin viittaamisen muiden toimesta.

On a general level, a workflow can be understood as an organized series of steps designed for achieving a particular result. A research workflow, then, refers to a set of actions taken, routines followed, decisions made, and tools utilized over the course of a research project. Open research workflows entail that researchers embrace and extend the Open Science principles to the entire research cycle and organize and carry out their work in a transparent, replicable and reproducible manner. Essentially, transparent and repeatable workflows require that each step of the research process is comprehensively documented and explicitly represented to facilitate verification and understandability of the results and reasoning behind them, to improve reuse utility of the used methods and data, and to enhance replicability and reproducibility of research.

Instead of a single Open Science practice, open workflows can be understood as varying collections of behaviours with the common aim of making research process transparent at each of its steps. It is important to note, however, that open workflows do not suggest exposing research. While the eventual target in all research should be shareability of the workflow to the public, in many cases, sharing e.g., data or materials prior to publication may be out of question. Key factors for open workflows are clear and thorough documentation of how research is conducted and provision of access to information and materials needed to reproduce the procedures and analyses and to understand the choices made. Components of the workflow vary across disciplines and contexts, but examples include instruments, data, tools, methods, code and scripts. While open workflows are approached differently depending on the discipline and context, the general idea of keeping an organized record of the process and being able to communicate its steps meaningfully to others is applicable to any research across all disciplines.

Numerous dedicated tools now exist for workflow management. These tools allow setting up a public or a private project page with cloud storage space for different types of project files. Their other important features include version control and time stamping of digital objects and possibility to share the project with others ability to control who has access to the content. Furthermore, online workflow repositories can be assigned their own DOI (digital object identifier) making it possible for others to cite the project.

Avoimet työnkulut ovat nousemassa käytännöksi, joka merkittävästi parantaa tutkimuksen läpinäkyvyyttä ja toistettavuutta. Avoimet työnkulut ovat olennaisia, jotta muut voivat ymmärtää tutkijan päätösten ja valintojen taustalla olevat kontekstit ja perustelut sekä toisaalta toistaa ja tarkentaa tutkimusprosessia. Avoimet työnkulut kannustavat myös tutkijoita käyttämään standardoituja rakenteita esimerkiksi datan ja koodin arkistointiin. Avoimien työnkulkujen toteutus vaihtelee kuitenkin kontekstin mukaan, ja tieteenalasta riippuen suurimmat hyödyt voivat liittyä esimerkiksi ennakkorekisteröintiin, koodiin, dataan, menetelmiin tai tuloksiin. Lopuksi, avoimet työnkulut voivat parantaa tutkimuksen tehokkuutta. Erityisesti skripteihin perustuvat työnkulut ovat äärettömän uudelleenkäytettäviä ja siirrettävissä muihin datasetteihin, mikä tuo merkittäviä ajansäästöjä.

Tutkijan näkökulmasta huolellinen kirjanpito tutkimusprojektin aikana auttaa pitämään projektin järjestyksessä, minimoi virheet, suojaa arvokkaiden tietojen menetyksiltä ja edistää tutkimustulosten pitkäaikaista säilyttämistä sekä muiden että omiin tarkoituksiin. Antamalla muiden tarkastella ja arvioida tutkimusprojektia sen ollessa vielä käynnissä, voidaan havaita virheitä, antaa ja sisällyttää palautetta, mikä voi olla hyödyllistä tutkimuksen laadun kannalta ja johtaa vankempiin tutkimustuloksiin. Lisäksi työnkulkujen avoin jakaminen ennen julkaisua muille verkkovarastossa lisää työn näkyvyyttä, mahdollistaa tunnustuksen saamisen viittausten muodossa ja voi edistää uusia ja odottamattomia yhteistyömahdollisuuksia.

Open workflows are emerging as a practice that significantly enhances transparency and reproducibility of research. Open workflows are essential for enabling others to understand the context and reasonings behind decisions and choices of the researcher and on the other hand replicate and refine the research process.  Open workflows also encourage researchers to employ standard structures for e.g., data and code archiving. However, implementation of open workflows varies based on context, and depending on the discipline, greatest benefits may relate to e.g., preregistration, code, data, methods or results. Finally, open workflows may improve efficiency of research. Especially, script-based workflows are infinitely reusable and transferable to other datasets bringing significant time savings.

From a researcher’s perspective, careful recordkeeping through the course of a research project helps to keep the project organised, minimises errors, provides protection against losses of valuable information, and contributes to long-term preservation of research outputs for others but also for one’s own purposes. Letting others to view and evaluate the research project while it is still ongoing allows for detecting errors, providing and incorporating feedback which can be beneficial in terms of quality of research and lead to more robust research results. Furthermore, open sharing of the workflows before publication to others in an online repository increases visibility of one’s work, allows for receiving credit in the form of citations, may facilitate new and unexpected collaboration.

Työvirtojensa avaamisesta kiinnostuneiden olisi hyvä huomioida seuraavat seikat:

  • Kun suunnittelet työsi vaiheita, voi olla hyödyllistä keskittää ja järjestää projektinhallinta käyttämällä verkkopohjaista alustaa, keskusvarastoa tai kansiota kaikille tutkimustiedostoille.
  • Työnkulkuvarastot, kuten Open Science Framework (OSF) tai GitHub, tarjoavat rakenteen tutkimuksen avoimeen jakamiseen ja auttavat hallitsemaan, kontrolloimaan pääsyä, arkistoimaan ja jakamaan tutkimusprojektin jokaista vaihetta.
  • Avoimien lisenssien ja pysyvien tunnisteiden käyttö helpottaa muiden uudelleenkäyttöä ja auttaa suojaamaan omaa työtä ja saamaan tunnustusta siitä.
  • Avoimen lähdekoodin ohjelmistojen tai sellaisten omistusoikeudellisten ohjelmistojen käyttö, jotka käyttävät avoimia tiedostomuotoja, helpottaa muiden tutkijoiden pääsyä tietoihin, tukee yhteentoimivuutta ja suojaa arvokkaiden tietojen menetyksiltä, jotka johtuvat tietyn mukautetun tiedostomuodon tuen päättymisestä.

For those who are interested in getting started with open workflows, it would be useful to note the following points:

  • As you plan the steps of your work it might be useful to centralize and organize your project management using an online platform, a central repository, or folder for all research files.
  • Workflow repositories, such as Open Science Framework (OSF) or GitHub, provide a structure for sharing your research openly and help you to manage, control access, archive, and share each step of your research project.
  • Use of open licenses and persistent identifiers facilitates reuse by others and helps to protect one’s work and receive credit for it.
  • Using open-source software or proprietary software that uses open file formats facilitates accessibility to other researchers, supports interoperability and provides protection against future losses of valuable information due to end of support for a particular custom file format.

Ennakkorekisteröinti – Mitä hyötyä siitä on?

Videolla Turun yliopiston tutkija Lydia Laninga-Wijnen kertoo ennakkorekisteröinnin hyödyistä ja haasteista sekä nostaa esille työkaluja ennakkorekisteröintien tekoon. Videon kieli englanti, tekstitys englanniksi.

Ensiaskeleet tutkimuksen toistettavuuteen – osa 1

Videolla Turun yliopiston tutkija Juuso Repo kertoo tutkimuksen toistettavuuden tärkeydestä ja esittelee keinoja tehdä tutkimuksen työvirroista avoimia. Videon kieli englanti, tekstitys englanniksi.

Ensiaskeleet tutkimuksen toistettavuuteen – osa 2

Videolla Turun yliopiston tutkija Juuso Repo esittelee käytännönläheisesti R-studion käyttöä. Videon kieli englanti, tekstitys englanniksi.

Tutkimusmenetelmien avoimuudessa on tärkeää että tutkija raportoi käyttämänsä tutkimusmenetelmät aina riittävän yksityiskohtaisesti ja kattavasti, jotta niiden käyttöä ja soveltuvutta on mahdollista arvioida luotettavasti. Tutkimusmenetelmien raportoinnissa keskeistä on tuoda esille miten tulokset on saatu ja miten valitut menetelmät voivat vaikuttaa tutkimuksen tuloksiin ja johtopäätöksiin. Tutkimusmenetelmiä koskevan tiedon dokumentointi, versiointi, avoin jakelu sekä selkeät uudelleenkäyttöä tukevat luvat edesauttavat tutkimusmenetelmien uudelleenkäytettävyyttä ja jatkokehitystä.

Osallistava tiede on tieteellistä tutkimusta, johon osallistuvat tutkimusyhteisön ulkopuolelta tulevat toimijat, kuten kansalaistieteilijät, yritykset ja kolmannen sektorin järjestöt. Osallistavan tieteen voidaan siis ajatella sisältävän kansalaistieteen lisäksi myös yritys- sekä järjestöyhteistyötä. Osallistavassa tieteessä tutkija voi osallistaa erilaisia yleisöjä ja olla vuorovaikutuksessa niiden kanssa edistääkseen tutkimuksensa luotettavuutta ja vaikuttavuutta.