 
    
    
        | Teljes név: | Concentrated Cooperation on Research Data | 
| Kezdet: | 2020. | 
| Lezárás: | 2023. | 
| Résztvevők: | |
| A projekt honlapja: | https://science-data.hu/ | 
| Vezető: | SZTAKI | 
A projekt célja magyar kutatási adat repozitórium létrehozása a COVID-19 járvánnyal kapcsolatos kutatások támogatása céljából. A kutatási adat repozitórium hazai és nemzetközi szinten adattárolási és repozitórium szolgáltatásokat, valamint egyértelműen (peer-to-peer módon) szabályozott és megbízható adatmegosztást biztosít.
A rendszer épít a SZTAKI és a Wigner kutatóintézetek által működtetett MTA Cloud szolgáltatásaira mind a biztonságos adattárolás, mind pedig a jól definiált hozzáférhetőségi jogosultságok tekintetében.
Bár a repozitórium generikus, elméletileg bármely kutatói közösség számára hasznos szolgáltatásokat nyújt, előnyben részesítjük a COVID-19 járvánnyal kapcsolatos kutatók, kutató csoportok, intézmények kiszolgálását.
Az adat repozitórium fejlesztését két lépcsőben tervezzük. Az első lépcsőben megvalósul:
- Nemzetközileg megosztott, publikációhoz társított kutatási adathalmaz tárolás. 
 Maga a publikáció egyértelműen hivatkozhat a tárolt kutatási adatokra. A publikációhoz társított adat entitásokat individuálisan avagy összecsomagoltan szeretnék feltölteni, amely után a rendszer kicsomagolja és az adat hivatkozás alapján rendezetten tárolja el az entitásokat.
- Adott tudományos közösség tudományos adatainak nemzetközi megosztása.
 A kívánt repozitórium funkciók: adatentiások individuális és burst-ös feltöltése, metaadatok individuális bevitele formon keresztül és azok burst-ös feltöltése. Az adat entitások azonosítása, böngészése, kereshetősége, individuális és keresési eredmény halmazok együttes letöltése.
- Kutatási adatok nyílt/zárt hosszú távú nemzetközi megosztása.
 A tervezett metaadatolás teljes körű és megfelel a hosszú távú digitális tárolás elvárásainak (OAIS).
Az első lépcsőben kialakított szolgáltatás a Dataverse szoftverre épül, azt fejleszti tovább és egészíti ki a magyar igényekhez igazítva. A második lépcsőben a nyers adatok megosztására és közös előállítására, gondozására adunk megoldást. A rendszer így már a kezdetektől adja a következő szolgáltatásokat:
- Hivatkozások létrehozása adathalmazokra és fájlokra.
 EndNote XML, RIS és BibTeX formátumok.
- OAI-PMH (Harvesting) interfészt biztosít.
 Metaadatok nyilvánossá tétele más rendszerek felé, illetve metaadatok gyűjtése.
- EduID bejelentkezés támogatása.
- Schema.org JSON-LD támogatás.
 Ez lehetővé teszi a Google Dataset Search szolgáltatás használatát más szolgáltatások felől.
- Verziókövetés.
 Az adathalmazok és fájlok változásainak listája tárolásra kerül.
- Irányított keresés (Faceted search) támogatása.

 
            
