Az egészségügyi és az orvosbiológiai kutatások adatainak széttagoltsága az adatvezérelt döntéseken alapuló, személyre szabott orvoslás egyik akadálya. A fejlődéshez a méretben és komplexitásban is rendkívüli, ám töredezett egészségügyi adatkincs hatékony kiaknázását, illetve az intézményeken vagy akár határokon is átívelő adatmegosztást biztosító technológiák szükségesek. A biobankok nemcsak a minták archívumai, hanem adatintegrációs központok is egyúttal. A biobankok adatainak együttműködésben történő elemzése értékesebb következtetéseket ígér. Az adatok megosztásának előfeltétele a harmonizáció, azaz a minták egyedi klinikai és molekuláris jellemzőinek egységes adatmodellben és standard kódokkal történő leképezése. Az egészségügyben keletkezett információk ezekben a közös sémára illesztett adatbázisokban válnak elérhetővé a gépi tanulás számára, így a módszer az együttműködés során a személyes adatokat tiszteletben tartó felhasználásra is lehetőséget ad. Az érzékeny egészségügyi adatok újraértékelése elképzelhetetlen a személyes adatok védelme nélkül, amelynek jogi és koncepcionális kereteit a GDPR- (General Data Protection Regulation) és a FAIR- (findable, accessible, interoperable, reusable) elvek jelölik ki. Az Európában működő biobankok számára a BBMRI-ERIC (Biobanking and Biomolecular Research Infrastructure – European Research Infrastructure Consortium) kutatási infrastruktúra fejleszt közös irányelveket, amelyhez hazánk 2021-ben mint Magyar BBMRI Csomópont csatlakozott. Első lépésben a biobankok szövetségében kapcsolódhatnak össze a széttagolt adathalmok, ahol sokrétű kutatási cél által motivált, igényesen összerendezett adatkészletek válnak hozzáférhetővé. Ezt követően, a betegellátás valós környezetében keletkezett adatok magasabb szinten történő értékelése is lehetővé válik, így a klinikai vizsgálatok szigorú keretek között generált bizonyítékai új szintre kerülhetnek. Közleményünkben a „federált” adatmegosztásban rejlő lehetőségeket mutatjuk be a Semmelweis Egyetem biobankjainak közös projektje kapcsán. Orv Hetil. 2023; 164(21): 811–819.
Dolley S. Big data’s role in precision public health. Front Public Health 2018; 6: 68.
Enticott JC, Melder A, Johnson A, et al. A learning health system framework to operationalize health data to improve quality care: an Australian perspective. Front Med. 2021; 8: 730021.
Institute of Medicene. Sharing clinical research data: workshop summary. National Academies Press, Washington, DC, 2013.
Kriegova E, Kudelka M, Radvansky M, et al. A theoretical model of health management using data-driven decision-making: the future of precision medicine and health. J Transl Med. 2021; 19: 68.
Ross JS. Clinical research data sharing. What an open science world means for researchers involved in evidence synthesis. Syst Rev. 2016; 5: 159.
Esteva‑Socias M, Artiga MJ, Bahamonde O, et al. In search of an evidence‑based strategy for quality assessment of human tissue samples. Report of the tissue Biospecimen Research Working Group of the Spanish Biobank Network. J Transl Med. 2019; 17: 370.
Coppola L, Cianflone A, Grimaldi AM, et al. Biobanking in health care: evolution and future directions. J Transl Med. 2019; 17: 172.
Mate S, Kampf M, Rödle W, et al. Pan-European data harmonization for biobanks in ADOPT BBMRI-ERIC. Appl Clin Inform. 2019; 10: 679–692.
Ong TC, Kahn MG, Kwan BM, et al. Dynamic-ETL: a hybrid approach for health data extraction, transformation and loading. BMC Med Inform Decis Mak. 2017; 17: 134.
Wieder P, Nolte H. Toward data lakes as central building blocks for data management and analysis. Front Big Data 2022; 5: 945720.
Krekora-Zając D, Marciniak B, Pawlikowski J. Recommendations for creating codes of conduct for processing personal data in biobanking based on the GDPR art. 40. Front Genet. 2021; 12: 711614.
Litton JE. Launch of an infrastructure for health research: BBMRI-ERIC. Biopreserv Biobank 2018; 16: 233–241.
Hulsen T. Sharing is caring. Data sharing initiatives in healthcare. Int J Environ Res Public Health 2020; 17: 3046.
Bentzen HB, Castro R, Fears R, et al. Remove obstacles to sharing health data with researchers outside of the European Union. Nat Med. 2021; 27: 1329–1333.
Rieke N, Hancox J, Li W, et al. The future of digital health with federated learning. NPJ Digit Med. 2020; 3: 119.
Xu J, Glicksberg BS, Su C, et al. Federated learning for healthcare informatics. J Healthc Inform Res. 2021; 5: 1–19.
Ng D, Lan X, Yao MM, et al. Federated learning. A collaborative effort to achieve better medical imaging models for individual sites that have small labelled datasets. Quant Imaging Med Surg. 2021; 11: 852–857.
Pletscher-Frankild S, Pallejà A, Tsafou K, et al. DISEASES: text mining and data integration of disease-gene associations. Methods 2015; 74: 83–89.
Bastarache L, Brown JS, Cimino JJ, et al. Developing real-world evidence from real-world data: transforming raw data into analytical datasets. Learn Health Syst. 2022; 6: e10293.
Mahendraratnam N, Mercon K, Gill M, et al. Understanding use of real-world data and real-world evidence to support regulatory decisions on medical product effectiveness. Clin Pharmacol Ther. 2022; 111: 150–154.
Rudrapatna VA, Butte AJ. Opportunities and challenges in using real-world data for health care. J Clin Invest. 2020; 130: 565–574.
Dyda A, Purcell M, Curtis S, et al. Differential privacy for public health data: an innovative tool to optimize information sharing while protecting data confidentiality. Patterns (N. Y.) 2021; 2: 100366.
Kumar AV, Sujith MS, Sai KT, et al. Secure multiparty computation enabled e-healthcare system with homomorphic encryption. IOP Conf Ser: Mater Sci Eng. 2020; 981: 022079.
Scheibner J, Ienca M, Vayena E. Health data privacy through homomorphic encryption and distributed ledger computing: an ethical-legal qualitative expert assessment study. BMC Med Ethics 2022; 23: 121.
Barnes C, Bajracharya B, Cannalte M, et al. The Biomedical Research Hub: a federated platform for patient research data. J Am Med Inform Assoc. 2022; 29: 619–625.
Hallock H, Marshall SE, ’t Hoen PA, et al. Federated networks for distributed analysis of health data. Front Public Health 2021; 9: 712569.
Pati S, Baid U, Edwards B, et al. Federated learning enables big data for rare cancer boundary detection. Nat Commun. 2022; 13: 7346. Erratum: Nat Commun. 2023; 14: 436.
Ogier du Terrail J, Leopold A, Joly C, et al. Federated learning for predicting histological response to neoadjuvant chemotherapy in triple-negative breast cancer. Nat Med. 2023; 29: 135–146.