Aktivity ZČU v rámci realizace projektu OS II
Sociální vědy (KA 05)
Využití AI pro bezpečnou práci s daty v sociálních vědách
Západočeská univerzita v rámci aktivit KA 05 vyvíjí a testuje postupy pro anonymizaci a sdílení výzkumných dat. Naším cílem je umožnit vědecké komunitě přístup k datům při zachování plné ochrany soukromí respondentů. K dosažení tohoto cíle využíváme metodu tvorby tzv. syntetických dat a zapojení velkých jazykových modelů (LLM).
Syntetická data a AI: Pomocí umělé inteligence generujeme věrné kopie datových souborů. Ty si zachovávají statistické vlastnosti původních dat, ale neobsahují žádné osobní údaje, což umožňuje jejich bezpečné publikování a sekundární analýzu.
Deidentifikace textů: Využíváme AI k znecitlivění kvalitativních dat (např. rozhovorů). Tento proces „překládá“ textová data z jejich původního kontextu do jeho funkčního ekvivalentu – např. vzpomínky zelináře na nekalé obchodní praktiky v 80. letech 20. století převedeme na vzpomínky automechanika ze stejné doby. Tím minimalizujeme riziko zpětné identifikace osob, avšak zachováme maximální vědeckou hodnotu dat – historici a sociologové stále mohou zkoumat, jak fungovaly nekalé obchodní praktiky v ČSSR.
Dostupnost dat: Všechny postupy ladíme v souladu s principy FAIR (vyhledatelnost, dostupnost, interoperabilita a opětovná použitelnost), aby věda na ZČU byla otevřená a zároveň bezpečná.
Humanitní vědy a umění (KA 07)
Cílem tematické klíčové aktivity KA 07 je především inovace stávajících a budování nových repozitářů v rámci oborového clusteru humanitních věd a umění, spolu s vývojem nástrojů a služeb pro rozvoj Národní datové infrastruktury (NDI). Aktivity se zaměřují na FAIRifikaci klíčových oborových datasetů, vývoj specifických metadatových schémat a implementaci principů otevřené vědy (Open Science) v disciplínách jako lingvistika, archeologie či literární bibliografie. Projekt rovněž usiluje o zvýšení uživatelského komfortu repozitářových platforem prostřednictvím vývoje nadstavbových nástrojů, například pro vizualizaci dat nebo využití virtuální reality. Role
Západočeské univerzity v Plzni (ZČU) v rámci této aktivity spočívá zejména v technologickém vývoji pokročilých softwarových nástrojů v rámci jedné z podaktivit. ZČU je zodpovědná za přípravu softwaru pro strojové zpracování audiodat, který zahrnuje moduly pro automatické rozpoznávání řeči (ASR). Dále univerzita vyvíjí softwarový nástroj pro automatický sběr (harvesting) textových dokumentů z webu, který má sloužit především potřebám lingvistického výzkumu a zpracování dat v humanitněvědných repozitářích.
Citlivá data (KA 09)
Nastavení metodiky pro správu citlivých dat z kolaborativního výzkumu
Západočeská univerzita se v rámci aktivit KA 09 podílí na nastavení jasných pravidel pro práci s citlivými daty. Konkrétním cílem ZČU je, aby soukromé firmy a další instituce, se kterými spolupracujeme, měly jistotu, že jsou jejich data a know-how v bezpečí a že je s nimi nakládáno podle nejpřísnějších pravidel.
Zaměřujeme se na 3 základní oblasti: na zabezpečení, eticko-právní principy a transparentnost. Navrhujeme, jak citlivá data vhodně anonymizovat, šifrovat a chránit před únikem či neoprávněným přístupem. Připravujeme návody, jak data bezpečně sdílet, jaké k nim vybrat licence a jak dodržet všechny právní a etické normy. A i když některá data musí zůstat skrytá, uživatelé se dozvědí vše podstatné o jejich původu a způsobu ochrany.
Spolupráce fakult a výzkumných center: FAV/NTIS (vedení), FEL/RICE, NTC a CIV