CIIRC ČVUT se podílí na realizaci evropského projektu v oblasti extrémních dat

0
1179

Český institut informatiky, robotiky a kybernetiky ČVUT se stal jedním z partnerů v devítičlenném konsorciu, které se spojilo za účelem realizace projektu EXA4MIND, který obdržel v rámci programu Horizont Evropa financování ve výši téměř 5 milionů EUR.

Název projektu je zkratkou z EXtreme Analytics for MINing Data Spaces a jeho cílem je do roku 2026 vybudovat platformu pro extrémně objemná data, která propojí datová úložiště a výkonnou výpočetní infrastrukturu (superpočítače) zavedením nových metod automatické správy dat a jejich efektivního přenosu a ukládání.

Na našem institutu se na tomto projektu, jehož realizace probíhá od začátku roku 2023 do konce roku 2025, podílí skupina aplikované algebry a geometrie oddělení robotiky a strojového vnímání. Vyvíjí metody strojového učení zaměřené na zpracování velkého množství multimodálních dat pocházejících z kamer, LiDARových senzorů a případně i radarů autonomních vozidel, které slouží k vykreslení prostoru kolem nich.

Skupina výzkumníků z CIIRC při vývoji těchto metod těsně spolupracuje s firmou Valeo, zejména s její výzkumnou skupinou valeo.ai, která se specializuje na výzkum a vývoj umělé inteligence a strojového učení v automobilovém průmyslu s cílem zlepšit efektivitu, bezpečnost a komfort automobilových aplikací.

Hlavním úkolem našeho výzkumného týmu je výzkum a vývoj v oblasti strojového učení s limitovaným přístupem k anotovaným datům, tedy k datům označeným tak, aby stroje při svém učení pochopily, co jsou zač a co znamenají. Toto je typický případ právě pro data sbíraná v automobilech, kde je k dispozici veliké množství nahrávek, které ovšem označení (anotace) postrádají.

Pro trénování modelů strojového učení jsou anotovaná data velmi důležitá. Manuální anotace dat je však velmi náročná jak z časového, tak i z finančního hlediska. Jedná se totiž o proces, kdy člověk musí ručně přiřadit jakýsi smysluplný informační štítek každému datovému příkladu, aby se z něj mohl model strojového učení učit. Metody vyvinuté v rámci tohoto projektu tedy budou schopné získávat užitečné informace z neanotovaných dat a vyprodukovat systém, který následně potřebuje méně anotovaných dat pro provedení finální úlohy.

„V praxi to znamená, že nejprve spustíme model pomocí námi vyvinuté metody na neanotovaných datech. Následně použijeme tento model jako inicializaci modelu pro cílovou úlohu, jako je například detekce chodců či jedoucích aut. Takto inicializovaný model následně potřebuje mnohem méně anotovaných dat pro cílovou úlohu, což přináší velké úspory na straně potřeby manuálních anotací“, vysvětluje Antonín Vobecký z našeho institutu, který se na výzkumu podílí.

 

Problematika extrémních dat se týká tak obrovského množství dat, které přesahuje kapacitu běžných nástrojů pro jejich správu a analýzu. A množství dat stále roste, takže se stává stále náročnější tato data uchovávat, zpracovávat a interpretovat.  Vyžaduje to využití speciálních technologií a nástrojů, jako jsou distribuované databáze, cloudová úložiště, nástroje pro paralelní zpracování dat, strojové učení a další.

Správa a analýza extrémních dat je důležitá pro mnoho oblastí, jako jsou například biomedicína, finance, marketing či výroba. Pomocí analýzy extrémních dat v nich mohou organizace odhalit skryté vztahy a vzorce, což může vést k vylepšení podnikových procesů, zlepšení produktů a služeb a lepšímu pochopení chování zákazníků.

Na realizaci evropského projektu EXA4MIND se podílí zástupci významných univerzit, výzkumných institucí, malých a středních podniků a průmyslového sektoru. Jako modelové zde byly vybrány čtyři aplikační oblasti charakterizované velkými objemy dat:
– molekulární dynamika
– autonomní řízení
– chytré zemědělství/vinařství
– zdravotnictví/společnost
.

Výstupem projektu by měl být návrh jedinečné databáze a nových metod přenosu, ukládání a analýzy dat, které budou prováděny pomocí superpočítačů s využitím umělé inteligence a strojového učení.

Koordinátorem projektu EXA4MIND se stalo IT4Innovations – národní superpočítačové centrum při VŠB – TU Ostrava, které provozuje v současné době tři superpočítače, Karolina, Barbora a NVIDIA DGX -2, z nichž nejvýkonnější Karolina s výkonem 15,7 PFlop/s, je v provozu od roku 2021.

 

 

Konsorcium projektu EXA4MIND tvoří celkem devět partnerů:

IT4Innovations, VŠB – Technická univerzita Ostrava (Česká republika)
Superpočítačové centrum Leibniz Bavorské akademie věd a humanitních oborů (Německo)
Technická univerzita Blízkého východu (Turecko)
Marketingová agentura AUSTRALO (Španělsko)
Konzultační organizace EURAXENT (Francie)
CIIRC, ČVUT v Praze (Česká republika)
Valeo Autoklimatizace k.s. (Česká republika)
IT poradenská společnost ALTRNATIV (Francie)
Konzultační společnost Terraview (Švýcarsko)

 

 

 

Další informace a zdroje:

Tiskovou zprávu vydanou VŠB-Technická univerzita Ostrava si můžete přečíst ZDE.

Více informací o projektu naleznete na stránkách EK CORDIS.

O problematice strojového učení s limitovaným přístupem k anotovaným datům se více dozvíte ZDE.

 

Previous articleČeská skupina DECCI zahájila výstavbu unikátního řešení pro vyšší energetickou bezpečnost a flexibilní využití obnovitelných zdrojů. CIIRC je jedním z partnerů.
Next articleTEPLATOR prezentován v Bruselu v rámci zahájení „Iniciativy EU SMR 2030“