3M1V

Název projektu / produktu: Docuhelper

Link na projekt: https://hackbrno.nadrazky.org/

Vedoucí týmu: Vojtěch Müller

Výzva: 2. AI DocuHelper

Problém: Extrahování a validace dat ze zdravotnické dokumentace je zdlouhavý proces. Cílem je vytvořit standardizovaný záznam o osobě, anamnéze a dalších atributů. Pracovníci musí ručně vyhledávat pacienta v NIS podle rodného čísla, procházet rozsáhlou dokumentaci, otevírat relevantní zprávy (patologie, propouštěcí zprávy, ambulance klinického onkologa, podání chemoterapie) a manuálně v nich hledat a kontrolovat potřebná data.

Řešení: Naše řešení nemá za cíl nahradit expertízu dokumentátora, pouze slouží jako asistent urychlující a pomáhající v jeho práci. Pro předem zadanou sadu otázek náš systém najde relevantní dokumenty ke každé otázce a konkrétní relevantní pasáže v každém dokumentu. Tyto data poté zobrazuje a umožňuje dokumentátorovi zrychlit jeho práci.

Dopady: Náš projekt významně ušetří čas dokumentátorům, kteří aktuálně nemají žádný nástroj, který by dokázal prioritizovat důležité dokumenty v celé historii pacienta. Naše řešení toto nabízí a dokumentátor se tedy může zaměřit pouze na důležité záznamy, což povede k rychlejšímu zpracování jednoho pacienta. Zároveň to také slouží jako testovací prostředí pro přenesení systému do nemocnice, kde by sloužil jako dokumentace pro doktory.

Proveditelnost: Projekt je téměř připravený pro zjednodušené nasazení již v aktuálním stavu. Určitě by bylo potřeba doladit extrakci na reálných datech nemocnice, vše pořádně otestovat a potenciálně přidat možnost uživatelských účtů. Jinak je aplikace připravena na deployment jako docker image, zobrazovaná a extrahovaná data jsou korektní.

V čem je řešení nové: Většina dostupných komerčních řešení má za snahu zcela nahradit práci dokumentátora, tedy extrahovat data automaticky a často jim chybí expertní znalost. Naše řešení slouží pouze jako asistent pro dokumentátora a umožňuje mu jeho expertízu aplikovat efektivněji. Toto zároveň znamená, že řešení je lépe nasaditelné v aktuálních podmínkách.

Co jste udělali během hackathonu - textové vysvětlení + kód (např. odkaz na GitHub): Kompletní implementaci jádra projektu. Všechny vzniklé zdrojové kódy jsou dostupné v následujícím GitHub: https://github.com/MatejFrnka/hackbrno. Řešení je rozděleno na 3 hlavní části: LLMBackend, WebBackend a WebFrontend. LLMBackend komunikuje s jazykovým modelem a zpracovává data o jednotlivých pacientech. WebBackend poskytuje všechna data pro webový frontend přes API, spravuje databázi a využívá LLMBackend pro zpracování dat pacientů. WebFrontend všechna data zobrazuje a vizualizuje.

Co jste měli hotové před hackathonem?: Neměli jsme nic. Jako jádro projektu jsme přímo nevyužili žádné existující části kódu, ovšem projekt jsme postavili na běžných Python a JS knihovnách, například flask, difflib a react.

Co bude následovat a čeho chcete dosáhnout? Máte zájem projekt dále rozvíjet?: Plánujeme uvést naše řešení do klinické praxe. Náš mentor potvrdil, že v nemocnici mají potřebnou infrastrukturu, tedy připravené etl pipelines pro export dat do našeho systému a hardware pro provoz jazykových modelů. Rádi bychom projekt posunuli dále a rozšířili ho na univerzální platformu pro evidenci pacientských záznamů, která pomůže v práci s dokumentací pro doktory. Propouštěcí zprávy, agregace záznamů o pacientovi, na to všechno lze naše jádro použít.