3M1V
Název projektu / produktu: Docuhelper
Link na projekt: https://hackbrno.nadrazky.org/
Vedoucí týmu: Vojtěch Müller
Výzva: 2. AI DocuHelper
Problém: Extrahování a validace dat ze zdravotnické dokumentace je zdlouhavý proces. Cílem je vytvořit standardizovaný záznam o osobě, anamnéze a dalších atributů. Pracovníci musí ručně vyhledávat pacienta v NIS podle rodného čísla, procházet rozsáhlou dokumentaci, otevírat relevantní zprávy (patologie, propouštěcí zprávy, ambulance klinického onkologa, podání chemoterapie) a manuálně v nich hledat a kontrolovat potřebná data.
Řešení: Naše řešení nemá za cíl nahradit expertízu dokumentátora, pouze slouží jako asistent urychlující a pomáhající v jeho práci. Pro předem zadanou sadu otázek náš systém najde relevantní dokumenty ke každé otázce a konkrétní relevantní pasáže v každém dokumentu. Tyto data poté zobrazuje a umožňuje dokumentátorovi zrychlit jeho práci.
Dopady: Náš projekt významně ušetří čas dokumentátorům, kteří aktuálně nemají žádný nástroj, který by dokázal prioritizovat důležité dokumenty v celé historii pacienta. Naše řešení toto nabízí a dokumentátor se tedy může zaměřit pouze na důležité záznamy, což povede k rychlejšímu zpracování jednoho pacienta. Zároveň to také slouží jako testovací prostředí pro přenesení systému do nemocnice, kde by sloužil jako dokumentace pro doktory.
Proveditelnost: Projekt je téměř připravený pro zjednodušené nasazení již v aktuálním stavu. Určitě by bylo potřeba doladit extrakci na reálných datech nemocnice, vše pořádně otestovat a potenciálně přidat možnost uživatelských účtů.
Jinak je aplikace připravena na deployment jako docker image, zobrazovaná a extrahovaná data jsou korektní.
V čem je řešení nové: Většina dostupných komerčních řešení má za snahu zcela nahradit práci dokumentátora, tedy extrahovat data automaticky a často jim chybí expertní znalost. Naše řešení slouží pouze jako asistent pro dokumentátora a umožňuje mu jeho expertízu aplikovat efektivněji. Toto zároveň znamená, že řešení je lépe nasaditelné v aktuálních podmínkách.
Co jste udělali během hackathonu - textové vysvětlení + kód (např. odkaz na GitHub): Kompletní implementaci jádra projektu. Všechny vzniklé zdrojové kódy jsou dostupné v následujícím GitHub: https://github.com/MatejFrnka/hackbrno. Řešení je rozděleno na 3 hlavní části: LLMBackend, WebBackend a WebFrontend. LLMBackend komunikuje s jazykovým modelem a zpracovává data o jednotlivých pacientech. WebBackend poskytuje všechna data pro webový frontend přes API, spravuje databázi a využívá LLMBackend pro zpracování dat pacientů. WebFrontend všechna data zobrazuje a vizualizuje.
Co jste měli hotové před hackathonem?: Neměli jsme nic. Jako jádro projektu jsme přímo nevyužili žádné existující části kódu, ovšem projekt jsme postavili na běžných Python a JS knihovnách, například flask, difflib a react.
Co bude následovat a čeho chcete dosáhnout? Máte zájem projekt dále rozvíjet?: Plánujeme uvést naše řešení do klinické praxe. Náš mentor potvrdil, že v nemocnici mají potřebnou infrastrukturu, tedy připravené etl pipelines pro export dat do našeho systému a hardware pro provoz jazykových modelů.
Rádi bychom projekt posunuli dále a rozšířili ho na univerzální platformu pro evidenci pacientských záznamů, která pomůže v práci s dokumentací pro doktory. Propouštěcí zprávy, agregace záznamů o pacientovi, na to všechno lze naše jádro použít.