Plzeňští vědci mapují výpovědi svědků komunistických represí

7. březen 2018

Specialisté ze Západočeské univerzity v Plzni vytvářejí programy, díky kterým bude možné v audiovizuálních a textových archivech rychle najít konkrétní výpovědi.

Vědci ze Západočeské univerzity v Plzni mapují výpovědi svědků totalitních režimů. Tvoří programy, díky kterým je možné v těchto dokumentech snadno vyhledávat. V minulosti spolu s pražskou matematicko-fyzikální fakultou zmapovali vzpomínky svědků holokaustu. Teď zpracovávají nahrávky rozhovorů se svědky komunistických represí.

Dokumenty shromáždil v letech 2008-2015 Ústav pro studium totalitních režimů. Pod vedením profesora Luďka Müllera je zpracovává tým z Fakulty aplikovaných věd ZČU v Plzni.

„Pracujeme asi s padesáti tisíci dokumenty v listinné podobě. Jsou naskenovány a obsahují různé věci jako obrázky, text psaný strojem, poznámky psané rukou a dále zpracováváme tisíc hodin výpovědí audiovizuálních," shrnul objem práce Luděk Müller.

V případě nahrávek pomáhá odborníkům při zpracování jejich vlastní systém na automatické rozpoznávání mluvené řeči. Ten dokáže nahrávku převést na text, který pak vědci dále opatří časovými značkami, aby bylo jasné, které slovo se v nahrávce kdy vyskytlo. To ve výsledku ocení uživatel.

„Aby na základě dotazu ve formě třeba nějakých klíčových slov, popřípadě nějakých frází našel to příslušné místo, kde se dané slovo vyskytuje. A pak umožňuje uživateli si nechat třeba přehrát ten úsek před i po výskytu tohoto slova," doplnil profesor Müller.

Systém umožní snadnou orientaci v materiálech a upozorní na souvislosti

Textové dokumenty a tabulky dostávají vědci ve formě naskenovaných dokumentů. Tyto dokumenty je třeba předzpracovat, tedy oddělit část výhradně s textem psaným většinou na stroji. Tuto část pak dále zpracuje automatický systém a text zaindexuje v databázi. Cílem celého procesu je, aby uživatel měl patřičný komfort při zpřístupnění dokumentů, které jsou uloženy v archivech.

„Pokud bychom takový systém neměli, musel by si uživatel poslechnout všechny nahrávky, popřípadě prohlédnout a přečíst velké množství dokumentů. Náš systém by mu měl umožnit to, že na základě dotazu najde všechny výskyty jak v té textové části, tak v té části audiovizuální a popřípadě může mezi těmito dokumenty nacházet i nějakou souvislost," vysvětlil Luděk Müller.

Výsledný produkt plzeňských vědců bude sloužit Ústavu pro studium totalitních režimů. Systém je ale podle profesora Müllera možné použít i na další archivy, které jsou podobného ražení. Například pro archiv Paměť národa. Jen v Plzni na projektu pracuje osm lidí. Vytváření softwaru a mapování dokumentů potrvá do konce příštího roku.

autoři: lum , sch
Spustit audio