„Mami, mám průšvih, pošli mi 2 tisíce.“ S odhalením hlasového deepfake může pomoct umělá inteligence

21. říjen 2025

Digitální podvody jsou stále častější a také rafinovanější. Jednou z hrozeb je takzvaný hlasový deepfake – umělý hlas, který dokáže věrně napodobit skutečného člověka. Vědci z Vysokého učení technického ve spolupráci s brněnskou technologickou firmou ale ukazují, že i proti takovým podvodům se lze bránit.

„Ahoj Mami, nemůžu mluvit moc dlouho, ale mám průšvih. Potřebuju, abys mi poslala na číslo účtu, co ti pošlu ve zprávě, dva tisíce,“ zní ženský hlas z reproduktoru počítače. A za chvíli se ozve stejná prosba znovu, prakticky identickým hlasem.

Čtěte také

„Máme zde dvě nahrávky – jedna je originál a jedna je vytvořená nástrojem pro syntézu hlasu,“ ukazuje Ivana Týralová z firmy Phonexia, jak funguje program, který dokáže rozpoznat falešný hlas. Software firma vyvinula společně s vědci z Vysokého učení technického v Brně.

„Klikneme jednoduše na jednu nebo na druhou nahrávku a v pravé části obrazovky se zobrazí výsledek, který naše technologie detekovala,“ vysvětluje vývojářka, jak zjistíme, který hlas patří skutečnému člověku a který je vygenerovaný uměle.

„Nahrávka číslo 1 se zobrazuje v zelené části škály. Naše technologie tedy říká, že se jedná o autentickou nahrávku – to je originál. A když si potom klikneme na druhou nahrávku, tak se výsledek se posune do pravé, červené části,“ popisuje Ivana Týralová.

Čtěte také

„To značí pozor, v tuto chvíli už technologie detekuje nějaký problém. Vyhodnotila a detekovala, že se jedná o zfalšovaný hlas.“

Tygr, nebo pes?

Kamil Malinka z Fakulty informačních technologií Vysokého učení technického v Brně vysvětluje, že jádrem softwaru je poměrně veliká neuronová síť natrénovaná na vzorcích. Na nich se učí, jak vypadá reálný a jak podvržený hlas, aby je pak sama dokázala rozpoznávat.

Hlas má totiž nespočet drobných parametrů, které člověk dokáže jen těžce popsat. Umělá inteligence se to ale může naučit.

Čtěte také

„Představte si to jako černou skříňku, kterou nakrmíte miliony a miliony dat. Například chceme, aby ta skříňka řekla, jestli je to pes nebo není. Nebo jestli je to tygr. Ukážete jí milion obrázků tygra, milion obrázků psa a ona se naučí vám říct, s jakou pravděpodobností je to pes nebo tygr,“ přibližuje proces učení Kamil Malinka.

„Nikdy vám neřekne jednoznačnou odpověď, dá vám pravděpodobnost. A potom, když jí ukážete tygra, tak ta neuronová síť řekne: je to oranžové, má to pruhy, bude to tygr.“

Zaskočte útočníka

Dnešní technologie umožňují podvodníkům vytvořit mimořádně věrné nahrávky. Podle Kamila Malinky je proto nutné být neustále na pozoru.

Čtěte také

„Jak se proti tomu bránit? Počítat s tím, že to nepoznáte. A ve chvíli, kdy je hovor podezřelý – z libovolného důvodu –, tak je dobré nespoléhat se pouze na to, že tomu člověku rozumíte, a přidat druhý autentizační krok: zeptat se na nějaké tajemství, které by ten člověk měl vědět. Třeba jak se jmenuje váš králík. To útočník nebude vědět,“ radí.

Ačkoli je software stále ve vývoji, už dnes ho využívají policisté, bezpečnostní složky, ale také třeba banky nebo call centra.

Jak běžný člověk pozná, že je hlas nebo video falešné? Poslechněte si, co radí Petr Matoušek z Fakulty informačních technologií v rozhovoru pro Magazín Experiment.

autoři: Marek Hensl , and | zdroj: Český rozhlas
Spustit audio

Mohlo by vás zajímat