Vědci našli víc než 250 tisíc vědeckých studií o rakovině, které zřejmě pocházejí z „papírny“. Tímto termínem (anglicky papermill) se označují takzvané továrny na články neboli falešné, ukradené nebo zcela nekvalitní studie, které jsou masově chrlené do veřejného prostoru.
Podvodníky odhalil australský vědec Adrian Barnett, který analyzoval pomocí speciálně vyvinuté umělé inteligence (AI) údaje o 2,6 milionech studií o rakovině z let 1999–2024 – téměř jedna desetina z nich byla podvodná. Tento výzkum našel nápadnou podobnost více jak 250 tisíc studií s články, které byly už v minulosti stažené kvůli podezření na falšování.
„‚Papírny‘ jsou společnosti, které prodávají falešné nebo nekvalitní vědecké studie. Produkují ‚výzkum‘ v průmyslovém měřítku a naše zjištění naznačují, že tento problém v oblasti výzkumu rakoviny je mnohem větší, než si většina lidí uvědomuje,“ komentoval profesor Barnett. „Papírny“ podle něj prodávají autorství a celé hotové výzkumné práce a často používají recyklovaný text, nešikovné formulace nebo zfalšovaná data a obrázky. „S největší pravděpodobností se spoléhají na šablony, které se dají odhalit pomocí velkých jazykových modelů analyzujících vzorce v textech,“ doplnil vědec.
Barnett a jeho kolegové právě takový velký jazykový model vycvičili, pojmenovali ho BERT. Naučili ho rozpoznával jakési otisky prstů, které jsou typické pro podvodné vědecké texty. Když ho otestovali na materiálech, u nichž věděli, že jsou podvodné, byl BERT úspěšný na 91 procent případů.
„V podstatě jsme vytvořili vědecký spamový filtr,“ vysvětluje Barnett smysl svého výzkumu. „Stejně jako váš e-mailový systém dokáže rozpoznat nežádoucí zprávy, náš nástroj zase označuje články, které odpovídají stylu psaní a struktuře, které vidíme v odvolaných, podvodných pracích.“
Zjistil, že počet označených článků se za dvě desetiletí dramaticky zvýšil, z přibližně jednoho procenta na počátku jednadvacátého století na více než šestnáct procent v roce 2022. Tento problém se týká tisíců časopisů od významných vydavatelů, včetně titulů s velkým vlivem. Problém se podle studie nejvíce koncentruje v oblastech, jako je molekulární biologie rakoviny a laboratorní výzkum v rané fázi. U některých typů rakoviny, včetně rakoviny žaludku, jater, kostí a plic, je podíl podezřelých článků obzvláště vysoký.
Úspěch v praxi
Tři vědecké časopisy už začaly tento Barnettův nástroj využívat: používají ho přesně jako výše popsaný spam-filtr. Redaktoři tak nemusí trávit čas tím, že budou zbytečně analyzovat zcela zbytečné a nepřínosné práce.
Tým plánuje rozšířit tento nástroj i do dalších oblastí výzkumu a vylepšit ho, aby byl ještě přesnější.







