Новата сајбер-војна е веќе тука, а се вика „труење“ на вештачката интелигенција

Вештачката интелигенција можеби наликува на совршена сигурна машина, но таа не е недопирлива.

Новите извештаи укажуваат на можно „труење“ на системите со вештачка интелигенција, што ја прави една од најопасните манипулации со технологијата со потенцијално сериозни последици, не само за оние што ја користат, туку и за општеството како целина.

Викенд Намаление ❤

Како функционира „труењето“?

Вметнувањето на само неколку стотици злонамерни датотеки во огромниот басен од збирки на податоци за ВИ може да предизвика моделот да се „отруе“ или да се однесува на неочекуван и потенцијално штетен начин. Овој процес вклучува намерно воведување на погрешни податоци при процесот на обука.

Постојат различни форми на вакви напади. Кај директните, моделот е обучен да одговори на специфичен „активатор“ (обично збор) што подоцна активира скриено однесување. Индиректните напади, пак, имаат за цел постепено да ја поткопаат доверливоста на моделот со тоа што му даваат пристрасни или лажни информации – како на пример „Зелената салата лечи рак“ – сè додека не ги прифати како вистинити.

Повеќе од само дезинформации – одбрана на уметниците

Експериментот со намерно компромитираниот модел „PoisonGPT“ покажа колку лесно ваквите системи можат да шират лажни информации, а да изгледаат целосно легитимни. Покрај ризикот од дезинформации, „отруените“ модели можат да ја загрозат и безбедноста на корисниците, бидејќи можат да откријат лични податоци.

Од друга страна, некои уметници го користат токму „труењето“ на податоците како средство за одбрана, со намерно вметнување неточни елементи во своите дела за да ги спречат моделите на вештачка интелигенција нелегално да ја користат нивната содржина. Ова докажува дека, и покрај општиот впечаток дека ВИ е непогрешлива, оваа технологија во суштина останува многу чувствителна и подложна на манипулација.

Сподели: