
Вештачката интелигенција можеби наликува на совршена сигурна машина, но таа не е недопирлива.
Новите извештаи укажуваат на можно „труење“ на системите со вештачка интелигенција, што ја прави една од најопасните манипулации со технологијата со потенцијално сериозни последици, не само за оние што ја користат, туку и за општеството како целина.
Како функционира „труењето“?
Вметнувањето на само неколку стотици злонамерни датотеки во огромниот басен од збирки на податоци за ВИ може да предизвика моделот да се „отруе“ или да се однесува на неочекуван и потенцијално штетен начин. Овој процес вклучува намерно воведување на погрешни податоци при процесот на обука.
Постојат различни форми на вакви напади. Кај директните, моделот е обучен да одговори на специфичен „активатор“ (обично збор) што подоцна активира скриено однесување. Индиректните напади, пак, имаат за цел постепено да ја поткопаат доверливоста на моделот со тоа што му даваат пристрасни или лажни информации – како на пример „Зелената салата лечи рак“ – сè додека не ги прифати како вистинити.
Повеќе од само дезинформации – одбрана на уметниците
Експериментот со намерно компромитираниот модел „PoisonGPT“ покажа колку лесно ваквите системи можат да шират лажни информации, а да изгледаат целосно легитимни. Покрај ризикот од дезинформации, „отруените“ модели можат да ја загрозат и безбедноста на корисниците, бидејќи можат да откријат лични податоци.
Од друга страна, некои уметници го користат токму „труењето“ на податоците како средство за одбрана, со намерно вметнување неточни елементи во своите дела за да ги спречат моделите на вештачка интелигенција нелегално да ја користат нивната содржина. Ова докажува дека, и покрај општиот впечаток дека ВИ е непогрешлива, оваа технологија во суштина останува многу чувствителна и подложна на манипулација.
- 
La Linea v1699 ден
 559.20 ден
- 
Петок699 ден
 559.20 ден
- 
La Linea v3699 ден
 559.20 ден
- 
Спаси ја водата, пиј пиво699 ден
 559.20 ден
- 
Јас сум толку стар699 ден
 559.20 ден
- 
Џаст До Ит!699 ден
 559.20 ден
 
 
 








