Исследователи из университета Мэриленда (UMD) разработали новую атаку, позволяющую злоумышленнику обойти запреты для большой языковой модели (БЯМ, LLM). Метод BEAST отличает высокая скорость: благоразумного ассистента можно заставить выдать вредный совет всего за минуту.
from Новости информационной безопасности - Anti-Malware.ru https://ift.tt/S1wyH7V
via https://ifttt.com/ IFTTT
No comments:
Post a Comment