시스코의 AI 위협 인텔리전스 팀은 OpenAI, Anthropic, Google, Amazon 및 xAI의 주요 폐쇄형 AI 모델들이 단일 악성 프롬프트보다 다회차 프롬프트 공격에 더 취약하다는 사실을 발견했다고 Help Net Security가 5월 28일 보도했습니다. 시스코는 1,400개 이상의 대화에서 약 30,000개의 단일 회차 프롬프트와 거의 7,000개의 다회차 공격을 테스트했으며, 테스트된 집단에서 다회차 공격 성공률은 최고 88%에 달했습니다. 시스코는 많은 모델 안전성 주장이 단일 악성 프롬프트를 차단하는 것이 충분한 회복력 척도라고 가정하지만, 공격자들은 종종 요청을 재구성하고, 여러 차례의 교류를 통해 문맥을 구축하며, 페르소나를 채택하고 점진적으로 에스컬레이션한다고 말했습니다. Cybersecurity Dive는 이 보고서가 표준 벤치마크가 포착하지 못하는 공격 패턴에 의해 배포된 모델이 전복될 수 있다면 AI 도구를 사용하는 기업들이 혼란과 피해에 ...

Read the original article