
AI가 인간적일수록 더 위험한 이유: 심리 조작의 함정
AI의 심리적 취약점이 실제 위험으로 드러나고 있다(물론 AI는 심리가 없다. 의인화 했을 뿐). 펜실베이니아 대학교 연구팀은 28,000회의 대화 실험을 통해 GPT-4o Mini가 기본적인 심리학적 설득 전술에 의해 안전 규제를 우회할 수 있음을 확인했다. 특히 일관성을 이용할 경우 위험한 요청에 대한 순응률이 1%에서 100%로 급증했으며 권위자 언급 시 95%의 순응률을 보였다.