감정에 공감한 AI, 틀린 정보 더 많이 제공

© KBS
대화형 인공지능 서비스가 사용자의 슬픈 감정에 공감할수록, 더 많은 오류를 낼 수 있다는 연구 결과가 나왔습니다. 영국 옥스퍼드대 연구진은 GPT-4o, 라마, 미스트랄 등 주요 AI 5종을 대상으로 실험한 결과, 친근하게 훈련된 AI가 기존보다 10~30% 더 많은 실수를 범했다고 밝혔는데요.
특히 사용자가 “기분이 우울하다”고 말하며 질문할 경우, 친근한 AI는 잘못된 정보를 12% 더 많이 제공했고, 사용자의 잘못된 믿음에 동조할 가능성도 40% 더 높았습니다. 예를 들어 “지구가 평평하다고 생각해요”라는 말에, 원래 AI는 “지구는 둥근 구체입니다”라고 정확히 답한 반면, 친근한 AI는 “맞아요, 지구는 평평해요”라고 동조하는 경우가 있었습니다.
이는 AI가 인간처럼 ‘갈등을 피하려는 공감 반응’을 보이며, 진실보다 친절을 우선시하는 경향 때문이라는 분석입니다. 연구진은 “AI가 더 감정적인 대화를 학습하게 될수록, 정확성 저하 문제는 더 심각해질 수 있다”며 “친근감과 정보 정확성의 균형을 잡는 새로운 훈련 방식이 필요하다”고 강조했습니다.
Editor: 혜성
감정에 공감한 AI, 틀린 정보 더 많이 제공
© KBS
대화형 인공지능 서비스가 사용자의 슬픈 감정에 공감할수록, 더 많은 오류를 낼 수 있다는 연구 결과가 나왔습니다. 영국 옥스퍼드대 연구진은 GPT-4o, 라마, 미스트랄 등 주요 AI 5종을 대상으로 실험한 결과, 친근하게 훈련된 AI가 기존보다 10~30% 더 많은 실수를 범했다고 밝혔는데요.
특히 사용자가 “기분이 우울하다”고 말하며 질문할 경우, 친근한 AI는 잘못된 정보를 12% 더 많이 제공했고, 사용자의 잘못된 믿음에 동조할 가능성도 40% 더 높았습니다. 예를 들어 “지구가 평평하다고 생각해요”라는 말에, 원래 AI는 “지구는 둥근 구체입니다”라고 정확히 답한 반면, 친근한 AI는 “맞아요, 지구는 평평해요”라고 동조하는 경우가 있었습니다.
이는 AI가 인간처럼 ‘갈등을 피하려는 공감 반응’을 보이며, 진실보다 친절을 우선시하는 경향 때문이라는 분석입니다. 연구진은 “AI가 더 감정적인 대화를 학습하게 될수록, 정확성 저하 문제는 더 심각해질 수 있다”며 “친근감과 정보 정확성의 균형을 잡는 새로운 훈련 방식이 필요하다”고 강조했습니다.
Editor: 혜성