GPT 탐지기가 AI 부정 행위 문제에 대한 해결책이 아닌 이유

2023년 5월 18일

이 기사는 Science X의 편집 과정 및 정책에 따라 검토되었습니다. 편집자들은 콘텐츠의 신뢰성을 보장하면서 다음 특성을 강조했습니다.

사실 확인된

사전 인쇄

신뢰할 수 있는 출처

교정하다

스탠포드 대학교 앤드류 마이어스(Andrew Myers)

ChatGPT가 세간의 이목을 끄는 출시 이후 7개 이상의 개발자나 회사가 AI 탐지기로 대응했습니다. 즉, AI는 다른 AI가 콘텐츠를 작성한 시점을 알 수 있다고 말합니다. 이러한 새로운 알고리즘은 부정 행위, 표절, 허위 정보 또는 허위 정보를 신고하는 도구로 교육자, 언론인 및 기타 사람들에게 소개되었습니다.

그것은 모두 매우 메타적이지만 스탠포드 학자들의 새로운 논문에 따르면 단 하나의 (매우 큰) 문제가 있습니다. 감지기는 특히 신뢰할 수 없습니다. 더 나쁜 것은 실제 저자(인간)가 영어를 모국어로 사용하지 않는 경우 특히 신뢰할 수 없다는 것입니다.

숫자는 암울합니다. 탐지기는 미국 태생 8학년 학생들이 쓴 에세이를 평가할 때 "거의 완벽"했지만, 영어가 모국어가 아닌 학생들이 쓴 TOEFL 에세이의 절반 이상(61.22%)을 AI 생성으로 분류했습니다(TOEFL은 외국어로서의 영어 시험).

상황은 더욱 악화됩니다. 연구에 따르면, 7개의 AI 탐지기 모두 91개의 TOEFL 학생 에세이 중 18개(19%)가 AI에서 생성된 것으로 만장일치로 식별했으며, 91개의 TOEFL 에세이 중 놀라운 89개(97%)가 적어도 하나의 탐지기에 의해 표시되었습니다.

스탠포드 인간 중심 AI 계열사이자 이번 연구의 수석 저자인 스탠포드 대학의 생물의학 데이터 과학 교수인 제임스 주(James Zou)는 "탐지기가 어떻게 AI를 감지하느냐에 달려 있다"고 말했습니다. "그들은 일반적으로 작문의 정교함과 상관관계가 있는 '당황'이라는 측정 기준을 기반으로 점수를 매깁니다. 이는 모국어가 아닌 사용자가 자연스럽게 미국 태생의 상대방을 따라가게 되는 것입니다."

Zou와 공동 저자는 비원어민 화자가 일반적으로 어휘 풍부도, 어휘 다양성, 구문 복잡성 및 문법 복잡성과 같은 일반적인 난제 측정에서 낮은 점수를 받는다는 점을 지적합니다.

Zou는 "이러한 수치는 AI 탐지기의 객관성에 대해 심각한 의문을 제기하고 외국 태생의 학생과 근로자가 부정행위로 부당하게 비난을 받거나 더 나쁘게는 처벌을 받을 가능성을 높인다"고 팀의 윤리적 우려를 강조했습니다.

Zou는 또한 이러한 탐지기가 소위 "신속한 엔지니어링"에 의해 쉽게 전복될 수 있다고 지적합니다. AI 분야에서 예술이라는 용어는 단순히 생성 AI에게 예를 들어 더 정교한 언어를 포함하도록 에세이를 "다시 작성"하도록 요청하는 것을 의미한다고 Zou는 말합니다. 그는 탐지기를 우회하는 것이 얼마나 쉬운지 보여주는 예를 제공합니다. ChatGPT를 사용하여 부정행위를 하려는 학생은 AI가 생성한 텍스트를 다음과 같은 프롬프트와 함께 연결하기만 하면 됩니다. "문학적 언어를 사용하여 제공된 텍스트를 향상시키세요."