최근 1,400만 건의 PubMed 초록을 기반으로 한 분석에서 AI 텍스트 생성기, 특히 ChatGPT가 과학 문서 작성에 미치는 영향이 큰 것으로 밝혀졌습니다. 연구진은 언어 스타일 변화를 분석해 AI가 생성한 텍스트의 특징적인 어휘를 발굴하고 AI의 영향을 받는 요약의 비율을 추정했다. 본 연구는 정량적 데이터를 제공할 뿐만 아니라, 과학 글쓰기에서 AI의 장단점은 물론, 여러 국가와 저널 간의 차이점을 탐구하여 과학 글쓰기 규범과 AI 윤리에 대한 추가 논의를 촉발합니다.
1,400만 개의 PubMed 초록을 분석한 결과 ChatGPT 출시 이후 AI 텍스트 생성기가 과학 초록의 최소 10%에 영향을 미쳤으며 일부 분야와 국가에서는 그 비율이 훨씬 더 높은 것으로 나타났습니다. 튀빙겐 대학교와 노스웨스턴 대학교의 연구원들은 2010년부터 2024년까지 1,400만 건의 과학 초록에서 언어 변화를 연구했습니다. 그들은 ChatGPT 및 유사한 AI 텍스트 생성기가 특정 스타일의 어휘를 크게 증가시키는 것으로 나타났습니다. 연구자들은 이전 연도보다 2024년에 훨씬 더 자주 등장하는 단어를 처음으로 식별했습니다. 이러한 단어에는 "dig deep", "complex", "showcase" 및 "stand out"과 같은 ChatGPT 글쓰기 스타일의 일반적인 동사와 형용사가 많이 포함되어 있습니다. 연구원들은 이러한 서명 단어를 기반으로 2024년까지 AI 텍스트 생성기가 모든 PubMed 초록의 최소 10%에 영향을 미칠 것으로 추정합니다. 어떤 경우에는 이 영향이 해당 기간의 "Covid", "pandemic" 또는 "Ebola"와 같은 단어의 영향을 능가합니다. 연구원들은 중국과 한국과 같은 국가의 PubMed 하위 그룹에서 약 15%의 초록이 ChatGPT를 사용하여 생성된 반면 영국에서는 3%에 불과하다는 것을 발견했습니다. 그러나 이것이 반드시 영국 작성자가 ChatGPT를 덜 사용한다는 의미는 아닙니다. 실제로 연구진에 따르면 AI 텍스트 생성기의 실제 활용도는 훨씬 높을 수 있다고 한다. 많은 연구자들이 AI가 생성한 텍스트를 편집하여 일반적인 로고 단어를 제거합니다. 원어민은 그러한 문구를 알아차릴 가능성이 더 높기 때문에 여기서 이점을 가질 수 있습니다. 이로 인해 AI의 영향을 받는 요약의 실제 비율을 판단하기가 어렵습니다. 측정 가능한 범위 내에서는 프론티어(Frontiers) 및 MDPI 저널이 약 17%, IT 저널이 약 20% 등 저널에서 AI 활용도가 특히 높다. IT 저널 중 중국인 저자 비율이 35%로 가장 높다. 과학 저자들에게 AI는 기사를 더 읽기 쉽게 만드는 데 도움이 될 수 있습니다. 연구 저자인 Dmitry Kobak은 요약을 위해 특별히 설계된 생성 AI가 반드시 문제가 되는 것은 아니라고 말했습니다. 그러나 AI 텍스트 생성기는 사실을 조작하거나, 편견을 강화하거나, 심지어 표절을 저지를 수도 있으며, 과학 텍스트의 다양성과 독창성을 감소시킬 수도 있습니다. ChatGPT가 출시되기 얼마 전 메타컴퍼니가 공개한 과학적인 오픈소스 언어 모델인 '갤럭티카'가 과학계 일부 사람들로부터 심한 비난을 받아 메타가 오프라인화될 수밖에 없었다는 점은 다소 아이러니해 보입니다. 이것이 분명히 생성적 AI가 과학 저술에 들어가는 것을 막지는 못했지만, 이 작업에 특별히 최적화된 시스템의 도입을 막았을 수도 있습니다. 하이라이트: PubMed 초록 분석에 따르면 ChatGPT 출시 이후 최소 10%의 과학 초록이 AI 텍스트 생성기의 영향을 받은 것으로 나타났습니다. 중국과 한국과 같은 국가의 PubMed 하위 그룹에서는 약 15%의 초록이 ChatGPT를 사용하여 생성된 반면 영국에서는 3%만 생성되었습니다. AI 텍스트 생성기는 사실을 조작하고 편견을 강화하며 심지어 표절까지 할 수 있기 때문에 연구자들은 AI 텍스트 생성기를 과학 분야에서 사용하기 위한 지침을 재평가할 것을 요구하고 있습니다.
이 연구 결과는 과학 저술에 AI를 적용하는 것은 주의 깊게 다루어야 하며 학문적 진실성과 연구 신뢰성을 보장하기 위해 보다 엄격한 규범과 윤리 지침을 마련해야 함을 경고합니다. 향후 연구에서는 AI가 생성한 텍스트로 인해 발생하는 위험을 더 잘 식별 및 방지하고 AI 지원 글쓰기의 편의성과 잠재적인 부정적인 영향의 균형을 맞추는 방법을 추가로 탐구해야 합니다.