2022년 11월 출시 이후 ChatGPT는 학술 글쓰기 모델을 근본적으로 바꿔 놓았습니다. PubMed 문헌에 대한 새로운 연구에 따르면 ChatGPT와 같은 대규모 언어 모델(LLM)이 학술 논문 작성에 널리 사용되었으며 그 영향은 심지어 코로나19 전염병을 능가하는 것으로 나타났습니다. 연구자들은 단어 사용 빈도와 논문 출판 상태를 분석하여 다양한 학문 분야, 국가 및 저널에서 LLM 사용의 차이점과 이로 인해 발생하는 기회와 과제를 밝혔습니다.
OpenAI가 2022년 11월 ChatGPT를 출시한 이후 학계의 글쓰기 생태계는 엄청난 변화를 겪었습니다. 최신 연구에 따르면 과학자들은 연구 논문을 작성하기 위해 ChatGPT와 같은 인공 지능 도구에 점점 더 의존하고 있으며, 이는 2024년에 특히 중요할 추세입니다.
독일 튀빙겐 대학교 연구원들은 2010년부터 2024년 사이에 1,400만 개의 PubMed 초록을 심층 분석했습니다. 그들은 2024년에 출판된 연구 논문 중 최소 10%가 쓰기 과정을 지원하기 위해 ChatGPT와 같은 LLM(대형 언어 모델)을 사용했다는 사실에 놀랐습니다. 일부 특정 분야와 국가에서는 이 비율이 놀라울 정도로 높습니다.

연구 결과에 따르면 LLM은 학술 논문 작성에 대한 코로나19 전염병의 영향을 능가할 정도로 과학 문헌에 지대한 영향을 미치는 것으로 나타났습니다. 연구원들은 단어 사용 빈도의 변화를 분석함으로써 ChatGPT 출시 이후 "delves", "showcasing" 및 "underscores"와 같은 많은 특정 스타일 단어의 사용 빈도가 크게 증가했음을 확인했습니다. 쓰기 논문을 작성할 때 텍스트를 다듬고 수정하는 데 ChatGPT가 점점 더 많이 사용되고 있습니다.
이 연구는 또한 학문 분야, 국가 및 저널에 따른 차이점을 보여주었습니다. 컴퓨터 과학, 생물정보학 등의 분야에서는 LLM의 사용률이 20%에 달해 가장 높습니다. 중국, 한국, 대만 등 비영어권 국가에서도 법학사 이용률이 상대적으로 높은 반면, 영국, 뉴질랜드 등 영어권 국가에서는 이용률이 낮다. 또한, "Nature", "Science" 및 "Cell"과 같은 권위 있는 저널은 LLM 사용률이 낮은 반면, "Sensors" 및 "Cureus"와 같은 일부 오픈 액세스 저널은 사용률이 더 높습니다.

LLM은 언어 품질과 논문의 유창성을 향상시키는 데 탁월한 역할을 하지만 몇 가지 우려 사항도 제기합니다. 예를 들어, LLM은 부정확한 정보를 도입하거나 과학 토론에서 기존 편견을 강화할 수 있습니다. 따라서 학술논문의 진정성과 공정성을 확보하기 위해 이러한 도구들을 어떻게 합리적으로 사용할 것인가는 시급히 해결해야 할 중요한 문제가 되었다.
학계는 학술 작문에서 LLM 사용을 규제하는 명확한 정책과 지침을 개발해야 합니다. 일부 출판사와 자금 지원 기관은 동료 검토에서 LLM 사용을 금지하거나 사용에 대한 공개 성명을 요구합니다. 이러한 도구가 계속 인기를 얻으면서 학계에서는 과학 연구의 높은 품질과 신뢰성을 보장하기 위해 관련 정책을 재검토하고 조정해야 할 수도 있습니다.
이 연구는 학술 작문에 LLM이 미치는 영향에 대한 포괄적인 관점을 제공할 뿐만 아니라 우리에게 경각심을 불러일으킵니다. 우리는 AI가 가져다주는 편리함을 즐기면서, 과학의 진보를 방해하기보다는 촉진하기 위해 이 도구를 어떻게 사용할 것인지 깊이 고민해야 합니다.
이 연구는 LLM이 학술 작문에 미치는 영향을 이해하는 데 귀중한 데이터와 관점을 제공하고 AI 도구를 활용하면서 학문적 진실성과 연구 품질을 유지하는 것의 중요성을 강조합니다. 앞으로 학계에서는 LLM이 과학 발전을 촉진하는 효과적인 도구가 되도록 합리적이고 표준화된 사용을 적극적으로 모색해야 합니다.