最近、1,400 万件の PubMed 抄録に基づく分析で、AI テキスト ジェネレーター、特に ChatGPT が科学文書作成に大きな影響を与えていることが明らかになり、注目を集めています。研究者らは言語スタイルの変化を分析することで、AIが生成したテキストの特徴的な語彙を発見し、AIの影響を受ける要約の割合を推定した。この研究は定量的なデータを提供するだけでなく、科学論文における AI の長所と短所、およびさまざまな国やジャーナル間の違いも調査しており、科学論文の規範と AI 倫理に関するさらなる議論のきっかけとなっています。
1,400 万件の PubMed 抄録の分析では、ChatGPT の開始以来、AI テキスト ジェネレーターが科学抄録の少なくとも 10% に影響を与えており、一部の分野や国ではその割合がさらに高いことが示されています。テュービンゲン大学とノースウェスタン大学の研究者は、2010 年から 2024 年の間に 1,400 万件の科学抄録における言語の変化を研究しました。彼らは、ChatGPT と同様の AI テキスト ジェネレーターにより、特定のスタイルの語彙が大幅に増加することを発見しました。研究者らはまず、2024年に前年よりも大幅に頻繁に出現した単語を特定した。これらの単語には、「深く掘り下げる」、「複雑な」、「紹介する」、「目立つ」など、ChatGPT の書き方に典型的な動詞や形容詞の多くが含まれています。これらの特徴的な単語に基づいて、研究者らは、2024 年までに、すべての PubMed 抄録の少なくとも 10% に AI テキスト ジェネレーターが影響を与えると推定しています。場合によっては、この影響は、その時代の「新型コロナウイルス」、「パンデミック」、「エボラ出血熱」などの言葉の影響をも上回ります。研究者らは、中国や韓国などの国のPubMedサブグループの抄録の約15%がChatGPTを使用して生成されているのに対し、英国ではわずか3%であることを発見した。ただし、これは必ずしも英国の著者が ChatGPT をあまり使用していないことを意味するわけではありません。実際、研究者らによると、AI テキスト ジェネレーターの実際の使用率ははるかに高い可能性があります。多くの研究者は、AI が生成したテキストを編集して、典型的なロゴワードを削除しています。ネイティブスピーカーはそのようなフレーズに気づく可能性が高いため、ここでは有利である可能性があります。このため、AI の影響を受ける概要の本当の割合を判断することが困難になります。測定可能な範囲内で、AI の使用率はジャーナルで特に高く、Frontiers および MDPI ジャーナルでは約 17%、IT ジャーナルでは 20% です。 ITジャーナルの中で中国人著者の割合が最も高く、35%に達している。科学著者にとって、AI は論文を読みやすくするのに役立つかもしれません。研究著者のドミトリー・コバック氏は、要約のために特別に設計された生成AIが必ずしも問題ではないと述べた。ただし、AI テキスト ジェネレーターは事実を捏造したり、偏見を強化したり、盗作を犯したりする可能性もあり、科学テキストの多様性と独自性を低下させる可能性もあります。 ChatGPT のリリースの少し前に Meta Company によってリリースされた科学オープンソース言語モデル「Garakutica」が科学界の一部の人々から厳しく批判され、Meta がそれをオフラインにせざるを得なくなったのは、いくぶん皮肉なことのように思えます。これによって生成 AI が科学論文に参入することが妨げられたわけではないことは明らかですが、このタスクに特化して最適化されたシステムの導入は妨げられた可能性があります。ハイライト: PubMed 抄録の分析により、ChatGPT の開始以来、科学抄録の少なくとも 10% が AI テキスト ジェネレーターの影響を受けていることが判明しました。中国や韓国などの国の PubMed サブグループでは、抄録の約 15% が ChatGPT を使用して生成されましたが、英国ではわずか 3% でした。 AI テキスト ジェネレーターは事実を捏造し、偏見を強化し、さらには盗作を犯す可能性があるため、研究者らは科学分野で AI テキスト ジェネレーターを使用するためのガイドラインの再評価を求めています。
この研究結果は、科学論文への AI の適用は慎重に扱う必要があり、学術的完全性と研究の信頼性を確保するために、より厳格な規範と倫理ガイドラインを策定する必要があることを警告しています。 今後の研究では、AI が生成したテキストによってもたらされるリスクをより適切に特定して回避し、AI 支援によるライティングの利便性と潜在的な悪影響のバランスを取る方法をさらに検討する必要があります。