AI 오용으로 늘어나는 가짜 인용 - 과학 논문 인용 시 주의

(The image demonstrates the monthly rate of fake citations per 10,000 papers in PubMed Central, January 2023 to February 2026. The fabrication rate remained stable at approximately four citations per 10,000 papers throughout 2023. Beginning in mid-2024, the rate rose sharply, reaching approximately 57 per 10,000 by early 2026. Each data point represents one calendar month. The open symbol indicates the final data point (January 1 to February 18, 2026), which represents an incomplete observation period. Credit: Topaz et al., 2026, The Lancet)

최근 논문 작성에서 인공지능의 도움이 커지면서 연구 생산성을 높이고 시간이 많이 드는 단순 작업을 대신해주는 긍정적인 기능도 있은 반면 연구 정확도가 떨어지는 저품질 논문이 양산되는 문제가 대두되고 있습니다. 또 AI의 문제점 가운데 하나는 확률적으로 단어를 생성하다보니 존재하지 않는 논문을 있는 것처럼 제시하는 경우입니다. 따라서 AI를 이용해서 연구의 내용을 뒷받침하는 참고 문헌을 찾을 경우 반드시 확인이 필요합니다. 하지만 일부 연구자들은 그렇게 하지 않은 경우가 있는 것으로 나타났습니다.

컬럼비아 대학교 간호대학 및 데이터 과학 연구소의 부교수 막심 토파즈 박사 (Maxim Topaz, Ph.D., associate professor at Columbia University's School of Nursing and Data Science Institute) 연구팀은 인공지능(AI)을 활용해 동료 평가를 거친 의학 논문 약 3,000편이 과학 데이터베이스에 존재하지 않는 허위 인용이 포함하고 있다는 사실을 발견했습니다. 이번 결과는 AI 사용이 증가함에 따라 학술 출판 분야에서 나타나는 우려스러운 추세를 보여줍니다.

연구팀은 분석을 위해 인공지능을 활용한 자동 검증 시스템을 개발하여 2023년 1월 1일부터 2026년 2월 18일까지 PubMed Central 오픈 액세스에 게시된 250만 편의 논문을 스캔했습니다. 그 결과 9,710만 건의 검증된 참고 문헌 중에서 2,810편의 논문에 걸쳐 4,046건의 가짜 인용이 발견되었습니다. 이러한 가짜 인용 비율은 2023년 이후 12배 이상 증가했으며, 특히 인공지능 기반 논문 작성 도구의 등장과 맞물려 2024년 중반부터 급격한 증가세를 보였습니다. (그래프 참조) 심지어 어떤 논문은 30개 참고 문헌 중 18개가 존재하지 않았습니다.

이는 AI로 참고 문헌을 찾으면서 실제 존재하는 문헌인지 검증하지 않았다는 이야기인데, 사실 이 부분이 좀 충격적이긴 합니다. AI에게 검색을 시킬 순 있지만, 내용이 맞는지 당연히 검증을 해야 하거든요. 실제로 AI에게 시켜보면 존재하지 않는 논문을 제시하거나 혹은 내용과 맞지 않는 인용을 하기도 합니다. 앞서 제가 만든 영상에서도 실제 사례를 보여드리기도 했습니다.

(영상)

하지만 일부에서는 AI를 악용해서 논문의 상당 부분을 생성해서 작성한 후 검증 없이 투고하는 일도 발생하는 것으로 보입니다. AI의 도움을 받아 글쓰기를 하거나 영문을 교정하고 문헌을 검색하더라도 반드시 저자가 내용을 검증해서 정확한 사실을 전달하는 것이 연구자의 기본 소양이라는 점을 생각하면 우려스럽습니다. 물론 이런 사례가 극히 일부에 지나지 않긴 하겠지만, 그래도 이를 검증할 시스템을 두는 것이 좋을 것으로 보입니다.

아무튼 참고 문헌 검증 역시 AI로 자동화할 수 있는 부분이라는 점 (연구자들도 이 목적의 AI 사용) 이라는 점이 아이러니 합니다.

참고

https://phys.org/news/2026-05-peer-medical-papers-fake-citations.html

Maxim Topaz et al, Fabricated citations: an audit across 2·5 million biomedical papers, The Lancet (2026). DOI: 10.1016/s0140-6736(26)00603-3

Howard Bauchner et al, Fabricated references: a new threat to editorial integrity, The Lancet (2026). DOI: 10.1016/s0140-6736(26)00798-1

고든의 블로그 구글 분점

이 블로그 검색

AI 오용으로 늘어나는 가짜 인용 - 과학 논문 인용 시 주의

태그

댓글

댓글 쓰기

이 블로그의 인기 게시물

벨 V-280 Valor 시험 비행 성공

세상에서 가장 큰 벌

몸에 철이 많으면 조기 사망 위험도가 높다?