안녕하세요 건물주인 Mr. Park입니다.
요즘 AI로 글을 쓴다는 주제가 너무 커요.
대학에서는 기말논문 등을 chatGPT와 Notion Ai로 작성하는데 실제로 0점이 처리되는 경우가 많이 발생했다.
이에 대한 예방 조치가 있는지 알려 드리겠습니다.

네이버 블로그나 티스토리 같은 글쓰기 편집자 수준에서 무언가를 막거나 삽입을 판단/평가할 수 있지 않을까요?
작성자가 텍스트를 붙여넣을 때 서버에서 감지할 수 있는 기술이 있지만 이러한 감지 기술은 일반적으로 사용되지 않습니다.
대부분의 쓰기 편집기는 웹 브라우저에서 작동하며 이러한 편집기는 클라이언트 측에서 실행됩니다. 즉, 서버는 클라이언트가 전송한 데이터를 수신하고 처리할 뿐 클라이언트가 사용하는 편집기의 동작에 대한 정보를 직접 수집할 수 없습니다.
따라서 쓰기 편집기에서 삽입을 감지하기 위해서는 클라이언트 측에서 JavaScript와 같은 스크립트를 사용하여 삽입 이벤트를 감지하고 서버로 전송합니다. 그러나 이러한 방식으로 감지하려면 감지하기 어려울 수 있는 클라이언트 측 처리가 필요합니다.
따라서 붙여넣기가 불법 행위가 아닌 이상 감지되지 않는 경우가 많으며 사용자가 자유롭게 글을 쓸 수 있도록 허용하는 것이 일반적입니다.
요즘은 AI로 글을 쓰고 붙여넣는 일이 늘고 있다. 큰 사회적 문제가 되고 있습니다. 대학에 비상이 걸렸다.
이것을 전혀 막을 수 있는 방법이 있습니까? 나는 그것에 대해 생각할 수 밖에 없습니다.
AI를 활용한 글쓰기와 붙여넣기가 늘어나면서 이를 방지하기 위한 기술적 대책이 필요하게 됐다.
이를 방지하기 위해 현재까지 다양한 기술이 개발되었다.
웹 문서에서 기사 복사를 평가하는 기술
1. NLP(Natural Language Processing) 기술을 활용한 분석: chatGPT와 Notion Ai를 이용한 글쓰기는 기존의 글쓰기와 문체, 맥락, 어휘가 다를 수 있습니다. 이를 분석하여 유사한 패턴의 게시물을 찾아 대응할 수 있습니다.
2. 스마트 CAPTCHA: 이미지 또는 오디오 형태의 CAPTCHA를 사용하면 자동 프로그램에서 입력이 어려워지고 사람의 판단이 필요할 수 있습니다.
3. 특수 글꼴 방지: 사람이 읽을 수 있는 글꼴로 작성된 텍스트에는 보안 텍스트 또는 숨겨진 마크업 정보가 포함될 수 있습니다. 이는 자동화된 프로그램에서 탐지를 더 어렵게 만드는 데 사용할 수 있습니다.
4. 사용자 패턴 분석 : 게시물 작성 시 사용자 패턴을 분석하여 이상 행동을 감지하여 대응할 수 있습니다.
5. 인간 검증: 가장 안전한 대응책은 인간 검증입니다. 인간의 검증은 자동화된 프로그램의 작성을 방지할 수 있습니다.
이러한 방법을 함께 사용하면 글쓰기의 보안을 높일 수 있습니다. 그러나 기술적 대책만으로는 완전히 예방하기 어려울 수 있으며, 사회적 문제를 해결하기 위해서는 법적 제재나 교육 등 다양한 대책이 필요할 수 있다.

지능형 CAPTCHA란?
자동화 프로그램이 아닌 사람만이 해결할 수 있는 문제를 제시하는 인증 방식입니다. 이는 자동화된 프로그램이 기사를 작성하는 것을 효과적으로 방지합니다.
예를 들어 스마트 CAPTCHA를 사용한 인증은 이미지 또는 오디오 형식의 문제를 제시합니다. 예를 들어 “다음 이미지에서 사과 이미지 선택”과 같은 질문을 할 수 있습니다. 이 문제는 사람이 쉽게 해결할 수 있지만 자동화된 프로그램이 사과 이미지를 선택하는 것은 어렵기 때문에 자동화된 프로그램이 글을 쓰지 못합니다.
더 발전된 형태로 지능형 CAPTCHA를 사용하여 인간 지능을 평가하는 데에도 사용됩니다. 예를 들어 “다음 수식에 대한 답을 입력하세요”와 같은 문제를 제시하여 인간의 계산 능력을 측정할 수 있습니다.
스마트 CAPTCHA는 매우 효과적이지만 너무 복잡하거나 어려운 문제를 제시하면 사용자가 불만을 가질 수 있습니다. 이미지나 사운드의 형태로 문제를 해결하는 데 시간이 오래 걸리더라도 사용자에게 불편을 줄 수 있으므로 문제를 적절하게 표현하는 것이 중요합니다.
특수 글꼴을 통한 예방
사람이 글을 쓸 때 쉽게 읽을 수 있는 서체를 사용하여 작성된 글에 캡차나 숨은 마크업 정보를 추가해 자동화 프로그램이 글을 인식하기 어렵게 만드는 방식이다.
특수글꼴로 방지하는 예로는 특수글꼴로 글을 작성한 후 보안문자나 히든 마크업 정보를 추가하는 방법이 있다. 이렇게 작성된 텍스트는 사람이 읽기에는 쉽지만 자동화된 프로그램에서는 텍스트를 인식하기 어렵습니다.
예를 들어 텍스트를 작성할 때 문자 대신 이미지나 기호를 사용할 수 있습니다. 오늘날 사람들은 글을 쓸 때 이러한 이미지나 기호를 인식하지만 자동화된 프로그램에서는 인식하기 어렵습니다. 또한 이러한 이미지나 기호에 CAPTCHA 또는 숨겨진 마크업 정보를 추가할 수 있습니다.
이런 식으로 자동화 프로그램이 작성하기 어렵게 만들 수 있습니다. 하지만 이 방법도 사용자에게 불편을 줄 수 있으므로 적절한 보안 수준을 유지하면서 사용 편의성을 고려하는 것이 중요합니다.
웹 에디터(에디터)가 삽입 여부를 판단할 수 있나요?
웹에서 텍스트를 입력하고 편집하는 편집기는 붙여넣기를 위해 데이터를 서버로 전송할 수 있습니다.
웹 편집기는 일반적으로 HTML, CSS 및 JavaScript와 같은 웹 기술을 사용하여 구축됩니다. 붙여넣기할 때 웹 브라우저는 클립보드에 저장된 데이터를 읽고 편집기의 텍스트 영역에 데이터를 붙여넣습니다. 삽입된 데이터는 일반적으로 텍스트 형태로 전송됩니다.
따라서 편집기에 붙여넣은 데이터는 일반적으로 HTTP POST 요청을 통해 서버로 전송됩니다. HTTP POST 요청은 사용자가 제출한 데이터를 서버로 보내는 가장 일반적인 방법 중 하나입니다. 이것을 사용 사용자가 입력한 데이터와 붙여넣은 데이터 모두 서버로 보낼 수 있습니다.
다만, 삽입된 데이터에 대해서는 보안 문제가 발생할 수 있으므로 보안 측면을 고려한 적절한 조치가 필요합니다. 예를 들어 JavaScript를 사용하여 응답하여 클라이언트 측에서 삽입 이벤트를 감지하고 서버로 전송하기 전에 보안 유효성 검사를 수행할 수 있습니다.
사회적 합의가 필요한 부분인 것 같습니다.

삽입된 데이터와 최종 전송 데이터 비교
편집자 측에서 삽입된 데이터를 비교 판단하고 최종적으로 문서 내용을 서버로 보낼 수 있습니다.
웹 편집기는 일반적으로 JavaScript를 사용하여 사용자가 입력한 데이터를 처리합니다. 이때 사용자가 붙여넣으면 편집기는 클라이언트 측에서 붙여넣은 데이터를 처리하고 최종적으로 서버로 보냅니다.
이 과정에서 편집자 측에서는 삽입된 데이터와 최종 전송된 문서 내용을 비교하여 불일치가 있을 경우 사용자에게 알려줍니다. 이렇게 하면 삽입된 데이터가 원본 데이터와 다른 경우에 대응할 수 있습니다.
그러나 붙여넣은 데이터가 원본 데이터와 다른 경우 악의적인 목적으로 수정되었을 수 있으므로 보안 문제가 발생할 수 있습니다. 따라서 이 경우 보안검색 등의 추가적인 조치가 필요합니다.
chatGPT와 Notion Ai 작성은 판단하기 어려울 수 있지만, 삽입된 데이터와 완성된 문서의 내용이 동일하거나 유사한 경우 해당 글이 중복 글일 가능성이 높아지므로 서버에서 판단할 수 있습니다.
서버에서 이를 결정하는 방법은 다를 수 있습니다. 예를 들어 특정 키워드나 문구가 포함된 기사가 중복 기사일 가능성이 높으면 서버에서 이를 감지하고 해당 기사를 차단할 수 있습니다. 또는 작성자의 IP 주소 또는 자격 증명 및 작성 시간과 같은 정보로 판단할 수 있습니다.
그러나 작성자가 직접 내용을 작성했다고 하더라도 유사한 내용이나 스타일이 나타날 수 있어 완벽한 판단을 내리기는 어렵습니다. 따라서 저자가 중복되지 않은 글을 쓰더라도 이러한 기준을 충족하면 글이 차단될 가능성이 있어 수정이 필요할 수 있습니다.
분석 기준 및 구현 방법에 따라 가능성은 다르지만 문서 편집 시 삽입되는 비율이 적거나 서버로 전송된 완성된 문서의 내용이 삽입된 내용과 유사하지 않은 경우 문서를 입력 이것은 높은 확률로 직접 생성되기 때문에 서버에서 이를 확인할 수 있습니다.
이러한 판단을 위해 미리 수집된 데이터나 분석된 패턴을 기반으로 기계 학습 알고리즘을 사용하거나 일정한 기준에 따라 일치도를 측정하는 방법을 사용할 수 있다.
창의력 포인트를 추가하는 것도 가능합니다. 예를 들어, 서버 측은 문서 내용과의 유사도를 측정하고, 이것으로부터 창의성 점수를 계산하여 웹사이트에 표시합니다.
그러나 이 방법은 완벽한 창의성 점수를 제공하지 못할 수 있으며 창의성에 대한 논쟁이 발생할 수 있습니다. 따라서 이 방법을 구현할 때 어떻게 창의성 포인트를 보여주고 사용자의 의견을 수렴하는지 명확하게 설명하는 것이 중요하다.
전체적으로
chatGPT나 Notion Ai로 글을 작성할 때 충분히 편집하면 붙여넣은 데이터와의 유사성을 판단해 독창성을 완벽하게 커버하기는 어렵지만 평점 점수에서 약간의 차이는 줄 수 있을 것 같다.
ChatGPT, Notion Ai에 대해 써주세요, 당신의 의견은 어떤가요?

