여기에 더 좋은 문제가 있습니다
홈페이지홈페이지 > 블로그 > 여기에 더 좋은 문제가 있습니다

여기에 더 좋은 문제가 있습니다

Aug 14, 2023

AI로 생성된 콘텐츠는 전례 없는 규모로 인터넷, 기업, 학교를 오염시키기 시작했습니다. 경우에 따라 생성 AI 콘텐츠에 플래그를 지정하는 것보다 사람의 텍스트를 감지하는 것이 더 쉬울 수도 있습니다. 최소한 서로 보완할 수는 있습니다.

AI 생성 콘텐츠의 급속한 성장으로 인해 AI 공급업체가 AI 생성 콘텐츠를 감지하는 도구를 개선할 수 있는 방법에 대한 논의가 주도되고 있습니다. 이것은 중요한 열망이지만 이러한 종류의 접근 방식은 이미 텍스트에 비해 부족합니다. AI 보안을 침해하거나 민주주의를 불안정하게 만들려는 '검은 모자'만을 위한 것이 아닙니다. 게으른 학생, 과도한 업무에 시달리는 직원, 부도덕한 제품 마케팅 담당자, 데이터 라벨링 작업장 등은 가벼운 편집만으로 대부분의 보호 장치를 쉽게 위반할 수 있습니다. 훨씬 더 나은 접근 방식은 준언어적 메타데이터와 공개 키 암호화를 조합하여 인간을 탐지하는 것입니다.

그리고 이를 위한 출처 체인을 구축하는 데 도움이 되는 도구가 등장하고 있습니다. 이전에 digitomica에 대해 쓴 것처럼 비디오, 오디오 및 사진용 AI 콘텐츠 탐지기는 디지털 워터마킹 도구 및 지적 재산 보호의 오랜 역사를 활용할 수 있습니다. 그러나 AI가 생성한 텍스트를 자동으로 감지하는 도구는 해결하기 훨씬 더 어려운 문제입니다. 디지털 워터마크는 일반 텍스트에 삽입하기가 훨씬 더 어렵습니다. 통계 패턴, 이상한 문법 사용, 심지어 문장 부호 규칙을 텍스트에 삽입하는 데 있어서 몇 가지 흥미로운 진전이 이루어지고 있습니다. 한 가지 예는 Google이 콘텐츠를 직접 복사했음을 증명하기 위해 음악 가사에 이상한 패턴을 삽입하려는 Genius의 노력이었습니다. 그러나 해당 사건은 법정에서 승소하지 못했다.

전 세계적으로 학교 시스템은 LLM(대형 언어 모델) 기반 생성 AI의 최근 발전으로 인해 학생들의 부정행위 노력이 과급될 것이라고 우려하고 있습니다. 장기적으로 이러한 노력이 성공하면 기업, 정부를 효과적으로 운영할 수 없고 가르치는 일도 할 수 없는 무능한 노동자가 대량으로 탄생할 수 있습니다. 그러나 이는 단순히 학문적인 문제만이 아닙니다. 정부는 부도덕한 제품 및 서비스 검토 관행에 관한 법률을 제정하기 시작했습니다. 영국은 현재 제품 리뷰 작성을 위해 돈이나 무료 상품을 교환하는 것을 금지하는 디지털 시장, 경쟁 및 소비자 법안 제안을 검토하고 있습니다. 유사한 법안이 보다 자동화된 접근 방식으로 확대되는 것은 시간 문제일 뿐입니다. 예를 들어, 부도덕한 마케팅 담당자가 가짜 인간 무리를 만들어 자사 제품의 경이로움을 칭찬하거나 경쟁 제품에 대한 욕설을 퍼붓는 등의 경우입니다.

그리고 데이터 라벨링 회사는 차세대 AI 교육을 위해 콘텐츠에 라벨을 적용하기 위해 비용을 지불하는 분산된 인간 네트워크와 씨름하기 시작했습니다. 이는 미래의 AI 도구가 이미지의 개체를 더 잘 식별하고, 유해한 콘텐츠를 조사하거나, 새로운 기업 AI 앱의 성능을 향상시킬 수 있도록 하는 데 필수적입니다. 한 가지 우려는 과로한 데이터 라벨러가 ChatGPT 및 기타 LLM으로 전환할 수 있다는 것입니다. 이는 데이터 생산성 및 일부 데이터 라벨링 작업에 유용할 수 있습니다. 단점은 AI 생성 콘텐츠에 대해 LLM을 교육하면 AI 모델이 붕괴되어 새 모델도 제대로 작동하지 않을 수 있다는 것입니다.

몇 년 전, 은행 업계는 새로운 온라인 서비스로 인해 사기가 증가하면서 어려움을 겪었습니다. 한편, 성장하는 구독 경제는 개인이 친구 및 가족과 중요한 정보 서비스에 대한 비밀번호를 공유하는 비밀번호 공유로 인해 어려움을 겪고 있습니다. 비밀번호 텍스트뿐만 아니라 비밀번호 입력 방법에 대한 메타데이터에도 많은 정보가 포함되어 있는 것으로 관찰되었습니다. 다양한 타이핑 스타일, 리듬, 리듬으로 인해 사람들은 실제 글자를 매우 다른 방식으로 타이핑하는 경향이 있습니다. 다양한 팀에서는 이를 행동 생체 인식, 키 입력 역학 또는 준언어적 메타데이터라고 부릅니다. 이러한 기술의 다양한 특징은 개념을 마우스 기술 및 음성 입력으로 확장할 수도 있습니다.

학술 분야에서는 이러한 행동 측정 지표를 차세대 워드 프로세서에 내장하는 것이 합리적입니다. 완전히 새로운 앱을 개발할 필요조차 없을 수도 있습니다. 기존 워드 프로세서, 웹 앱 및 기타 도구가 사용할 수 있는 오픈 소스 라이브러리에 간단히 통합될 수 있습니다.