นักวิจัยพัฒนาอัลกอริทึมที่สามารถระบุภาพหลอนของ AI ได้

ผู้เขียน：Eve Cole เวลาอัปเดต：2025-02-25 23:25:01

แม้ว่าโมเดลภาษาขนาดใหญ่ (LLM) เช่น ChatGPT, Claude และ Gemini จะทรงพลัง แต่ก็มีข้อบกพร่องที่สำคัญทั่วไปเช่นกัน นั่นคือ มักทำให้เกิดอาการประสาทหลอน นั่นคือข้อมูลสมมติ นี่ไม่เพียงแต่น่าอายเท่านั้น แต่ยังเป็นอุปสรรคต่อการประยุกต์ใช้ LLM ในวงกว้างอีกด้วย แม้แต่ Apple ก็ยังแสดงความกังวลเกี่ยวกับวิธีที่ระบบ AI ของตัวเองจะตอบสนองต่อปัญหานี้ เพื่อแก้ปัญหานี้ นักวิจัยได้พัฒนาเครื่องตรวจจับภาพหลอน AI ใหม่ ซึ่งสามารถระบุเนื้อหาเท็จที่สร้างโดย AI ได้อย่างมีประสิทธิภาพ โดยวางรากฐานสำหรับความก้าวหน้าของเทคโนโลยี AI รวมถึงแอปพลิเคชันที่ปลอดภัยและเชื่อถือได้มากขึ้น

机器人人工智能 AI

ภาพลวงตาเหล่านี้นำไปสู่ข้อผิดพลาดที่น่าอับอายและน่าสนใจมากมาย และนี่เป็นหนึ่งในสาเหตุหลักที่ทำให้ปัญญาประดิษฐ์อย่าง ChatGPT ยังไม่สามารถใช้งานได้จริงมากขึ้น ครั้งหนึ่งเราเคยเห็น Google ต้องแก้ไขภาพรวมการค้นหาด้วย AI เนื่องจาก AI เริ่มบอกผู้คนว่ากินหินได้อย่างปลอดภัย และใส่กาวลงบนพิซซ่าได้อย่างปลอดภัย มีกระทั่งทนายความที่ใช้ ChatGPT เพื่อช่วยเขียนเอกสารของศาล แต่ถูกปรับเพราะแชทบอทสร้างการอ้างอิงในเอกสาร

ตามรายงาน อัลกอริธึมใหม่ที่พัฒนาโดยนักวิจัยสามารถช่วยแยกแยะได้ว่าคำตอบที่สร้างโดย AI มีความแม่นยำประมาณ 79 เปอร์เซ็นต์ของเวลาทั้งหมดหรือไม่ แน่นอนว่านี่ไม่ใช่สถิติที่สมบูรณ์แบบ แต่ดีกว่าวิธีกระแสหลักอื่นๆ ถึง 10%

Chatbot เช่น Gemini และ ChatGPT อาจมีประโยชน์ แต่ก็สามารถสร้างคำตอบที่สมมติขึ้นได้อย่างง่ายดาย การวิจัยนี้ดำเนินการโดยสมาชิกของภาควิชาวิทยาการคอมพิวเตอร์แห่งมหาวิทยาลัยออกซ์ฟอร์ด นักวิจัยอธิบายในรายงานของพวกเขาว่าวิธีที่พวกเขาใช้นั้นค่อนข้างง่าย

ขั้นแรก พวกเขาขอให้แชทบอทตอบกลับข้อความแจ้งเดิมหลายครั้ง ซึ่งปกติแล้วจะอยู่ที่ห้าถึงสิบครั้ง จากนั้นพวกเขาคำนวณค่าที่เราเรียกว่าเอนโทรปีความหมาย ซึ่งเป็นการวัดว่าคำตอบมีความหมายเหมือนหรือต่างกันเพียงใด หากแบบจำลองตอบคำถามแต่ละรายการต่างกัน คะแนนเอนโทรปีความหมายจะสูงขึ้น ซึ่งบ่งชี้ว่า AI อาจกำลังสร้างคำตอบ อย่างไรก็ตาม หากคำตอบเหมือนกันทั้งหมดหรือมีความหมายคล้ายกัน คะแนนเอนโทรปีความหมายจะลดลง ซึ่งบ่งชี้ว่าคำตอบที่ให้นั้นมีความสอดคล้องกันมากกว่าและมีแนวโน้มที่จะเป็นจริง นี่ไม่ใช่เครื่องตรวจจับภาพหลอน AI ที่แม่นยำ 100% แต่เป็นแนวทางที่น่าสนใจ

วิธีการอื่นๆ อาศัยสิ่งที่เรียกว่าเอนโทรปีไร้เดียงสา ซึ่งโดยทั่วไปจะตรวจสอบว่าถ้อยคำของคำตอบแตกต่างไปจากความหมายหรือไม่ ดังนั้นจึงมีโอกาสน้อยที่จะตรวจจับภาพหลอนได้อย่างแม่นยำเท่ากับการคำนวณเอนโทรปีความหมายเนื่องจากไม่ได้เน้นที่ความหมายเบื้องหลังคำในประโยค

นักวิจัยกล่าวว่าสามารถเพิ่มอัลกอริธึมลงในแชทบอทเช่น ChatGPT ผ่านปุ่มที่จะให้ "คะแนนแน่นอน" แก่ผู้ใช้สำหรับคำตอบที่พวกเขาแจ้ง การสร้างเครื่องตรวจจับภาพหลอน AI โดยตรงลงในแชทบอทเป็นเรื่องที่น่าสนใจ ดังนั้นจึงเป็นเรื่องง่ายที่จะเพิ่มเครื่องมือดังกล่าวลงในแชทบอทต่างๆ

แม้ว่าเครื่องตรวจจับภาพหลอน AI นี้ที่ใช้เอนโทรปีความหมายจะไม่สมบูรณ์แบบ แต่ความแม่นยำ 79% และความได้เปรียบ 10% จากวิธีการที่มีอยู่ให้แนวคิดและวิธีการใหม่ในการแก้ปัญหาภาพหลอน AI การวิจัยครั้งนี้จะส่งเสริมความก้าวหน้าของเทคโนโลยี AI และทำให้ระบบ AI มีความน่าเชื่อถือและน่าเชื่อถือมากขึ้นอย่างไม่ต้องสงสัย