เมื่อเร็ว ๆ นี้ Trilegangers เว็บไซต์ยูเครนที่มุ่งเน้นไปที่โมเดล 3 มิติของมนุษย์พบการโจมตีด้วยการจราจรที่ไม่เคยเกิดขึ้นมาก่อนทำให้เซิร์ฟเวอร์พังทลาย เว็บไซต์มีความมุ่งมั่นที่จะให้ข้อมูลศิลปิน 3 มิติและนักพัฒนาเกมที่มีข้อมูลโมเดล 3D ร่างกายมนุษย์จำนวนมาก แต่มีปัญหาเนื่องจากการรวบรวมข้อมูลบ่อยครั้งของ GPTBOT ของ OpenAI เหตุการณ์นี้ไม่เพียง แต่เปิดเผยถึงภัยคุกคามที่อาจเกิดขึ้นจากการรวบรวมข้อมูลเว็บไปยังการดำเนินงานเว็บไซต์ แต่ยังก่อให้เกิดการอภิปรายอย่างกว้างขวางเกี่ยวกับความสมดุลระหว่างเทคโนโลยี AI และการป้องกันลิขสิทธิ์
ตามที่พนักงานของ Trilegangers แม้ว่าเว็บไซต์จะห้ามการรวบรวมข้อมูลและใช้งานในข้อตกลงการใช้งานอย่างชัดเจนเซิร์ฟเวอร์จะถูกโอเวอร์โหลดเนื่องจากการตั้งค่า Robots.txt ที่ไม่ถูกต้องเพื่อป้องกันไม่ให้ซอฟต์แวร์รวบรวมข้อมูลเข้าถึง ตามบันทึกของเซิร์ฟเวอร์ GPTBOT Crawler ของ OpenAI เริ่มต้นการร้องขอนับหมื่นผ่านที่อยู่ IP ที่แตกต่างกันมากกว่า 600 ที่แตกต่างกันซึ่งส่งผลให้เว็บไซต์ไม่สามารถทำงานได้ตามปกติเช่นเดียวกับการเผชิญหน้ากับการปฏิเสธการบริการแบบกระจาย (DDOS) สถานการณ์นี้ไม่เพียงส่งผลกระทบต่อการทำงานปกติของเว็บไซต์ แต่ยังทำให้ผู้ใช้ไม่สะดวก

Openai ที่กล่าวถึงในคำอธิบายตัวรวบรวมข้อมูลว่าหากเว็บไซต์ไม่ต้องการให้ GPTBOT รวบรวมเนื้อหาจะต้องตั้งค่าในไฟล์ Robots.txt อย่างไรก็ตาม Trilegangers ไม่ได้ตระหนักถึงสิ่งนี้นำไปสู่ภาวะที่กลืนไม่เข้าคายไม่ออกในปัจจุบัน แม้ว่ากฎหมาย Robots.txt จะไม่ถูกต้องตามกฎหมายหากเว็บไซต์ระบุว่าห้ามใช้การใช้งานที่ไม่ได้รับอนุญาต แต่พฤติกรรมการรวบรวมข้อมูลของ GPTBOT อาจยังคงละเมิดกฎระเบียบที่เกี่ยวข้อง เหตุการณ์นี้เตือนผู้ประกอบการเว็บไซต์ถึงความสำคัญของการตั้งค่าทางเทคนิคและยังกระตุ้นให้เกิดการคิดเกี่ยวกับจริยธรรมของการประยุกต์ใช้เทคโนโลยี AI
นอกจากนี้เนื่องจากการใช้เซิร์ฟเวอร์ Amazon AWS การบริโภคของ Trilegangers ในแบนด์วิดท์และการจราจรก็เพิ่มขึ้นอย่างมากทำให้เกิดแรงกดดันด้านต้นทุนเพิ่มเติม ในการตอบสนองต่อเหตุฉุกเฉินนี้ TrileGangers ได้ใช้มาตรการในการตั้งค่าไฟล์ robots.txt ที่ถูกต้องและบล็อกการเข้าถึงโปรแกรมรวบรวมข้อมูลหลายตัวรวมถึง GPTBOT ผ่าน CloudFlare บทเรียนนี้ยังให้การอ้างอิงที่มีค่าสำหรับเว็บไซต์อื่น ๆ
เหตุการณ์นี้กระตุ้นให้ผู้คนให้ความสนใจกับพฤติกรรมของซอฟต์แวร์รวบรวมข้อมูลเครือข่ายโดยเฉพาะอย่างยิ่งในบริบทของการพัฒนาเทคโนโลยี AI ที่เพิ่มขึ้น ด้วยความก้าวหน้าอย่างต่อเนื่องของเทคโนโลยี AI พฤติกรรมของซอฟต์แวร์รวบรวมข้อมูลเครือข่ายจะมีความซับซ้อนและซ่อนเร้นมากขึ้น เหตุการณ์นี้ไม่เพียง แต่เป็นความท้าทายสำหรับ Trilegangers เท่านั้น แต่ยังเป็นคำเตือนสำหรับอุตสาหกรรมอินเทอร์เน็ตทั้งหมด