NVIDIA ถูกกล่าวหาว่าใช้วิดีโอ YouTube และ Netflix เพื่อฝึกโมเดล AI ทำให้เกิดความกังวลเรื่องลิขสิทธิ์

จากการเปิดเผยที่น่าประหลาดใจ NVIDIA ถูกกล่าวหาว่าฝึกโมเดล AI เชิงสร้างสรรค์ด้วยเนื้อหาวิดีโอจำนวนมหาศาลที่แยกออกมาจาก YouTube และ Netflix ตามการสืบสวนล่าสุดโดย 404 Media ยักษ์ใหญ่ด้านเทคโนโลยีรายงานว่าได้ป้อนข้อมูลวิดีโอที่เทียบเท่ากับเนื้อหา 80 ปีลงในโมเดล AI ทุกวัน ทำให้เกิดความกังวลอย่างมากเกี่ยวกับการละเมิดลิขสิทธิ์ที่อาจเกิดขึ้น

การสืบสวนเผยให้เห็นว่าพนักงานของ NVIDIA มีส่วนร่วมในการดึงข้อมูลขนาดใหญ่จากแพลตฟอร์มสตรีมมิ่งยอดนิยมเหล่านี้ แม้ว่าจะเผชิญกับความท้าทายทางกฎหมายที่อาจเกิดขึ้น ข้อมูลดังกล่าวถูกเปิดเผยผ่านข้อความภายใน Slack ที่รั่วไหล อีเมลขององค์กร และคำให้การจากอดีตพนักงาน

ความพยายามในการดึงข้อมูลจำนวนมาก

รายงานระบุว่า NVIDIA ใช้เครื่องมือโอเพนซอร์สเพื่อดาวน์โหลดวิดีโอจาก YouTube และดำเนินการดาวน์โหลดขนาดใหญ่โดยใช้เครื่องเสมือน 20 ถึง 30 เครื่องที่โฮสต์บน Amazon Web Services (AWS) การดำเนินการอันทะเยอทะยานนี้ส่งผลให้สามารถสกัดเนื้อหาวิดีโอที่มีมูลค่าสูงถึง 80 ปีต่อวัน นอกจากนี้ บริษัทสามารถรวบรวม URL ได้ถึง 30 ล้านรายการภายในเวลาเพียงหนึ่งเดือน

ที่น่าสังเกตคือ ฐานข้อมูลวิดีโอบางส่วนที่ใช้ในโครงการนี้ระบุอย่างชัดเจนว่ามีไว้สำหรับวัตถุประสงค์ทางวิชาการเท่านั้นและไม่มีใบอนุญาตเชิงพาณิชย์ แม้จะมีทีมนักวิจัยของตนเอง แต่ก็มีข้อบ่งชี้ว่า NVIDIA ตั้งใจที่จะใช้เนื้อหานี้เพื่อวัตถุประสงค์เชิงพาณิชย์ในการพัฒนาโมเดล AI ใหม่ Ming-Yu Liu รองประธานฝ่ายวิจัยของ NVIDIA เป็นหนึ่งในผู้ที่มีส่วนร่วมอย่างแข็งขันที่สุดในการจัดหาข้อมูลนี้

คำตอบขององค์กร

ในการตอบสนองต่อข้อกล่าวหา โฆษกของ NVIDIA ยืนยันว่าบริษัท "เคารพสิทธิของผู้สร้างเนื้อหาทั้งหมด และมั่นใจว่าโมเดลและความพยายามในการวิจัยของเราเป็นไปตามตัวอักษรและเจตนารมณ์ของกฎหมายลิขสิทธิ์อย่างสมบูรณ์" NVIDIA ปกป้องการกระทำของตนโดยอ้างถึง "การใช้งานโดยชอบ" โดยอ้างว่าการใช้เนื้อหาวิดีโอเพื่อวัตถุประสงค์ในการเปลี่ยนแปลง เช่น การฝึกโมเดล AI เป็นสิ่งที่ได้รับอนุญาต โฆษกยังกล่าวเสริมว่า "ทุกคนสามารถเรียนรู้ข้อเท็จจริง แนวคิด ข้อมูล และข้อมูลจากแหล่งอื่นได้อย่างอิสระ และใช้ข้อมูลเหล่านั้นเพื่อสร้างการแสดงออกของตนเอง"

รายงานฉบับเดิมได้ขอความคิดเห็นจาก YouTube และ Netflix เกี่ยวกับการใช้เนื้อหาของพวกเขาในทางที่ผิด YouTube ซึ่งเป็นบริษัทในเครือของ Google ได้ย้ำถึงคำพูดของ Neal Mohan ซีอีโอที่กล่าวไว้เมื่อต้นปีนี้ ซึ่งกล่าวถึงการใช้ YouTube เพื่อฝึกอบรมโมเดล AI ว่าเป็น "การละเมิดเงื่อนไขการให้บริการของ YouTube อย่างชัดเจน"

ขณะเดียวกัน Netflix ระบุว่าไม่มีข้อตกลงใดๆ กับ NVIDIA สำหรับการถ่ายโอนเนื้อหา และเน้นย้ำว่าเงื่อนไขการให้บริการของบริษัทห้ามการดึงข้อมูลจำนวนมาก

การถกเถียงอย่างต่อเนื่องเกี่ยวกับแนวทางการฝึก AI

การพัฒนาครั้งนี้เน้นย้ำถึงการถกเถียงอย่างต่อเนื่องเกี่ยวกับความโปร่งใสและจริยธรรมในการใช้เนื้อหาที่มีลิขสิทธิ์เพื่อวัตถุประสงค์ในการฝึก AI เหตุการณ์นี้ชวนให้นึกถึงข้อโต้แย้งก่อนหน้านี้ที่เกี่ยวข้องกับบริษัทเทคโนโลยีรายใหญ่ รวมถึง Apple และ Salesforce ซึ่งเผชิญข้อกล่าวหาว่าใช้ YouTube เพื่อฝึกอบรมระบบ AI

ในขณะที่อุตสาหกรรมเทคโนโลยียังคงเผชิญกับปัญหาเหล่านี้ ความสนใจยังคงจับจ้องไปที่วิธีการที่บริษัทต่างๆ จัดการและใช้เนื้อหาที่มีลิขสิทธิ์ในการวิจัยและพัฒนา AI สถานการณ์ดังกล่าวเน้นย้ำถึงความจำเป็นในการมีแนวทางที่ชัดเจนและการป้องกันที่เข้มงวดเพื่อปกป้องสิทธิ์ของผู้สร้างเนื้อหาในขณะที่พัฒนานวัตกรรมทางเทคโนโลยี

---

NVIDIA ถูกกล่าวหาว่าใช้วิดีโอ YouTube และ Netflix เพื่อฝึกโมเดล AI ทำให้เกิดความกังวลเรื่องลิขสิทธิ์

Commentaires

Inscrivez-vous à notre newsletter