مجله وایرد در مقالهای به نقل از گزارش دیدهبان حقوق بشر میگوید بیش از ۱۷۰ تصویر و اطلاعات شخصی کودکان برزیل که بدون رضایت یا اطلاع آنها در یک پایگاه داده منبعباز، برای آموزش هوش مصنوعی استفاده شده بود شناسایی شدهاند.
به گزارش پیوست، این تصاویر از محتواهایی گرفتهاند که قدمت آنها از۱۹۹۰ تا سال ۲۰۲۳، یعنی بسیار پیش از آنکه نگرانی آموزش هوش مصنوعی با استفاده از دادههای خود باشند، متغییر است. دیدهبان حقوق بشر مدعی است اطلاعات شخصی این کودکان در کنار لینکی به تصاویر در پایگاه داده LAION-5B شناسایی شدهاند که برای در میان استارتآپهای هوش مصنوعی برای آموزش شهرت دارد.
های جانگ هان، پژوهشگر حقوق کودکان و فناوری در دیدهبان حقوق بشر و فردی که این تصاویر را شناسایی کرده است، میگوید: «در همان مورد اول که تصاویر استخراج و به این پایگاههای داده منتقل شدهاند، حریم خصوصی آنها نقض شده است و سپس این ابزارهای هوش مصنوعی براساس این دادهها آموزش دیدهاند و در نتیجه میتوانند تصاویر واقعگرایانهای از کودکان تولید کنند. این فناوری به گونهای توسعه یافته تا هرکودکی که تصویر یا ویدیویی از خود رد فضای آنلاین دارد در معرض خطر قرار میگیرد زیرا تبهکاران میتوانند آن تصاویر را برداشته و هرطور که میخواهند دستکاری کنند.»
پایگاه داده LAION-5B در منبعی به نام Common Crawl قرار دارد که دادههای آن از اینترنت جمعآوری و در اختیار پژوهشگران قرار گرفته است. این منبع اطلاعاتی پیش از این برای آموزش چندین مدل هوش مصنوعی از جمله ابزار مولد تصویر Stable Diffusion از شرکت Stability AI استفاده شده است. این پایگاه داده را که سازمان خیریه LAION آلمان تهیه کرده است به صورت آزاد قابل دسترسی است و در حال حاضر بیش از ۵.۸۵ جفت تصویر و توضیحات را در خود جای داده است.
تصاویر کودکانی که پژوهشگران شناسایی کردهآند مربوط به بلاگهای مامایی و دیگر بلاگهای شخصی، درمانی و نگهداری از کودکان است و همچنین بخشهایی از ویدیوهای یوتیوبی کمتر دیده شده را که به نظر برای مشاهده خانواده و دوستان بارگذاری شدهاند، در بر می گیرد.
های میگوید: «تنها با بررسی شرایطی که آنها در آن منتشر شدهاند میتوان فهمید که سطحی از حریم خصوی انتظار میرفته است. بیشتر این تصاویر را نمیتوان با جستجوی معکوس در اینترنت پیدا کرد.»
نیت تایلر، سخنگوی LAION، میگوید این سازمان به سرعت در این باره اقدام کرده است. او با اشاره به اینکه این سازمان در حال کار با «بنیاد دیدهبان اینترنت، مرکز حمایت از کودکان کانادایی، استنفورد و دیدهبان حقوق بشر است تا تمامی ارجاعات به محتوای غیرقانونی را حذف کند» میگوید: «LAION-5B در پاسخ به گزارشی از استنفورد که لینکهایی در دیتاست را به محتوای غیرقانونی عمومی شناسایی کرده بود از دسترس خارج شده است.»
شرایط استفاده یوتیوب استخراج دادههای کاربران را مگر در موقعیتهای خاص غیرمجاز میداند و به نظر دادههای شناسایی شده این شرایط را نقض میکنند. جک مائون، سخنگوی یوتیوب، میگوید: «ما به روشنی اعلام کردهایم که استخراج غیرمجاز محتوای یوتیوب نقض شرایط استفاده ما است و ما به اقدام قانونی علیه چنین سو استفادهای ادامه میدهیم.»
پژوهشگران بخشی از مسئولیت حمایت از دادهها را نیز برعهده دولتها میدانند. نمایندگان مردم در سراسر جهان از جمله ایالت متحده قوانینی را برای محدود کردن دسترسی به دادهها و منع استفاده از اطلاعات مردم در دیپفیک پیشنهاد کردهاند.