آمازون پس از «نقض» درخواست‌های حریم خصوصی و حذف بچه‌ها با FTC برای 25 میلیون دلار توافق کرد.

آمازون یک جریمه 25 میلیون دلاری به FTC پرداخت خواهد کرد و همچنین “روش های حذف آن را اصلاح می کند و تدابیر سختگیرانه حفظ حریم خصوصی را اجرا می کند” تا از اتهامات مربوط به نقض قانون حفاظت از حریم خصوصی آنلاین کودکان برای تقویت هوش مصنوعی خود جلوگیری کند.

رابط صوتی آمازون الکسا سال‌هاست که در خانه‌ها در سراسر جهان استفاده می‌شود و هر پدر و مادری که یکی از این رابط‌ها را داشته باشد، می‌داند که بچه‌ها دوست دارند با آن بازی کنند، جوک بگویند، حتی از آن برای هدفش استفاده کنند، هر چه که باشد. در واقع آنقدر برای بچه‌هایی که نمی‌توانند بنویسند یا دارای معلولیت هستند مفید بود که FTC قوانین COPPA را برای استفاده منطقی کاهش داد: تجزیه و تحلیل خاص خدمات خاص از داده‌های کودکان، مانند رونویسی، تا زمانی که حفظ نشود مجاز بود. بیشتر از حد منطقی لازم باشد.

به نظر می رسد آمازون ممکن است دیدگاه نسبتاً گسترده ای در مورد مقیاس زمانی «معقولاً ضروری» داشته باشد و داده های گفتار کودکان را کم و بیش برای همیشه حفظ کند. همانطور که FTC می گوید:

بر اساس این شکایت، آمازون ضبط‌های کودکان را به‌طور نامحدود حفظ می‌کند، مگر اینکه یکی از والدین درخواست کند این اطلاعات حذف شود. و حتی زمانی که یکی از والدین به دنبال حذف این اطلاعات بود، FTC گفت، آمازون نتوانست رونوشت‌هایی از آنچه بچه‌ها گفته‌اند را از تمام پایگاه‌های داده‌اش حذف کند.

داده‌های موقعیت جغرافیایی نیز حذف نشدند، مشکلی که شرکت «مکرراً موفق به رفع آن نشد».

این برای سال‌ها ادامه داشته است – FTC ادعا می‌کند که آمازون در اوایل سال 2018 از آن مطلع بوده است، اما تا سپتامبر سال بعد، پس از اینکه آژانس به آنها کمکی مفید داد، اقدامی انجام نداده است.

این نوع زمان بندی معمولاً نشان می دهد که یک شرکت برای همیشه به این رویه ادامه می داد. و ظاهراً به دلیل «تعمیرات معیوب و مشکلات فرآیندی»، برخی از این اقدامات تا سال 2022 ادامه یافت!

شاید بپرسید، داشتن انبوه ضبط شده از صحبت بچه ها با الکسا چه فایده ای دارد؟ خوب، اگر قصد دارید رابط صوتی خود را زیاد با بچه ها صحبت کنید، مطمئناً به داشتن یک پایگاه داده مخفی از تعاملات صوتی کمک می کند که بتوانید مدل های یادگیری ماشینی خود را بر روی آن آموزش دهید. و به این ترتیب FTC گفت که آمازون حفظ این داده ها را توجیه می کند.

کمیسیونرهای FTC Bedoya و Slaughter و همچنین Chair Khan بیانیه ای را به همراه پیشنهاد حل و فصل و شکایت نوشتند تا به ویژه این یک نکته را مورد تاکید قرار دهند:

کمیسیون مدعی است که آمازون برای اصلاح بیشتر الگوریتم تشخیص صدای خود، داده های کودکان را به طور نامحدود نگه می دارد. آمازون تنها نیست که ظاهراً به دنبال جمع آوری داده ها برای اصلاح مدل های یادگیری ماشینی خود است. در حال حاضر، با ظهور مدل های زبانی بزرگ، صنعت فناوری به طور کلی در حال انجام همین کار است.

تسویه حساب امروز پیامی را به همه آن شرکت ها ارسال می کند: یادگیری ماشینی بهانه ای برای نقض قانون نیست. ادعاهای کسب‌وکارها مبنی بر اینکه داده‌ها باید به‌طور نامحدود برای بهبود الگوریتم‌ها حفظ شوند، ممنوعیت‌های قانونی نگهداری نامحدود داده‌ها را لغو نمی‌کند. داده‌هایی که برای بهبود الگوریتم‌های خود استفاده می‌کنید باید به طور قانونی جمع‌آوری و نگهداری شوند. شرکت ها بهتر است به این درس توجه کنند.

و بنابراین امروز ما 25 میلیون دلار جریمه داریم که البته برای اندازه یک شرکت آمازون ناچیز است. این به وضوح با سایر مفاد دستور پیشنهادی مطابقت دارد که احتمالاً آنها را سردرد خواهد کرد. FTC می گوید که این دستور:

ممنوعیت آمازون از استفاده از موقعیت جغرافیایی، اطلاعات صوتی و اطلاعات صوتی کودکان مشروط به درخواست حذف مشتریان برای ایجاد یا بهبود هر محصول داده.
شرکت را ملزم به حذف حساب‌های غیرفعال الکسا کودکان کنید.
از آمازون بخواهد که کاربران را در مورد اقدام FTC-DOJ علیه این شرکت مطلع کند.
آمازون را ملزم می کند تا از شیوه ها و کنترل های حفظ و حذف خود به کاربران اطلاع دهد.
آمازون را از ارائه نادرست خط مشی های حفظ حریم خصوصی مربوط به موقعیت جغرافیایی، صدا و اطلاعات صوتی کودکان منع کنید. و
ایجاد و اجرای یک برنامه حفظ حریم خصوصی مرتبط با استفاده شرکت از اطلاعات موقعیت جغرافیایی را مکلف کنید.

این تسویه حساب و اقدام کاملاً مستقل از یکی دیگر از FTC که امروز با زیرمجموعه آمازون Ring اعلام شد، است. با این حال، یک موضوع مشترک وجود دارد که “عدم اجرای حریم خصوصی و حفاظت های امنیتی اولیه” است.

آمازون در بیانیه‌ای گفت: «در حالی که ما با ادعاهای FTC مخالفیم و نقض قانون را تکذیب می‌کنیم، این توافق‌نامه موضوع را پشت سر گذاشته است». آنها همچنین قول می‌دهند که «نمایه‌های کودکانی را که بیش از ۱۸ ماه غیرفعال بوده‌اند، حذف کنند»، که به نظر می‌رسد حفظ آن داده‌ها بسیار طولانی است. من سوالاتی در مورد این مدت زمان و اینکه آیا داده ها برای آموزش ML استفاده خواهند شد را پیگیری کرده ام و در صورت شنیدن پاسخ به روز رسانی خواهم شد.