مجموعه داده های مصنوعی قربانیان قاچاق انسان می تواند به داده های بزرگ بدون آسیب رساندن به حریم خصوصی اجازه دهد – TechCrunch

برای مبارزه م effectivelyثر با قاچاق انسان ، کسانی که با آن مبارزه می کنند باید آن را درک کنند – و این روزها ، این به معنای داده است. متأسفانه ، به دلایل واضح ، هیچ شاخص مناسبی برای قربانیان قاچاق وجود ندارد ، اگرچه این اطلاعات محرمانه از جهاتی فراوان است. ممکن است مایکروسافت و سازمان بین المللی مهاجرت با یک پایگاه داده مصنوعی جدید که تمام ویژگی های مهم داده های قاچاق واقعی را دارد ، اما راهی کاملاً مصنوعی است ، راهی برای پیشرفت پیدا کرده اند.

در حالی که هر قربانی بدون تردید فردی است ، س questionsالات اساسی سطح بالا مانند این که کشورها به طور فزاینده منبع یا ابزار قاچاق انسان هستند ، از چه مسیرها و روش هایی استفاده می شود و قربانیان به کجا می رسند ، یک امر آماری است. شواهد برای شناسایی روندها و الگوهای مهم پیشگیری ، در هزاران داستان جداگانه قفل شده است که اکثر آنها ترجیح می دهند از انتشار آنها خودداری کنند.

هری کوک ، هماهنگ کننده برنامه IOM در بیانیه خبری توصیف مجموعه داده ها گفت: “داده های اداری در مورد موارد شناسایی شده قاچاق انسان یکی از منابع اصلی داده های موجود است ، اما چنین اطلاعاتی بسیار حساس است.” “IOM از همکاری با Microsoft Research در دو سال گذشته بسیار خوشحال بوده است تا بتواند در چالش حیاتی به اشتراک گذاری چنین داده هایی برای تجزیه و تحلیل و حفاظت از ایمنی و حریم خصوصی قربانیان پیشرفت کند.”

از نظر تاریخی ، برای مواردی مانند پایگاه های اطلاعاتی جنایی و اطلاعات پزشکی ، استراتژی این است که آزادانه عمل کنید ، اما این روش “ناشناس ماندن” در برابر هرگونه تلاش جدی برای بازسازی داده ها بی اثر است. با استفاده از پایگاه های اطلاعاتی متعدد عمومی و نشت و محاسبه قدرت روی ضربه ، اطلاعات ویرایش شده را می توان به طور قابل اطمینان ارائه کرد.

گزینه Microsoft Research این است که از داده های اصلی به عنوان پایه ای برای مجموعه داده های مصنوعی استفاده شود که تمام روابط آماری مهم منبع را حفظ کند اما هیچ یک از اطلاعات قابل شناسایی را نداشته باشد. و این فقط تبدیل “جین دو” به “جانت دومان” و زادگاهش از کلیولند تا کوئینز نیست. در عوض ، گروههای کمتر از ده نفر با داده های مشابه یا همپوشان با هم ادغام می شوند تا مجموعه ای از ویژگیها را ایجاد کنند که آنها را از نظر آماری دقیق نشان می دهد ، اما نمی توان آنها را به صورت جداگانه شناسایی کرد.

عنوان: آمار مربوط به قاچاق انسان در سراسر جهان.

اعتبار تصویر: تحقیقات مایکروسافت / IOM

طبیعتاً این اطلاعات جزئیات اصلی را ندارد ، اما برخلاف منبع حساس ، این در واقع می توان از داده ها استفاده کرد لزوماً نيازي به تجزيه و تحليل و گفتن “خيلي خوب ، عمليات قاچاق بعدي از …” نيست ، بلكه اين داده ها ، كه بر اساس شواهد و دستاوردهاي مستقيم صورت مي گيرد ، مي تواند به عنوان يك سابقه واقعي براي پرداختن به اين امر در سياست و ديپلماسي مورد توجه قرار گيرد. مرحله. در مواردی که قبلاً مجبور بودید به طور کلی تری بگویید که کشور X یا دولت Z در این امور غفلت کرده یا در این امور شریک بوده است ، داشتن داده های محکم برای تأیید این امر به شما اجازه می دهد بگویید “36 درصد قربانیان قاچاق جنسی از حوزه قضایی شما عبور می کنند. ”

نه اینکه داده ها باید در تاکتیک های قوی استفاده شوند – صرفاً درک تجارت جهانی بدبختی انسان به عنوان یک سیستم و نه فقط یک سری رویدادهای ناپیوسته ، به خودی خود ارزشمند است. می توانید داده ها را مرور کرده و درخواست استفاده از آنها را در اینجا کنید. و در مورد روند ایجاد آن در GitHub برنامه بیشتر بیاموزید.