در خبر نامه ما عضو شوید .

سیاه و سفید کلان‌داده

باسمه تعالی

در عصر دیجیتال سیاستگذاری نیز به‌مانند باقی امور بیش از گذشته با داده گره خورده است. این مساله تا بدان جا پیش رفته است که در دهه‌ی گذشته عباراتی نظیر حکمرانی داده‌-محور یا سیاستگذاری شواهد-محور در ادبیات سیاستگذاری عمومی مطرح و اقدامات مهم ملی و بین المللی را منجر شده است. در این رهگذر تحلیل کلان‌داده‌ها به‌عنوان رهیافتی فنی به یاری سیاستگذار خواهد آمد. ۱۲ ام بهمن ۹۸ آزمایشگاه داده و حکمرانی در پژوهشکده سیاستگذاری شریف میزبان دکتر حمید شیردستیان با ارائه‌ای با موضوع «سیاه و سفید کلان‌داده» بود. شیردستیان فارغ التحصیل دکتری بازاریابی دانشگاه کنکوردیا، مدرس مدرسه کسب و کار همان دانشگاه و مشاور حوزه‌ی بازاریابی و کلان‌داده است. تجربیات حمید در مواجهه با داده‌های شرکت‌هایی نظیر اوبر و تجربیات پیشین سیاستی سبب شده است نظر را به عمل پیوند دهد.

ایشان در ابتدا و با ذکر مثالی به تعریف کلان داده، وسعت این علم و معرفی منابع تولید کلان داده‌ها پرداختند. سپس با ذکر چند مثال به این پرسش پاسخ دادند که «با تحلیل کلان داده‌ها به چه سوالاتی می‌توان پاسخ داد ؟» ایشان کاربرد‌های کلان داده‌ها را به 7 دسته کلی شامل پیش‌بینی (ارتباط بین بودجه,تبلیغات و فروش), طبقه بندی (کدام مشتری به برند ما علاقه دارد یا از آن تنفر دارد ؟), تشابه سنجی ,خوشه بندی (دسته بندی‌های مشتریان), اتفاق همزمان (کدام محصولات با یکدیگر خریداری می شوند؟), پروفایل سازی (آیا تراکنش انجام شده توسط این کاربر ,کلاهبرداری است ؟), تحلیل ارتباطات (ارتباط افراد با یکدیگر با توجه به شبکه دوستی) تقسیم کردند .همچنین چند مورد از کاربرد های تجزیه و تحلیل داده ها شامل راهکار‌های تصمیم سازی یا تشخیص و پیشگویی را بازگو کردند.

از موارد موفق تحلیل کلان داده‌ها ,به تبلیغات موثرتر (یعنی ارائه محصول به فرد مناسب, در زمان و مکان مناسب ) , جلوگیری از بی عدالتی و شفافیت بیشتر (و به تبع آن بالاتر رفتن اعتماد مردم به تنظیم‌گری ) اشاره کردند و با بررسی دو حوزه نظام سلامت و امنیت اطلاعات به بررسی مزایا و معایب استفاده از کلان داده‌ها در زندگی روزمره پرداختند.

“در بحث نظام سلامت ,تاثیر تحلیل داده‌ها در مواردی مانند بهبود سلامت جامعه و تولید دارو به وضوح قابل مشاهده است اما مواردی مانند محرمانه بودن اطلاعات بیمار و محدودیت داده‌ها و الگوریتم‌ها در تشخیص بیماری و داروی مورد نیاز, باعث ایجاد نگرانی‌هایی شده است .در انگلیس 63% افراد از ثبت اطلاعات بیماریشان برای بهبود سیستم‎ سلامت و به‎کارگیری هوش مصنوعی به جای پزشکان و پرستاران ناخشنودند. 83% دانشجویان پزشکی در آلمان نسبت به کاربرد هوش مصنوعی در تواید دارو خوشبین ولی 56% نسبت به تشخیص قطعی به کمک آن بدبین هستند. مشکل جایی پیچیده‌تر می‌شود که داده‌ها تاثیر مستقیم در تصمیم گیری داشته باشند ,در آن صورت مسئول یک تصمیم اشتباه کیست ؟بیمارستان ؟پزشکان ؟ یا توسعه دهندگان الگوریتم‌ها؟

در حوزه امنیت اطلاعات هم علاوه بر نگرانی‌هایی مانند نگه داری صحیح و امن از دیتا‌های تحلیل شده ,دو ریسک اساسی وجود دارد :

1 – حریم خصوصی – یکی از تعریف‌های ارائه شده در مورد حریم خصوصی بیان می‌کند “حریم خصوصی شامل حق افراد به ناشناس بودن و داشتن کنترل بر روی در معرض قرار گرفتن اطلاعات خصوصی است”. با توجه به مطالب گفته شده و با در نظر گرفتن آنکه جمع‎آوری لحظه‌ای اطلاعات خصوصی (نام، دین، نژاد، آی پی و …) به صورت بدون وقفه و از طرق مختلف (ردپای آنلاین، ساعت هوشمند و …) انجام می‌شود,هر چه اطلاعات بیشتر و خصوصی تر باشد خطر شناسایی شدن بیشتر است .

2 – تحت نظارت بودن – داده‌های جمع آوری شده توسط شرکت‌های کوچک و بزرگ وقتی خطرناک می‌شود که این داده‌ها علاوه بر جمع آوری و پردازش ,مورد تجارت قرار بگیرند .به عبارت دیگر یعنی داده‌های جمع آوری شده از افراد, به مشابه کالا دست به دست شوند .”

در انتها ایشان با اشاره به قوانین اتحادیه اروپا که از سال 2018 و در جهت حفاظت از اطلاعات کاربران اجرایی شدند و با بیان چند مثال از جنبه‌های سفید و سیاه داده‌ها که در جدول ذیل آورده شده به جلسه خاتمه دادند .

حوزه‌ی فعالیت

سیاه

سفید

بر اساس تکنولوژی

تشخیص چهره

شناسایی افراد حاضر در عکس توسط شبکه‎های اجتماعی

پیدا کردن تروریست در استادیوم ورزشی

GPS

جاسوسی موقعیت

مسیریابی و تشخیص موقعیت

بر اساس زمینه

سلامت

تبعیض بیمه‎گذارها

 

آموزش

لستفاده برای تبعیض آموزشی در پذیرش

 

برق

اجازه به مجرمان برای دانستن حضور یا عدم حضور با هک کردن سیستم

 

نیروهای امنیتی

دستیابی به تلفن همراه بدون اجازه، شناسایی مظنونان با بررسی عادات وبگردی

یادگیری ماشینی برای شناسایی سارقان

خرده‎فروشی‎ها

قیمت تبعیضانه، پیش‎بینی بارداری مشتریان

بهبود چیدمان فروشگاه‎ها، بر اساس تحرک مشتریان، کوپن‎ها‌ی تخفیف بهتر، پیشنهادهای بهتر محصولات، بهبود زنجیره تأمین

برنامه‎ریزی شهری

بهبود راه‎ها در مناطق بیشتر برخوردار که دیتای آنها رسیده، هک سیستم‎های مدیریت ترافیک

مدیریت ترافیک، بهبود راه‎ها