کتاب همه دروغ میگویند (Everybody Lies)، نوشته ست استیونز دیویدویتس-دانشمند داده- است.
این کتاب دربارهی کلان دادهها(بیگ دیتا) و ریزدادهها است؛
درواقع راجع به اطلاعاتی است که شرکتهای مختلف از جمله گوگل از آدمها جمعآوری میکنند.
کتاب «همه دروغ میگویند» با استفاده از مفهوم بیگ دیتا، چیزهای جالبی در مورد عادات، رفتار،
ترسها و انگیزههای آدمها به ما میدهد.
و درکل این ایده را دنبال میکند که « ما به همه دروغ میگوییم به جز گوگل.»
مثلا تو نصف شب به خاطر درد معده بیدار میشوی.
دلت نمیخواهد به هیچکس بگویی درد داری ولی احتمالا به گوگل میگویی.
بنابراین با تحلیل دادههایی که دست گوگل است میتوان فهمید دلیل سوزش و درد معده چیست.
یا مثلا میتوانیم بفهمیم چقدر از سفیدپوستان امریکا به اوباما رای ندادند!
یا آدمها درباره سکس لایف خود، چه دروغهایی میگویند.
(نه اینکه با گوگل کردن، این اطلاعات را به دست بیاوریم، بلکه چون قبلا گوگل کردیم این اطلاعات، جمعآوری شده است.)
اصطلاح بیگ دیتا(کلان داده) به دادههای عظیمی گفته میشود که مغز انسان نمیتواند آن را هضم کند و برای دیدن مدلها و الگوها، به پردازنده کامپیوتر نیاز است.
همه ما آدمها یک جور دانشمند دادهایم. البته به لحاظ حسی!
استیونز تعریف میکند که روز عید شکرگزاری مادربزرگش به او میگوید پسرم هروقت خواستی شریک زندگیات را انتخاب کنی بیا من ویژگیهای یک شریک زندگی خوب را به تو میگویم تا بتوانی انتخاب درستتری داشته باشی.
مادربزرگ استیونز، رابطههای زیادی را در طول زمان دیده بود.
و در ذهنش اطلاعات این سالها را جمعآوری کرده بود و حالا میخواست از دل این اطلاعات بگوید ویژگیهای لازم و اساسی برای شریک زندگی، چه چیزهایی میتواند باشد.
در واقع در ذهنش الگوها را شناسایی میکرد و اینکه چه متغیرهایی روی بقیه اثر میگذارند و اگر چطور باشند میتوان نتیجه گرفت این رابطه دوام دارد.
او میگوید: شریک زندگی باید باهوش، بامزه، مهربان و زیبا باشد.
این دقیقا همان کاری است که یک دیتا ساینتیست (دانشمند داده) انجام میدهد.
مادربزرگ استیونز حرف دیگری هم میزند.
میگوید: اگر دو نفر شریک زندگی، دوستان مشترک داشته باشند رابطشان پایدارتر میماند.
ماجرا این است که حجم دادههای این مادربزرگ کوچک بوده است.
نمونههایی که امروز داریم نشان میدهد زوجهایی که دوستان مشترک بیشتری دارند احتمال قویتری وجود دارد که جدا شوند!
این یعنی ما نیاز داریم دیتاهای واقعی به کمکمان بیایند و چشماندازمان را تصحیح و شفاف کنند.
علم داده یک ابزار است. کار دانشمند داده، این نیست که صرفا اطلاعات جمع کند.
بلکه الگوهایی در این اطلاعات شناسایی میکند و بر اساس آن الگوها، آینده را پیشبینی میکند.
مثلا گوگل آمد اطلاعات لینکها را جمعآوری کرد، الگوها را شناسایی کرد و بر اساس آن پیشبینی کرد که چه سایتهایی معتبرتر است و چه چیزی بیشتر به درد مخاطب میخورد که همان را به او پیشنهاد کند.
دلایل اصلی مهم بودن بیگ دیتا:
به رویکرد گوگل که نگاه کنیم اولین قدرت بیگدیتا را میبینیم.
بیگ دیتا یک جریان دائمی از اطلاعات تازه به ما میدهد.
مثلا قبل از اینکه بیگدیتا ایجاد شود اگر میخواستیم آمار بیکاری را جمعآوری کنیم باید صبر میکردیم که اداره امور کارگران، تلفنی اطلاعات را از مردم جمع کند، و بعد ما از آنها بگیریم (با سلسله مراتبی که احتمالا وجود دارد)
یا مثلا باید منتظر میماندیم که اداره بهداشت عمومی اعلام کند نرخ ابتلا به آنفولانزا از این منطقه تا فلان منطقه چه تغییری کرده است.
بیگ دیتا دروغ نمیگوید.
آدمها در نظرسنجی دروغ میگویند؛
خصوصا وقتی موضوعی حساس است مردم چیزی را میگویند که فکر میکنند درستتر است.
یک دلیلش این است که ما میخواهیم تصویر خوبی از خود به جای بگذاریم.
(که احتمالا بخاطر خطاهای شناختی و خصوصا سوگیری مطلوبیت اجتماعی است.)
دلیل دیگرش این است که ما میخواهیم مصاحبه کننده را تحت تاثیر قرار دهیم.
مهم هم نیست که غریبه باشد یا آشنا!
خب این ها باعث میشود که نظرسنجیها با خطای زیادی مواجه شوند.
ست استیونز در فصل چهارم این کتاب میگوید:
«همه دروغ میگویند. مردم در مورد تعداد نوشیدنیهایی که در راه خانه خوردهاند راست نمیگویند.
دربارهی اینکه چند وقت یکبار باشگاه میروند،
قیمت کفشهای جدیدی که خریدهاند چقدر بوده،
یا اینکه فلان کتاب را خواندهاند یا نه دروغ میگویند.
آدمها میگویند «در تماس خواهیم بود» در صورتی که دیگر خبری ازشان نمیشوند.
میگویند از دست تو ناراحت نیستند ولی هستند.
میگویند دوستت دارند در حالی که ندارند.
با اینکه در لجن دست و پا میزنند میگویند خوشحالند.
میگویند زنها را دوست دارند حال آنکه در حقیقت از مردها خوششان میآید.
مردم به دوستها دروغ میگویند؛
به رئیسها دروغ میگویند؛
به بچهها دروغ میگویند؛
به پدر و مادرها دروغ میگویند؛
به دکترها دروغ میگویند؛
به همسرها دروغ میگویند؛
حتی به خودشان هم دروغ میگویند.
و بیبرو برگرد به پیمایشها (نظرسنجیها) هم دروغ میگویند.»
به اعتقاد ست استیونز، مردم در فضای دیجیتال، ردپای قابلاطمینانی از واقعیتهای زندگی خود به جا میگذارند.
او معتقد است که به جای اینکه از مردم بپرسید «آیا افسرده هستی» بهتر است ببینید آیا تا کنون، دربارهی روشهای غلبه بر افسردگی در گوگل جستجو کردهاند؟
بیگ دیتا به این خاطر قدرتمند است که دروغ نمیگوید. چون از روی رفتار فیلترنشدهی آدمها جمعآوری شده است.
احتمالش خیلی کم است که آدم موقع سرچ کردن، اطلاعات تحریف شده به گوگل بدهد.
(خصوصا اینکه در زمان سرچ، تو با گوگل تنها هستی!)
اطلاعات هم ناشناس است و معلوم نیست چه کسی چه چیزی سرچ میکند.
سومین مؤلفه قدرتمند بیگ دیتا این است که علیرغم عظیم بودن، به ما کمک می کند روی یه تکه مشخص زوم کنیم و با دقت خوبی، فقط اطلاعات آن قسمت را مطالعه کنیم.
در واقع بیگ دیتا به ما کمک می کند اسمال دیتا (ریزدادهها) را هم بهتر بفهمیم.
عیبهای بیگ دیتا
وقتی تعداد متغیرها زیاد است به راحتی نمیشود نتیجهگیری کرد.
همینطور زمانی که چیزهایی غیرقابل اندازهگیری است نمیتوان آن را تحلیل کرد.
مثلا فیسبوک همه لایکها و کلیکهای ما را هم جمع کند نمیتواند درست بفهمد تجربه واقعی ما با یک محصول یا یک سایت چطور بوده است.
اینجا نیاز به نظرسنجی و ریزداده پیدا میکنیم که اینکار را فیسبوک میکند.
علاوه بر این روانشناس و جامعهشناس هم استخدام میکند که به کمک آنها بفهمد کاربران چطور فکر میکنند و بتواند چیزهای غیرقابل اندازهگیری را از این طریق استخراج کند.
البته مشکل از این عمیقتر است.
هروقت ما چیزی در گوگل مینویسیم یا خرید آنلاین میکنیم داریم در جمع شدن بیگ دیتا مشارکت میکنیم.
اما سوالی که مطرح میشود این است:
اگر دولتها به این اطلاعات دسترسی پیدا کنند چه اتفاقی میافتد؟
مثلا گوگل کنی میخواهم خودم را بکشم.
دولت باید اینجا به طور مستقیم دخالت کند؟ یعنی باید پلیس خبردار شود؟
در ماه ۳.۵ میلیون سرچ در امریکا راجع به خودکشی انجام میشود ولی کمتر از ۴۰۰۰نفر خودکشی میکنند.
مسلما خیلی هزینه سنگینی دارد که پلیس دنبال تک تک افراد برود.
البته یک بحث اخلاقی هم مطرح میشود.
دولت حق دارد که وارد حریم شخصی افراد شود؟
تفاوت بین گوگل و شبکههای اجتماعی
هردو بیگ دیتا جمع میکنند ولی سوشال مدیا نهایت دروغگویی است.
چون مردم در شبکههای اجتماعی، مدام دروغ میگویند که بقیه را تحت تاثیر قرار دهند.
در شبکههای اجتماعی، بیشترین ترکیبی که راجع به شوهرم میسازند اینهاست:
شوهرم از همه بهتره
شوهرم بهترین دوست منه
شوهرم فوقالعادهست
شوهرم خوش تیپه
ولی در گوگل اگر نگاه کنید بعد از شوهرم این کلمات میآید:
شوهرم آشغاله
شوهرم اعصابخوردکنه
شوهرم بیتربیته
و…
حالا که بیگ دیتاهای سرچ به ما دروغ نمیگویند چه استفادههایی میتوانیم از آن بکنیم؟
محققین مایکروسافت تحقیق جالبی روی موتور جستجویشان (بینگ) انجام دادند.
گفتند وقتی برای کسی تشخیص سرطان لوزوالمعده میدهند، کاری که میکند سرچ راجع به این سرطان است.
بعد محققان، کسانی که این سرچ را انجام دادند بررسی کردند که ببینند این آدمها دوماه پیش چه علائمی را سرچ کردند و شش ماه پیش، چه چیزی سرچ کردند.
مثلا اینکه کسی سرچ کرده باشد: «سوءهاضمه»؛ شاید چیز خاصی نباشد؛
ولی اگر کسی سرچ کرده باشد سوءهاضمه، و بعد از آن سرچ کرده باشد درد معده و بعد از شش ماه سرچ کرده باشد سرطان لوزوالمعده، یک الگو ایجاد میکند.
این الگو میگوید: اگر امروز این علامت و این علامت را سرچ کرد، ۱۰% احتمال دارد که این آدم در مسیر سرطان لوزالمعده باشد.
ولی سرطان لوزالمعده بیماریای است که اگر زود تشخیص داده شود، شانس کنترل و درمانش زیاد است.
حالا فرض کنید سیستم این را به او بعد از سرچ علائم نشان دهد.
بگوید: ۱۰% احتمال سرطان داری ولی برو چک کن. چون اگه مبتلا باشی ۹۰% شانس درمان داری!
با اطلاعات سرچ احتمالا در آینده میتوان سیستم بهداشتی و سلامت را طوری تنظیم کرد که از این اطلاعات استفاده کند و نظام سلامت دچار تحول بزرگی شود.
کتاب ست استیونز برای کسی که با بیگ دیتا آشنایی ندارد، میتواند نقطهی شروع خوبی باشد.
آشنایی با علم تحلیل داده، دیدِ وسیعتری به ما میبخشد و کمک میکند که رفتار مردم و گروهها را بهتر درک و تحلیل کنیم؛
همچنین به ما نشان میدهد که چقدر پیشفرضهایی که در مورد دیگران و رفتار و افکار آنان داریم میتواند غلط باشد.
کتاب همه دروغ میگویند، کتاب اول ست استیونز است که خیلی هم به شهرت این دانشمند داده کمک کرده است.
من نسخه انگلیسی این کتاب را خواندم ولی نشر گمان به گفته دوستانم، ترجمه خوبی از آن منتشر کرده است.
۱۳ نظر
یاد یه داستانی افتادم چند سال پیش اف بی ای از فیس بوک قدردانی کرده بود که ما هزینه های جمع کردن پروفایل خلافکارها مون تا نود درصد کاهش پیدا کرده هر اطلاعاتی راجع به هرکس بخوابم کافی اسمش رو تو فیس بوک سرچ کنیم واقعا مبحث عجیبیه و کمی ترسناک مثل فیلم های علمی تخیلی.
کم کم شرکت های بزرگ رایانه ای توانایی این رو پیدا میکنن تا هر چندتا نسخه از هر کس دلشون خواست بسازن از اصلش بهتر
دیدن ردپای دیجیتالی افراد یکطرف، مهمتر از اون به نظرم الگوهای شخصیتی و رفتاری و نیازهای هرکسیه که توی سرچهای پنهانش پیدا میشه و میشه رفتارهای آینده ش رو حدس زد!
ساختن نسخههای مشابه و حتی هوشمندتر دور از انتظار نیست. یاد وست ورلد افتادم!
چند ماه پیش بود که موضوع این کتاب تو لیست پادکست بی پلاس نظرمو جلب کرد و گوشش کردم و لذت بردم.
جدا از بحث اطلاعات داده ها در کتاب، به نظرم کتاب میخواد بگه که اکثرا ما گفتارمون با رفتارمون متفاوته و این خوب نیست
راستش من در حال دیدن یه فیلم به شدت خوشال شدم از بودن دروغ تو زندگیمون و فقط بعد از تنها بیست دقیقه ابتدایی فیلم فهمیدم دنیای بدون دروغ واقعا وحشتناکه :)) (البته آخر فیلم دوباره به این نتیجه میرسی که هرچی بدبختی داریم از دروغ و دروغگوها هست)
به نظرم دروغ نیاز زندگی ماست فقط یه وجدان قوی میخواییم که به دیگران و مهمتر به خودمون ضرری نزنیم.
:اسم فیلم
The Invention of Lying 2009
چقدر جالبه محتوای این فیلمی که معرفی کردی. مشتاق شدم ببینمش. احتمالا بعدش مطلبی بنویسم با این عنوان: در ستایش دروغ و دروغگویی!
ولی صبر کن!
قبلا اینو به من معرفی نکرده بودی؟ یا اون سریال بود؟ تمامش حول محور دروغ و زبان بدن دروغگوها بود. (یه چنین تصویر محوی توی ذهنمه).
یک نکته هم این بین هست که نمیشه با توجه به بیگ دیتا زندگی یک جامعه رو انالیز کرد
توی سرچ گوگل ما معمولا مشکلات یا نیاز هامون رو سرچ میکنیم
شاید به همین دلیله که نتایج بیگ دیتا ها معمولا تلخن
نمیدونم شایدم من اشتباه میکنم
یه جمله فان هم همینجور بگم که
خود ست استیونز هم میتونه دروغ گو باشه:)
تا حد زیادی میشه آنالیز کرد ولی دقیق نیست یه جاهایی. همونجور که ست استیونز میگه: جاهایی که تعداد متغیرها زیاده یا متغیرها غیرقابل اندازهگیریاند.
ولی تحلیلهای این کتاب خصوصا فصلهای اولش، چندان دقیق نیست و خیلی جاها خودش خودشو نقض میکنه
اینم بهتره در نظر داشته باشیم که بعضی از سرچهای ما از سر کنجکاویه و الزاما از سر نیاز و یا ضرورت نیست. ( خب این میتونه باگ این تحلیل باشه)
و میتونه نتایج رو با خطا مواجه کنه.
راجع به جمله آخر هم موافقم :))
موافق هستم.
در حین خوندن متن داشتم تصور می کردم اخرین سرچ هام در مورد چی بودن؟ و اگه همونا رو میخواستم توی سوشال بنویسم یا مستقیم به دیگران می گفتم چقدر فرق میکرد؟!
بله با حذف و اضافه زیادی روبرو میشدیم در بعضی موارد.
و عموم آدما زندگی توی سوشال مدیا رو شاید به خاطر همین ویژگی «خود نبودن» ترجیح میدن. جایی که زندگی نزیستهشون رو بتونن اغراقآمیز به نمایش بذارن و غرایز (خطاهای شناختی)شون رو تغذیه کنند.
اون سریال lie to me هست که از طریق زبان بدن، دروغ رو تحلیل میکنه.
هدف اصلی این فیلم The Invention of Lying 2009 زیر سوال بردن ادیان هست و اینکه دروغ اصلی ترین پایه ادیان ها هست.
به نظر من مردم (حداقل اکثرشون) توی شبکههای اجتماعی تلاش میکنن نقشی رو بازی کنن که دوست داشتن توی زندگی واقعیشون باشن. از طرف دیگه شبکههای اجتماعی جای خوبی برای نشون دادن گرایشهای افراده به هر حال پشت اکثر اکانتهای داخل یه شبکه اجتماعی یه نفر آدم هست و گرایشاتی داره. میگن هر آدم برایند ۵ نفر دوستان اطرافشه و این موضوع توی اینستاگرام به خوبی قابل لمسه. پس دادههای شبکههای اجتماعی هم مفید و با اهمیته و با تحلیل درست نتایج درستی در اختیار ما قرار میده. ولی در کل به نظر من بیگ دیتا مثل اختراع دینامیت میمونه. هم مفید و هم خطرناک. در مورد درغگو بودن ادمها هم باید گفت گاهی دروغها ارزشمندتر از واقعیتها هستند. گاهی واقعا دروغ نیازه و گاهی هم نه. به هرحال ما با همین دروغها تا اینجا رسیدیم.
نمیدونم ویدئوی سخنرانی من رو دیدید یا نه. ولی به صحبتهای شما نزدیکه.
اگر دوست داشتید میتونید از این لینک ببینید:
شبکههای اجتماعی و فاشیسم مدرن
توی فیلم ex machina یه دیالوگ هست که نیتن راجب موتور جستجویی که ساخته میگه:
موتور جستجو مثل منبع نفت وقتی که پالایشگاهها نبود هستند، کلی مواد خام که کسی نمیدونست باهاش چیکار کنه!
رسانههای اجتماعی صرفا خرید و پول درآوردن نیست بلکه یه نگاشت از چیزهایی که مردم بهشون فکر میکنن هست، در واقع نگاشتی از طرز فکر مردمه!
دیتا ماینینگ در حقیقت میتونه نقش پالایشگاههایی که نیتن میگه رو بازی کنه
توی سریال بلک میرور هم یه اشارهی غیر مستقیمی شده بود، یادم نیست کدوم اپیزود بود، مردی فوت کرده بود که خانمش با غم رفتنش کنار نیومده بود و دوستی پیشنهاد شرکتی کرد که با استفاده از دادههایی که اون مرد فوت شده در اینترنت داشت ربات چتی ساخته بود و بعد ربات واقعی از اون نمونه ساخت.
تمام الگوهای رفتاری و صحبتی اون شخص رو داشت، یکم ترسناک شده بود 🙂
اینستاگرام جدیدا سیستم ماشین لرنینگی پیاده کرده که تو نسخهی وب میشه دید، وقتی سرعت نتم کم بود عکس لود نشد و به جاش متنهایی که توصیف عکس بودن نمایش داده شد و اینجا دیتای زیادی در حال ساخته شدن هست.
جمع بندی خاصی ندارم در اصل نمیتونم جمع بندی کنم باید ساعتها راجب این چیزها صحبت کرد :)))
من خلاصش رو از بی پلاس گوش داده بودم، کنجکاو شدم بخونم مرسی ?
مهدی عزیز چون ex machina رو همین دیشب دیدم میفهمم دقیقا از چی صحبت میکنی!
خصوصا جایی که گفت اینکه مردم به چه چیزی فکر میکنن مهم نیست مهم اینه که چطوری فکر میکنن. این همون موضوع ترسناک آینده نزدیکه.
بلک میرر هم رندوم دو سه قسمت دیدم که از قضا اینی که تعریف کردی جزوشون بود.
این سه چهارسال انقدر درگیر این موضوع بودم که دیگه اتفاقش رو خیلی دور نمیبینم چنانچه از خیلی وقت پیش شروع شده.
نسخه وب اینستاگرام رو اطلاعی نداشتم راستش. جالب بود چیزی که گفتی.
ولی واسه سایتم همینجورهها. اصلا توضیح عکس رو برای چنین مواقعی گذاشتن. منظورت همین بود یا دیتاهای خاص دیگهای رو افشا میکنه؟