Начало » Мисли » Сет Стивънс-Давидовиц

Сет Стивънс-Давидовиц

Сет Айзък Стивънс-Дейвидовиц (Seth Isaac Stephens-Davidowitz) (1982)
американски учен, икономист и писател

Понякога подозирам, че във всеки учен по данни има дете, което се опитва да разбере защо детските му мечти не са се сбъднали.

Нетфликс научи подобен урок в началото на своя жизнен цикъл: не се доверявайте на това, което хората ви казват; вярвайте на това, което правят.

Силвър забеляза, че областите, в които Тръмп се представи най-добре, създават странна карта. Тръмп се представи добре в части от Североизтока и индустриалния Среден Запад, както и в Юга. Той се представи значително по-зле на Запад. Силвър потърси променливи, за да се опита да обясни тази карта. Беше ли безработица? Беше ли религия? Беше ли притежание на оръжие? Беше ли процент на имиграция? Беше ли опозиция срещу Обама? Силвър установи, че единственият фактор, който най-добре корелира с подкрепата на Доналд Тръмп в републиканските първични избори, е тази мярка, която бях открил четири години по-рано. Областите, които подкрепиха Тръмп в най-голям брой, бяха тези, които направиха най-много търсения в Гугъл за "негър".

Ако не можете да разберете едно изследване, проблемът е в изследването, а не във вас.

Както при Гугъл така и при всички останали, които се опитват да използват данни, за да разберат света. Революцията на големите данни е по-малко свързана със събирането на все повече и повече данни. Става дума за събиране на точните данни.

Например, казаха ни, че онези от нас, които пият умерено количество алкохол, обикновено са в по-добро здраве. Това е корелация. Означава ли това, че пиенето на умерено количество ще подобри здравето на човек - причинно-следствена връзка? Може би не. Възможно е доброто здраве да кара хората да пият умерено количество. Социолозите наричат това обратна причинно-следствена връзка. Или може да има независим фактор, който причинява както умереното пиене, така и доброто здраве. Може би прекарването на много време с приятели води както до умерена консумация на алкохол, така и до добро здраве. Социалните учени наричат това отклонение на пропуснатата променлива.

Щатът с най-висок процент търсения в Гугъл за самопредизвикани аборти е Мисисипи, щат с приблизително три милиона души и сега само една клиника за аборти.

Първоначално исках да дам заглавието на книгата: Колко голям е моят пенис? Какво можем да научим за човешката природа от търсенията в Гугъл? Но моят редактор ме предупреди, че продажбата на такава книга ще бъде трудно предизвикателство. Според него би било неудобно хората да си купят книга с това заглавие, да речем, в книжарницата на летището.

Много хора не съобщават за неудобно поведение и мисли в проучванията. Искат да изглеждат добре, въпреки че повечето анкети са анонимни. Това се нарича пристрастие към социалната желателност.

Прекарах почти всеки ден от последните четири години в анализиране на данни от Гугъл. Това включва работа като учен по данни в Гугъл, която ме нае, след като научи за моето изследване на расизма. И продължавам да изследвам тези данни като автор на мнения и журналист на данни за Ню Йорк Таймс. Разкритията продължават да идват. Психично заболяване; човешка сексуалност; насилие върху дете; аборт; реклама; религия; здраве. Не съвсем малки теми и този набор от данни, който не съществуваше преди няколко десетилетия, предложи изненадващи нови перспективи за всички тях. Икономисти и други социални учени винаги търсят нови източници на данни, така че нека бъда откровен: сега съм убеден, че търсенията в Гугъл са най-важният набор от данни, събиран някога за човешката психика.

Това е втората сила на Big Data: определени онлайн източници карат хората да признаят неща, които не биха признали никъде другаде. Те служат като дигитален серум на истината.

Една потенциална причина учениците да се борят толкова много е, че учителите не се появяват постоянно. В даден ден в някои училища в селските райони на Индия повече от 40 процента от учителите отсъстват.

Ако повече хора правят търсения, казвайки, че искат да направят нещо, повече хора ще направят това нещо.

Хората се адаптират към своя опит и хората, които ще успеят, намират предимства във всяка ситуация. Факторите, които ви правят успешни, са вашият талант и вашият стремеж. Те не са тези, които изнасят вашата встъпителна реч или други предимства, които предлагат най-големите училища с известни марки.

Бях много шокиран от това, което интернет разкрива за човешката сексуалност...

Но естествените експерименти не трябва да бъдат изрично случайни, като лотарии. След като започнете да търсите произволността, ще я видите навсякъде - и можете да я използвате, за да разберете как работи нашият свят.

Big Data ни позволяват смислено да увеличаваме мащаба на малки сегменти от набор от данни, за да придобием нови прозрения за това кои сме ние.

Науката за данни взема естествен и интуитивен човешки процес - забелязване на модели и осмисляне на тях - и го инжектира със стероиди, като потенциално ни показва, че светът работи по напълно различен начин от начина, по който си мислехме.

Big Data ни позволяват най-накрая да видим какво хората наистина искат и наистина правят, а не какво казват, че искат и казват, че правят. Предоставянето на честни данни е втората сила на Big Data.

Това, че ни позволява да увеличим мащаба на малки подгрупи от хора, е третата сила на Big Data.

Позволяването ни да правим много причинно-следствени експерименти е четвъртата сила на Big Data.

Първо и може би най-важно, ако се опитвате да използвате нови данни, за да революционизирате дадена област, най-добре е да отидете в област, където старите методи са отвратителни.

Но тези точно над или точно под острия числов праг имаха практически идентични криминални истории и произход. Тази една мижава точка обаче означаваше много различно преживяване в затвора. Резултатът? Икономистите установиха, че затворниците, назначени в по-тежки условия, са по-склонни да извършат допълнителни престъпления, след като напуснат. Тежките условия в затвора, вместо да ги възпират от престъпления, ги закоравиха и ги направиха по-насилствени, след като се върнаха във външния свят.

Всичко е данни! И с всички тези нови данни най-накрая можем да прозрем лъжите на хората.

И със сигурност е възможно лъжата да е изиграла роля в провала на социологическите проучвания да предскажат победата на Доналд Тръмп през 2016 г. Проучванията подценяват подкрепата му средно с около 2 процентни пункта. Някои хора може да са се срамували да кажат, че планират да го подкрепят. Някои може би са твърдяли, че не са решили, когато наистина са вървели по пътя на Тръмп през цялото време.

Изправен пред това несъответствие, Нетфликс спря да иска от хората да им казват какво искат да видят в бъдеще и започна да изгражда модел, базиран на милиони кликвания и гледания от подобни клиенти. Компанията започна да поздравява своите потребители с предложени списъци с филми, базирани не на това, което твърдят, че харесват, а на това, което според данните е вероятно да гледат. Резултатът: клиентите посещават Нетфликс по-често и гледат повече филми. "Алгоритмите ви познават по-добре, отколкото вие самите се познавате", казва Ксавие Аматриан, бивш специалист по данни в Нетфликс.

Никога не сравнявайте вътрешностите си с външността на всички останали.

Когато снимките бяха изобретени за първи път, хората ги възприемаха като картини. Нямаше с какво друго да ги сравнявам. Така обектите на снимките копират обекти на картините. И тъй като хората, които седяха за портрети, не можаха да задържат усмивка за многото часове, които отне картината, те приеха сериозен вид. Обектите на снимките приеха същия вид. Какво в крайна сметка ги накара да се променят? Бизнес, печалба и маркетинг, разбира се. В средата на двадесети век Кодак, компанията за филми и камери, беше разочарована от ограничения брой снимки, които хората правеха, и измисли стратегия, за да ги накара да правят повече. Рекламата на Кодак започна да свързва снимките с щастието. Целта беше хората да придобият навик да се снимат винаги, когато искат, за да покажат на другите колко добре си прекарват. Всички тези усмихнати снимки от годишника са резултат от тази успешна кампания (както и повечето от снимките, които виждате във Фейсбук и Инстаграм днес).

Учените се чудеха дали езикът може да е ключът към разбирането на пристрастията.

Пълнотата на кошчетата в супермаркетите е информация. Зрелостта на ябълките е данни. Снимките от космоса са данни. Кривината на устните е данни. Всичко е данни! И с всички тези нови данни най-накрая можем да прозрем лъжите на хората.

Градските райони обикновено са добре снабдени с модели на успех. За да видите стойността да бъдете близо до успешни практикуващи занаят, когато сте млади, сравнете Ню Йорк, Бостън и Лос Анджелис. Сред трите, Ню Йорк произвежда забележителни журналисти с най-висок процент; Бостън произвежда забележителни учени с най-висок процент; и Лос Анджелис произвежда забележителни актьори с най-висок процент. Не забравяйте, че говорим за хора, които са родени там, а не за хора, които са се преместили там. И това важи дори след като се извадят хора с известни родители в тази област.

Хората ще признаят повече, ако са сами, отколкото ако други са в стаята с тях.

Сред констатациите на учените във Фейсбук: Коледа е един от най-щастливите дни в годината.

Ако харесвате расистки шеги, нямате никакъв стимул да споделите този некомпютърен факт с анкета. Вие обаче имате стимул да търсите най-добрите нови расистки вицове онлайн. Ако смятате, че може да страдате от депресия, нямате стимул да признаете това в проучване. Имате стимул да попитате Гугъл за симптоми и потенциални лечения.

Данните разкриха, че медиите ни дават изкривена представа за възрастта на типичните предприемачи. Скорошно проучване установи, че средната възраст на предприемачите, представени в бизнес списанията, е двадесет и седем години. Медиите обичат да ни разказват секси историите на чудотворците, създали големи компании. Но на колко години всъщност е типичният предприемач? Скорошно проучване на цялата вселена от предприемачи установи, че средният успешен предприемач е на четиридесет и две години. И шансовете за започване на успешен бизнес се увеличават до шестдесетгодишна възраст. Освен това предимството на възрастта в предприемачеството е вярно дори в технологиите, област, която повечето хора смятат, че изисква младостта да овладее новите инструменти.

Следователно заключението на тази книга на практика се написа от само себе си. Бих се запознал и оженил за момичето. Още по-добре, бих използвал Big Data, за да срещна правилното момиче. Може би бих могъл да втъкам пикантии от процеса на ухажване през цялото време. Тогава цялата история щеше да се обедини в заключение, което щеше да опише сватбения ми ден и да се удвои като любовно писмо до новата ми съпруга. За съжаление животът не съвпадна с моята визия. Да се заключвам в апартамента си и да избягвам света, докато пиша книга, вероятно не помогна на романтичния ми живот. И аз, уви, все още трябва да си намеря жена. По-важното беше, че трябваше да намеря ново заключение.

Big Data не премахват необходимостта от всички други начини, по които хората са се развили през хилядолетията, за да разбират света. Те взаимно се допълват.

Както заключават авторите, "колкото по-положително е съдържанието, толкова по-вероятно е да стане вирусно."

Един шестдесетгодишен основател на стартиращ бизнес има приблизително три пъти по-голям шанс да създаде ценен бизнес, отколкото тридесетгодишен основател на стартиращ бизнес.

Изследователите установиха, че един азиатски мъж би трябвало да печели зашеметяващите 247 000 долара повече годишен доход, за да бъде толкова привлекателен за средната бяла жена, колкото би, ако беше бял.

Както вече видяхме, думите са данни. Кликванията са данни. Връзките са данни. Печатните грешки са данни. Бананите в сънищата са данни. Тонът на гласа е данни. Хрипове са данни. Сърдечните удари са данни. Размерът на далака е данни. Твърдя, че търсенията са най-разобличителните данни.

Какво е общото между двойките, които се подобряват с времето? Ами тези, които се влошават?

Щастливите двойки са по-склонни да бъдат щастливи в бъдеще. Нещастните двойки са по-склонни да бъдат нещастни в бъдеще.

Трябва да се признае, че има все повече доказателства, че търсенията в Гугъл, свързани с престъпна дейност, корелират с престъпна дейност.

Има голям етичен скок от правителството, което разполага с данните за търсене на хиляди или стотици хиляди хора, към полицейското управление, което разполага с данните за търсене на индивид.

Никога не сравнявайте вашите търсения в Гугъл с публикациите на всички останали в социалните медии.

Колко хора в Америка имат сериозни проблеми? Александър прегледа данните. Той установи, че във всеки един момент около 20 процента от американците изпитват хронична болка; 10 процента се справят с травма от сексуално насилие; 7% имат депресия; 7 процента са алкохолици; 2 процента са с когнитивни увреждания; и 1% са в затвора. Александър направи някои анализи, които предполагат, че около половината американци в даден момент може да имат сериозен проблем. Александър заключава: "Светът почти със сигурност е много по-лошо място, отколкото някой от нас иска да признае."

Освен това, разбира се, не е буквално вярно, че "никой не е щастлив". Всъщност, според Общото социално проучване (GSS), 31 процента от американците се определят като "много щастливи" в наши дни.

Неотдавнашен анализ се опита да разбере колко струват някои от тези услуги за хората, като ги попита колко трябва да им платят, за да се откажат от тях. Те изчислиха, че търсачките струват 17 530 долара всяка година за средния американец; имейлът струва 8,414 долара; цифрови карти 3,648 долара; и социални медии 322 долара. Ние плащаме 0 долара за тези услуги. Възхитително!

Колинс и Хансен заключиха, че успешните компании нямат повече късмет; те успяха по-добре да се възползват от късмета, който имаха, късмета, който всяка компания може да очаква.

Ако отборът на фен спечели, фенът получава допълнителен тласък от около 3,9 точки щастие. Не е зле! Засега добре като любител на спорта. Ако вашият спортен отбор спечели, да бъдете спортен фен е забавно. Но какво се случва, когато вашият спортен отбор загуби? Ако спортният отбор на фен загуби, той може да очаква да загуби 7,8 точки щастие. (Равенството дава на средния фен 3,2 точки болка.) С други думи, загубите нараняват средния спортен фен много повече, отколкото победите го радват.

Колкото повече изучавах, толкова повече научавах, че Гугъл разполага с много информация, която е пропусната от анкетите и която може да бъде полезна за разбирането - наред с много, много други теми - изборите.

МакКерън и Долтън нарязаха данните допълнително. Те откриха, че мозъкът на спортните фенове се приспособява към това колко добър е техният отбор, ограничавайки колко удоволствие могат да получат от победите на страхотен отбор. По-специално, изследователите установиха, че спортен фен, когато се очаква отборът му да спечели мача, ще получи само 3,1 точки удоволствие от победа и ще загуби 10 точки щастие от загуба. С други думи, колкото по-добър е отборът, който подкрепяте, толкова повече отборът трябва да спечели, за да ви достави някакво удоволствие.

Четейки новаторските съвременни изследвания за щастието, стигнах до извода, че щастието е по-малко сложно, отколкото понякога си мислим. Нещата, които обикновено правят хората щастливи - да речем, излизане с приятели или разходка близо до езеро - не са точно умопомрачителни. И все пак съвременното общество се опитва да ни заблуди да правим неща, за които според данните (или дори малко здрав разум) е малко вероятно да ни направят щастливи. Много от нас посвещават години на работа твърде усилено на работа, която не харесват, с хора, които не харесват. Много от нас прекарват часове в разглеждане на последните актуализации в социалните медии. Много от нас минават месеци, без да прекарват реално време сред природата.

Всъщност във всички състезания, които Тодоров и колегите са изследвали, те са открили, че лицето, чието лице е оценено като по-компетентно от мнозинството субекти, е спечелило 71,6 процента от състезанията за Сената и 66,8 процента от състезанията за Камарата. И важността да изглеждаш компетентен за спечелване на избори, дори като се вземат предвид други фактори, като етническа принадлежност, възраст и пол.

Най-големият показател за успеха в кариерата на кадетите беше колко доминиращи изглеждат лицата им. Притежаването на лице, което хората смятаха за доминиращо, увеличи шансовете полковник да стане бригаден генерал, бригаден генерал да стане генерал-майор и генерал-майор да стане генерал-лейтенант.

...да израснеш в близост до големи идеи е по-добре, отколкото да израснеш с голям заден двор.

В Гугъл основните решения се основават само на малка извадка от всички техни данни.

Общо взето, ако някой ви каже, че ще ви върне парите, той няма да ви върне.

Американците, например, търсят "порно" повече, отколкото "времето".

Колкото по-категорично е обещанието, толкова по-вероятно е той да го наруши.

В по-общ план не се доверявам на актуализациите на статуса във Фейсбук поради причини, които ще обсъдя в следващата глава - а именно нашата склонност да лъжем за живота си в социалните медии.

Всъщност най-умните компании за Big Data често съкращават своите данни. В Гугъл основните решения се основават само на малка извадка от всички техни данни. Не винаги се нуждаете от много данни, за да намерите важна информация. Имате нужда от точните данни. Основната причина, поради която търсенията с Гугъл са толкова ценни, не е, че има толкова много от тях; това е, че хората са толкова честни в тях.

Търсенето на информация от хората само по себе си е информация.

И така, какво да правим с тази информация? Една проста, доста непротиворечива идея: можем да използваме данните на ниво област, за да разпределим ресурси. Ако в даден град има огромно увеличение на търсенията, свързани със самоубийство, можем да повишим осведомеността за самоубийство в този град. Градската управа или организациите с нестопанска цел може да пускат реклами, обясняващи къде хората могат да получат помощ, например. По същия начин, ако в даден град има огромно увеличение на търсенията за "убий мюсюлмани", полицейските управления може да са разумни да променят начина, по който патрулират по улиците. Те могат да изпратят повече служители, за да защитят местната джамия, например.

Силата в данните на Гугъл е, че хората казват на гигантската търсачка неща, които може да не кажат на никой друг.

През 2014 г. имаше около 6000 търсения на точната фраза "как да убия приятелката си" и 400 убийства на приятелки. Ако всички тези убийци бяха направили точно това търсене предварително, това би означавало, че 1 от 15 души, които са търсили "как да убия приятелката си", са го изпълнили. Разбира се, много, вероятно повечето, хора, които са убили приятелките си, не са направили точно това търсене. Това би означавало, че истинската вероятност това конкретно търсене да доведе до убийство е по-ниска, вероятно много по-ниска. Но ако специалистите по данни могат да изградят модел, който показва, че заплахата срещу конкретен индивид е, да речем, 1 на 100, може да искаме да направим нещо с тази информация. Най-малкото застрашеното лице може да има право да бъде информирано, че има шанс 1 на 100 да бъде убито от конкретен човек.

Данните ясно ни казват, че има много, много ужасяващи търсения, които рядко водят до ужасни действия. И все още няма доказателство, че правителството може да предвиди определено ужасно действие с голяма вероятност само от изследването на тези търсения. Така че трябва да сме много внимателни, за да позволим на правителството да се намеси на индивидуално ниво въз основа на данни от търсене. Това не е само по етични или правни причини. Също така, поне засега, поради причини, свързани с науката за данните.

Данните от търсенето разкриха, че живеем в много различно общество от това, в което учените и журналистите, разчитайки на социологически проучвания, смятаха, че живеем. Те разкриха неприятна, страшна и широко разпространена ярост, която чакаше кандидат да даде гласност за нея.

Какво прави науката за данните интуитивна? В основата си науката за данните е за откриване на модели и прогнозиране как една променлива ще повлияе на друга. Хората правят това през цялото време.

Еленберг, математик от университета на Уисконсин, беше любопитен колко хора всъщност завършват книги. Той измисли гениален начин да го тества с помощта на Big Data. Амазон съобщава колко хора цитират различни редове в книги. Еленберг разбра, че може да сравни колко често цитатите са подчертавани в началото на книгата спрямо края на книгата. Това би дало груба насока за склонността на читателите да стигнат до края.

И Big Data не премахват необходимостта от всички други начини, по които хората са се развили през хилядолетията, за да разберат света. Те взаимно се допълват.

Идеите се разпространяват – понякога бавно; друг път експоненциално, като вируси. Хората реагират по непредвидими начини на стимули. Тези връзки и взаимоотношения, тези скокове и набъбвания не могат да бъдат проследени с малки проучвания или традиционни методи за данни. Светът, просто казано, е твърде сложен и твърде богат за малко данни.

През 1998 г., ако сте търсили "коли" в популярна търсачка преди Гугъл, сте били залети с порно сайтове. Тези порно сайтове пишеха думата "коли" често с бели букви на бял фон, за да подмамят търсачката. След това получиха няколко допълнителни кликвания от хора, които възнамеряваха да купят кола, но бяха разсеяни от порно.

Всички лъжат; Единствената разлика е колко.

Един известен вестник от 1978 г., който твърди, че спечелването на лотарията не ви прави щастливи, до голяма степен беше развенчан.

Фейсбук ни излага на слаби социални връзки – познат от гимназията, лудият трети братовчед, приятелят на приятеля на приятеля, когото някак, някак, може би познавате. Това са хора, с които може би никога няма да отидете на боулинг или на барбекю. Може да не ги поканите на вечеря. Но вие ги сприятелявате във Фейсбук. И вие виждате техните връзки към статии с изгледи, които може би никога не бихте помислили иначе.

Защо присъствието на богати хора е толкова мощен показател за продължителността на живота на бедните?

Всъщност не е толкова изненадващо, че родословието не е толкова предсказващо. Помислете за хората. Представете си собственик на НБА, който е купил бъдещия си отбор, като десетгодишни, въз основа на техните родословия. Той би наел агент да прегледа Ървин.

Средно читателите на вестници се накланят малко наляво. (Те имат данни за това.) И вестниците средно се накланят малко наляво, за да дадат на своите читатели гледните точки, които изискват. Няма голям заговор. Има просто капитализъм.

Отново виждаме, че най-важната година в живота на един мъж, за целите на укрепването на любимия му бейзболен отбор като възрастен, е, когато той е на повече или по-малко осем години... Може би се питате какво да кажем за женския бейзбол фенове? Моделите са много по-малко остри, но пиковата възраст изглежда е двадесет и две години.

Някой, който споменава Бог, е 2,2 пъти по-вероятно да не изпълни задълженията си.

Възрастните с деца са 3,6 пъти по-склонни да кажат на Гугъл, че съжаляват за решението си, отколкото възрастните без деца.

Традиционно, когато учени или бизнесмени искаха данни, те провеждаха проучвания. Данните дойдоха спретнато оформени, извлечени от числа или отметнати квадратчета във въпросниците. Това вече не е така. Дните на структурирани, чисти, прости, базирани на проучвания данни свършиха. В тази нова ера разхвърляните следи, които оставяме в живота си, се превръщат в основен източник на данни.

Повече богати хора в един град означава, че бедните там живеят по-дълго. Бедните хора в Ню Йорк, например, живеят много по-дълго от бедните хора в Детройт. Защо присъствието на богати хора е толкова мощен показател за продължителността на живота на бедните? Една хипотеза – и това е спекулативна – беше изложена от Дейвид Кътлър, един от авторите на изследването и един от моите съветници. Заразното поведение може да е причина за това. Има много изследвания, които показват, че навиците са заразни. Така че бедните хора, живеещи близо до богати хора, могат да възприемат много от техните навици.

Докато методологията на добрата наука за данни често е интуитивна, резултатите често са контраинтуитивни.

Неотдавнашно проучване изчисли, че през първата година от живота на бебето родителите са изправени пред 1750 трудни решения.

Сега сме събрали три различни доказателства – страната на раждане, семейното положение на майките на голмайсторите и първите имена на играчите. Никой източник не е съвършен. Но и трите подкрепят една и съща история. По-добрият социално-икономически статус означава по-голям шанс да влезете в НБА. С други думи, конвенционалната мъдрост е погрешна.

Икономистите установиха, че след прожектирането на популярен филм с насилие престъпността намалява.

Понякога сме склонни да преувеличаваме стойността на собствения си опит. На езика на учените по данни, ние придаваме много по-голямо значение на фактите, взети от един източник - самите нас.

Представете си държава, която избира лидерите си въз основа на техните кръвни линии. Щяхме да бъдем ръководени от хора като Джордж Буш - младши.

Човек може да си помисли [...], че учтив, открито религиозен човек, който дава честната си дума, би бил сред тези, които най-вероятно ще изплатят заема. Всъщност не е. Както показва статистиката, честността на такива хора е под средната.

Всъщност всички ние сме толкова заети да изучаваме собствените си тела, че ни остава твърде малко сила, за да съдим телата на другите хора.

Природата непрекъснато експериментира с нас.

Когато изнасяме лекции на ядосани хора, заявките за търсене показват, че техният гняв може само да се увеличи. Но финото провокиране на любопитството на хората, подхвърлянето им на нова информация и предлагането на нови образи на групата, подклаждаща гнева им, може да обърне мислите в различна, по-положителна посока.

Не вярвайте на това, което хората казват - вярвайте само на това, което те правят.

Хората са адаптивни и тези, които ще успеят, ще намерят предимство във всяка ситуация.

Твърдя, че заявките за търсене са най-разкриващите данни. Оказва се, че снимките също са данни.

Способността да ни предлагат нови видове факти е първата мощна характеристика на Big Data.

Нашият собствен житейски опит и вкоренени предразсъдъци могат да ни заслепят.

...винаги трябва да отиваме там, където ни отвежда Big Data – и да действаме съответно.

В ерата на Big Data целият свят е една голяма лаборатория.

Защо ягода? Нямам идея. Но когато ураганите отминат, хората помитат ягодовите бисквити.

Децата, които учат дроби чрез игра, се представят по-зле на тестовете от тези, които учат дроби по стандартния начин.

За да работят по-добре Big Data, е необходима специална подправка: човешко решение и малки проучвания, които бихме могли да наречем малки данни.

Икономисти са установили, че затворниците, живеещи в по-тежки условия, са по-склонни да рецидивират. Тежките условия на задържане в затворите не толкова ги възпираха от престъпността, колкото смекчаваха и правеха по-жестоки.

Богатите хора навсякъде се стремят да развият здравословни навици. Средно те спортуват повече, хранят се по-добре, пушат по-малко и е по-малко вероятно да затлъстеят. Богатите могат да си позволят бягаща пътека, био авокадо, уроци по йога.

Вторият най-често срещан въпрос, който мъжете задават за секса, е как да го направят по-дълъг. Отново тази несигурност не е същата като притесненията на жените.

В редките случаи, когато жените изразяват загриженост относно размера на пениса на партньора си, те не означават непременно, че е твърде малък - повече от 40% от оплакванията се дължат на факта, че е твърде голям.

За всяко женско търсене на размера на пениса на партньора има около 170 мъжки заявки за техния собствен пенис.

Една жена вероятно се интересува от вас, ако говори за себе си.

В разговор мъжът ограничава диапазона от нюанси на гласа. Проведени са проучвания, които показват, че монотонният глас често се възприема от жените като мъжествен. Това означава, че мъжете, когато харесват една жена - може би подсъзнателно - преувеличават своята мъжественост.

В семейства с двама родители от средната класа възпитанието на децата като цяло е значително по-добро.

Средният човек в развитите страни сега е с 10 см по-висок, отколкото преди век и половина.

Мъжете от бедни семейства обикновено са по-ниски.

Понякога нашата интуиция - ако не се ръководи от внимателен компютърен анализ - може да ни отведе в напълно грешна посока. Нашият собствен житейски опит и вкоренени предразсъдъци могат да ни заслепят.

Вторият урок е, че когато се опитвате да направите прогноза, не е нужно сериозно да се съмнявате защо вашият модел работи.

Ако се опитвате да използвате нови данни, за да революционизирате дадена ситуация, най-добре е първо да се запитате: Къде старите методи се провалят?

Революционната същност на Big Data не е да се събира все повече и повече информация. Става въпрос за събиране само на това, от което се нуждаете.

Разчитайки само на интуицията си, можем да се подведем и от основната човешка склонност да драматизираме случващото се. Обичаме да надценяваме значението на всичко, което може да бъде основата на една незабравима история.

...когато се опитвате да направите прогноза, не е нужно сериозно да се питате защо вашият модел работи... т.е. просто трябва да знаете, че работи, а не да се опитвате да разберете защо.

Нашата култура непрекъснато ни бомбардира с образи на красиви, щастливи семейства. Повечето хора дори не са си представяли, че могат да съжаляват, че имат деца. Но някои съжаляват. И не могат да го признаят на никого - освен на Гугъл.

Смехът е тоник, начин да се отпуснете, да забравите за страданията.

От гледна точка на науката за данните има голяма разлика между опитите да се предвиди вероятността от определени събития в даден град и опитите да се предвидят действията на дадено лице.

Хората отдавна са оценявани по фактори, които не са пряко свързани с представянето [...]. Но опасността от информационната революция е, че тъй като животът ни става все по-дигитализиран, тези приблизителни преценки могат да стават все по-объркващи.

Лесно е да се използват факти, за да се разбере какво трябва да се направи. Всъщност да направите това е доста трудно.



XX век | XXI век | САЩ | икономисти | писатели |
САЩ икономисти | САЩ писатели | САЩ XX век | САЩ XXI век | икономисти XX век | икономисти XXI век | писатели XX век | писатели XXI век

Добави коментар

Режим на клавиатурата: ENG
Обратно горе