Google тұмауының үрдістері - Google Flu Trends

Google Flu Trends деректері, Оңтүстік Африка

Google тұмауының үрдістері (GFT) болды веб-қызмет басқарады Google. Бұл шамамен берілген тұмау 25-тен астам мемлекет үшін қызмет. Жинақтау арқылы Google Search сұраулар, ол тұмаудың белсенділігі туралы нақты болжамдар жасауға тырысты. Бұл жоба алғаш рет 2008 жылы Google.org сайтында тұмаудың өршуін болжауға көмектесу үшін іске қосылды.[1]

Google Flu Trends ағымдағы бағалауды 2015 жылдың 9 тамызында жариялауды тоқтатты. Тарихи болжамдарды жүктеу үшін әлі де қол жетімді, ал қазіргі деректер мәлімделген зерттеу мақсатында ұсынылады.[2]

Тарих

Google Flu Trends-тің идеясы миллиондаған қолданушылардың денсаулығын бақылауды онлайн режимінде бақылау арқылы көптеген Google іздеу сұрауларына талдау жасай отырып, халықтың арасында тұмауға ұқсас аурудың бар-жоғын анықтауға болатын. Google Flu Trends бұл нәтижелерді тиісті аймақ үшін тұмаудың тарихи бастапқы деңгейімен салыстырды, содан кейін белсенділік деңгейі минималды, төмен, орташа, жоғары немесе қарқынды деп хабарлайды. Бұл бағалау, әдетте, ұлттық және аймақтық деңгейде денсаулық сақтау агенттіктері жинақтаған қадағалаудың дәстүрлі мәліметтерімен сәйкес келді.

Рони Зайгер Google Flu Trends дамытуға көмектесті.[3]

Әдістер

Google тұмауының үрдістері тұмаудың үрдістері туралы ақпарат жинау үшін келесі әдісті қолданумен сипатталды.[4][5]

Біріншіден, АҚШ-та 2003-2008 жылдар аралығында апта сайын енгізілген 50 миллионға жуық жалпы сұраныстарға уақыт қатары есептеледі. Сұрау уақыт тізбегі әр штат үшін бөлек есептеледі және әр сұраудың санын бөлу арқылы бөлшекке бөлінеді. барлық сұраулар осы күйде. Әр іздеуге байланысты IP-мекен-жайды анықтау арқылы осы сұраудың енгізілген күйін анықтауға болады.

Сызықтық модель тұмауға ұқсас аурудың (ILI) дәрігеріне бару және ILI-ге байланысты іздеу сұранысының журнал-коэффициенттерін есептеу үшін қолданылады:

P - бұл ILI дәрігерінің келу пайызы және Q алдыңғы қадамдарда есептелген ILI-ге қатысты сұраныстың бөлігі болып табылады. β0 кесінді және β1 - бұл коэффициент, ал ε - қателік термині.

50 миллион сұрақтың әрқайсысы ретінде тексеріледі Q бір сұрау бойынша есептелген нәтиже АҚШ-тың Ауруларды бақылау және алдын-алу орталықтарынан (CDC) алынған ILI мәліметтерінің нақты тарихына сәйкес келе ме, жоқ па екенін білу үшін. Бұл процесс сызықтық модельді пайдалану кезінде CDI ILI деректерінің дәл болжамдарын беретін ең жақсы сұраныстар тізімін шығарады. Содан кейін ең жақсы 45 сұраныс таңдалады, өйткені жинақталған кезде бұл сұраулар тарих деректеріне дәл сәйкес келеді. ILI-ге қатысты 45 ең жақсы сұраныстардың жиынтығын пайдаланып, сызықтық модель коэффициентті алу үшін 2003 - 2007 жылдар аралығында апта сайынғы ILI мәліметтеріне сәйкес келеді. Сонымен, дайындалған модель АҚШ-тың барлық аймақтарында тұмаудың өршуін болжау үшін қолданылады.

Осы алгоритмді кейінірек Google дәлдікке қатысты алаңдаушылыққа байланысты қайта қарады және оның нәтижелерін қайталауға тырысу алгоритмді жасаушыларға «анықталған нақты іздеу сөздерін жасырудың қажеттілігі сезілді» деген болжам жасады.[6]

Жеке өмірге қатысты мәселелер

Google Flu Trends іздеу жүргізген адамдарды анықтамай, тек миллиондаған жасырын іздеу сұрауларын біріктіру арқылы құпиялылықты бұзбауға тырысады.[1][7] Олардың іздеу журналы пайдаланушының IP-мекен-жайын қамтиды, оны іздеу сұранысы бастапқыда берілген аймақты іздеу үшін қолдануға болады. Google деректерге қол жеткізу және есептеу үшін компьютерлерде бағдарламаларды іске қосады, сондықтан бұл процеске бірде-бір адам қатыспайды. 9 айдан кейін Google іздеу журналдарында IP мекенжайын жасыру саясатын жүзеге асырды.[8]

Алайда, Google Flu Trends кейбір құпиялылық топтарының құпиялылық мәселесін көтерді. Электрондық құпиялылық туралы ақпарат орталығы және пациенттердің құпиялылық құқықтары хат жіберді Эрик Шмидт 2008 жылы, содан кейін Google бас директоры.[9] Олар пайдаланушылар жасаған деректерді пайдалану қоғамдық денсаулық сақтау іс-әрекеттерін айтарлықтай қолдау көрсетуі мүмкін деп мойындады, бірақ «қолданушының арнайы тергеуі соттың бұйрығымен немесе Президенттің өкімімен, тіпті Google қарсылығымен де мәжбүр етілуі мүмкін» деген алаңдаушылықтарын білдірді.

Әсер

ГФТ-ның бастапқы мотиві аурудың белсенділігін ерте анықтап, жылдам әрекет ету мүмкіндігі маусымдық және пандемиялық тұмаудың әсерін төмендетуі мүмкін еді. Бір хабарламада Google Flu Trends аймақтық тұмаудың өршуі туралы CDC (Ауруларды бақылау және алдын алу орталықтары) хабарлағанға дейін 10 күн бұрын болжай алғандығы айтылды.[10]

Ішінде 2009 ж. Тұмау пандемиясы Google Flu Trends АҚШ-тағы тұмау туралы ақпаратты қадағалады.[11] 2010 жылдың ақпанында CDC АҚШ-тың орта Атлантика аймағында тұмау жағдайларын анықтады. Алайда, Google-дің тұмаудың белгілері туралы іздеу сұрауларының мәліметтері CDC есебі шыққанға дейін екі апта бұрын дәл осындай өсімді көрсете алды.

«Ескерту неғұрлым ерте болса, соғұрлым алдын-алу және бақылау шараларын қолдануға болады, және бұл тұмау жағдайларын болдырмауға мүмкіндік береді», - дейді доктор Лин Финелли, CDC тұмау бөлімінде қадағалау жүргізеді. «Жыл сайын халықтың 5-тен 20 пайызына дейін тұмаумен ауырады, бұл орташа есеппен 36000 өлімге әкеледі». [10]

Google Flu Trends мысалы ұжымдық интеллект тенденцияларды анықтау және болжамдарды есептеу үшін қолдануға болатын. Іздеу жүйелерінде жинақталған мәліметтер айтарлықтай түсінікті, өйткені іздеу сұраныстары адамдардың шексіз қажеттіліктері мен қажеттіліктерін білдіреді. «Бұл әлемде көрінбейтін көрінетін заңдылықтарды көру үшін Google қолданушылары ойланбай жасаған деректерді пайдаланудың шынымен де ақылды тәсілі сияқты көрінеді», - дейді Томас В.Мэлоун, MIT жанындағы Слоан менеджмент мектебінің профессоры. «Менің ойымша, біз тек ұжымдық интеллектпен мүмкін болатын нәрсені тырнап жатырмыз». [10]

Дәлдік

Google-дің алғашқы мақаласында Google Flu Trends болжамдары CDC деректерімен салыстырғанда 97% дәл болды деп көрсетілген.[4] Алайда кейінгі есептерде Google Flu Trends болжамдары кейде өте дұрыс болмады, әсіресе 2011-2013 жылдар аралығында, тұмаудың салыстырмалы түрде жоғарылауын үнемі жоғарылатқан кезде,[6] және 2012-2013 жылдардағы тұмау маусымында бір аралықта дәрігерлердің келуі CDC-ге қарағанда екі есе көп болатынын болжады.[6][12]

Мәселелердің бір көзі - Google-да тұмауға байланысты іздеу жүргізетін адамдар тұмаудың диагнозын қою туралы өте аз білуі мүмкін; тұмау немесе тұмау белгілерін іздеу тұмауға ұқсас, бірақ іс жүзінде тұмауға жатпайтын ауру белгілерін зерттей алады.[13] Сонымен қатар, Google қадағалайтын «қызба» және «жөтел» сияқты іздеу терминдерін талдау, сондай-ақ олардың уақыт бойынша іздеу алгоритміндегі өзгерістердің әсерлері оның болжамдарының мағынасына қатысты алаңдаушылық туғызды.[6] 2013 жылдың күзінде Google жаңалықтарда тұмаудың көп болуына байланысты іздеудің өсуін өтеуге тырысты, ол бұрын нәтижелерді бұрмалап жіберді.[14] Алайда бір талдау «GFT және кешіктірілген CDC деректерін біріктіру, сондай-ақ GFT-ны динамикалық қайта калибрлеу арқылы біз тек GFT немесе CDC өнімділігін едәуір жақсартуға болады» деген қорытындыға келді.[6] Кейінгі зерттеу сонымен қатар Google іздеу деректерін бағалауды жақсарту үшін пайдалануға болатындығын, тек CDC деректерін қолданатын модельде кездесетін қателіктерді 52,7 пайызға дейін төмендетуге болатындығын көрсетеді.[15]

GFT бастапқы моделін қайта бағалау арқылы зерттеушілер бұл модель денсаулық сақтаудың әртүрлі жағдайлары туралы сұрақтарды біріктіретіндігін анықтады, бұл ILI ставкаларын шамадан тыс болжауға әкелуі мүмкін; сол жұмыста ILI модельдеудің біршама жетілдірілген сызықтық және сызықтық емес жақсырақ тәсілдері ұсынылды.[16]

Байланысты жүйелер

Тұмауды болжау жобасы сияқты ұқсас жобалар[17] Оснабрюк когнитивті ғылым институты негізгі идеяны біріктіру арқылы алға тартады әлеуметтік медиа деректер мысалы. Twitter бірге CDC мәліметтер, және кеңістіктік және уақыттық таралуды болжайтын құрылымдық модельдер [18] аурудың.

Әдебиеттер тізімі

  1. ^ а б «Google тұмауының үрдістері | қалай». Мұрағатталды түпнұсқадан 2012 жылғы 22 қазанда. Алынған 10 қараша 2012.
  2. ^ Фред О'Коннор (20 тамыз 2015). «Google Flu Trends науқастарды шексіз шақырады». PCWorld. Мұрағатталды түпнұсқадан 2015 жылғы 23 тамызда. Алынған 23 тамыз 2015.
  3. ^ Цейгер, Рони (6 қазан 2009). «Google тұмауының үрдістеріне шолу». youtube.com. YouTube. Мұрағатталды түпнұсқадан 2013 жылғы 6 маусымда. Алынған 6 маусым 2013.
  4. ^ а б Гинсберг, Джереми. «Іздеу жүйесінің сұранысының мәліметтерін пайдаланып тұмау эпидемиясын анықтау» (PDF). Мұрағатталды (PDF) түпнұсқасынан 2012 жылдың 4 қыркүйегінде. Алынған 10 қараша 2012.
  5. ^ Гинсберг, Джереми; Мохебби, Мэтью Х .; Пател, Раджан С .; Браммер, Линнетт; Смолинский, Марк С .; Бриллиант, Ларри (19 ақпан 2009). «Іздеу жүйесінің сұранысының мәліметтерін пайдаланып тұмау эпидемиясын анықтау». Табиғат. 457 (7232): 1012–1014. дои:10.1038 / табиғат07634. PMID  19020500.
  6. ^ а б c г. e Лазер, Дэвид; Кеннеди, Райан; Король, Гари; Веспигани, Алессандро (14 наурыз 2014). «Google тұмауы туралы астарлы әңгіме: үлкен деректерді талдаудағы тұзақтар» (PDF). Ғылым. 343 (6176): 1203–1205. дои:10.1126 / ғылым.1248506. PMID  24626916. Мұрағатталды (PDF) түпнұсқадан 2019 жылғы 19 қарашада. Алынған 19 желтоқсан 2019.
  7. ^ Хелфт, Мигель (13 қараша 2008). «Google тұмау үрдісінде құпиялылық қаупі бар ма?». The New York Times. Мұрағатталды түпнұсқадан 2012 жылғы 6 қарашада. Алынған 10 қараша 2012.
  8. ^ «Құпиялылық саясаты - саясат және қағидалар - Google». Мұрағатталды түпнұсқадан 2012 жылғы 3 қарашада. Алынған 10 қараша 2012.
  9. ^ Пиллинг, Дебора. «EPIC-тің 2008 жылғы 12 қарашада Google-ге Google тұмауының тенденциясы туралы хаты» (PDF). Мұрағатталды (PDF) түпнұсқадан 2012 жылғы 15 қарашада. Алынған 10 қараша 2012.
  10. ^ а б c «Google тұмаудың таралуын бақылау үшін іздеуді пайдаланады» (PDF). Мұрағатталды (PDF) түпнұсқадан 2012 жылғы 15 қарашада. Алынған 10 қараша 2012.
  11. ^ Кук, С .; Конрад, С .; Фаулкс, А.Л .; Mohebbi, M. H. (2011). Коулинг, Бенджамин Дж (ред.) «2009 ж. Тұмау вирусы А (H1N1) пандемиясы кезінде АҚШ-тағы Google тұмауының тенденцияларының тиімділігін бағалау». PLOS ONE. 6 (8): e23610. дои:10.1371 / journal.pone.0023610. PMC  3158788. PMID  21886802.
  12. ^ Батлер, Деклан (2013 ж. 13 ақпан). «Google тұмаумен ауырғанда». Табиғат. 494: 155–156. дои:10.1038 / 494155a. PMID  23407515.
  13. ^ «Google тұмауының тенденциясы: Үлкен деректердің жағдайы нашар болды ма?». SiliconANGLE.
  14. ^ Ричард Харрис (2014-03-13). «Google-дің тұмауды қадағалаушысы иістен зардап шегеді». ҰЛТТЫҚ ӘЛЕУМЕТТІК РАДИО. Мұрағатталды түпнұсқасынан 2019-03-19. Алынған 2019-12-19.
  15. ^ Прейис, Тобиас; Moat, Helen Susannah (29 қазан 2014). «Google іздеуін қолдана отырып, тұмаудың өршуіне бейімделу режимін анықтау». Royal Society Open Science. 1: 140095. дои:10.1098 / rsos.140095. PMC  4448892. PMID  26064532.
  16. ^ Лампос, Василейос; Миллер, Эндрю С .; Кроссан, Стив; Стефансен, Христиан (3 тамыз 2015). «Іздеу сұраныстарының журналдарын қолдана отырып, тұмауға ұқсас аурулардың жылдамдығын растайтын жетістіктер». Ғылыми баяндамалар. 5 (12760). дои:10.1038 / srep12760. PMC  4522652. PMID  26234783.
  17. ^ «Оснабрюк университетінің және IBM WATSON тұмауын болжау жобасы». Мұрағатталды түпнұсқасынан 2019-05-27. Алынған 2019-12-19.
  18. ^ Шумахер Йоханнес (2015). «Күрделі жүйелерді өлшеу кезінде ақпарат ағынының кешігуін және бағытын анықтайтын статистикалық негіз». Нейрондық есептеу. 27: 1555–1608. дои:10.1162 / NECO_a_00756. Мұрағатталды түпнұсқасынан 2019-02-12. Алынған 2016-03-20.

Сыртқы сілтемелер