Wie die Grippe bug Bit Google

    Zahlen und Daten können kritische Werkzeuge zu bringen komplexe Themen in klaren Fokus. Das Verständnis von Krankheiten , zum Beispiel profitiert von Algorithmen, die helfen, ihre Ausbreitung zu überwachen . Aber ohne dabei eine Zahl kann nur eine Nummer, oder noch schlimmer, irreführend sein.

    " Das Gleichnis von Google Grippe : Traps in Big Data Analysis " wird in der Zeitschrift Science , gefördert veröffentlicht , zum Teil durch einen Zuschuss von der National Science Foundation . Insbesondere untersuchen die Autoren die Google- Daten - Aggregation -Tool von Google Grippe- Trend ( GFT ), die entwickelt, um Echtzeit-Überwachung von bereitzustellen wurde Grippe Fälle auf der ganzen Welt auf der Grundlage der Google-Suche , die Geschäftsbedingungen für Grippe- Aktivität abgestimmt.

    " Google Grippe- Trend ist eine erstaunliche Stück Technik und ein sehr nützliches Werkzeug , aber es zeigt auch , wo Analyse" Big Data " schief gehen ", sagte Ryan Kennedy, University of Houston Professor für Politikwissenschaft . Er und Co- Forscher David Lazer ( Northeastern University / Harvard University) , Alex Vespignani ( Northeastern University ) und Gary King ( Harvard University ) Detail neue Forschung über die problematische Verwendung von großen Daten -Aggregatoren wie Google .

    Auch bei Änderungen an der GFT über viele Jahre hinweg hat sich die Tool, dargelegt, um als Reaktion auf Grippewellen zu verbessern Spitzengrippe -Fälle in den USA in den vergangenen zwei Jahren überschätzt.

    "Viele Quellen von " Big Data " kommen aus Privatunternehmen , die , ebenso wie Google , ändern sich ständig ihren Dienst im Einklang mit ihrem Geschäftsmodell ", sagte Kennedy , der auch lehrt Forschungsmethoden und Statistik für Politologen . "Wir brauchen ein besseres Verständnis, wie sich dies auf die Daten , die sie produzieren , das Risiko der Zeichnung falsche Schlussfolgerungen und die Annahme unsachgemäße Politik sonst laufen wir . "

    GFT überschätzen die Prävalenz der Grippe in der Saison 2012-2013 , als auch die tatsächlichen Niveaus der Grippe in den Jahren 2011-2012 , die von mehr als 50 Prozent , entsprechend der Forschung . Zusätzlich von August 2011 bis September 2013, GFT übervorhergesagt, die Prävalenz von Grippe in 100 von 108 Wochen .

    Das Team stellt auch Datensammlungen von Plattformen wie Twitter und Facebook (wie Polling Trends und Markt popularity) , wie Kampagnen und Unternehmen können diese Plattformen zu manipulieren, um sicherzustellen, dass ihre Produkte sind Trending .

    Doch der Artikel macht es gibt Raum für Daten aus dem Googles und Twitters des Internet , um mit traditionelleren Methoden zu kombinieren , die im Namen der Schaffung eines tieferen und genaueren Verständnis des menschlichen Verhaltens .

    " Unsere Analyse der Google Grippe zeigt, dass die besten Ergebnisse aus der Kombination von Informationen und Techniken aus beiden Quellen ", sagte Kennedy. "Anstatt sprechen von einem " Big Data Revolution , " sollten wir diskutieren eine ' alle Daten Revolution ' , in denen neue Technologien und Techniken ermöglichen es uns, mehr und bessere Analyse aller Art zu tun. "