Die Vorhersage der Einfluss der Lebensweise auf Gesundheit durch Twitter

    Forscher an der University of Rochester zeigte im vergangenen Jahr , wie Twitter kann verwendet werden, um vorherzusagen, wie wahrscheinlich es ist für ein Twitter-Nutzer krank zu werden. Sie haben jetzt Twitter zur Modellierung , wie andere Faktoren - sozialer Status, Exposition gegenüber Verschmutzung , zwischenmenschliche Interaktion und andere - die Gesundheit beeinflussen .

    " Wenn Sie auf der individuellen Ebene , wie viele Menschen , die krank sind in einer Population wissen wollen , müssten Sie , um die Bevölkerung , die kostspielige und zeitraub ist überblicken ", sagte Adam Sadilek , Postdoktorand an der Universität Rochester . " Twitter und die Technologie, die wir entwickelt haben, ermöglicht es uns, diese passiv zu tun , schnell und preiswert , und wir können auf das, was andere dazu sagen und mir diese Daten, um Vorhersagen zu machen hören . "

    Sadilek erklärte auch, dass viele Tweets sind Geo-Tags , die sie GPS-Informationen , die genau zeigt , wo der Benutzer war, als er oder sie getwittert tragen bedeutet .

    In der alle diese Informationen können die Forscher kartieren , in Raum und Zeit , was die Leute sagten in ihren Tweets, sondern auch , wo sie waren , und wenn sie da waren. Mit dem folgenden Tausende von Benutzern , wie sie tweet und gehen über ihr Leben, Forscher könnten Wechselwirkungen zwischen zwei Benutzern und zwischen sich und Ihre Umgebung zu schätzen.



    In einem Vortrag auf der Internationalen Konferenz über Web- Suche und Data Mining in Rom vorgestellt , Italien, wird Sadilek zeigen, wie ihr neues Modell erklärt viele der Faktoren, die die Gesundheit und wie sie traditionelle Studium der Lebenswissenschaften ergänzen können beeinflussen. Mit Tweets in New York City über einen Zeitraum von einem Monat erhoben , sahen sie Faktoren wie , wie oft eine Person nimmt die U-Bahn , geht in die Turnhalle oder ein bestimmtes Restaurant, Nähe zu einer Verschmutzungsquelle und ihre Online- sozialen Status. Sie sahen sich 70 Faktoren insgesamt . Sie sahen dann , ob diese sich positiv , negativ oder neutral Auswirkungen auf die Gesundheit der Benutzer.

    Einige ihrer Ergebnisse sind vielleicht nicht überraschend ; beispielsweise Verschmutzungsquellen scheinen eine negative Wirkung auf die Gesundheit haben. Allerdings ist dies das erste Mal, diese Auswirkungen dem Online- Verhalten einer großen Online-Bevölkerung entnommen. Das Papier zeigt auch ein breiteres Muster , in dem praktisch jede Aktivität, die menschliche Kontakt beinhaltet führt zu gesundheitlichen Risiken deutlich erhöht. Zum Beispiel, auch Menschen, die regelmäßig ins Fitnessstudio gehen krank geringfügig häufiger als weniger aktive Menschen . Doch die Menschen , die nur über die Turnhalle zu sprechen, aber eigentlich nie gehen (überprüft anhand ihrer GPS) , krank werden signifikant häufiger . Dies zeigt, dass es interessant Störfaktoren , die jetzt im Maßstab untersucht werden können .

    Die Technologie, die Sadilek und sein Kollege Professor Henry Kautz entwickelt hat , um eine Web-Anwendung namens GermTracker geführt. Die Anwendung Farbcodes Nutzer ( von rot nach grün ) nach ihrer Gesundheit durch den Bergbau Informationen von ihren Tweets für 10 Städte weltweit. Mit Hilfe der GPS-Daten in den Tweets die App codiert können dann Leute auf einer Karte , die jeder mit der Anwendung ihrer Verteilung sehen können.

    " Diese App kann von Menschen benutzt, um persönliche Entscheidungen über ihre Gesundheit zu machen. Zum Beispiel werden sie vielleicht eine U-Bahn Station zu vermeiden, wenn es voll von kranken Menschen " Sadilek vorgeschlagen. " Es könnte auch in Verbindung mit anderen Methoden , die von Regierungen und lokalen Behörden genutzt , um zu versuchen , um Ausbrüche von dem zu verstehen Grippe . "

    Es ist jetzt Grippesaison und so die Zahl der Menschen mit der Grippe in den USA steigt , so auch die Zahl der Menschen, die Überwachung GermTracker . An manchen Tagen im Januar 10.000 Menschen besuchten die Website * , wo die App gehostet wird.

    Die , die Sadilek und seine Kollegen entwickelten Modell basiert auf maschinen Lernen. Im Mittelpunkt ihrer Arbeit ist , wie sie die Ausbildung einen Algorithmus, um zwischen Tweets, die vorschlagen, die Person tweeting ist krank und diejenigen, die nicht zu unterscheiden.

    "Es ist wie eine neue Sprache zu lehren ein Baby ", sagte Sadilek . Er erklärte, dass sie zum ersten Mal einen Trainingssatz von Daten , 5.000 Tweets, die manuell kategorisiert worden waren und aus denen der Algorithmus starten, um zu unterscheiden , welche Wörter und Phrasen mit jemand krank verbunden generiert. Er fügte hinzu: "Wir müssen den Algorithmus zu verstehen, dass jemand, der twittert " Ich bin krank und habe im Bett den ganzen Tag " als krank bezeichnet werden , aber :" Ich habe es satt, Herumfahren in diesem Verkehr " nicht sein sollte . "

    Die Anwendung wird auch den Algorithmus zu verbessern. Jedes Mal, wenn jemand auf die Anwendung und klickt auf eines der farbigen Punkte , die die Nutzer stellen twittern geht , können sie den spezifischen tweet , dass jemand in einer bestimmten Weise zu klassifizieren geführt sehen . Die Anwendung fordert Sie auf, die tweet selbst beurteilen und sagen, ob Sie sich mit der Klassifizierung oder nicht. Dieser wird wieder in den Algorithmus , der aus seinen Fehlern zu lernen weiter zugeführt.

    Die Autoren haben seit kurzem zwei Kooperationen mit Forschern an der University of Rochester Medical Center. " In einer Anstrengung , planen wir, Twitter Vorhersagen für die klinische verlinken Grippe Studien ", sagte Co-Autor Kautz , Vorsitzender der Universität Fakultät für Informatik . " In einem anderen Bemühungen , sind wir mit der Fakultät , die in der Klinik für Psychiatrie und der School of Nursing an der sich diese Techniken zur Überwachung und Messung Einflussfaktoren Depression und anderen psychischen Störungen . "