Twitteris pole kohalikke uudiseid raske leida

Kuna ameeriklased kasutavad üha enam sotsiaalmeediat, on teadlased loomulikult huvitatud sellest, kuidas sellest saadud andmeid saab paremini mõista, kuidas kasutajad nendel uutel platvormidel teavet jagavad ja arutavad. Säutumiste mass, alates poliitilistest kommentaaridest kuni üldise 'meeleoluni' ettevõtete, toodete või teenuste kohta, on paljudel turundusettevõtetel ja akadeemikutel tagasiside saamiseks Twitteri kollektiivsesse teadvuse voolu.


Kuid kui täpne on Twitter avaliku meeleolu mõõdupuuna ja kuidas seda saab kasutada? Pewi uurimiskeskuses oleme alates 2008. aastast olnud huvitatud Twitteri rolli katsetamisest uudistes. Kui me eelmisel aastal käivitasime aastase projekti, kus uuriti kohalikke uudiseid kolmes linnas, katsetasime Twitteri andmete abil mitut lähenemist, et mõista, kuidas see teenib uudiste allikana ja võimaldab kohalikel elanikel selles osaleda.

Meie kohtuotsus? Kuigi Twitteri analüüs on alles eksperimentaalses etapis ja Twitteri andmetel on piiranguid, võib see olla väärtuslik uus vahend meediakeskkonna mõistmiseks. Täpsemalt pidasime väärtuslikuks aru saada, kuidas uudiste organisatsioonid Twitterit kasutavad. Kohalikud uudised on siiski vaid üks väike teema paljudest platvormil arutletud teemadest. Puudulikuks pidasime Twitteri kasutajate kohta andmete kogumist asukoha järgi.


Siin on ülevaade sellest, mis töötas ja mis mitte Twitteri kasutamisel teadusuuringute jaoks.

Mida me tegime:

Tahtsime mõista, millist rolli mängib Twitter uudiste allikana kolme juhtumiuuringu linna kohalikele elanikele: Denver, Macon, Ga ja Sioux City, Iowa. See hõlmas Twitteris traditsiooniliste uudisteorganisatsioonide, näiteks ajalehtede, tele- ja raadiojaamade, samuti uudistetoimetajate endi, näiteks poliitikute, kogukonna juhtide ja valitsusametnike jälgimist. Selleks kasutasime enamasti teenust Gnip, et pääseda vidistama Twitteri tuletõrjevõrku, mis viitab juurdepääsule kõigile Twitteri säutsudele ja metaandmetele.



Selle asemel, et võtta Twitteri kasutajaid oma suurema kogukonna esindajana, käsitlesime igas linnas asuvaid Twitteri kasutajaid lihtsalt omaette kogukonnana. Tegime igakülgse uudiste pakkujate igakülgse auditi ja leidsime, et enamikul neist on Twitteri kontod. Isegi kui suhteliselt väike osa elanikkonnast on Twitteris, võib uudiste organisatsioonide Twitteri kasutamine olla kasulik vahend, et mõista, kuidas kohalik teave kogukonna kaudu levib.


Teiseks soovisime teada, kas iga linna elanikud kasutasid Twitterit uudistesündmuste kommenteerimiseks, arutamiseks ja isegi neis osalemiseks. Eksperimenteerisime mitme erineva meetodiga, enne kui otsustasime lähenemisviiside kombinatsioonile, mis vastaks kõige paremini käsitletud küsimustele.

Selle analüüsi tegemisel pidasime silmas Twitteri kasutamise üldisi piiranguid, et rääkida sellest, mida üldsus arvab, teeb või väärtustab. Erinevalt meie poolt läbi viidud esinduslikest telefoniküsitlustest on ka Twitteris olevadmitteelanikkonna kui terviku esindaja. Üldiselt näitavad meie uuringud, et umbes 23% veebipõhistest täiskasvanutest on Twitteris ja need, kes saidilt oma uudiseid saavad, on nooremad, haritumad ja omavad suurema tõenäosusega nutitelefoni kui kogu elanikkond.


Kuidas me analüüsi tegime:

Iga linna jaoks säutsude valimi loomise esimene ülesanne oli leida usaldusväärne viis sihtlinnade säutsude geograafiliste piiride loomiseks.

See osutus keerukaks, kuna geosiltide või Twitteri kasutajate enda tuvastatud asukohtade vaatamine - näiliselt ilmsed lahendused - ei olnud toimivad vastused. Twitteris peavad kasutajad lubama, et nende säutsud märgitakse automaatselt asukohaga ja väga vähesed teevad seda; enamiku hinnangute kohaselt on geomärgiseid vaid umbes 2% säutsudest. See osutus tõeks ka selles uuringus: kolmes nädala jooksul uuritud linnas ei olnud peaaegu üldse geosildiga säutse.

Seejärel vaatasime Twitteri kasutajate enda tuvastatud asukohta nende Twitteri profiili põhjal. Uurisime igas linnas säutsu valimi ja leidsime, et enamik kasutajaid kas ei täitnud seda teavet või täitsid selle teabe, mis ei olnud kasulik. Näiteks 'kuu' ja 'kosmos' olid äärmiselt populaarsed asukohad. Isegi juhul, kui kasutatav asukoht oli olemas, ei olnud otsest viisi kontrollida, kas kasutajad elasid tegelikult seal, kus nad ütlesid.


Selle asemel pöördusime tehnika poole, mida nimetatakse lumepalli või kettide proovide võtmiseks.

Twitteri heinakuhiKuna me olime juba kogunud igas linnas uudiste pakkujate Twitteri käepidemed, võtsime sellest kõigist säutsudest kõigist Twitteri käepidemetest või kasutajatest, kes @ olid uuritud aja jooksul uudisepakkuja käepidet maininud või uuesti tweetinud. Tegime seda seetõttu, et uudiste mainimine või retweetimine näitab, et Twitteri kasutaja tegeleb sellega kas uudistetarbijana või inimesena, kes soovib uudiseid levitada. Kuigi me teadsime, ei saa me seda garanteeridakõikuutest käepidemetest oleks otseselt ühendatud iga kogukonnaga, see andis meile lähtepunkti valimi täiendavaks täpsustamiseks.

See samm suurendas valimis olevate Twitteri kasutajate koguarvu mitmesajalt enam kui 30 000-ni. Lõpuks tõmbasid teadlased igast käepidemest kõik säutsud, mis olid iga linna ajavahemiku jooksul identifitseeritud kas uudiste pakkuja või uudiste tarbijana. Selle tulemuseks oli üle 4,7 miljoni säutsu.

Seejärel kitsendasime seda 4,7 miljoni suurust valimit, et leida Twitteris kohalike uudiste kohta käiva uuringu jaoks olulised säutsud - oluline samm, kuna leidsime, et valdav enamus Twitteri sisust ei olnud uuritud nädala jooksul kohaliku iseloomuga.

Proovisime valimi täpsustada, uurides igas linnas Twitteris jagatud URL-e ja vaadates märksõnu. Ligikaudu 40% säutsudest sisaldas URL-i või linki mõnele teisele veebisaidile. Teadlased lõid programmi, mis läheks igale veebilehele ja otsiks märksõnade järgi, mis seostaksid lehte iga linnaga. Kasutades Maconit testjuhtumina, lõime märksõnade loendi, lähtudes Maconi suurlinna statistilisest piirkonnast (MSA). 26 märksõna hõlmasid kõiki Maconi MSA-s sisalduvaid maakondade ja linnade nimesid. Praktikas need märksõnad ei töötanud. Isegi need geograafilisele piirkonnale omased märksõnad olid liiga üldised, et neist kasu oleks.

Isegi kui see meetod oleks töötanud, oli endiselt probleem 60% säutsudest, mis ei sisaldanud URL-i. Märksõnastrateegia ebaõnnestumine ja täiendavate 60% säutsude küsimus viisid meid uuringu jaoks kasutatud lõpliku meetodini.

Mis töötas:

Lõpuks oli lahendus sotsiaalmeedia analüüsitööriist nimega Crimson Hexagon, mis analüüsis kogu meie säutsu valimi kõige levinumate märksõnade ja räsimärkide kohta. Crimson Hexagon on tarkvara, mida saab kasutada suures koguses säutsude analüüsimiseks ja mitmesuguse teabe väljavõtmiseks. Sel juhul kasutasime tööriista meie uurimistöö jaoks ebaoluliste säutsude eemaldamiseks. Nende hulka kuulusid säutsud, mis saadeti riikidest väljaspool USA-d, ja säutsud, mis ei olnud inglise keeles.

Pärast nende eemaldamist kasutasime karmiinpunast kuusnurka, et leida säutsude sisust kõige sagedamini kasutatavad sõnad ja fraasid. See näitas meile, et Twitteri kohalik uudistesisu ületab üleriigilised uudised ja muu sisu kaugelt. Kohalike uudiste kohta märksõnu oli praktiliselt võimatu ühegi sagedusega leida.

Hoolimata selliste tööriistade kasulikkusest nagu Karmiinpunane kuusnurk, leidsime lõpuks kõige suurema edu palju vähem tehnilise tööriista abil: inimesed. Kohalike uudiste leidmiseks lugesime lihtsalt säutse - kümneid tuhandeid. See protsess võimaldas meil ka paremini mõista, kus kohalikud uudised ilmusid ja kuidas neid jagati.

Koos kohalike uudiste allikate sisuanalüüsiga näitasid meie leiud, et isegi see, mida vähe kohalikke uudiseid Twitteris jagati, erines sageli sellest, mida kajastasid iga linna uudistepunktid. Näiteks Maconis oli Twitteris seni kõige enam jagatud lugu kohalikust bändist, kes oli sellest VH1-s võistlusele pääsenud. Seda lugu ei uuritud nädala jooksul peavoolu ajakirjanduses peaaegu üldse kajastatud.

Suurte trendide kaardistamiseks Twitteris on saadaval rohkem tehnilisi vahendeid, näiteks globaalse hashtagi jälgimine. Kuid meie eesmärkidel, uurides uudiseid väiksemates kogukondades, olid Twitteri andmed nii hõredad, et need polnud nii kasulikud kui lootsime.