Skelbimas

Ką jūs pasakytumėte, jei sakyčiau, kad turite savo įrankius atlikti novatoriškus, žemę ardančius tyrimus? Na, jūs darote, ir aš jums parodysiu, kaip.

Vyriausybės, akademinės institucijos ir ne pelno siekiančios mokslinių tyrimų organizacijos viešai skelbia visas duomenų lenteles. Niekam nenaudojant šios informacijos, tikroji jos vertė niekada nebus žinoma. Deja, nedaugelis žmonių turi įžvalgą, įgūdžių ar įrankių priimti duomenis ir užmegzti įdomias, atrodytų, nesusijusios informacijos sąsajas.

Bendrosios aplinkybės

Daugybė tyrimų, kuriuos darau dėl savo tinklaraščio, yra susiję su tuo, kas vadinama nematomas internetas 12 geriausių paieškos variklių, skirtų tyrinėti nematomą internetą„Google“ ar „Bing“ negali visko ieškoti. Norėdami tyrinėti nematomą internetą, turite naudoti šiuos specialius paieškos variklius. Skaityti daugiau , norėdami atskleisti duomenis, kurie buvo paviešinti, bet paslėpti nuo paieškos sistemos 5 pažangiausios paieškos sistemos internete Skaityti daugiau internetinės duomenų bazės viduje. Tai yra

instagram viewer
Gilus voratinklis „TorSearch“ siekia tapti „Google“ giliam žiniatinkliui„Tor“ yra paslėpta paslauga ir giliojo interneto dalis. „TorSearch“ yra nauja anoniminė paieškos sistema, kurią jos įkūrėjas Chrisas MacNaughtonas nori sukurti „Google of Tor“. Skaityti daugiau , ir joje gausu vertingų duomenų. Labai dažnai susiduriu su tinklalapiais, kuriuose yra tik keletas vertingiausių duomenų tomis temomis, kurios apima nuo surašymo duomenų iki retų ligų epidemiologinių tyrimų. Aš nuolat turiu naujų idėjų, kaip išbandyti ir susieti tuos skirtingus duomenų šaltinius, naudojant įvairius įrankiai - ir vienas iš vertingiausių mano rastų įrankių yra „Microsoft“ žiniatinklio užklausa „Excel“.

Įdomių duomenų koreliacijų radimas

Tai, ką šiandien jums parodysiu, yra pavyzdys, kaip galite naudoti „Excel Web“ užklausas, kad surinktumėte duomenis iš skirtingas svetaines ir nubraižykite jas tarpusavyje, kad ieškotumėte galimų koreliacijų tarp duomenys.

Būdas pradėti tokį pratimą yra sugalvoti įdomią hipotezę. Pvz., Kad čia viskas būtų įdomu, aš atsitiktinai postuliuosiu tuo sparčiai augančiu autizmo rodikliu JAV sukelia vakcinų užkrėtimas arba didėjantis elektromagnetinių laukų, tokių kaip ląstelės, buvimas vaikams ir aplink juos telefonus. Tai beprotiška hipotezė, kurią galite rasti daugelyje sąmokslo teorijos svetainių, tačiau būtent tai ir daro tai smagu. Taigi, pradėkime, ar ne?

Pirmiausia atidarykite „Excel“, eikite į duomenų meniu punktą ir meniu juostoje raskite piktogramą „Iš interneto“.

žiniatinklio užklausa-excel1

Tai naudosite importuodami skirtingas duomenų lenteles iš daugelio ten paskelbusių svetainių.

Žiniatinklio duomenų importavimas į „Excel“

Taigi senais laikais turėtumėte pabandyti nukopijuoti duomenis iš tos lentelės į tinklalapį, įklijuoti juos į „Excel“ ir tada išspręsti visas beprotiško formavimo problemas, susijusias su tuo. Visiškas vargas ir dažnai tai nėra verta galvos skausmo. Na, o „Excel Web Queries“ tų dienų nebėra. Žinoma, prieš importuodami duomenis, turėsite „Google“ ieškoti žiniatinklyje, kad surastumėte reikiamus duomenis lentelės formatu. Mano atveju radau svetainę, kurioje buvo paskelbta Švietimo departamento statistika apie JAV valstybinių mokyklų mokinių, kurie buvo identifikuoti kaip sergantys autizmu, skaičių. Graži lentelė pateikė numerius nuo 1994 m. Iki 2006 m.

Taigi jūs tiesiog spustelėkite „Iš interneto“, įklijuokite tinklalapio URL į užklausos adreso lauką ir slinkite žemyn puslapiu, kol šalia lentelės pamatysite geltoną rodyklę su duomenimis, kuriuos norite importuoti.

žiniatinklio užklausa-excel2

Spustelėkite rodyklę, kad ji taptų žalia varnelė.

žiniatinklio užklausa-excel3

Galiausiai papasakokite „Excel“, kurį lauką norite įklijuoti lentelės duomenis į savo naujos skaičiuoklės vidų.

žiniatinklio užklausa-excel4

Tada - Voila! Duomenys automatiškai patenka į jūsų skaičiuoklę.

žiniatinklio užklausa-excel5
Taigi, atsižvelgiant į valstybinių mokyklų autizmo rodiklius nuo 1996 iki 2006 m., Atėjo laikas ieškoti vakcinacijos ir mobiliųjų telefonų naudojimo tendencijų.

Laimei, greitai radau mobiliųjų telefonų abonentų tendencijas JAV nuo 1985 m. Iki 2012 m. Puikūs šio konkretaus tyrimo duomenys. Vėlgi, tai lentelės importavimui naudojau „Excel Web Query“ įrankį.

žiniatinklio užklausa-excel6

Aš tą lentelę importavau į švarų, naują lapą. Tada atradau skiepijimo nuo įvairių ligų procentą moksleivių skiepijimo tendencijų. Aš importavau tą lentelę naudodamas žiniatinklio užklausos įrankį į trečiąjį lapą. Taigi galiausiai turėjau tris lapus su trimis lentelėmis, užpildytomis neva nesusijusiais duomenimis, kuriuos radau internete.

žiniatinklio užklausa-excel8

Kitas žingsnis yra „Excel“ naudojimas duomenims analizuoti ir ryšiams nustatyti. Štai čia pradeda veikti vienas mano mėgstamiausių duomenų analizės įrankių - „PivotTable“.

Duomenų analizė „Excel“ naudojant „PivotTable“

Geriausia sukurti „PivotTable“ visiškai naujame, tuščiame lape. Norite naudoti vedlį tam, ką ketinate daryti. Norėdami įgalinti „PivotTable“ vedlį programoje „Excel“, turite tuo pačiu metu paspausti „Alt-D“, kol pasirodys pranešimų langas. Tada paleiskite tuos mygtukus ir paspauskite mygtuką „P“. Tuomet pamatysite vedlį.

žiniatinklio užklausa-excel10

Pirmajame vedlio lange norite pasirinkti „Keli konsolidacijos diapazonai“, kuris leidžia pasirinkti duomenis iš visų importuotų lapų. Tai atlikę, galėsite sujungti visus tuos iš pažiūros nesusijusius duomenis į vieną, galingą, sukabinamą elementą. Kai kuriais atvejais gali tekti pamasažuoti kai kuriuos duomenis. Pavyzdžiui, aš turėjau autizmo lentelėje pritvirtinti lauką „Metai“, kad vietoj jo būtų rodomas „1994“ „1994–1995 m.“ - kad ji geriau atitiktų kitų lapų lenteles, kurios taip pat turėjo pagrindinius metus laukas.

žiniatinklio užklausa-excel11

Šis bendras duomenų laukas yra tas, kurio jums reikia norint išbandyti ir koreguoti informaciją, todėl atminkite, kai ieškote žiniatinklyje savo duomenų.

Kai „PivotTable“ bus parengtas ir gausite visas skirtingas duomenų vertes, pateiktas vienoje lentelėje, laikas atlikti vaizdinę analizę, kad pamatytumėte, ar yra koks nors akivaizdus ryšys, kuris jus užklumpa.

Duomenų vizualizavimas yra raktas

Puiku turėti daugybę skaičių lentelėje, jei esate ekonomistas, tačiau greičiausias ir lengviausias būdas kad „aha!“ akimirka, kai jūs bandote rasti ryšius, pavyzdžiui, adatą šieno kamino viršuje, yra per diagramas ir grafikai. Kai jau turėsite „PivotChart“ su visais jūsų surinktais duomenų rinkiniais, laikas kurti savo schemą. Paprastai linijinė schema bus geriausia, tačiau tai priklauso nuo duomenų. Kartais yra, kai juostinė diagrama veikia daug geriau. Pabandykite suprasti, kokius duomenis žiūrite ir kokie palyginimai yra veiksmingiausi.

Šiuo atveju žiūriu į duomenis bėgant laikui, todėl linijų schema yra geriausias būdas pamatyti tendencijas bėgant metams. Diagnozuojami autizmo rodikliai (žalia) pagal sumažintą skiepijimo procentą (tamsiai mėlyna), vėjaraupių vakcinas (šviesiai mėlyna) ir mobiliojo telefono naudojimas (purpurinė), šiame duomenų rinkinyje, kurį grojau, netikėtai atsirado keista koreliacija su.

žiniatinklio užklausa-excel12

Kaip bebūtų keista, mobiliųjų telefonų naudojimo tendencija nuo 1994 m. Iki 2006 m. Beveik tobulai atitiko padidėjusį autizmo lygį per tą patį laikotarpį. Nors modelis buvo visiškai netikėtas, jis yra puikus pavyzdys, kaip susiejus įdomius duomenis galima atskleisti patrauklių klientų - suteiksite jums daugiau įžvalgos ir motyvacijos toliau stumti į priekį ir ieškoti daugiau duomenų, kurie galėtų dar labiau sustiprinti jūsų hipotezė.

Viena tokia koreliacija, kaip aukščiau, nieko neįrodo. Laikui bėgant kyla daugybė tendencijų - modelis gali būti sutapimas, tačiau tai taip pat gali būti svarbus užuomina į jūsų nuolatinius siekius gauti daugiau duomenų internete. Laimei, jūs turite galingą įrankį, vadinamą „Excel Web Queries“, kuris palengvins šį ieškojimą.

Nuotraukų kreditas: Kevinas Dooley per fotopinaskopija

Ryanas turi elektros inžinerijos bakalauro laipsnį. Jis 13 metų dirbo automatikos inžinerijoje, 5 metus IT srityje, o dabar yra programų inžinierius. Buvęs „MakeUseOf“ generalinis redaktorius, jis kalbėjo nacionalinėse duomenų vizualizacijos konferencijose ir buvo rodomas per nacionalinę televiziją ir radiją.