Tänapäeval, kui info- ja andmerohkus kasvab iga päevaga, muutub järjest olulisemaks oskus andmeid analüüsida, tõlgendada ja esitada arusaadavalt. See oskus on vajalik mitte ainult uurimistöös, vaid ka igapäevaelus ja tulevases karjääris. Hea uurimistöö ei põhine ainult faktide kogumisel, vaid ka nende mõtestamisel ja järelduste tegemisel.
Selles tunnis keskendume sellele, kuidas kasutada Microsoft Excelit andmete analüüsimiseks ja Wordi nende tulemuste esitamiseks. Rõhku pannakse ka korrektsusele – õigesti vormistatud tabelid, sisukord ja viitamised aitavad muuta töö professionaalseks ning arusaadavaks ka teistele lugejatele.
Rakendada eelmisel tunnil õpitud oskusi oma uurimistöös (sisukord, tabelite vormistus, joonised).
Õppida koguma ja korrastama andmeid.
Arvutada sagedusi ja protsente Excelis.
Luua sobivaid graafikuid andmete esitamiseks.
Kirjutada selgeid ja sisukaid tõlgendusi Wordis.
Teha järeldusi ja anda oma tööle kriitiline hinnang.
Ava oma uurimistöö fail.
Lisa automaatne sisukord (kasutades Wordi tiitlitasemeid: Heading 1, Heading 2).
Kontrolli ja paranda kõigi tabelite ja jooniste vormistus:
Lisa pealkirjad ja allkirjad (nt „Tabel 1. Õpilaste eelistatud spordialad“).
Lisa viited tekstis: „vt joonis 2“, „vt tabel 3“.
Selgita iga joonist ja tabelit töö tekstiosas loogiliselt ja lühidalt.
Mis on andmete analüüs ja miks see on oluline?
Milline on tulemuste esitamise roll uurimistöös?
Kuidas tõlgendada tulemusi nii, et neist tekiks lugejal selge arusaam?
Vii läbi lihtne küsitlus vähemalt 10 inimesega.
Sisesta andmed Excelisse:
Küsimus veergu (nt “Mis on sinu lemmik spordiala?”).
Vastused reahaaval.
Korrasta andmestik – eemalda tühjad või ebaolulised kirjed.
Loo liigendtabel (Pivot Table), et näha, mitu korda iga vastusevariant esines.
Arvuta käsitsi iga vastuse protsentuaalne osakaal.
Koosta tabel järgmise struktuuriga:
| Vastusevariant | Vastajate arv | Protsent (%) |
|---|---|---|
| Jalgpall | 5 | 33% |
| Korvpall | 3 | 20% |
| Võrkpall | 4 | 27% |
| Ujumine | 3 | 20% |
| Kokku | 15 | 100% |
Loo tabeli põhjal tulpdiagramm.
Loo sektordiagramm, mis näitab protsentide jaotust.
Iga diagrammi juurde lisa:
Pealkiri (nt „Õpilaste spordieelistused“)
Andmesildid (nt protsendid)
Legend (kui diagrammis on mitu kategooriat)
Ava Wordi dokument.
Lisa tabel ja graafikud (kopeeri Excelist või lisa kujutisena).
Kirjuta tulemuste kohta lühike tõlgendus (5–6 lauset):
Milline valik domineerib?
Kas tulemused olid ootuspärased?
Milliseid tendentse võib välja tuua?
Küsi lisaküsimus (nt vanus, klass, sportimise sagedus).
Koosta võrdlev tabel (nt „Kas vanemad õpilased eelistavad teist spordiala?“).
Loo uus graafik, mis näitab tulemusi kahe tunnuse lõikes.
Kirjuta Wordi 4–5 lausega analüüs: kas mingi seos on nähtav?
Kirjuta Wordi lõppu vähemalt 3 sisulist järeldust, mis põhinevad sinu analüüsil.
Lisa hinnang:
Kas tulemused kinnitasid sinu hüpoteesi?
Milliseid vigu või piiranguid sa märkasid?
Kuidas võiks edaspidi andmete kvaliteeti parandada?
Tulemuste osa on soovitatav esitada liigendatuna alapeatükkideks. Paljudes töödes, eriti eksperimentaalsetes uurimustes, on õigustatud omaette peatükina või alapeatükina arutelu (diskussioon). See on töö üks vastutusrikkamaid ja suurimat mõttepinget nõudev osa. Autoril tuleb siin tema poolt uuritavale probleemile kõige lähedasemaid kirjanduse seisukohti võrrelda oma katsetulemustega ja samas kõrvutada teiste uurijate järeldusi enda omadega. Arutelus saab autor esitada ka oma hüpoteetilisi seisukohti ja arvamusi.
Andmete analüüsi saab läbi viia järgmiste etappidena:
NB! Uurimistöö tulemused esitada võimalikult kergesti tajutavalt ja lahtiseletatult!
Andmete tõlgendamiseks ehk interpreteerimiseks kasutatakse näit. klassifitseerimist, reastamist, võrdlemist, loogilist analüüsi, sünteesi, üldistamist
Järelduste formuleerimisel:
Analüüsi käigus antakse hinnang:
NB! Tulemused mõtestatakse töös lahti keeleliselt korrektses ja arusaadavas vormis
Varasemate tööde põhjal tehtud tähelepanekud
Analüüs algab küsimuse sõnastamisest andmete kohta. Näiteks: „Kui suurel osal küsitlusele vastanutest on Facebooki konto?”, „Kuidas jagunevad spordipäeval saadud jooksutulemused?”, „Kas ja kui palju hommikul ja õhtul mõõdetud õhutemperatuurid erinevad?”, „Kas käitumise hinne on seotud hindega klassijuhataja õpetatud aines?” jne.
Analüüsi tuleks alustada lihtsamate ühte tunnust korraga puudutavate küsimustega, mis annavad andmetest esialgse üldise ülevaate. Pärast andmetest esialgsete kokkuvõtete ja ülevaadete tegemist on võimalik asuda uurima ka erinevusi ja seoseid.
Sammud andmete analüüsi läbiviimisel:
• Sõnastan konkreetsetest andmetest lähtuva küsimuse, millele tahan vastust saada.
• Valin püstitatud küsimusest lähtudes kasutada olevate andmete jaoks sobiva analüüsimeetodi.
• Tulemuste esitlemiseks valin andmete olemust ja tulemuste sisu parimal viisil välja toova ning sihtrühmale arusaadava ja esitluse kohale sobiva esitlusviisi ning kujunduse.
Statistilisi andmeid ja statistilise andmeanalüüsi arvulisi tulemusi saab esitada:
Tulemuste esitlusviisi valik sõltub mitmest tegurist: nt, kas tulemusi esitatakse paberil või suulises ettekandes, kes on sihtrühm ja mis on nende eeldatavad teadmised uurimuse teemavaldkonnas ning statistiliste meetodite alal jms, kuid esmatähtis on, et esitlusviis toetaks parimal viisil tulemuste sisust kiiret ja õiget arusaamist ning oleks kompaktne.
Üldjuhul vali esitluseks:
Jäta meelde:
Näide

Näide
Uuringus osales 17 inimest, kellest 4 olid eelmise aasta jooksul teinud rahalisi annetusi. Soovi korral võib ülevaatlikkuse tõstmiseks sagedusele sulgudes lisada osakaalu: uuringus osales 17 inimest, kellest 4 (23%) olid eelmise aasta jooksul teinud rahalisi annetusi.
Suurte valimite korral (kui vastajaid on rohkem kui 100), võib tulemuste esitamisel kasutada ka ainult protsente. Näiteks: “Uuringus osales 350 õpilast, kellest 12% olid annetanud oma mänguasjad heategevuslikuks otstarbeks”.
Isegi kui esmane küsimus eeldab ainult ühe vastusevariandi e väärtuse esinemissageduse leidmist, koostatakse arvuti abil analüüsi läbi viies mugavuse ja analüüsi kompaktsuse tõttu üldjuhul vastava tunnuse kõiki väärtusi kokkuvõttev sagedustabel (vt Tabel 1).
Jäta meelde:
Tabel 1. Facebooki külastuste sagedus.
| Vastajate arv | Osakaal | |
| Mitu korda päevas | 347 | 54,2% |
| Tavaliselt kord päevas | 209 | 32,7% |
| Küllalt regulaarselt, aga mitte iga päev | 24 | 3,7% |
| Üsna harva, ebaregulaarselt | 25 | 3,9% |
| Ei kasuta üldse | 35 | 5,5% |
| KOKKU | 640 | 100% |
Tabelis 1 on lisaks sagedustele (vastajate arv) välja toodud ka iga väärtuse esinemise osakaal protsentides, mis lihtsustab andmetest ülevaate saamist.
Tabeli loomisel ja vormistamisel tuleks meeles pidada järgmisi põhimõtteid:
Tulemusi uurimistöö raportis kirjalikult esitledes tuleb arvestada, et igale lisatud tabelile, diagrammile ja joonisele tuleb tekstiosas viidata ning tabelis või diagrammil olev sisu seletatakse tekstiosas lahti. Lahtiseletuseks ei sobi tabelis või diagrammil oleva arvulise info üksühene tekstina üleskirjutamine. Nii ei sobi tabelis 4 toodud tulemuste lahtiseletamiseks näiteks järgmine tekst: “47 õpilast ei kasuta Facebooki portaali üldse, 184 õpilast kasutab küllaltki regulaarselt, kuid mitte iga päev. 84 õpilast kasutab portaali mitu korda päevas, 101 kasutab tavaliselt kord päevas ja 224 õpilast kasutab Facebooki üsna harva”. Tabelis või diagrammil olevate arvuliste tulemuste lahtiseletamisel uurimistöö tekstis tuleks välja tuua üldised tendentsid (nt üle poolte vastanutest kasutavad portaali mitu korda päevas või ligikaudu 85% vastanutest kasutab portaali vähemalt üks kord päevas) ning see, mis on töö sisulises kontekstis selle tulemi korral oluline ja mida tahetakse esile tõsta.
Google vormi küsimustiku vastused: kuidas teada saada, kui palju vastajaid mingi vastusevariandi valis?
Google vormi küsimustiku vastused: kuidas teada saada, kui suur osa vastajatest mingi vastusevariandi valis ja kuidas võrrelda gruppe omavahel?
Tulpdiagrammil väljendavad arvväärtusi erineva kõrgusega tulbad. Seda tüüpi diagramm sobib objektide omavaheliseks võrdlemiseks. Väärtused võib esitada absoluutarvudes või protsentidena. Kui terviku 100% jagunemist osadeks on ülevaatlikum väljendada sektordiagrammi abil, siis mitme valikuga vastuste esitamiseks sobib just tulpdiagramm.
Objektid järjestatakse kas ajaliselt või siis suuruse kasvamise/kahanemise järjekorras. Juhuslikku järjestust tuleks vältida, kuna see vähendab ülevaatlikkust. Mitme sarnase diagrammi esitamisel kasutatakse kõigil ühesugust järjestust.
Tabel 2. Sagedustabel tunnuse “Teleri vaatamise aeg päevas” kohta

Joonisel 1 on tulpdiagramm, mis on koostatud tabeli 2 tulemuste visualiseerimiseks ja milles iga tulba kõrgus on proportsionaalne vastavasse kategooriasse kuuluvate õpilaste arvuga.

Joonis 1. Tulpdiagramm

Joonis 2. Peamised diagrammidega seotud terminid. https://www.stat.ee/files/koolinurk/abiks/graafiline/komponendid.php
Kui tulpasid kirjedavad tekstid on pikad, siis paigutub tekst tavaliselt automaatselt nii, et seda on ebamugav lugeda, nt kaldu, üksteise alla (vt joonis 3). Et parem lugeda oleks, tuleks tulpdiagrammi teljed ära vahetada.

Joonis 3. Vaikimisi kujundusega, raskesti loetav tulpdiagramm
Lintdiagramm ehk ribadiagramm on sarnane tulpdiagrammiga, kus vertikaalsete tulpade asemel kirjeldavad suurusi horisontaalsed ribad (vt Joonis 4). Lintdiagrammi tuleb eelistada siis, kui objekte on palju ja/või objektide nimetused on pikad. Pikemat teksti on horisontaalsihis mugavam lugeda.
Lintdiagrammi objektid järjestatakse suuruse kahanemise või kasvamise järjekorras. Ajaliste suuruste järjestamisel tuleks eelistada siiski tulpdiagrammi.

Joonis 4. Korrektselt vormindatud tulpdiagramm
Üldisi nõuandeid tulpdiagrammide vormistamiseks
Histogramm on tulpdiagrammi spetsiifiline alamliik, ta annab ülevaate andmete jaotumisest sageduse järgi. Histogrammi saab koostada arvuliste väärtustega tunnuste korral, millel on palju erinevaid vastusevariante (vanused, pikkused, kehakaalud jne).
Histogrammi loomine Google vormi küsimustiku vastuste põhjal
Terviku jaotumist osadeks kirjeldatakse tihti sektordiagrammi abil, milles kõik kategooriad kokku moodustavad 100% ning mis toob selgelt välja iga kategooria osa tervikust. Ring jaotatakse sektoriteks, infot vahendab sektori pindala. (vt joonis 5).

Joonis 5. Sektordiagramm
Sektordiagrammi koostamisel tasub meelde jätta järgmised nõuanded:
Sektorite arv
Sektoreid ei tohi olla liiga palju, nii on neid raske omavahel võrrelda. Suurim sektorite arv võiks olla kuus.
Sektorite paigutus
Sektorid paigutatakse kindla korra järgi. Tavaliselt tehakse seda suuruse järgi, alustades kella 12-st ja liikudes päripäeva. Olulisele sektorile võib tähelepanu juhtida nii, et see tõstetakse ringist välja. Väljatõstetud sektorit ei suurendata. Üle kahe sektori ei ole soovitatav ringist välja tõsta.
Sektori nimetus ja väärtus
Sektori nimetus tuleb paigutada sektori lähedale. Sektori nimetuse juurde pannakse tavaliselt ka arv (protsent). Sektorite nimetus ja arvud peavad olema paigutatud nii, et oleks arusaadav, milliste sektorite juurde nad kuuluvad. Võib kasutada ka suunavaid jooni. Nimetuste esitamine sektori kõrval lihtsustab ka värvide valikut — kõikidele sektoritele pole vaja erinevaid värvitoone leida. Piisab, kui kasutada kaht tooni vaheldumisi. Protsentide lisamine on ringdiagrammi puhul soovitatav — et ringdiagrammil abistavat skaalat pole ega saagi olla, on raske protsendilist väärtust hinnata. Legendi kasutamine ei ole hea lahendus, sest väheneb ülevaatlikkus.
Ebaõnnestunud kujundusega diagrammid: liiga vähe või palju kategooriaid, põhjendamatu ruumilisus, loetamatu värvikood, raskestiloetavad arvväärtuste sildid.

Püsttulpdiagrammis saab infot esitada ka terviku osade kohta. Sellist diagrammiliiki nimetatakse summatulpdiagrammiks. Summatulpdiagramm esitab osade ja koguhulga muutust. Koguhulgad on sellise diagrammitüübi puhul kergesti võrreldavad. Tähelepanu tuleb siinjuures aga pöörata osade paigutusele. Siin on võimalusi mitmeid:
Et pilt ei muutuks liiga kirjuks, tuleks tulbaosade arvu piirata — optimaalne tulbaosade arv on 2–4.

Joonis 6. Töötud töötuse kestuse järgi, 1995–2002
Kui tahetakse rõhutada muutusi terviku koostises või esitada protsendilist jaotust, võib summapüsttulpdiagrammi tulbad teha ühepikkused. Y-telje skaala on sellisel juhul protsentides 0-st 100-ni. Selline diagramm on hea alternatiiv ringdiagrammile. Selle diagrammitüübi puhul on eriti oluline vältida järgmisi vigasid:

Joonis 7. Töötud töötuse kestuse järgi, 1995–2002
Diagrammil peavad olema järgmised komponendid (vt ka Diagrammi komponendid MS Excel’i näitel):
Diagrammid tehakse tasapinnalised. Diagrammidel olev tekst ja arvud vormindatakse Times New Roman kirjas suurusega 11 või 12 punkti, aga kõigil diagrammidel ühtemoodi.
Diagrammi alla tehakse joonise allkiri.
Kvantitatiivsete ehk arvuliste andmete töötlemiseks saab kasutada statistilisi meetodeid. Statistiline andmetöötlus on võimalik siis, kui andmeid on palju: uuritud palju samaväärseid objekte (näiteks küsitletavate arv on suur) või sama objekti uurimisel tehtud kordusmõõtmisi.
Enimkasutatavad lihtsamad statistilised andmetöötlused on
Mis on andmeanalüüs: http://youtu.be/BzKg3RyWfmU
Kuidas korrastada andmetabelit (MS Excel 2010): http://youtu.be/HNEaBBQGCK4
Arvnäitajad (MS Excel 2010): http://youtu.be/99zJCqujBsM
Diagrammid (MS Excel 2010): http://youtu.be/nPy2QJMDIkY
Sagedustabelid (MS Excel 2010): http://youtu.be/aGGk99FuY3o
Mis tüüpi diagrammi millal kasutada? http://koolitusska.pbworks.com/f/Diagrammide_naidised.pdf
Krista Kõlli-Raud. 11. Joonised. UPT vormindamine
Mart Laanpere, Katrin Niglas, Kairi Osula, Kai Pata. Arvuti kasutamine uurimistöös. Informaatika valikaine e-õpik gümnaasiumile. Tallinna Ülikool 2013