Tuli aika aktivoitua taka-alalla olleen opiskeluprojektin kanssa ja valita aihe informaatiotutkimuksen kandidaattiseminaariin Åbo Akademille. En lähtenyt merta edemmäs kalaan ja aloin miettimään, saisiko oman korkeakoulun Theseus-kokoelmista ainesta pienimuotoiseen tutkimusprojektin. Erityisesti minua kiinnosti se, millaisia bibliometrisiä menetelmiä voisi soveltaa Theseuksessa olevien opinnäytetöiden metadatan tarkasteluun. Lopulta valitsin seminaarityöhöni laadullisen bibliometriikan menetelmän nimeltä yhteissana-analyysi.
Yhteissana-analyysiä on käytetty erityisesti tutkittaessa tieteessä tapahtuneita muutoksia ja tutkimusverkostojen syntymistä (Forsman, 61). Menetelmä on syntynyt Ranskassa 1980-luvulla. Yhteissana-analyysissä rakennetaan termeistä kognitiivisia verkostoja sen perusteella, miten eri sanat esiintyvät yhdessä esimerkiksi julkaisujen otsikoissa, tiivistelmissä, avainsanoissa tai tekstissä. Tausta-ajatuksena on, että kuvailutermit ja niiden yleisyys heijastavat tekstien sisältöä ja että tarkastelemalla sanojen esiintymistä yhdessä voidaan tehdä havaintoja tutkimuksen rakenteista (Kärki & Kortelainen 1998, 31; Persson 1991, 51-52).
Menetelmää on pääasiassa käytetty tieteellisen aineiston kanssa, joten opinnäytetyöt tarjosivat mahdollisuuden tarkastella ammatillisempaa aineistoa. Tausta-ajatukseni oli, että opinnäytetöiden sisällöt heijastaisivat alan trendejä, ja että opinnäytetöiden aiheita kuvastavista asiasanoista näkisi myös muutoksen koulutusohjelman painopistealueissa.
Tutkimusaineisto ja sen analysointi käytännössä
Tutkimusaineistoni koostui vuosina 2010-2016 Humakin Theseus-kokoelmiin tallennetuista kansalaistoiminnan ja nuorisotyön koulutusohjelman (yhteisöpedagogi) opinnäytetöistä. Tarkastelin opinnäytetöiden sisällönkuvailussa käytettyjä asiasanoja. Tällä ajanjaksolla Humakin opinnäytetöiden metatiedoissa oli vielä sekä opiskelijoiden itse määrittämät asiasanat (keywords) että informaatikoiden valitsemat YSA-asiasanat. Opinnäytetöitä oli analyysin kohteena 880 kappaletta ja ne edustivat noin 90 prosenttia kaikista tuona ajanjaksona tehdyistä yhteisöpedagogikoulutusohjelman opinnäytetöistä. Tarkastelin aineistoa sekä kokonaisuutena että kahdessa erillisessä ajanjaksossa, 2010-2013 ja 2014-2016, jotta näkisin onko näiden ajankohtien välillä tapahtunut muutoksia opinnäytetöiden käsittelemissä aihealueissa.
Käytännön tasolla muokkasin ensin Theseus-ylläpidolta saamani Humakin Theseus-kokoelman metatiedot sisältävän excelin avain- ja asiasanakentät sopivaan muotoon. Sen jälkeen analysoin datan Bibexcel-ohjelmalla ja lopulta visualisoin tulokset Gephi-ohjelmalla. Visuaalisointeja voi tehdä monella muullakin ohjelmalla ja esimerkiksi VOSviewer olisi lopulta saattanut olla omaan tarkoitukseeni sopivampi, mutta kuulin ohjelman olemassa olosta hieman liian myöhään omaa projektiani ajatellen. Visualisointikartoissa sanojen suosituimmuutta ja niiden välisiä yhteyksiä voi tulkita esimerkiksi eri sanojen sijainnin keskeisyydestä, sanojen välisistä etäisyyksistä ja niitä yhdistävien viivojen paksuudesta (Eck & Waltman 2014, 286).
Opinnäytetöiden asiasanojen analyysi ei yllättänyt. Visualisointien keskiöstä löytyivät koulutusalan keskeiset painopistealueet kuten nuorisotyö, järjestötyö, yhteisöllisyys ja osallisuus. Laidoille reunoille sijoittui erilaisia keskeisiä, mutta kuitenkin harvemmin käytössä olevia termejä, kuten esimerkiksi usein yhdessä esiintyvät monikulttuurisuuden, kotoutumisen ja maahanmuuttajiin liittyvät asiasanat. Samat termit olivat keskeisimpien joukossa kumpanakin tarkastelemani ajanjaksoja, mutta 2014-2016 vuosien suosituimmissa asiasanoissa näkyi myös muutamia uusia termejä, kuten esimerkiksi sosiaalinen media ja sukupuolisensitiivisyys.
Eroja opiskelijoiden ja informaatikkojen tekemissä sisällönkuvailuissa
Aineistoni perusteella pystyi myös tekemään havaintoja opiskelijoiden ja koulutettujen sisällönkuvailijoiden tekemistä asiasanoista. Kuten arvata saattaa, opiskelijoiden tekemät sisällönkuvailut olivat vaihtelevan tasoisia, eivätkä kaikki olleet käyttäneet YSA-sanastoa suosituksesta huolimatta. Esimerkiksi YSAn järjestöt-sanaan viitattiin opiskelijoiden tekemissä avainsanakuvailuissa myös muodoissa yhdistykset, järjestö tai yhdistys, ja YSAn vapaaehtoistyö-termin synonyymi on vapaaehtoistoiminta. Toisaalta kontrolloidun sanaston käyttö voi hidastaa uusien ilmiöiden näkymistä kuvailussa koska usein kestää tovin, että termi pääsee sanastoon asti.
Aineistossani molemmissa kuvailuissa oli käytetty melko sama määrä termejä, informaatikot olivat käyttäneet keskimäärin viittä asiasanaa per opinnäytetyö kun taas opiskelijat käyttivät kuvailuun keskimäärin 4,7 termiä. Ammattilaisen tekemissä kuvailuissa käytettiin kuitenkin pienempää termien joukkoa: koko aineistossa informaatikot olivat käyttäneet yhteensä 1 101 eri kuvailutermiä kun taas opiskelijoiden käyttämiä eri termejä oli 1 555.
Keskeisin ero käytetyissä termeissä oli se, että informaatikot käyttivät selvästi enemmän alaan liittyviä yleistermejä. Esimerkiksi asiasana nuorisotyö esiintyi ammattilaisten sisällönkuvailuissa 217 kertaa kun taas opinnäytetöiden tekijät käyttivät termiä vain 103 kertaa. Joissain tapauksissa opiskelija oli käyttänyt ainoastaan suppeampaa alan termiä, kuten esimerkiksi koulunuorisotyö, joka saattoi myös puuttua YSAsta. On myös mahdollista, että alan yleistermi tuntui opiskelijasta niin itsestään selvältä että sen käyttö unohtui - tai ehkä informaatikko alan ulkopuolisena helpommin käyttää yleisemmän tason termiä.
Määrä
|
YSA-asiasana
|
Määrä
|
YSA-asiasana
|
238
|
nuoret
|
41
|
sosiaalinen vahvistaminen
|
217
|
järjestötyö
|
41
|
maahanmuuttajat
|
95
|
järjestöt
|
40
|
kehittäminen
|
81
|
osallisuus
|
34
|
syrjäytyminen
|
78
|
vapaaehtoistyö
|
30
|
vapaa-aika
|
67
|
järjestötoiminta
|
30
|
vertaistuki
|
55
|
yhteisöllisyys
|
30
|
ohjaus
|
52
|
lastensuojelu
|
30
|
nuorisotilat
|
50
|
lapset
|
29
|
hyvinvointi
|
43
|
yhteistyö
|
28
|
monikulttuurisuus
|
Taulukko: 20 käytetyintä YSA-asiasanaa koko aineistossa 2010-2016
Määrä
|
YSA-asiasana
|
Määrä
|
YSA-asiasana
|
126
|
osallisuus
|
32
|
monikulttuurisuus
|
103
|
nuorisotyö
|
31
|
yhteistyö
|
90
|
nuoret
|
29
|
vertaistuki
|
78
|
sosiaalinen vahvistaminen
|
28
|
vapaa-aika
|
70
|
yhteisöllisyys
|
26
|
vaikuttaminen
|
49
|
vapaaehtoistyö
|
26
|
sukupuolisensitiivisyys
|
47
|
kehittäminen
|
24
|
koulu
|
40
|
lastensuojelu
|
23
|
ehkäisevä päihdetyö
|
37
|
järjestötoiminta
|
23
|
hyvinvointi
|
33
|
syrjäytyminen
|
23
|
kansalaistoiminta
|
Taulukko: 20 opiskelijoiden eniten käyttämää avainsanaa koko aineistossa 2010-2016.
Yhteissana-analyysin mahdollisuuksia
Alkuperäinen ajatukseni uusien trendien havainnoinnista yhteissana-analyysin avulla ei täysin toiminut, sillä analyysin kohteena ollut ajanjakso oli lopulta melko lyhyt selkeiden muutosten tapahtumiseen, vaikka jonkun verran uusia termejä nousikin suosituimpien joukkoon. Lisäksi uudet nousevat kiinnostuksen kohteet eivät aina nouse kovinkaan nopeasti keskeisimpien kuvailusanojen joukkoon eivätkä täten näy tarkasteluissa, joissa keskitytään eniten käytettyihin sanoihin. Aina uusista nousevista aiheista ei myöskään heti nouse yksittäisiä paljon käytettyjä termejä.
Yhteissana-analyysin avulla on mahdollista saada kiinnostavia tuloksia eri koulutusalojen kehityksestä ja painopistealueista, mutta arkiseen käyttöön kirjastotyössä se on todennäköisesti monen kirjaston kannalta liian työläs ainakin jos menetelmä pitää opetella alusta asti. Myös visualisointien hiominen ja tulkitsemaan oppiminen vaatii työtä ja omassa seminaarityössäni pääsin tämän teeman suhteen vasta alkuun. Menetelmää olisi mahdollista käyttää myös ammattikorkeakoulujen julkaisutoiminnan tarkasteluun, eli sinänsä sen käytölle olisi paljon mahdollisuuksia.
Lähteet:
Forsman, Maria. 2016. Julkaisut ja tieteen mittaaminen: bibliometriikan käännekohtia. Tampere: Enostone.
Eck, Nees Jan van & Ludo Waltman. 2014. ”Visualizing Bibliometric Networks”. Kirjassa Measuring Scholarly Impact, 285–320. Springer Netherlands.
Kärki, Riitta & Terttu Kortelainen. 1998. Introduktion till bibliometri. Helsingfors: Nordinfo.
Persson, Olle. 1991. Forskning i bibliometrisk belysning. Umeå: INUM.
Tietoa kirjoittajasta:
informaatikko Pirjo Kangas, Humak
Kommentit