Teorian ja kohteen välissä – Tieteenfilosofian näkemyksiä malleista
Moderniteettia kuulustelemassa – Sandra Harding ja modernin ja tradition kontrasti
Leikin paikka – Oppiminen yliopistossa vai sen liepeillä?
Psykoanalyysin ja feminismin risteytyksessä – Haastattelussa Eva Bahovec
Polyamoriaa taiteen ja filosofian kanssa
ilmestynyt 16.5.2012
Kalle Virtanen
Tieteen tekeminen ja tulosten esittäminen edellyttää jatkuvaa mallien luomista, korvaamista ja selittämistä. Tieteilijät kuitenkin ottavat mallit enemmän tai vähemmän annettuina, sillä harvemmin tulee esimerkiksi ajatelleeksi, että periaatteessa pelkästään tutkimustulosten esittäminen kielellisesti tai graafisesti on mallin luomista ja esittämistä. Tämän tulkinnan mukaan minkä tahansa ilmiön selitys on malli, joten on melko vaikeaa eritellä sitä, mikä tieteessä on malli ja mikä ei.
Tieteenfilosofia tarkastelee malleja lähtökohtaisesti kahdesta eri suunnasta. Toisaalta ollaan kiinnostuneita mallin ja sen kohteen välisestä suhteesta. Millä tavalla malli edustaa ja selittää sitä kohdetta, jota se mallintaa? Toisaalta voidaan kysyä, mikä on mallin ja teorian välinen suhde. Onko malli teorian ja kohteen suhdetta välittävä tekijä? Entä onko teoria itse malli tai joukko malleja?
Malleja voidaan kategorisoida mielivaltaisen moneen luokkaan, koska periaatteessa mitä tahansa voidaan pitää jonkin mallina. Kuitenkin tyypillisesti kaikilla malleilla katsotaan olevan yhdistävänä tekijänä se, että ne representoivat kohdettaan [1]. Täten tieteellisiä malleja on syytä tarkastella niiden ominaisuuksien kautta, joilla ne representoivat kohdettaan tai mikä on niiden suhde teoriaan. Tieteenfilosofit jakavat mallien tavan representoida kohdettaan usein neljään luokkaan. Käytän tässä tekstissä Roman Friggin ja Stephan Hartmannin artikkelissaan “Scientific Models” (2005) esittämää jaottelua.
Yksi mallin tapa representoida kohdetta on kohteen peilaaminen. Tällä tarkoitetaan sitä, että malli representoi kohdetta muistuttamalla sitä merkittävissä määrin. Frigg ja Hartmann kutsuvat tätä ikonimalliksi. Esimerkkinä ikonimallista käyköön pienoismalli. Pienoismalli muistuttaa kohdettaan, sillä se on olemukseltaan, vaikkei kaikilta ominaisuuksiltaan, samankaltainen kohteensa kanssa. Kysymys siitä, minkälaisia kohteen ominaisuuksia mallin sitten tulee edustaa, on tutkimuskohtainen.
Toinen mallityyppi on ideaalimalli. Ideaalimalleissa poistetaan tietoisesti tarkasteltavan ilmiön kannalta irrelevantit piirteet ja joissakin tapauksissa jopa käytetään tietoisia vääristymiä. Väärää tietoa antavat mallit antavat tietoa siitä, mitä kohde ei ainakaan ole. Jos malli on luotu vääristämään olosuhteita, joissa mallin kohteen tulisi toimia, niin mallin toimivuutta voidaan käänteisesti arvioida vääristymien perusteella. Esimerkiksi äärellisten tilojen automaatit on todettu epäluonnolliseksi tavaksi mallintamaan kieltä, mutta ne silti kertovat sen, että kielen pitää toteuttaa rekursiota, koska mallissa itsessään sitä ei ole. Mallin epäonnistuminen kuvaamaan kohdetta ohjaa tulevien mallien suunnittelua. Tämän tekeminen tietoisesti ei ole mitenkään kiellettyä. Malli voidaan luoda vääristämään kohdetta, jotta varsinaisesta kohteesta saadaan informaatiota epäsuorasti. Ideaalimallista oiva esimerkki on ideaaliheiluri. Tämä heiluri ei ota huomioon esimerkiksi kitkaa tai materiaalia, josta heiluri olisi mahdollisesti tehty. Ideaalimalli on usein abstrahoitu valmiiksi kasatusta datasta. Jos ollaan vakuuttuneita, että ideaalimallilla on konkreettinen kohde, niin malli vaatii vahvaa pohjatietoa siitä, mitä se representoi. Tämä tieto tyypillisesti kerätään kokeellisesti. Tietty esitiedon määrä oikeuttaa abstrahoinnin. Toisaalta, jos kohteesta ei ole lainkaan dataa tai sitä on erittäin vähän, ideaalimalli toimii tavallaan hypoteesigeneraattorina, joka konstruoi ilmiöitä mahdollisesti ohjaten tutkimuksen suuntaa.
Kolmas tyyppi on analoginen malli, joka representoi kohdettaan siten, että se on analoginen kohteelle. Analoginen malli ottaa tietoisesti rakenteensa jostakin toisesta kohteesta, kuten ilmiöstä tai jopa mallista. Se ei pyri edustamaan kohdetta sinänsä vaan havainnollistamaan tiettyjä ominaisuuksia mallin ja sen kohteen välillä. Esimerkki analogiasta on biljardipallot, joita voidaan käyttää kuvaamaan kaasun käyttäytymistä ilmapallon sisällä. Frigg ja Hartmann toteavat, että analogiset mallit ovat tyypillisiä etenkin heuristisina metodeina. Opettajat käyttävät analogisia malleja opettaessaan jotakin asiaa. Bohrin atomimallia voidaan esimerkiksi havainnollistaa aurinkokunnalla, sillä nämä ovat toistensa analogioita joissain määrin. Analogiset mallit ovat siis usein malleja malleista, mikä edellyttää, että varsinainen ilmiö kaiken taustalla ymmärretään. Analogiset mallit soveltuvatkin lähinnä heuristiikoiksi, sillä ymmärryksen jälkeen ei analogioille ole juuri tarvetta ja ymmärrystä on mahdoton lisätä analogioilla, jos kohde on tuntematon – eli sitä ei ymmärretä.
Frigg ja Hartmann esittävät vielä neljänneksi mallityypiksi fenomenologisen mallin, joka keskittyy representoimaan itse ilmiötä eikä yritä edustaa sen takana piilevää mekanismia. Tämän mallin mukaan taustamekanismia ei joko ole, sitä ei tiedetä tai se ei palvelisi selityksellisiä intressejä. Mekanismi tarkoittaa tässä William Bechtelin ja Wesley Salmonin näkemystä siitä, että ilmiön selitys on mekanismi itse [2]. Fenomenologiset mallit ovat toimivia esimerkiksi molekyylibiologiassa, jossa selityksen raja tulee vastaan mekanismin rajoissa, sillä molekyylibiologiassa esiintyvien ilmiöiden mallintaminen esimerkiksi subatomisella tasolla ei enää palvele molekyylibiologian intressejä. Tilanteen valottamiseksi käyköön esimerkkinä se, että kvanttimekaniikalla ei voida selittää molekulaarisia ilmiöitä eikä molekulaarisilla ilmiöillä kvanttimekaniikkaa, vaikka on melko voimakas konsensus siitä, että kvanttimekaniikka on läsnä atomien ja täten molekyylien käyttäytymisessä. Tässä kohtaa tarkasteltava ilmiö itsessään katoaa, jos mallintamista jatketaan reduktion mukaisesti. Jos tutkija(t) eivät tiedä mitään ilmiön takana piilevistä mekanismeista tai ovat jopa täysin siinä uskossa, että niitä ei ole, on luonnollista, että malli on fenomenologinen. Tutkijat saattavat esimerkiksi uskoa, että tarkasteltava ilmiö on taustalla vaikuttava mekanismi itse, vaikka he kuvaavatkin jotakin toista ilmiötä. [3]
Mallit edustavat monesti useampaa tai mahdollisesti jopa kaikkia edellisiä tyyppejä, kuten esimerkiksi tietokonesimulaatio. Tietokonesimulaatio vaikkapa paikallisesta säästä on ikonimalli, sillä paikallinen sää näyttäisi siltä avaruudesta, toisaalta se on myös analoginen, sillä tietokoneohjelma ei ole pyörremyrsky itse. Tietokonesimulaatio on ideaalinen, koska paikallisen sään kannalta kaikilla siihen vaikuttavien tekijöiden tuntemuksella ei ole merkitystä. Simulaatio on myös fenomenologisen, koska se ei itsessään selitä, miten ilmanpaineen vaihtelut aiheuttavat poutasäätä. Mallien luokittelu tyyppikategorioihin onkin tieteellisen näkemyksen kannalta enemmän tai vähemmän keinotekoista, vaikka sillä pyritään esittämään eri representaatiotapoja.
Aina ei ole selvyyttä siitä, mitä ollaan mallintamassa. Tarja Knuuttila esittää tekoälytutkimuksen oivana esimerkkinä tällaisesta tilanteesta. Tekoälytutkijoilla ei ole juuri yhteisymmärrystä siitä, mitä älykkyys on tai ollaanko mallintamassa jotain älykkyyden osatekijää ja missä määrin se voidaan tulkita älykkyydeksi. On melko haastavaa arvioida sitä, mikä on mallin representationaalinen rooli, jos mallintajat eivät tiedä, mitä ollaan representoimassa. Tämä ei ole kuitenkaan mikään este mallintamiselle. Edellisen kaltaisessa tilanteessa malli on tavallaan itse itsensä kohde. [4] Mallien tyypit tai ominaisuudet eivät itse asiassa riipu kohteesta. Tämä tekee mallien tyypittämisestä niiden alkuperäisen tarkoituksen kannalta merkityksettömiä. Kohde ei määritä mallin tyyppiä millään universaalilla perusteella. Mallin tyypin valinta ei riipu kohteen ominaisuuksista, vaan tutkijan motiiveista. Tyypin valitseminen on pragmaattinen ja se usein myös ilmaistaan mallia esittäessä. Syy mallin valinnalle voi olla esimerkiksi tekninen tai tiedollinen puute.
David Walonick esittää näkemyksen, jossa mallilla on kohde sen luomisprosessin aikana, mutta ei sen luomisen jälkeen. Walonick esittää, että jos malli on vähäänkään abstrahoitu, kuten kaikki mallit lopulta ovat, niin se ei enää representoi konkreettista kohdetta siten, että kohteesta siepattaisiin informaatiota, ikään kuin malli olisi jonkinlainen informaatioportti. Jos malli olisi informaation välittäjä tieteellisessä valtakunnassa, niin voitaisiin toki arvioida, miten hyvin jokin malli välittää tai representoi informaatiota, mutta Walonick toteaa, että abstrahoituna malli itsessään on informaatiota. Malli on siis luomisprosessinsa aikana kerännyt informaation kohteesta, eikä tämän jälkeen enää kanavoi informaatiota, vaan on sitä itse. [5] Walonickin näkemys on osuva, sillä ymmärryksemme parhaimmasta mahdollisesta mallista on suoraan verrannollinen ymmärrykseemme itse kohteesta. Jos opiskelijalle opetetaan Bohrin atomimalli, niin atomi on opiskelijalle Bohrin atomimallin mukainen.
Perinteisen ajattelutavan mukaisesti tapa, jolla malli edustaa teoriaa, aktualisoituu siten, että malli pyrkii tyydyttämään teorian väitelauseet. Tässä tarkastelukannassa malli olisi kohteen representaatio ja teorian realisaatio [6]. Mallin ja teorian välinen suhde ei kuitenkaan ole näin yksinkertainen. Teoriaa voidaan pitää aivan yhtä hyvin mallina: ei ole ennenkuulumatonta, että mallia ja teoriaa käytetään synonyymeina tieteellisessä kielenkäytössä. Hiukkasfysiikasta kiinnostunut törmää usein kuvaukseen, jossa todetaan, että ”hiukkasfysiikan standardimalli on maailman tarkin teoria” [7].
Anouk Barberousse ja Pascal Ludwig katsovat, että mallin ja teorian välinen suhde on ongelmallinen juuri siksi, että ne koostuvat samoista elementeistä. Kaikki se, mitä käytetään teorian rakentamiseen (empiirinen näyttö, ilmiö eli kohde, oletukset yms.) ovat myös niitä asioita, joista mallit rakennetaan. Kuitenkin mallin asema teorian ja kohteen välillä jaetaan tyypillisesti kahteen tulkintaan – syntaktiseen ja semanttiseen. [8]
Syntaktinen mallin tulkinta katsoo, että mallit ovat tieteellisen teorian mallintamisen tuloksia, jotka vahvistavat sen totuusarvoa. Mallit ovat siis tyhjiä mekanismeja, jotka saavat sisältönsä teoriasta, ja teoria määrittelee sen mitä ja miten mallit representoivat. Mallien tehtävä on siis edustaa teoriaa, mutta ei manipuloida sitä. Mallit ovat näin joukko ”lauseita” – luonteeltaan vaihtoehtoisia tulkintoja kyseisestä teoriasta tai sen seurauksista, väitteistä jne. Mallit ovat siis teorian instansseja. Frigg ja Hartmann katsovat, että jos otamme mallit syntaktisina, niin malleilla on vain pedagogisia, esteettisiä ja psykologisia arvoja. Mallilla voidaan havainnollistaa teoriaa tai käyttää esimerkiksi voimakeinona teorian puolustamiseen, mutta sillä ei ole syntaktisena omaa itsenäistä roolia teoriasta riippumatta.
Syntaktisesta tulkinnasta seuraa se, että malleilla on totuusarvo. Totuusarvolla tarkoitetaan sitä, että mallit, lauseet jne. ovat joko tosia tai epätosia. Näin ei olisi mitään ”harmaata aluetta” ja tieteellisen näkemyksen valossa epätodet, kuten analogiset mallit olisivat arvottomia tieteellisten tulosten kannalta. Koska mallit ovat joko tosia tai epätosia ja näin syntaktinen tulkinta edustaa vahvaa tieteellistä realismia. [9] Tulkinta on myös vahvasti positivistinen. Vaikuttaa siltä, että syntaktisen tulkinnan edustajat tarkastelisivat tiedettä tavalla, jossa lopullisen tiedon takuu on varma. Ajatus siitä, että mallit rakennetaan teoriasta, on vähintäänkin kyseenalainen, mitä tulee tieteen tekemiseen prosessina. Tarja Knuuttila esittääkin, että syntaktisen tulkinnan mukaisesti etenevä mallintaminen tarkastelee maailmaa juuri valmiin tieteen näkökulmasta. Knuuttila tarkoittaa tällä sitä, että tieteentekijät ymmärtäisivät kohteen ja teorian tavallaan ikuisiksi totuuksiksi. Mallin tehtävä olisi olla välissä vain jonkinlaisena julkilausumana. [10]
Syntaktisessa tulkinnassa periaatteessa katsotaan, että teoriaa voidaan mallintaa esimerkiksi liitutaululle, mutta mitä semanttiseen tulkintaan tulee, niin liitutaulu on teoria itse. Tässä tulkinnassa teoriat ovat siis joukko malleja. Eräs semanttinen näkemys katsoo, että teoriat rakentuvat malleista ja mallien osat taas empiirisistä ilmiöistä, ja teoria on tosi, jos se on palautettavissa mallien osiin, jotka ovat empiirisesti adekvaatteja. Tämä on myös tieteellisesti realistinen malli. Yksinkertaisesti ilmaistuna tieteellisen realismin mukainen semanttinen tulkinta katsoo, että mallit ja teoria on sama asia. Malli on semanttinen siten, että teorian sisältö on malleissa – malleja ei johdeta teorioista.
Konstruktivistinen semanttinen mallin tulkinta taas esittää, että mallien toimivuuden ja tosimaailman välillä ei tarvitse olla isomorfiaa, merkittävää vastaavaisuutta tai samankaltaisuutta [11]. Mallien totuusarvo ei siis ole joko/tai, vaan mallin ja teorian välinen suhde määräytyy niiden sopivuuden perusteella ja tätä kautta taustalla vaikuttavien tosimaailman systeemien kanssa. Tyypillisesti ”sopivuus” on tilannekohtainen valinta, joka on lähinnä pragmaattinen. Täten semanttisessa konstruktionismissa malli on antirealistinen. Antirealismilla tarkoitetaan tässä kontekstissa sitä, että mallilla ei ole, tai sillä ei tarvitse olla totuusarvoa. Mallin toiminta on riippumatonta siitä, miten se mallintaa kohdetta. Ronald N. Gieren näkemyksessä malli ei tavallaan ole tilivelvollinen teorialle tai teoria on malli itse. Teoria ikään kuin syntyy tarpeen niin vaatiessa malliksi ja ”elää” vain sen ajan, jota mallia käytetään. Teoria on näin viitekehys, joka rajaa keskustelun aluetta, jossa malleja luodaan ja unohdetaan, mutta kaikki teorian aktualisoitumat ovat malleja. [12]
Mallin ja kohteen välinen suhde ei juurikaan ole problemaattinen. Lähtökohtaisesti mallien tehtävä tieteessä on selittää ja ennustaa ja tähän tarkoitukseen soveltuvat mallit rakentuvat juurikin aiemmasta informaatiosta, jonka määrä on nykytieteissä erittäin suuri. Täten mallien rakentaminen on filosofian kannalta melko yksinkertainen prosessi. On helppoa unohtaa, että mallit rakennetaan usein tutkimusdatasta, joten mallintajilla on erittäin hyvä tietämys ilmiön alku- tai lopputilasta ennen varsinaista mallintamista. Toisaalta jos mallin kohteesta, alku- tai lopputilasta ei ole informaatiota, mallit ovat hypoteesigeneraattoreita. Tässäkään tapauksessa mallin ja kohteen välinen suhde ei ole problemaattinen, sillä malli luo oman mahdollisen maailmansa, jonka ehdoilla se toimii. Mallin edellyttämä data postuloidaan kohteelle. Tämä mahdollinen maailma taas voi kuvastaa todellisuutta, mutta jos näin ei ole, se ei estä mallin toimintaa: esimerkiksi ideaaliheiluri tuottaa tuloksia Jupiterin arvoilla, vaikka kyseinen abstrakti instrumentti on luotu maapallon välittömässä läheisyydessä. Jos unohdetaan toviksi kohteet ja tarkastellaan malleja irrallaan kaikesta, ne ovat konstruktioita – jonkinlaisia ideaalisia rakenteita omassa maailmassaan. Sikäli kun mallin mekaniikka on peräisin konkreettisesta kohteesta tai sen toivotaan soveltuvan johonkin kohteeseen, kun se tunnistetaan, Walonickin kanta ei ole lainkaan huono. Jos ilmiön selitys on malli, niin informaatiomme kohteesta on malli itse.
Mallin ja kohteen välistä suhdetta hieman ongelmallisempi on mallin ja teorian välinen suhde. Syntaktinen ja semanttinen mallin tulkinta tuottaa erilaisia asenteita, mutta loppujen lopuksi mallin ja kohteen välinen suhde taikka mallin toiminta ei muutu, oli kannanotto mallin suhteesta teoriaan mikä hyvänsä. Syntaktinen tulkinta on perua loogisesta positivismista ja tämä tekee siitä hyvin jäykän tulkinnan. Syntaktinen tulkinta nostaa teorian erityisarvoiseen asemaan ja puskee mallit edustamaan näkemystä, jossa toimitaan ikään kuin valmiin tieteen perspektiivistä. Tämä on ongelmallista juurikin siksi, että harva uskaltaa julistaa tiedettään valmiiksi, vaikka teoria olisi mallien suhteen ensisijainen ja mallit tuottaisivat tiedeyhteisön kannalta varsin positiivisia tuloksia. Lisäksi tieteellisen realismin kannalta mallien totuusarvo on vaikeasti määriteltävissä esimerkiksi vahvasti idealisoitujen mallien tapauksessa.
Semanttisessa tulkinnassa mallit eivät ole tilivelvollisia teorian oletetulle suvereniteetille, sillä semanttisessa tulkinnassa teoriat ovat malleja tai yleistyksiä joukosta malleja. Tässä mielessä teorian ominaisuudet ovat mallien ominaisuuksia. Semanttinen tulkinta on myös yksinkertaisempi. Siinä on niin sanotusti vähemmän liikkuvia osia ja on melko yleisesti hyväksyttyä, että yksinkertaisempi, mutta yhtä tehokas malli tai teoria on aina parempi, kuin monimutkaisempi. Semanttinen tulkinta ei myöskään alistu valmiin tieteen perspektiiville ja mahdollistaa tieteen tekemisen näkemisen prosessina tuloksen sijaan. Tiede itsessään ei ole valmis systeemi, joka syöksee totuuksia, vaan se on prosessi, joka muovaa itseään. Tässä mielessä semanttinen tulkinta ei ole pelkästään vapaamielisempi suhteessa teorioihin ja kohteisiin, vaan se on turvallisempi, sillä se ei nojaa valmiin tieteen perspektiiviin, vaikka ei periaatteessa kielläkään sitä.
1. Barberousse & Ludwig 2009, 70 – 71.
2. Edellisten tieteenfilosofien näkemyksiä mekanistisista selityksistä löytyy mm. Wesley Salmonin Four Decades of Scientific Explanationista (1990) sekä William Bechtelin teoksesta Discovering Complexity (1993).
3. Frigg & Hartmann 2005, 9 – 11.
4. Knuuttila 2005, 10 – 14.
5. Walonick 1993, 1 – 10.
6. Frigg & Hartmann 2005, 5.
7. Bailer-Jones 2002, 108 – 111.
8. Barberousse & Ludwig 2009.
9. Frigg & Hartmann 2005, 10; Knuuttila 2005, 27 – 40.
10. Knuuttila 2009, 205 – 212.
11. Giere 2004, 1 – 11.
12. Frigg & Hartmann 2005, 10 – 19; Knuuttila 2005, 27 – 40.
Bailer-Jones, Daniela M. (2002) ”Models, Metaphories and Analogies”. The Blackwell Guide to the Philosophy of Science, toim.. Machamer, Peter; Silberstein, Michael. Oxford, Blackwell Publisher Ltd.
Barberousse, Anouk & Ludwig, Pascal (2009) ”Models as Fictions”. Fictions in Science: Philosophical Essays on Modeling and Idealization, toim. Mauricio Suárez. New York, Routledge.
Frigg, Roman & Hartmann, Stephan (2005) “Scientific Models”. The Philosophy of Science: An Encyclopedia, Vol. 2. toim. Sahotra Sarkas. New York. Routledge.
Giere, Ronald N. (2004) “How Models Are Used to Represent Reality”. [http://homes.dsi.unimi.it/~boccignone/GiuseppeBoccignone_webpage/MateCompAff_files/Giere2004PoS.pdf]
Knuuttila, Tarja (2009) “Representation, Idealization, and Fiction in Economics: From the Assumptions Issue to the Epistemology of Modeling”. Fictions in Science: Philosophical Essays on Modeling and Idealization, toim. Mauricio Suárez. New York, Routledge.
Knuuttila, Tarja (2005) Models as Epistemic Artefacts: Toward a non-representationalist account of scientific representation. Helsinki. University of Helsinki.
Walonick, David S. (1993) "General Systems Theory". [http://www.statpac.org/walonick/systems-theory.htm]