Publications Office of the EU
Legal notices: Virtual assistant, the explainability notice - Tietoja julkaisutoimistosta
Dockbar
Tekoälyn selitettävyyttä koskeva seloste

Virtuaaliavustaja : Tekoälyn selitettävyyttä koskeva seloste

Publio – Euroopan unionin julkaisutoimiston portaalin älyavustaja

Päivitetty viimeksi: 16/05/2023

Publio on Euroopan unionin julkaisutoimiston portaalin älyavustaja. Se on tekoälysovellus, joka toimii vuorovaikutuksessa luonnollisten henkilöiden kanssa ja tekee hakuja käyttämällä avainsanoja, jotka perustuvat portaalissa julkisesti saatavilla oleviin tietoihin.
Tässä tekoälyn selitettävyyttä koskevassa selosteessa annetaan käyttäjille tietoa tekoälyn sääntelykehyksestä ja Publion toimintaa tämän suhteen ohjaavista periaatteista. Euroopan unionin julkaisutoimisto on sitoutunut läpinäkyvyyteen ja avoimuuteen ja siihen, että sen käyttämä tekoäly on luotettavaa ja selitettävissä olevaa.

Tekoälyä koskevat läpinäkyvyysvelvoitteet – yleiset periaatteet

EU:n toimielinten toiminnan läpinäkyvyys ja avoimuus ovat hyvän hallintotavan ja kansalaisyhteiskunnan osallistumisen kannalta keskeisiä vaatimuksia, kuten Euroopan unionin toiminnasta tehdyn sopimuksen (SEUT) 15 artiklassa todetaan:

”1. Unionin toimielimet, elimet ja laitokset toimivat mahdollisimman avoimesti edistääkseen hyvää hallintotapaa ja varmistaakseen kansalaisyhteiskunnan osallistumisen.”

EU:n perusoikeuskirjan 41 artiklassa (Oikeus hyvään hallintoon) vahvistetaan hallintoelinten velvollisuus perustella päätöksensä.

Euroopan komission perustaman tekoälyä käsittelevän korkean tason asiantuntijaryhmän vuonna 2019 laatimassa asiakirjassa Luotettavaa tekoälyä koskevat eettiset ohjeet (1) mainitaan läpinäkyvyys yhtenä seitsemästä vaatimuksesta, jotka tekoälyjärjestelmien olisi täytettävä (2). Lisäksi näissä ohjeissa todetaan, että läpinäkyvyys on osa selitettävyyden periaatetta. Tämä tarkoittaa, että tietoaineistojen ja prosessien on oltava läpinäkyviä ja tekoälyjärjestelmien kapasiteetti ja tarkoitus on ilmoitettava avoimesti. Tietoaineistojen ja teknisten prosessien on siksi oltava dokumentoituja, jäljitettävissä, selitettävissä ja tulkittavissa.

Edellä mainitut periaatteet on otettava huomioon tekoälypohjaisten ratkaisujen ja välineiden kehittämisessä, käyttöönotossa ja käytössä EU:n toimielimissä, laitoksissa, elimissä ja virastoissa.

Näiden yleisten periaatteiden mukaisesti tekoälyä hyödyntävien järjestelmien käyttäjille on ilmoitettava etukäteen siitä, että he ovat vuorovaikutuksessa tekoälyjärjestelmän kanssa. Näin käyttäjät voivat tehdä tietoon perustuvan päätöksen siitä, jatkavatko he tekoälysovelluksen käyttöä vai poistuvatko he siitä.

Läpinäkyvyyttä koskevien sääntöjen mukaisesti käyttäjille on myös annettava tarvittavat tiedot, jotta he voivat tulkita järjestelmän tuloksia ja käyttää niitä asianmukaisesti.

Luotettava, selitettävä tekoäly

Tekoälyn luotettavuus ja selitettävyys ovat keskeisen tärkeitä EU:lle. EU valmistelee parhaillaan tekoälyn sääntelykehystä. Euroopan komissio antoi 21.4.2021 ehdotuksen asetukseksi tekoälyä koskevista yhdenmukaistetuista säännöistä (jäljempänä ’tekoälysäädös’) (3). Siinä asetetaan tekoälypohjaisten ratkaisujen ja välineiden tarjoajille velvoitteita sekä läpinäkyvyyden että tietojen antamisen suhteen.

Järjestelmien käyttäjillä on oikeus saada tieto siitä, että käytössä on tekoäly. Tähän oikeuteen liittyy myös vastuita: käyttäjän olisi käytettävä tekoälyjärjestelmää käyttöohjeiden mukaisesti ja tapauksen mukaan huolehdittava kyseisen järjestelmän toiminnan seurannasta. Vastuuvelvollisuus on siis kaikilla asianomaisilla toimijoilla.

Ehdotetun tekoälysäädöksen 52 artiklan (Tiettyjä tekoälyjärjestelmiä koskevat läpinäkyvyysvelvoitteet) mukaan ”1. Tarjoajien on varmistettava, että luonnollisten henkilöiden kanssa vuorovaikutukseen tarkoitetut tekoälyjärjestelmät suunnitellaan ja toteutetaan siten, että luonnollisille henkilöille ilmoitetaan, että he ovat vuorovaikutuksessa tekoälyjärjestelmän kanssa, paitsi jos tämä on olosuhteiden ja käyttöyhteyden perusteella ilmeistä. […]”

Ehdotetussa tekoälysäädöksessä noudatetaan riskiperusteista lähestymistapaa, jossa erotetaan toisistaan tekoälyn käyttö, joka aiheuttaa i) riskin, joka ei ole hyväksyttävissä, ii) suuren riskin ja iii) vähäisen tai minimaalisen riskin.

Publio on EU:n julkaisutoimiston portaalin älyavustaja, joka toimii vuorovaikutuksessa luonnollisten henkilöiden kanssa ja tekee hakuja käyttämällä avainsanoja, jotka perustuvat portaalissa julkisesti saatavilla oleviin tietoihin. Näiden tietojen julkaisussa noudatetaan läpinäkyvyysperiaatetta, joka on kaikkien EU:n politiikkojen ja kaiken EU-lainsäädännön kantava periaate. Publio-älyavustaja ei tuota uutta sisältöä, manipuloi käyttäjiä tai vaikuta käyttäjien tekemiin valintoihin muutoin kuin siten, että se ehdottaa käyttäjälle mahdollisia suodatusvaihtoehtoja, joilla hakua voi tarkentaa. Publion on näin ollen katsottava kuuluvan ehdotetussa tekoälysäädöksessä määriteltyyn ”vähäisen riskin” luokkaan (iii).

Ehdotetun tekoälysäädöksen IV osastossa (Läpinäkyvyys) säädetään, että tekoälyjärjestelmien suunnittelussa ja toiminnassa on otettava huomioon erityiset riskit, joita voi aiheutua 1) manipuloinnista subliminaalisilla tekniikoilla, joista käyttäjät eivät ole tietoisia, tai 2) haavoittuvien ryhmien hyväksikäytöstä, josta todennäköisesti aiheutuu psyykkistä tai ruumiillista haittaa. Järjestelmiin, i) jotka ovat vuorovaikutuksessa ihmisten kanssa, ii) joilla havaitaan tunteita tai määritetään yhteys (sosiaalisiin) luokkiin biometristen tietojen perusteella tai iii) joilla tuotetaan tai manipuloidaan sisältöä (’syväväärennökset’), on sovellettava erityisiä läpinäkyvyysvelvoitteita. Publio on vuorovaikutuksessa luonnollisten henkilöiden kanssa, mutta sitä ei ole suunniteltu havaitsemaan käyttäjien tunteita, jotta se voisi manipuloida heitä, eikä siihen sisälly elementtejä, jotka voisivat tahattomasti johtaa tällaiseen lopputulokseen. Publio ei näin ollen ole edellä mainittujen erityisiä velvoitteita edellyttävien arviointiperusteiden mukainen järjestelmä.

Tekoälyn liittyvät vastuukysymykset

Euroopan komission ehdotusta tekoälysäädökseksi täydennettiin 28.9.2022 ehdotuksella direktiiviksi tekoälyyn liittyvästä siviilioikeudellisesta vastuusta (4), jota koskevan päätöslauselman Euroopan parlamentti oli hyväksynyt SEUT-sopimuksen 225 artiklan nojalla (5).

Kuten tekoälyyn liittyvää vastuuta koskevassa direktiiviehdotuksessa esitetään, nykyiset tuottamukseen perustuvat vastuusäännöt eivät sovellu tekoälyä hyödyntävien tuotteiden ja palvelujen aiheuttamia vahinkoja koskevien korvausvaateiden käsittelyyn. Tällaisten sääntöjen mukaan uhrin on todistettava, että vahingon aiheuttanut henkilö on toiminut sääntöjenvastaisesti tai laiminlyönyt velvollisuutensa, ja osoitettava syy-yhteys. Tekoälyn erityispiirteet, kuten monimutkaisuus, itsenäisyys ja läpinäkymättömyys (niin sanottu musta laatikko -vaikutus), voivat tehdä tekoälyn käytöstä aiheutuvasta vahingosta vastuussa olevan henkilön yksilöimisestä vaikeaa. Tämä voi estää vahinkoa kärsineitä uhreja vaatimasta korvausta. Kun otetaan huomioon todistustaakkakysymyksen luonne, tekoälyyn liittyvää vastuuta koskeva direktiiviehdotus tarjoaa innovatiivisia ratkaisuja keventämällä todistustaakkaa todisteiden esittämisen ja kumottavissa olevien olettamien avulla.

Ehdotettu direktiivi tarjoaa korvausta hakeville henkilöille tehokkaat keinot yksilöidä mahdollisesti vastuussa olevat henkilöt ja vaateen kannalta merkitykselliset todisteet. Siinä säädetään esimerkiksi, että kansallinen tuomioistuin voi määrätä esittämään (ja säilyttämään) asiaankuuluvia todisteita tietyistä suuririskisistä tekoälyjärjestelmistä, joiden epäillään aiheuttaneen vahinkoa (6). Jollei ehdotetun direktiivin 4 artiklassa säädetyistä vaatimuksista muuta johdu, kansallisten tuomioistuinten on oletettava syy-yhteys vastaajan tuottamuksen ja tekoälyjärjestelmän tuottaman tuotoksen (tai sen, ettei tekoälyjärjestelmä tuottanut tuotosta) välillä.

Kuten ehdotetun direktiivin perusteluissa todetaan,”[t]ällaisilla tehokkailla siviilioikeudellista vastuuta koskevilla säännöillä on se lisäetu, että ne antavat kaikille tekoälyjärjestelmiin liittyvään toimintaan osallistuville lisäkannustimen noudattaa odotettua toimintaansa koskevia velvollisuuksia”.

Tietoa Publiosta

Käsitteitä ja määritelmiä

Käsite Määritelmä
Viitetaulukot Viitetaulukoilla (”Authority tables”, myös ”Named Authority lists” (NAL)) yhdenmukaistetaan ja standardoidaan koodeja ja niihin liittyviä tunnisteita (”labels”), joita käytetään eri ympäristöissä (verkkoalustat, -järjestelmät ja -sovellukset) ja joilla helpotetaan EU:n toimielinten tiedonvaihtoa esimerkiksi päätöksentekoprosessien yhteydessä. Esimerkkejä tällaisista viitetaulukoista ovat kielten, maiden, elinten jne. koodatut luettelot.
Chatbot Chatbot (chattibotti, asiointibotti) on tekoälyjärjestelmä, joka on suunniteltu keskustelemaan ihmisen kanssa joko puheen tai kirjoitetun tekstin välityksellä. Se käyttää luonnollisen kielen käsittelyn (NLP) tekniikoita, joiden avulla se ymmärtää käyttäjien syötteitä ja vastaa niihin. Se tarjoaa automatisoidusti apua ja tietoa tai suorittaa tiettyjä tehtäviä ennalta määriteltyjen sääntöjen tai algoritmien perusteella. Chatboteja käytetään yleisesti erilaisissa sovelluksissa, kuten asiakastuessa, virtuaaliavustajina ja verkkoviestintäalustoilla. Ne helpottavat viestintää ja antavat nopeasti vastauksia käyttäjien kysymyksiin.
Keskusteleva tekoäly Keskusteleva tekoäly (conversational AI) on tekoälyn muoto, joka helpottaa ihmisen ja tietokoneen välistä reaaliaikaista, kahden ihmisen välisen kommunikoinnin kaltaista keskustelua.
Keskusteluvirta Keskusteluvirralla (conversational flow) tarkoitetaan chatbotin ja käyttäjän välisen keskustelun (käyttäjäpolun) sujuvaa ja loogista etenemistä. Käsitteellä viitataan tapaan, jolla chatbot ymmärtää käyttäjän aikeen, reagoi ja vastaa käyttäjän viesteihin ja käy keskustelua pyrkien saavuttamaan käyttäjän ilmoittaman tavoitteen tai tarkoituksen.
Entiteetti Entiteetillä (entity) tarkoitetaan tässä yhteydessä käyttäjän viestistä poimittavia tiettyjä käyttäjän tarkoitukseen liittyviä tietoja, joiden perusteella tekoäly voi ymmärtää, mikä käyttäjän tarkoitus on. Nämä tiedot tunnistetaan ja tallennetaan, jotta tekoälyjärjestelmä voi poimia käyttäjän tarvitsemat tiedot. Esimerkki entiteetistä on tietyn artikkelin laatija.
EU Vocabularies, EuroVoc EuroVoc (EU Vocabularies) on joukko EU:n julkaisutoimiston hallinnoimia monikielisiä, monialaisia viitetaulukoita, jotka kattavat EU:n kaikki toimialat. Se sisältää termejä EU:n 24 virallisella kielellä sekä kolmen EU:n ehdokasmaan (Albania, Makedonia ja Serbia) kielillä.
Aie Aie (intent) viittaa tekoälyjärjestelmissä tarkoitukseen tai tavoitteeseen, joka käyttäjällä on, kun hän kirjoittaa tai lausuu kysymyksen tai kommentin. Aie edustaa ideaa tai käsitettä, joka voi sisältyä käyttäjän viestiin (ilmaukseen). Esimerkki aikeesta on, että käyttäjä haluaa etsiä tiettyä aihetta, julkaisua tai henkilöä.
Kielimalli Kielimalli (language model) on tekoälyohjelma, joka on suunniteltu luonnollisen kielen analysointiin ja ymmärtämiseen. Se käyttää tilastollisia ja todennäköisyysmalleihin perustuvia tekniikoita ennustaakseen, mikä sana tai ilmaisu tietyssä lauseessa tai tekstissä seuraavaksi esiintyy. Kielimalli on siis työkalu, jota voidaan käyttää lauseiden luomiseen tai täydentämiseen syötteen asiayhteyden ja sisällön perusteella.
LUIS LUIS (Language Understanding Intelligent Service) on pilvipalvelussa toimiva keskusteleva tekoälypalvelu, jossa käytetään räätälöityä koneoppimista hyödyntävää teknologiaa. Se ennakoi käyttäjän luonnollisella kielellä tuottaman tekstin perusteella syötteen yleistä merkitystä poimiakseen siitä olennaisia tietoja.
Koneoppiminen Koneoppiminen (machine learning) on tekoälyn tyyppi, jossa ohjelmistosovellukset voivat oppia aiemmasta datasta ja palautteesta ja näin kehittyä ennustamaan tuloksia paremmin ilman, että niitä nimenomaisesti ohjelmoitaisiin tältä osin.
Luonnollisen kielen käsittely (NLP) Luonnollisen kielen käsittely (Natural Language Processing, NLP) on tekoälyn osa-alue, jossa pyrkimyksenä on saada tietokoneohjelma analysoimaan ja ymmärtämään kirjoitettua ja puhuttua ihmiskieltä.
Hakupolku Hakupolulla (search journey) viitataan vuorovaikutusprosessin vaiheisiin, joiden kautta käyttäjä etenee etsiessään tiettyä tietoa. Tässä prosessissa käyttäjää ohjataan kysymysten ja vastausten kautta niin, että tekoäly voi tunnistaa ja toteuttaa hänen aikeensa. Chatbot-sovelluksessa prosessi etenee niin, että tekoäly pyrkii ymmärtämään käyttäjän kyselyn, hakemaan tietoja tieto- tai tietämyskannasta ja esittämään tiedot käyttäjälle helposti ymmärrettävällä ja käyttäjän tarpeiden kannalta merkityksellisellä tavalla.
Käyttäjäpolku Käyttäjäpolku (user journey) on henkilön yhden istunnon aikana saama kokemus verkkosivuston tai sovelluksen käytöstä. Se koostuu sarjasta toimia, jotka käyttäjä toteuttaa saavuttaakseen tietyn tavoitteen kyseisellä verkkosivustolla tai sovelluksessa.
Ilmaus Ilmaus (utterance) on käyttäjän mikä tahansa bottikeskustelussa kirjoittama tai puhuma viesti. Tällainen ilmaus voi olla yksi sana tai koostua useammasta sanasta, kuten kysymyksestä tai lauseesta.

Mikä Publio on?

Publio on Euroopan unionin julkaisutoimiston portaalin älyavustaja. Se on tekoälysovellus, joka toimii vuorovaikutuksessa luonnollisten henkilöiden kanssa ja tekee hakuja käyttämällä avainsanoja, jotka perustuvat portaalissa julkisesti saatavilla oleviin tietoihin. Publio-sovellus yhdistää keskustelevan tekoälyn tekniikoita, kuten luonnollisen kielen käsittelyn (NLP) ja koneoppimisen tekniikoita, vuorovaikutteisiin puheentunnistusjärjestelmiin ja perinteisiin hakujärjestelmiin, jotka auttavat käyttäjiä löytämään EU-julkaisuja, EU-lainsäädäntöä ja EU:n toimielinten yhteyshenkilöitä.

Sovelluksen avulla julkaisutoimiston portaalin loppukäyttäjät voivat käydä puhuttuja tai kirjoitettuja keskusteluja Publio-älyavustajan kanssa. Sovellus on toistaiseksi käytettävissä englannin, ranskan ja espanjan kielillä. Vaikka Publio on kaikkien käytettävissä, se tarjoaa myös räätälöityjä ratkaisuja sellaisten henkilöiden tarpeisiin, joilla on lukemisen erityisvaikeuksia, mikä edistää esteettömyyttä. Publiossa on uudenlainen keskusteluun pohjautuva haku, jonka avulla käyttäjät voivat puhua täydellisiä virkkeitä (samaan tapaan kuin tavallisessa keskustelussa) tekoälyyn perustuvalle ääniohjattavalle virtuaaliavustajalle, joka vuorostaan vastaa käyttäjälle. Käyttäjän ja älyavustajan välinen kommunikointi tapahtuu siis keskustelun muodossa.

Minkä tyyppisiä tietoja Publio käyttää?

Publio käyttää julkaisutoimiston portaalissa julkisesti saatavilla olevia tietoja. Näiden tietojen julkaisussa noudatetaan läpinäkyvyysperiaatetta, joka on kaikkien EU:n politiikkojen ja EU-lainsäädännön taustalla oleva periaate. Publio hyödyntää julkaisutoimiston portaalissa saatavilla olevia luokituksia ja jaotteluja, kuten EuroVocin aiheluokituksia, julkaisujen laatijatietoja tai julkaisuformaatteja, ohjatessaan ja pyrkiessään tarkentamaan keskustelua, jonka tarkoituksena on auttaa käyttäjää tekemään hakuja julkaisutoimiston portaalin kolmessa pääkokoelmassa (EU-julkaisut, EU:n lainsäädäntö ja EU:n toimielinten hakemisto EU Whoiswho).

Publio käyttää olemassa olevaa kielimallia pyrkiessään ymmärtämään käyttäjien esittämiä kysymyksiä ja opastamaan käyttäjiä hakupolun kaikissa vaiheissa. Publion kielimallia parannetaan jatkuvasti käyttäjiltä saadun palautteen perusteella. Järjestelmää koulutetaan täyttämään käyttäjien odotukset ja vastaamaan käyttäjien erilaisiin syötteisiin kolmella kielellä.

Koulutusprosessi kohdistuu useisiin Publion taustajärjestelmän osatekijöihin:

 

  • Ennalta määritelty joukko erilaisiin aikeisiin liittyviä ilmauksia, joiden avulla Publio voi ensin ymmärtää käyttäjän lopullisen tavoitteen ja tämän jälkeen ohjata käyttäjää vaiheittain tämän tavoitteen saavuttamiseksi.
  • Ennalta määritelty sarja vakiokysymyksiä, jotka Publio ”ymmärtää” ja joihin se voi antaa käyttäjille ennalta määritellyn vastauksen. Esimerkki: Miten voin tilata julkaisuja?
  • Koneoppimisen perusteella opitut entiteetit, jotka Publio voi tunnistaa ja joita käytetään sen taustaprosesseissa hakuparametrien havaitsemiseen ja tarkempien hakutulosten tai hakuvaihtoehtojen tarjoamiseen. Nämä entiteetit perustuvat olemassa oleviin dataluokituksiin ja -jaotteluihin, kuten EuroVoc-tesaurukseen tai muihin EuroVocin viitetaulukoihin, jotka kattavat esimerkiksi asiakirjojen laatijat ja formaatit, kielet, EU-elimet (organisaatiot), EU:n julkishallinnon organisaatioiden työtehtävät jne. Publio voi niiden pohjalta esimerkiksi ymmärtää käyttäjän kyselystä, että käyttäjä hakee tietyn tekijän laatimaa tai tiettyä aihetta koskevaa julkaisua.

Miten Publio toimii?

Publio käsittelee käyttäjän syötteen (minkä tahansa kirjoitetun tai puhutun ilmauksen) Microsoftin LUIS-palvelun (7) avulla ja pyrkii ymmärtämään käyttäjän aikeen sekä tunnistamaan keskeiset elementit (entiteetit), jotka ovat käyttäjän kiinnostuksen kohteena. Publio käynnistää tunnistamansa aikeen perusteella räätälöidyn keskusteluvirran, jonka tavoitteena on auttaa käyttäjää saavuttamaan tavoitteensa muutaman yksinkertaisen vaiheen kautta.

Publiossa on tällä hetkellä käytössä neljä keskusteluvirran päätyyppiä:

  • asiakirjahakuvirta, joka auttaa käyttäjiä hakemaan EU-julkaisuja tai EU:n oikeudellisia asiakirjoja
  • henkilöhakuvirta, joka auttaa käyttäjiä hakemaan EU:n toimielinten palveluksessa olevia virkamiehiä
  • organisaatiohakuvirta, joka auttaa käyttäjiä hakemaan EU:n elimiä (organisaatioita)
  • usein kysyttyjen kysymysten (UKK/QnA) hakuvirta, jonka avulla Publio voi antaa tällaisiin toistuviin kysymyksiin ennalta määrittyjä vastauksia.

Jos järjestelmä tunnistaa hakuvirran, Publio opastaa käyttäjää hakemaan asianomaisen asiakirjan, henkilön tai organisaation esittämällä käyttäjälle yksinkertaisia kysymyksiä ja ehdottaa käyttäjän vastauksen perusteella suodatusvaihtoehtoja.

Usein kysyttyjen kysymysten (QnA) hakuvirta perustuu julkaisutoimiston henkilöstön ylläpitämään luetteloon usein kysytyistä kysymyksistä ja niiden ennalta määritellyistä vastauksista. Jos järjestelmä tunnistaa QnA-aikeen ja käyttäjän esittämä kysymys ja jokin järjestelmään tallennetuista kysymyksistä ovat hyvin samankaltaisia, järjestelmä tarjoaa kyseisen valmiin vastauksen suoraan käyttäjälle. Esimerkkejä:

- Jos käyttäjä kysyy vaikkapa ”Missä tilaukseni on?” ja järjestelmä tunnistaa QnA-aikeen, Publio vastaa kysymykseen ”Voit tarkistaa tilauksesi tilan käyttäjäprofiilisi Omat tilaukset -osiossa.”.

- Jos järjestelmä tunnistaa QnA-aikeen esimerkiksi kysymyksestä ”Mistä löytyy lapsille suunnattuja julkaisuja?”, Publio vastaa ”Lapsille suunnattuja julkaisuja on Lapsille-osiossa”.

Kysymykset voi esittää kirjoittamalla tai puhumalla. Chatbot äänittää audiosyötteen (puhutun kysymyksen) ja lähettää sen puheentunnistimeen, joka muuntaa puheen tekstiksi. Audiosyöte prosessoidaan Microsoft Azure -puheentunnistuspalvelun avulla (8). Publio näyttää tämän jälkeen audiosyötteen puheentunnistimen tulkitsemina sanoina ja esittää sitten vastauksen sekä tekstinä että automatisoituna äänenä. Tämä keskustelu on hetkellinen eikä se säily järjestelmässä.

 

Miten Publio analysoi kysymyksen ja ehdottaa tuloksia?

Publio ei käytä generatiivista teknologiaa, joten se ei pysty tuottamaan sisältöä tai manipuloimaan käyttäjiä.

Publio käyttää koneoppimiseen perustuvaa kielimallia, joka on koulutettu oppimaan, miten käyttäjien syötteitä voidaan tunnistaa ja miten niihin voidaan vastata. Järjestelmä käsittelee käyttäjän viestin tai kyselyn, tunnistaa viestin aikeen ja antaa asianmukaisen vastauksen tämän mallin avulla. Publion koulutusprosessissa koneoppimismallille annetaan suuri määrä tunnisteilla merkittyä opetusdataa, jossa on esimerkkejä käyttäjien syötteistä ja niihin liittyvistä aikeista sekä soveltuvista vastauksista.

Publio pyrkii luonnollisen kielen käsittelyn tekniikoiden ja koulutetun kielimallin pohjalta ymmärtämään käyttäjän aikeen ja poimii käyttäjän kysymyksestä tunnistamansa entiteetit (esim. hakusana, aihe, asiakirjan laatija, asiakirjan päivämäärä ja asiakirjan formaatti). Publio tekee näiden entiteettien perusteella haun ja näyttää hakutuloksen.





Jos hakutulos on liian laaja, Publio jatkaa keskustelua esittämällä käyttäjälle lisäkysymyksiä ja rajaa hakutulosta suodattamalla sitä muiden entiteettien perusteella.

Publion muotoilemat kysymykset rajoittuvat käyttäjän aikeen tunnistamiseen, sen tarkoituksen selvittämiseen ja sopivan hakukysymyksen muotoilemiseen, jotta botti voi tehdä haun julkaisutoimiston portaalissa julkaistun sisällön muodostamaan korpukseen. Kaikki Publion ehdottamat tulokset ovat peräisin tästä korpuksesta.

Käyttäjäpalaute



Loppukäyttäjä voi milloin tahansa keskustelun aikana antaa positiivista, neutraalia tai kielteistä palautetta Publion käyttökokemuksestaan. Käyttäjä voi antaa palautetta missä tahansa vaiheessa manuaalisesti taikka reagoida automaattisen ponnahdusikkunan palautepyyntöön, joka näytetään, kun käyttäjä ei ole muutamaan sekuntiin ollut aktiivinen sovelluksessa. Jos Publio ei ymmärrä kysymystä oikein, kysymys kirjautuu automaattisesti järjestelmään. Julkaisutoimiston henkilöstöstä koostuva tiimi käsittelee nämä kysymykset myöhemmin. Käyttäjäpalautetta ja Publion virheellisesti ymmärtämien kysymysten analyyseja käytetään kielimallin uudelleenkoulutukseen, jotta loppukäyttäjille tarjottavia palveluja voitaisiin parantaa jatkuvasti.

 

Henkilötietojen käsittely

Julkaisutoimiston portaalissa saatavilla olevia tietoja käsitellään EU:n yleisen tietosuoja-asetuksen (GDPR) ja EU:n toimielinten, elinten ja laitosten suorittamaa henkilötietojen käsittelyä koskevan asetuksen mukaisesti (9).

Publio ei tallenna, säilytä tai arkistoi mitään elementtejä, esim. käyttäjän syötettä tai Publion vastauksissa annettuja tietoja.

Kerätty palaute anonymisoidaan siten, että palautetta ei voida yhdistää käyttäjään, jolta palaute on kerätty.

Henkilötietoja ei millään tavalla käytetä automatisoituun päätöksentekoon, jäljittämiseen tai profilointiin.

Tämänhetkiset rajoitukset

  • Nimien kirjoittaminen puhesyötteestä: vaikka tekoäly ”ymmärtää” useimmat nimet ja kirjoittaa ne oikein, nimien poiminta perustuu koneoppimiseen eikä ole täysin tarkkaa. LUIS-järjestelmän rajoitusten vuoksi joidenkin nimien poimiminen oikein ei onnistu, vaikka mallia olisi koulutettu datajoukon esimerkkien avulla.
  • Päivämäärät ranskan- ja espanjankielisissä ilmaisuissa: tekoäly ei ”ymmärrä” päivämääriä täysin tarkkaan ranskan- ja espanjankielisessä ilmaisuissa monimutkaisemmissa yhteyksissä. Se tunnistaa vuoden esimerkiksi espanjankielisessä ilmaisussa ”entre 2016 y 2017” ilman lisäkontekstia, muttei ilmaisussa ”entre el año 2019 y 2020”. Se tunnistaa englannin ilmaisun ”2 years ago”, muttei ranskan ilmaisua ”il y a 2 ans”.
  • Puheentunnistus onnistuu vain yhdellä kielellä kerrallaan.
  • Puheentunnistuksessa ei ole mahdollista täsmentää jonkin ilmaisun tarkkaa kirjoitustapaa luettelemalla merkit yksi kerrallaan.
  • Nimientiteetin tunnistaminen ei toimi hyvin laajemmissa lausekkeissa, kun nimeen yhdistetään titteli ”Mrs”/”Miss”.

 

Euroopan unionin julkaisutoimisto, 16.5.2023

1 Saatavilla osoitteessa https://ec.europa.eu/futurium/en/ai-alliance-consultation.1.html

2 Nämä seitsemän vaatimusta, jotka luotettavan tekoälyn olisi täytettävä, ovat 1) ihmisen toimijuus ja ihmisen suorittama valvonta, 2) ohjelmistojen tekninen luotettavuus ja turvallisuus, 3) yksityisyyden suoja ja datan hallinta, 4) läpinäkyvyys, 5) monimuotoisuus, syrjimättömyys ja oikeudenmukaisuus, 6) yhteiskunnallinen ja ekologinen hyvinvointi ja 7) vastuuvelvollisuus.

3 Ehdotus Euroopan parlamentin ja neuvoston asetukseksi tekoälyä koskevista yhdenmukaistetuista säännöistä (tekoälysäädös) ja tiettyjen unionin säädösten muuttamisesta (COM(2021) 206 final, 21.4.2021; asiakirja on parhaillaan EU:n lainsäädäntövallan käyttäjien eli Euroopan parlamentin ja neuvoston käsiteltävänä.

4 Ehdotus Euroopan parlamentin ja neuvoston direktiiviksi sopimuksenulkoista siviilioikeudellista vastuuta koskevien sääntöjen mukauttamisesta tekoälyyn (direktiivi tekoälyyn liittyvästä vastuusta), COM (2022) 496 final, 28.9.2022.

5 Euroopan parlamentin päätöslauselma suosituksista komissiolle tekoälyä koskevasta siviilioikeudellisen vastuun järjestelmästä (2020/2014(INL)), 20.10.2020.

6 Ks. direktiivin 3 artikla.

7 https://www.luis.ai/

8 https://query.prod.cms.rt.microsoft.com/cms/api/am/binary/RE5cCGB

9 Asetus (EU) 2016/679, EUVL L 119, 4.5.2016, s. 1–88 ja asetus (EU) 2018/1725, EUVL L 295, 21.11.2018, s. 39–98.