{"id":9431,"date":"2023-12-22T16:20:45","date_gmt":"2023-12-22T14:20:45","guid":{"rendered":"https:\/\/sites.utu.fi\/hiiskuttua\/?p=9431"},"modified":"2024-01-23T19:41:55","modified_gmt":"2024-01-23T17:41:55","slug":"kohti-suomenkielisia-keskustelumalleja-tule-kehittamaan-tekoalya","status":"publish","type":"post","link":"https:\/\/sites.utu.fi\/soihtu\/kohti-suomenkielisia-keskustelumalleja-tule-kehittamaan-tekoalya\/","title":{"rendered":"Kohti suomenkielisi\u00e4 keskustelumalleja: tule kehitt\u00e4m\u00e4\u00e4n teko\u00e4ly\u00e4"},"content":{"rendered":"<p><em>Erilaiset generatiiviset kielimallit ovat olleet huomion keskipisteen\u00e4 noin vuoden ajan ChatGPT:n tultua laajan yleis\u00f6n k\u00e4ytt\u00f6\u00f6n. Teko\u00e4lyst\u00e4 on keskusteltu runsaasti uutisissa, ja monet tahot, yliopistot mukaan luettuina, ovat j\u00e4rjest\u00e4neet keskustelutilaisuuksia esimerkiksi opiskelijavilpist\u00e4 ja ty\u00f6el\u00e4m\u00e4n\u00e4kymist\u00e4. Kansallisesta n\u00e4k\u00f6kulmasta kielimallien kehitysty\u00f6 ja k\u00e4yt\u00e4nn\u00f6n pelis\u00e4\u00e4nn\u00f6t ovat olleet keskeisi\u00e4 teemoja, sill\u00e4 meilt\u00e4 puuttuu suomalaiseen kulttuuriin ja kieleen t\u00e4sm\u00e4tuotteena laadittu kielimalli. <\/em><\/p>\n<p>Turun yliopiston kieliteknologian tutkimusryhm\u00e4 TurkuNLP vastaa nyt tarpeeseen suomenkielisest\u00e4 teko\u00e4lyst\u00e4. Ryhm\u00e4 on nimitt\u00e4in juuri julkaissut Avoin Avustaja -verkkoalustan suomeksi keskustelevan kielimallin kehitt\u00e4mist\u00e4 varten. Avoin Avustaja pohjautuu aiempaan LAION AI:n avoimen l\u00e4hdekoodin Open Assistant -projektiin, joka p\u00e4\u00e4ttyi aikaisemmin t\u00e4n\u00e4 vuonna. T\u00e4m\u00e4 hanke ker\u00e4si vapaaehtoisten k\u00e4ytt\u00e4jien tuottamaa keskusteludataa monilla eri kielill\u00e4. Projektissa tuotettu data oli kuitenkin p\u00e4\u00e4osin englanninkielist\u00e4 eik\u00e4 vastaavanlaista dataa ole saatavilla suomeksi. T\u00e4st\u00e4 syyst\u00e4 ryhm\u00e4 p\u00e4\u00e4tti luoda t\u00e4ysin suomenkielisen vastineen verkkoalustaa hy\u00f6dynt\u00e4en.\u00a0Kuten Open Assistant, my\u00f6s Avoimen Avustajan ohjelmakoodi sek\u00e4 tuotettu data ovat vapaasti ladattavissa ja k\u00e4ytett\u00e4viss\u00e4 avoimesta l\u00e4hteest\u00e4.<\/p>\n<p>Kieli- ja k\u00e4\u00e4nn\u00f6stieteiden laitoksen t\u00e4m\u00e4n syksyn Korpuksia ja kieliteknologiaa -kurssilla opiskelijat p\u00e4\u00e4siv\u00e4t osallistumaan hankkeen pilottivaiheeseen. Heid\u00e4n tarkoituksenaan oli muun muassa arvioida jonkun muun tekemi\u00e4 kysymys-vastaus pareja. Kun teht\u00e4v\u00e4n kanssa oli saanut ty\u00f6skennell\u00e4 luennolla, palaute oli, ett\u00e4 opiskelijat pitiv\u00e4t teht\u00e4vi\u00e4 hauskoina ja mielenkiintoisina. Positiivista oli my\u00f6s se, ett\u00e4 sai ty\u00f6skennell\u00e4 aidon hankkeen parissa. Yksi opiskelija kommentoi arviointiteht\u00e4v\u00e4\u00e4n, ett\u00e4 oli aivan mahtavaa, ett\u00e4 kysymykseen \u201cMiten menen ty\u00f6matkat Turun ja Helsingin v\u00e4lill\u00e4?\u201d j\u00e4rjestelm\u00e4st\u00e4 l\u00f6ytyi vastaus \u201cSuosittelen menem\u00e4\u00e4n julkisilla\u201d. Opiskelijan mukaan t\u00e4m\u00e4 keskustelu edusti luontevaa idiomaattista suomenkielist\u00e4 kielenk\u00e4ytt\u00f6\u00e4 \u2013 usein kun malleista h\u00e4nen mukaansa aistii englanninkieliset rakenteet niiden taustalla.<\/p>\n<p>Laajalti tunnetut sovellukset kuten ChatGPT ja Bing AI ovat suljettua l\u00e4hdekoodia, ja niiden kehitysprosessista tiedet\u00e4\u00e4n hyvin v\u00e4h\u00e4n. T\u00e4st\u00e4 poiketen TurkuNLP kutsuu vapaaehtoisia k\u00e4ytt\u00e4ji\u00e4 nyt mukaan ainutlaatuiseen mahdollisuuteen osallistua suomenkielisen teko\u00e4lyn kehitt\u00e4miseen. Avoimen Avustajan k\u00e4ytt\u00f6 ei edellyt\u00e4 erityist\u00e4 teknist\u00e4 osaamista, ja se on avoin kaikille asiasta kiinnostuneille.<\/p>\n<p>Verkkoalustalle rekister\u00f6idyt\u00e4\u00e4n s\u00e4hk\u00f6postia k\u00e4ytt\u00e4m\u00e4ll\u00e4 osoitteessa <a href=\"https:\/\/avoin-avustaja.fi\/\">https:\/\/avoin-avustaja.fi<\/a>.<\/p>\n<p>Viestien tuottamiseen ja arviointiin liittyv\u00e4 ohjeistus l\u00f6ytyy osoitteesta <a href=\"https:\/\/github.com\/TurkuNLP\/Open-Assistant\/wiki\">https:\/\/github.com\/TurkuNLP\/Open-Assistant\/wiki<\/a>.<\/p>\n<p>Lis\u00e4tietoja: TurkuNLP, <a href=\"http:\/\/turkunlp.org\/\">turkunlp.org<\/a><\/p>\n<p><em>Kirjoittajat ovat TurkuNLP-ryhm\u00e4n j\u00e4seni\u00e4 Turun yliopistosta.<\/em><\/p>\n","protected":false},"excerpt":{"rendered":"<p>Erilaiset generatiiviset kielimallit ovat olleet huomion keskipisteen\u00e4 noin vuoden ajan ChatGPT:n tultua laajan yleis\u00f6n k\u00e4ytt\u00f6\u00f6n. Teko\u00e4lyst\u00e4 on keskusteltu runsaasti uutisissa, ja monet tahot, yliopistot mukaan luettuina, ovat j\u00e4rjest\u00e4neet keskustelutilaisuuksia esimerkiksi opiskelijavilpist\u00e4 ja ty\u00f6el\u00e4m\u00e4n\u00e4kymist\u00e4. Kansallisesta n\u00e4k\u00f6kulmasta kielimallien kehitysty\u00f6 ja k\u00e4yt\u00e4nn\u00f6n pelis\u00e4\u00e4nn\u00f6t&#8230;<\/p>\n","protected":false},"author":4042,"featured_media":9473,"comment_status":"closed","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"_acf_changed":false,"_kad_blocks_custom_css":"","_kad_blocks_head_custom_js":"","_kad_blocks_body_custom_js":"","_kad_blocks_footer_custom_js":"","_kad_post_transparent":"","_kad_post_title":"","_kad_post_layout":"","_kad_post_sidebar_id":"","_kad_post_content_style":"","_kad_post_vertical_padding":"","_kad_post_feature":"","_kad_post_feature_position":"","_kad_post_header":false,"_kad_post_footer":false,"_kad_post_classname":"","wds_primary_category":0,"footnotes":""},"categories":[53,2275,89],"tags":[2377,2353,2199,2379],"class_list":["post-9431","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-ajankohtaista","category-hankkeet","category-opiskelijat","tag-chatgpt","tag-hiiskuttua","tag-tekoaly","tag-turkunlp"],"acf":[],"lang":"fi","translations":{"fi":9431},"taxonomy_info":{"category":[{"value":53,"label":"Ajankohtaista"},{"value":2275,"label":"Hankkeet"},{"value":89,"label":"Opiskelijat"}],"post_tag":[{"value":2377,"label":"ChatGPT"},{"value":2353,"label":"Hiiskuttua"},{"value":2199,"label":"teko\u00e4ly"},{"value":2379,"label":"TurkuNLP"}]},"featured_image_src_large":["https:\/\/sites.utu.fi\/soihtu\/wp-content\/uploads\/sites\/107\/2024\/01\/Tekoaly-567x300.png",567,300,true],"author_info":{"display_name":"Joona Kyt\u00f6niemi, Jenna Saarni, Hanna-Mari Kupari ja Sampo Pyysalo","author_link":"https:\/\/sites.utu.fi\/soihtu\/author\/minergutufi\/"},"comment_info":0,"category_info":[{"term_id":53,"name":"Ajankohtaista","slug":"ajankohtaista","term_group":0,"term_taxonomy_id":53,"taxonomy":"category","description":"","parent":0,"count":161,"filter":"raw","cat_ID":53,"category_count":161,"category_description":"","cat_name":"Ajankohtaista","category_nicename":"ajankohtaista","category_parent":0},{"term_id":2275,"name":"Hankkeet","slug":"hankkeet","term_group":0,"term_taxonomy_id":2278,"taxonomy":"category","description":"","parent":0,"count":26,"filter":"raw","cat_ID":2275,"category_count":26,"category_description":"","cat_name":"Hankkeet","category_nicename":"hankkeet","category_parent":0},{"term_id":89,"name":"Opiskelijat","slug":"opiskelijat","term_group":0,"term_taxonomy_id":89,"taxonomy":"category","description":"","parent":0,"count":166,"filter":"raw","cat_ID":89,"category_count":166,"category_description":"","cat_name":"Opiskelijat","category_nicename":"opiskelijat","category_parent":0}],"tag_info":[{"term_id":2377,"name":"ChatGPT","slug":"chatgpt","term_group":0,"term_taxonomy_id":2380,"taxonomy":"post_tag","description":"","parent":0,"count":1,"filter":"raw"},{"term_id":2353,"name":"Hiiskuttua","slug":"hiiskuttua","term_group":0,"term_taxonomy_id":2356,"taxonomy":"post_tag","description":"","parent":0,"count":971,"filter":"raw"},{"term_id":2199,"name":"teko\u00e4ly","slug":"tekoaly","term_group":0,"term_taxonomy_id":2202,"taxonomy":"post_tag","description":"","parent":0,"count":9,"filter":"raw"},{"term_id":2379,"name":"TurkuNLP","slug":"turkunlp","term_group":0,"term_taxonomy_id":2382,"taxonomy":"post_tag","description":"","parent":0,"count":1,"filter":"raw"}],"pll_sync_post":[],"_links":{"self":[{"href":"https:\/\/sites.utu.fi\/soihtu\/wp-json\/wp\/v2\/posts\/9431","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/sites.utu.fi\/soihtu\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/sites.utu.fi\/soihtu\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/sites.utu.fi\/soihtu\/wp-json\/wp\/v2\/users\/4042"}],"replies":[{"embeddable":true,"href":"https:\/\/sites.utu.fi\/soihtu\/wp-json\/wp\/v2\/comments?post=9431"}],"version-history":[{"count":9,"href":"https:\/\/sites.utu.fi\/soihtu\/wp-json\/wp\/v2\/posts\/9431\/revisions"}],"predecessor-version":[{"id":9476,"href":"https:\/\/sites.utu.fi\/soihtu\/wp-json\/wp\/v2\/posts\/9431\/revisions\/9476"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/sites.utu.fi\/soihtu\/wp-json\/wp\/v2\/media\/9473"}],"wp:attachment":[{"href":"https:\/\/sites.utu.fi\/soihtu\/wp-json\/wp\/v2\/media?parent=9431"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/sites.utu.fi\/soihtu\/wp-json\/wp\/v2\/categories?post=9431"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/sites.utu.fi\/soihtu\/wp-json\/wp\/v2\/tags?post=9431"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}