{"id":3081,"date":"2018-11-07T07:24:40","date_gmt":"2018-11-07T05:24:40","guid":{"rendered":"http:\/\/hiiskuttua.utu.fi\/?p=3081"},"modified":"2024-04-22T16:00:23","modified_gmt":"2024-04-22T13:00:23","slug":"digilang-kehittaa-kieliaineistoja-ja-kokoaa-ne-portaaliin-rahoitusta-myonnettiin-yli-puoli-miljoonaa-vuosille-2018-2021","status":"publish","type":"post","link":"https:\/\/sites.utu.fi\/soihtu\/digilang-kehittaa-kieliaineistoja-ja-kokoaa-ne-portaaliin-rahoitusta-myonnettiin-yli-puoli-miljoonaa-vuosille-2018-2021\/","title":{"rendered":"Digilang kehitt\u00e4\u00e4 kieliaineistoja ja kokoaa ne portaaliin: rahoitusta my\u00f6nnettiin yli puoli miljoonaa vuosille 2018\u20132021"},"content":{"rendered":"<p>Turun yliopiston kieli- ja k\u00e4\u00e4nn\u00f6stieteiden laitoksessa on erityisaloillaan kansallisesti ja kansainv\u00e4lisesti ainutlaatuisia kieliaineistoja, joilla on jo entuudestaan oma kotimainen ja kansainv\u00e4linen k\u00e4ytt\u00e4j\u00e4kuntansa. Laitoksessa on koostettu, kehitetty ja yll\u00e4pidetty digitaalisia aineistoja tutkimuksen tarpeisiin vuodesta 1967, jolloin suomen kielen oppiaineen yhteyteen perustettiin Lauseopin arkisto (LA). Viime vuosikymmenten aikana on laitoksessa muodostettu yh\u00e4 useampia korpuksia.<\/p>\n<p>Yliopiston rehtori my\u00f6nsi viime kev\u00e4\u00e4n\u00e4 laitoksessa toimivalle Digilang-hankkeelle yli 580\u00a0000 euroa aineistojen kehitysty\u00f6h\u00f6n vuosille 2018\u20132021. Tavoitteena on, ett\u00e4 tulevaisuudessa n\u00e4m\u00e4 aineistot tavoittavat yh\u00e4 laajemman k\u00e4ytt\u00e4j\u00e4kunnan, kun aineistoja kehitet\u00e4\u00e4n, niiden n\u00e4kyvyytt\u00e4 parannetaan ja ne kootaan samaan portaaliin. N\u00e4in vahvistetaan samalla Turun yliopiston ja laitoksen br\u00e4ndi\u00e4 kieliaineistojen tuottajana.<\/p>\n<p>Digilang-hankkeessa parannetaan nykyisten aineistojen k\u00e4ytett\u00e4vyytt\u00e4 kehitt\u00e4m\u00e4ll\u00e4 niiden ns. metatietoja, kun esimerkiksi kunkin sanan, lauseen, virkkeen, intonaatiojakson ja diskurssin rakenteesta ja visualisoinnista lis\u00e4t\u00e4\u00e4n tietoja. N\u00e4in aineiston k\u00e4ytt\u00e4j\u00e4t pystyv\u00e4t l\u00f6yt\u00e4m\u00e4\u00e4n helpommin yh\u00e4 useammasta laajasta puhe- tai tekstimassasta tarvitsemansa tapaukset. Kieliaineistojen n\u00e4kyvyytt\u00e4 lis\u00e4t\u00e4\u00e4n ker\u00e4\u00e4m\u00e4ll\u00e4 ne yhteen ja luomalla yhteinen k\u00e4ytt\u00e4j\u00e4portaali, jonka avulla tutkijat ja opiskelijat l\u00f6yt\u00e4v\u00e4t entist\u00e4kin paremmin tarvitsemiaan aineistoja ja saattavat samalla l\u00f6yt\u00e4\u00e4 heille entuudestaan tuntemattomia mutta hy\u00f6dyllisi\u00e4 aineistoja. Osa laitoksen kieliaineistoista on jo aiemmin liitetty osaksi kansallista <a href=\"https:\/\/www.kielipankki.fi\/\">Kielipankkia<\/a>. My\u00f6s n\u00e4ist\u00e4 korpuksista liitet\u00e4\u00e4n tiedot portaaliin, ja portaalin k\u00e4ytt\u00e4j\u00e4t l\u00f6yt\u00e4v\u00e4t n\u00e4m\u00e4kin aineistot helposti. Laitoksen omasta portaalista ei tule siis kilpailijaa Kielipankille, vaan se t\u00e4ydent\u00e4\u00e4 sit\u00e4.<\/p>\n<p>Digilang-hankkeessa mukana on kuusi laitoksessa\u00a0eri tahoilla kehitetty\u00e4 kieliaineistoa: Satakuntalaisuus puheessa -korpus, Suomen kielen prosodian alueellisen ja sosiaalisen variaation korpus, erilaisia fennougristisia korpuksia (mm. Mormula ja marin ja mordvalaiskielten kirjakielen historian korpukset), Akateemisen suomen korpus, Universal Parsebanks -korpus (joka sis\u00e4lt\u00e4\u00e4 mm. suomenkielisen Finnish Internet Parsebank -korpuksen) sek\u00e4 ranska\u2013suomi- ja englanti\u2013suomi-kirjoitus- ja k\u00e4\u00e4nt\u00e4misprosessien LOG-korpus.<\/p>\n<p><em>Tommi Kurki on suomen kielen dosentti.<\/em><\/p>\n","protected":false},"excerpt":{"rendered":"<p>Turun yliopiston kieli- ja k\u00e4\u00e4nn\u00f6stieteiden laitoksessa on erityisaloillaan kansallisesti ja kansainv\u00e4lisesti ainutlaatuisia kieliaineistoja, joilla on jo entuudestaan oma kotimainen ja kansainv\u00e4linen k\u00e4ytt\u00e4j\u00e4kuntansa. Laitoksessa on koostettu, kehitetty ja yll\u00e4pidetty digitaalisia aineistoja tutkimuksen tarpeisiin vuodesta 1967, jolloin suomen kielen oppiaineen yhteyteen perustettiin&#8230;<\/p>\n","protected":false},"author":1754,"featured_media":3082,"comment_status":"closed","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"_acf_changed":false,"_kad_blocks_custom_css":"","_kad_blocks_head_custom_js":"","_kad_blocks_body_custom_js":"","_kad_blocks_footer_custom_js":"","_kad_post_transparent":"","_kad_post_title":"","_kad_post_layout":"","_kad_post_sidebar_id":"","_kad_post_content_style":"","_kad_post_vertical_padding":"","_kad_post_feature":"","_kad_post_feature_position":"","_kad_post_header":false,"_kad_post_footer":false,"_kad_post_classname":"","wds_primary_category":0,"footnotes":""},"categories":[119],"tags":[665,2353,527],"class_list":["post-3081","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-tutkimus-ja-opetus","tag-digilang","tag-hiiskuttua","tag-suomen-kieli"],"acf":[],"lang":"fi","translations":{"fi":3081},"taxonomy_info":{"category":[{"value":119,"label":"Tutkimus ja opetus"}],"post_tag":[{"value":665,"label":"Digilang"},{"value":2353,"label":"Hiiskuttua"},{"value":527,"label":"suomen kieli"}]},"featured_image_src_large":["https:\/\/sites.utu.fi\/soihtu\/wp-content\/uploads\/sites\/107\/2018\/10\/KARUSELLI_TUTK_Kurki.jpg",570,290,false],"author_info":{"display_name":"Tommi Kurki","author_link":"https:\/\/sites.utu.fi\/soihtu\/author\/aeliirutufi\/"},"comment_info":0,"category_info":[{"term_id":119,"name":"Tutkimus ja opetus","slug":"tutkimus-ja-opetus","term_group":0,"term_taxonomy_id":119,"taxonomy":"category","description":"","parent":0,"count":410,"filter":"raw","cat_ID":119,"category_count":410,"category_description":"","cat_name":"Tutkimus ja opetus","category_nicename":"tutkimus-ja-opetus","category_parent":0}],"tag_info":[{"term_id":665,"name":"Digilang","slug":"digilang","term_group":0,"term_taxonomy_id":665,"taxonomy":"post_tag","description":"","parent":0,"count":1,"filter":"raw"},{"term_id":2353,"name":"Hiiskuttua","slug":"hiiskuttua","term_group":0,"term_taxonomy_id":2356,"taxonomy":"post_tag","description":"","parent":0,"count":971,"filter":"raw"},{"term_id":527,"name":"suomen kieli","slug":"suomen-kieli","term_group":0,"term_taxonomy_id":527,"taxonomy":"post_tag","description":"","parent":0,"count":24,"filter":"raw"}],"pll_sync_post":[],"_links":{"self":[{"href":"https:\/\/sites.utu.fi\/soihtu\/wp-json\/wp\/v2\/posts\/3081","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/sites.utu.fi\/soihtu\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/sites.utu.fi\/soihtu\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/sites.utu.fi\/soihtu\/wp-json\/wp\/v2\/users\/1754"}],"replies":[{"embeddable":true,"href":"https:\/\/sites.utu.fi\/soihtu\/wp-json\/wp\/v2\/comments?post=3081"}],"version-history":[{"count":2,"href":"https:\/\/sites.utu.fi\/soihtu\/wp-json\/wp\/v2\/posts\/3081\/revisions"}],"predecessor-version":[{"id":9768,"href":"https:\/\/sites.utu.fi\/soihtu\/wp-json\/wp\/v2\/posts\/3081\/revisions\/9768"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/sites.utu.fi\/soihtu\/wp-json\/wp\/v2\/media\/3082"}],"wp:attachment":[{"href":"https:\/\/sites.utu.fi\/soihtu\/wp-json\/wp\/v2\/media?parent=3081"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/sites.utu.fi\/soihtu\/wp-json\/wp\/v2\/categories?post=3081"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/sites.utu.fi\/soihtu\/wp-json\/wp\/v2\/tags?post=3081"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}