{"id":33,"date":"2009-10-08T11:35:31","date_gmt":"2009-10-08T08:35:31","guid":{"rendered":"http:\/\/www.fyysika.ee\/wordpress\/?p=33"},"modified":"2014-12-26T01:48:13","modified_gmt":"2014-12-25T22:48:13","slug":"keeletehnoloogiast","status":"publish","type":"post","link":"https:\/\/www.fyysika.ee\/?p=33","title":{"rendered":"Keeletehnoloogiast"},"content":{"rendered":"<p>Juba m\u00f5nda aega tagasi toimus \u00a0Eesti keeletehnoloogide konverents. K\u00e4isime vaatamas.<\/p>\n<p>Tegelikult tahaks ju kasutada k\u00f5iksuguseid keeletehnoloogilisi &#8230; vidinaid, nagu k\u00f5netuvastus, masint\u00f5lkimine, k\u00f5nes\u00fcntesaator, intelligentne veeb &#8230; aeg-ajalt siit ja sealt meediakanalist ka kostub (p\u00f5hiliselt ametnike) h\u00e4\u00e4li, et kohe-kohe saab see k\u00f5ik v\u00f5imalikuks. Kui aga kuulata tegijate endi esinemisi ning nendega sel teemal r\u00e4\u00e4kida, siis asjad edenevad visalt. Teisiti \u00f6elduna, inimese aju on ikka h\u00e4mmastavalt kaval s\u00fcsteem ning seda arvuti abil j\u00e4ljendada on \u00e4ra\u00fctlemata raske.<\/p>\n<p>K\u00f5ik on vist juba proovinud google&#8217;i t\u00f5lkimise masinat ja selle \u00fcle naeru kihistanud?<\/p>\n<p>Allakirjutanu noppis \u00fcles kaks tema jaoks \u00fcllatavat asjaolu ning pani k\u00f5rva taha \u00fche kommentaari<\/p>\n<p>* Kui arvutiajastu alguses \u00fcritati ehitada deterministlikke t\u00f5lkemasinaid, mis t\u00f6\u00f6tavad m\u00f5nesugune range algoritmi alusel (kui lauses on see, siis tee seda, kui on see ja see, siis tee seda jne), siis t\u00e4nasel p\u00e4eval on k\u00f5ige paremad t\u00f5lkemasinad statistilised. Statistilises t\u00f5lkemasinas on m\u00f5nesugune keelekorpus, st suur hulk teadaolevate t\u00f5lgetega fraase ja s\u00f5nu ning arvuti teeb oma otsused nene n\u00e4idete p\u00f5hjal. Ja et korpused on suured ning algoritmid statistilised, siis tegelikult neid k\u00e4ivitavad inimesed ei teagi p\u00e4ris t\u00e4pselt, kuidas nad t\u00f6\u00f6tavad ja miks just \u00fche v\u00f5i teise tulemuse annavad.<\/p>\n<p>* Teine, seonduv asjaolu. T\u00e4iesti t\u00f5sine selle valdkonna teadlane arvas, et kuna korpused on k\u00f5igile k\u00e4ttesaadavad ning algoritmid v\u00e4ga raskesti testitavad\/parandatavad, siis edukas v\u00f5ib olla ka sel teel, et teha algusest peale uus t\u00f5lkealgoritm &#8211; v\u00f5ib juhtuda, et tegijal on \u00f5nnelik k\u00e4si v\u00f5i perfektne intuitsioon ning tulemus saab parem, kui seni n\u00e4htud. F\u00fc\u00fcsikat tehakse teistmoodi &#8230;<\/p>\n<p>* \u00dcldine kommentaar: kogu see valdkond on keeruline, raskesti hoomatav ning eesti keeleruumi v\u00e4iksuse t\u00f5ttu ka alaarendatud &#8230; ja t\u00f5epoolest, l\u00e4bimurret v\u00f5ib siin oodata ehk vaid sellep\u00e4rast, et aeg-ajalt on p\u00f5him\u00f5tteliselt v\u00f5imalik ka loteriiga v\u00f5ita.<\/p>\n<p>Aga hoidke end kursis &#8230; ja \u00fcllatage seda seltskonda \ud83d\ude42 : <a href=\"http:\/\/www.keeletehnoloogia.ee\" target=\"_blank\">www.keeletehnoloogia.ee<\/a> .<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Juba m\u00f5nda aega tagasi toimus \u00a0Eesti keeletehnoloogide konverents. K\u00e4isime vaatamas. Tegelikult tahaks ju kasutada k\u00f5iksuguseid keeletehnoloogilisi &#8230; vidinaid, nagu k\u00f5netuvastus, masint\u00f5lkimine, k\u00f5nes\u00fcntesaator, intelligentne veeb &#8230; aeg-ajalt siit ja sealt meediakanalist ka kostub (p\u00f5hiliselt ametnike) h\u00e4\u00e4li, et kohe-kohe saab see k\u00f5ik v\u00f5imalikuks. Kui aga kuulata tegijate endi esinemisi ning nendega sel teemal r\u00e4\u00e4kida, siis asjad edenevad [&hellip;]<\/p>\n","protected":false},"author":2,"featured_media":0,"comment_status":"open","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"_genesis_hide_title":false,"_genesis_hide_breadcrumbs":false,"_genesis_hide_singular_image":false,"_genesis_hide_footer_widgets":false,"_genesis_custom_body_class":"","_genesis_custom_post_class":"","_genesis_layout":"","footnotes":""},"categories":[3],"tags":[],"class_list":{"0":"post-33","1":"post","2":"type-post","3":"status-publish","4":"format-standard","6":"category-opetamine","7":"entry"},"_links":{"self":[{"href":"https:\/\/www.fyysika.ee\/index.php?rest_route=\/wp\/v2\/posts\/33","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.fyysika.ee\/index.php?rest_route=\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.fyysika.ee\/index.php?rest_route=\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.fyysika.ee\/index.php?rest_route=\/wp\/v2\/users\/2"}],"replies":[{"embeddable":true,"href":"https:\/\/www.fyysika.ee\/index.php?rest_route=%2Fwp%2Fv2%2Fcomments&post=33"}],"version-history":[{"count":0,"href":"https:\/\/www.fyysika.ee\/index.php?rest_route=\/wp\/v2\/posts\/33\/revisions"}],"wp:attachment":[{"href":"https:\/\/www.fyysika.ee\/index.php?rest_route=%2Fwp%2Fv2%2Fmedia&parent=33"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.fyysika.ee\/index.php?rest_route=%2Fwp%2Fv2%2Fcategories&post=33"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.fyysika.ee\/index.php?rest_route=%2Fwp%2Fv2%2Ftags&post=33"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}