FOOKUS | Karmen Turk: inimloome tehisaru treenerina – kas sunnitud pärisorjus?



See, et miski on avaandmete andmebaasis, ei tähenda, et see on alati vabalt kasutatav kõigile ja mistahes tingimustel. Neljapäeval, 6. veebruaril avaldas justiits- ja digiministeerium pressiteates, et Eesti andis sotsiaalmeediaplatvormi Meta kasutusse ligi neli miljardit sõna – täpsemalt eesti keele korpuse (justiis- ja digiminesteerium on täpsustanud, et tegelikult midagi „antud“ ei ole, vaid on antud juhatus, et avaandmetena on keelekorpus kättesaadav). Põhjus on täiesti arusaadav: suurte keelemudelite võime ülesandeid lahendada sõltub paljuski nende treenimiseks kasutatud andmetest ning hästi toimivate keelemudelite loomiseks on vaja suurel hulgal kvaliteetseid andmeid. Tahame ju, et meie külmik mõistaks, kui nõuame poenimekirja „hapupiima“ ning et meie lapsed kasvaksid uues tehisarupõhises ühiskonnas, mis on meie enda emakeelne. Siiski on samm tekitanud juba palju vastukaja. LOE EDASI JUBA ARTIKLIST: https://epl.delfi.ee/a/120355434