Luonnollisen kielen käsittely (NLP) on keinotekoisen älyn ala, jonka avulla tietokoneet voivat analysoida ja ymmärtää ihmisen kieltä. Se oli suunniteltu rakentamaan ohjelmistoja, jotka luovat ja ymmärtävät luonnolliset kielet, jotta käyttäjä voi käydä luonnollisia keskusteluja tietokoneen kanssa ohjelmoinnin tai keinotekoisten kielten, kuten Java tai C, sijaan.
Luonnollisen kielen käsittelyn (NLP) rikkominen
Luonnollisen kielen käsittely (NLP) on yksi askel suuremmassa tehtävässä teknologiasektorille - nimittäin käyttää tekoälyä (AI) yksinkertaistamaan maailman toimintatapaa. Digitaalimaailma on osoittautunut pelinmuuttajaksi monille yrityksille, kun yhä enemmän tekniikkaa hyödyntävä väestö löytää uusia tapoja olla vuorovaikutuksessa verkossa toistensa ja yritysten kanssa. Sosiaalinen media on määritellyt uudelleen yhteisön merkityksen; kryptovaluutta on muuttanut digitaalisen maksun normaa; Verkkokauppa on luonut sanan mukavuus uuden merkityksen, ja pilvitallennus on ottanut massat käyttöön toisen tason tietojen säilyttämisestä.
AI: n kautta, kuten koneoppiminen ja syväoppiminen, avataan silmät kaikkien mahdollisuuksien maailmaan. Koneoppimista käytetään yhä enemmän data-analytiikassa isodatan ymmärtämiseksi. Sitä käytetään myös chatbotien ohjelmointiin simuloidakseen ihmisten keskusteluja asiakkaiden kanssa. Nämä koneoppimisen tulevaisuuden sovellukset eivät kuitenkaan olisi mahdollisia ilman luonnollisen kielen käsittelyä (NLP).
Kuinka NLP todella toimii?
NLP yhdistää AI: n laskennallisen kielitieteen ja tietotekniikan kanssa ihmisten tai luonnollisten kielten ja puheen käsittelyyn. Prosessi voidaan jakaa kolmeen osaan. NLP: n ensimmäinen tehtävä on ymmärtää tietokoneen vastaanottama luonnollinen kieli. Tietokone käyttää sisäänrakennettua tilastollista mallia suorittaakseen puheentunnistusrutiinin, joka muuntaa luonnollisen kielen ohjelmointikieleksi. Se tekee tämän jakamalla kuulemansa äskettäisen puheen pieniksi yksiköiksi ja vertaa sitten näitä yksiköitä edellisen puheen edellisiin yksiköihin. Tulos tai tulos tekstimuodossa määrittelevät tilastollisesti sanat ja lauseet, jotka todennäköisimmin sanottiin. Tätä ensimmäistä tehtävää kutsutaan puhe tekstiksi -prosessiin.
Seuraavaa tehtävää kutsutaan puhetta puhetta varten (POS) tai sanaryhmän yksilöintiä. Tämä prosessi tunnistaa sanat kielellisessä muodossaan substantiivien, verbien, adjektiivien, aikataulujen jne. Sanoista käyttämällä tietokoneeseen koodattua sanastosääntöä. Näiden kahden prosessin jälkeen tietokone todennäköisesti ymmärtää nyt käydyn puheen merkityksen.
Kolmas vaihe, jonka NLP suorittaa, on tekstistä puheeksi muuntaminen. Tässä vaiheessa tietokoneohjelmointikieli muunnetaan käyttäjän äänimuotoon tai tekstimuotoon. Esimerkiksi finanssiuutisten chatbotti, jolle esitetään kysymys, kuten ”Kuinka Google menee tänään?” Tarkistaa todennäköisesti online-rahoitussivustot Google-osakkeita varten ja voi päättää valita vastaukseksi vain tiedot, kuten hinnan ja määrän.
NLP yrittää tehdä tietokoneista älykkäitä tekemällä ihmiset uskomaan olevansa vuorovaikutuksessa toisen ihmisen kanssa. Turingin testissä, jonka Alan Turing ehdotti vuonna 1950, todetaan, että tietokone voi olla täysin älykäs, jos se osaa ajatella ja käydä keskustelua ihmisen tavoin, ilman että ihminen tietää, että hän keskustelee koneen kanssa. Toistaiseksi vain yksi tietokone on läpäissyt testin - chatbotin 13-vuotiaan pojan kanssa. Tämä ei tarkoita, että älykästä konetta on mahdoton rakentaa, mutta se tuo esiin vaikeudet, jotka liittyvät tietokoneen ajatteluun tai keskusteluun ihmisen tapaan. Koska sanoja voidaan käyttää erilaisissa yhteyksissä ja koneilla ei ole todellista elämänkokemusta, joka ihmisillä on kokonaisuuksien välittämiseksi ja kuvaamiseksi sanoina, voi kestää hetken, ennen kuin maailma voi kokonaan poistaa tietokoneohjelmointikielen.
