Text mining, eller automatisk tekstanalyse, er et nytt og spennende analysefelt, som har fått en oppblomstring i kjølvannet av Web 2.0 og sosiale medier. Text mining handler om å analysere og trekke ut innsikt fra tekstbasert kunde- og markedsinformasjon, enten fra internett i form av blogger og andre sosiale medier, eller fra fritekstsdata i bedrifters kundesystemer.
Gjennom analyser av prat om alt fra internettbutikkers kundeservice, et nylig lansert produkt, om politiske partier eller politiske tema kan markedsførere få en forståelse av hvilken posisjon bedriften eller partiet – og konkurrentene – har i markedet. eMinds avanserte analyser av samtaler i sosiale medier gjør det mulig å oppdage sammenhenger og tendenser som ofte først senere – om i det hele tatt – oppfanges av gallupbyråer og tradisjonelle markedsundersøkelser og meningsmålinger.
Som nevnt på eMinds blogg har vi samarbeidet med Telemarksforsking i evalueringen av Møre og Romsdals reiselivssatsing 2006-2010. Noen av hovedfunnene i evalueringen illustrerer hvilke innsikter man kan få gjennom avanserte analyser av innholdet i tusenvis av innlegg i sosiale medier:
- Møre og Romsdal er det norske fylket som oftest omtales i forbindelse med vandring.

- Nordland omtales mest når det prates om fiske. En interessant observasjon er at barnefamilier, camping og sommer omtales når man snakker om fiske.

- Nordland er vinneren når det gjelder padling. Samtidig prates det om sykling, dykking, fisking og vandring i forbindelse med padling.

Hele rapporten kan lastes ned fra Telemarksforsking. eMinds bidrag kan leses her, Kapittel 8 – Posisjon i sosiale medier.
Se flere eksemplene og les mer i eMinds blogginnlegg om analyser av Venstre og Sponheim i valgkampen foran Stortingsvalget 2009. Se også en analyse av NAVs kundeservice i dette blogginnlegget.
eMind benytter automatisk innsamling av “samtaler” fra sosiale medier, og bruker markedets mest avanserte verktøy til text mining, social network analysis og øvrige analyser, som gjør det mulig å påvise mønstre og sammenhenger i store mengder tekst gjennom automatisk analyse av innholdet. Både statistiske og lingvistiske algoritmer brukes i analysen (blant annet Natural Language Processing, Named Entity Recognition og linkanalyser).
Dag Petter Svendsen
