ANALHITZA norbere testuak edo testu-multzoak (corpusak) aztertzeko tresna erabilerraza da. Ez da ezer instalatu behar, ez da erabiltzailerik sortu behar. Webgune batera sartu eta klik batzuk eginez zure testuak aztertzen ditu.
Tresna hori eskoletan erabiltzeko diseinatuta dago; izan ere, tresnaren emaitza ez da formato “arraro” batean ematen, baizik eta kalkulu-orri batean. Beraz, emaitza deskargatu eta erabiltzaileak nahieran molda dezake, ondoren konparaketak egiteko, filtroak erabiltzeko edota datuen errepresentazio grafikoak egiteko.
ANALHITZAk euskarazko, gaztelaniazko edo ingeleseko testu batetik ondorengo informazio linguistikoa erauzten lagunduko dizu:
izenak, adjektiboak, aditzak, adberbioak…
pertsona-izenak, leku-izenak…
binakako, hirunakako eta launakako hitz-sekuentziak
… eta gehiago!
Testua fitxategi batean duzuna, hemen bertan kopiatuko duzuna edo web-orri batekoa izan daiteke, baina UTF8 kodeketan egon beharko du.
ANALHITZA erabiltzeko, sartu aztertu nahi duzun testua azpiko 3 aukera hauetakoren bat erabiliz, eta jarraian, testuaren hizkuntza aukeratu (euskara, gaztelania edo ingelesa). Apur bat itxaron ondoren, emaitzak Excel fitxategi batean jasoko dituzu. Horrela, emaitzak modu errazean moldatu ahal izango dituzu zure beharretara.
Fitxategia igo (txt formatuan) Sartu testua Url-a sartu
ANALHITZAk testua automatikoki prozesatzen du ixaKat (euskararako) eta Ixa pipes (gaztelania eta ingeleserako) hizkuntza prozesatzaileen kate modularrak erabiliz.
ANALHITZA, hizkuntza-teknologiak baliatuz, humanitateetako eta giza zientzietako ikertzaileei datu linguistiko fidagarriak eta erraz manipula daitezkeenak eskaintzeko helburuarekin diseinatu da. Hauetako arloren batean zure ikergaia definituta baduzu, testu-multzo bat eskura baduzu eta ANALHITZArekin aztertzeko interesa baduzu, idatzi eta lagunduko dizugu: mikel.iruskieta@ehu.eus
ANALHITZA erabiltzen baduzu zure ikerketaren batean, ondorengo lan honen aipamena egin zure lan akademikoan mesedez:
Otegi, A. Imaz, O. Díaz de Ilarraza, A. Iruskieta, M. Uria, L. 2017 ANALHITZA: a tool to extract linguistic information from large corpora in Humanities research. Procesamiento del Lenguaje Natural 58: 77-84.
Erantzun bat “Testuak aztertzeko tresna: ANALHITZA” sarreran