Testuak aztertzeko tresna: KWIC

Key Word in Context edo KWIC teknika oso baliagarria hizkuntza-egitura baten erabileraren adibideak lortzeko testu-multzo (corpus) batean:

1. Hasteko, deskargatu karpeta honetako dokumentuak:
https://ikasgela-birtuala.ueu.eus/mod/folder/view.php?id=30701
Karpeta horretan 5 testu-zati dituzu, probak egiteko baino ez da izango.

2. Ondoren, joan Voyant Tools delakoaren webgunera: https://voyant-tools.org/
Bertan “upload” delako botoiari klik eginda deskargatu dituzun 5 testu-zatiak igotzen utziko dizu eta honelako zerbait aterako zaizu:

Voyant

Testu-multzoak aztertzeko tresna horretan eskuman eta azpikaldean, “CONTEXTS” dagoen atalean “hizkuntz*” idatziko dugu eta “hizkuntza”, “hizkuntzaren”, “hizkuntzak”, “hizkuntzen”… hitzak agertzen diren esaldiak erakutsiko dizkigu programak, baita nork (edo zein testutan) erabili duen adibide bakoitza, ezkerrean.

Nahi baduzu, beste proba batzuk ere egin ditzakezu. Voyant erabiltzen hasi nahi baduzu, hemen duzu gisa ofiziala: https://voyant-tools.org/docs/#!/guide/start; Horrez gain, tutorialak eta bestelako gidak ere aurkituko dituzue. Guk hauxe gomendatzen dizuegu: https://programminghistorian.org/es/lecciones/analisis-voyant-tools.

Testuak aztertzeko tresna: ANALHITZA

ANALHITZA norbere testuak edo testu-multzoak (corpusak) aztertzeko tresna erabilerraza da. Ez da ezer instalatu behar, ez da erabiltzailerik sortu behar. Webgune batera sartu eta klik batzuk eginez zure testuak aztertzen ditu.

Tresna hori eskoletan erabiltzeko diseinatuta dago; izan ere, tresnaren emaitza ez da formato “arraro” batean ematen, baizik eta kalkulu-orri batean. Beraz, emaitza deskargatu eta erabiltzaileak nahieran molda dezake, ondoren konparaketak egiteko, filtroak erabiltzeko edota datuen errepresentazio grafikoak egiteko.

ANALHITZAk euskarazko, gaztelaniazko edo ingeleseko testu batetik ondorengo informazio linguistikoa erauzten lagunduko dizu:

izenak, adjektiboak, aditzak, adberbioak…
pertsona-izenak, leku-izenak…
binakako, hirunakako eta launakako hitz-sekuentziak
… eta gehiago!

Testua fitxategi batean duzuna, hemen bertan kopiatuko duzuna edo web-orri batekoa izan daiteke, baina UTF8 kodeketan egon beharko du.
ANALHITZA erabiltzeko, sartu aztertu nahi duzun testua azpiko 3 aukera hauetakoren bat erabiliz, eta jarraian, testuaren hizkuntza aukeratu (euskara, gaztelania edo ingelesa). Apur bat itxaron ondoren, emaitzak Excel fitxategi batean jasoko dituzu. Horrela, emaitzak modu errazean moldatu ahal izango dituzu zure beharretara.

Fitxategia igo (txt formatuan) Sartu testua Url-a sartu

ANALHITZAk testua automatikoki prozesatzen du ixaKat (euskararako) eta Ixa pipes (gaztelania eta ingeleserako) hizkuntza prozesatzaileen kate modularrak erabiliz.
ANALHITZA, hizkuntza-teknologiak baliatuz, humanitateetako eta giza zientzietako ikertzaileei datu linguistiko fidagarriak eta erraz manipula daitezkeenak eskaintzeko helburuarekin diseinatu da. Hauetako arloren batean zure ikergaia definituta baduzu, testu-multzo bat eskura baduzu eta ANALHITZArekin aztertzeko interesa baduzu, idatzi eta lagunduko dizugu: mikel.iruskieta@ehu.eus
ANALHITZA erabiltzen baduzu zure ikerketaren batean, ondorengo lan honen aipamena egin zure lan akademikoan mesedez:
Otegi, A. Imaz, O. Díaz de Ilarraza, A. Iruskieta, M. Uria, L. 2017 ANALHITZA: a tool to extract linguistic information from large corpora in Humanities research. Procesamiento del Lenguaje Natural 58: 77-84.

Hizkuntza-teknologiak

Hizkuntzaren prozesamenduan oinarritutako edo erabiltzeko aplikazioei deritze pastedImage0hizkuntza-teknologiak.

Gaur egun Hezkuntzan edukiak sortzeko edota kudeatzeko teknologien erabilera edo aipamen handia bada ere, hizkuntzazko edukiak baliatzeko teknologiaren erabilera urria da oso. Zer dela-eta? Ondoko arrazoiak aipa daitezke:

  • Datuetan oinarrituriko ikerketa gutxi
  • Hurbilpen teorikoen eraginez
  • Diziplinen arteko lotura eskasa: pedagogia eta hizkuntzaren prozesamendua
  • Tresna batzuk erabiltzeko konplexutasuna edota kalitatea

Ikuspegi orokorra

Tresnak (I): testuak eta corpusak aztertzeko

Tresnak (II): testuen zuzenketa digitala

Tresnak (III): ulermena eta irakurmena lantzeko

Tresnak (IV): testu idatzien laburpenak