Prospectiva blog

2005eko otsailaren 10a, osteguna

eu Berriak

Testuen Trataera Automatikoaren Aplikazioak eta estandarrak

Hizkuntza Teknologiak. Liburu zuria (III)

Aplikazioak

Testuen Trataera Automatikoaren teknologiari sarreratxoa eskaintzen dio Le traitement automatique des langues dans les industries de l'information Liburu Zuriak eta, adibide moduan, Testuen Trataera Automatikoaren zenbait aplikazio zehatzak aipatzen ditu.

Besteak beste, honako hauek:

  • Zelata estrategikoa
  • Zelata adimen ekonomikoan
  • Web Atariak
  • Sailkapen Automatikoa
  • Patente kudeaketa
  • E-merkataritza
  • Enpresa Terminologia
  • Lan eskaintzen kudeaketa
  • Bilaketa motoreak

Testuen trataera automatikoaren aplikazioak aurrerakuntza eta errentagarritasun handia eskein diezaizkiete, beste beste, arlo hauei.

Estandarrak

Datuen trataeran estandarrak erabiltzean dago gakoetariko bat. Hau da, behar beharrezkoa da trukaketa eta interoperabilitatea arlo ezberdinetan:

  • datu testualetan
  • hizkuntz errekurtsoetan eta terminologietan
  • meta data delakoetan

Ikerketaren arabera, de facto-ko estandarrak lortu ez direnez, soluzioa de jure-ko estandarrak definitzean dago.

ISO-k Hizkuntzaren Trataera Automarikoari zuzendutako arau familia definitu du, ISO-TC37-ren barnean. Bi mailatan:

  • Maila bajuko arau edo norma batzuk: hizkuntz kodeak (ISO-639), script kodeak (ISO-15924), lurralde kodeak (ISO-3166), Unicode karaketeren kodeaketarako, etabar
  • Maila altuko arau edo normak, askoz ere egiturauak: TMF (Terminological Markup Framework ISO-16642), enpresas terminologiei buruz elebakarrak edo eleanitzak; LMF (Lexical Markup Framework ISO-24613), hiztegiak hartzen ditu neurria handian; eta MAF (Morpho-syntactic Annotation Framework ISO-24611) Korpusen anotazioei buruz.

Hirurak XML lengoaian definituak daude, beraz interoperatibitate handia eskeintzen dute.

Enviado por: Eneko Astigarraga. 07:46 | Permalink | Comentarios (0)

Comentarios

No hay comentarios.

Responder con un comentario







2+3 en letra y en minuscula