Semantica italiana

Semantica, che cos'è? Rinviando per una risposta a questa domanda all'ottimo articolo pubblicato da Carlo in questo blog, mi preme qui sottolineare due aspetti critici per la reale applicazione delle tecnologie di navigazione semantica in contesti aziendali:

  1. La possibilità di estendere l'uso delle tecnologie semantiche dall'analisi dei siti web (internet, intranet) agli archivi documentali aziendali; infatti la conoscenza aziendale è codificata nei documenti molto più che nelle pagine web.
  2. La possibilità di disporre di strumenti semantici che lavorino con la lingua locale, nel nostro caso l'italiano; infatti le tecnologie semantiche sono fortemente sensibili alla lingua in cui sono espressi i concetti e l'applicazione di un motore pensato per l'inglese ad un contesto in italiano difficilmente darà risultati significativi.

La buona notizia è che OpenText ha annunciato per il proprio prodotto di analisi semantica OpenText Content Analytics (OTCA), frutto della recente acquisizione della società specializzata Nstein, una roadmap che colloca nella seconda metà del 2011 proprio queste due funzionalità:

  1. L'applicazione del motore OTCA sul Content Server e non più soli ai siti web
  2. L'estensione del motore OTCA in grado di estrarre concetti ed entità dai documenti in lingua italiana (terza lingua dopo i già disponibili inglese e tedesco)

Grazie a queste nuove funzioni, sarà possibile estendere le potenti capacità di gestione documentale di OpenText Content Server all'analisi semantica dei contenuti archiviati, che permetterà di scoprire i concetti utilizzati in azienda e le relazioni che li legano, modellando così la conoscenza ziendale ben oltre le normali funzioni di ricerca libera e categorizzazione manuale dei documenti.