Artigo da ACM  Autonomously Semantifying Wikipedia. Artigo descreve uma estratégia para geração automática de conteudo semantico da web. Argumenta que isto é preciso ja que sem uma iniciativa do tipo tem-se um impasse: se tivesse mais conteudo semantico, mais aplicações seriam criadas. Não se tem conteudo semantico poque não ha aplicações.

O autor então descreve uma aplicação (KYLIN) que analisando o texto de artigos da wikipedia consegue extrair informações para compor automaticamente um infobox  que é um tipo de resumo de informações do texto.

Há muitas referências importantes. É utilizado um framework que consegue identificar sentenças em um texto livre (Opennlp). Há também muitas referências sobre inteligência artificial uma vez que a aplicação “aprende” conforme o volume de dados a melhorar a identificação das informações do infobox.

Embora o objetivo seja a automação, sem interação humana, há uma sugestão onde um agente com as funcionalidades deo KYLIN poderia atuar online, durante a edição ou criação de um artigo do wikipedia. Desta forma, o usuário poderia interagir a partir da análise e sugestões dadas;

Esta é originalmente o que havia pensando. Um editor online que ajudasse de forma menos intrusiva possível a criação de conteudo semântico a partir de um texto livre editado pelo usuário.

Anúncios