Conjuntos temáticos que representam a diversidade linguística e cultural lusófona.
O que é o Xnewdata Corpus
O Xnewdata Corpus reunirá repositórios, colecções e bases linguísticas especializadas em língua portuguesa, organizadas por temas, formatos, variantes e utilizações. É o espaço onde consolidamos e preservamos o património textual e multimodal da lusofonia, aplicando metodologias rigorosas de curadoria e qualidade.
Tipos de Colecções Previstas
Textos académicos e científicos
Conteúdos jurídicos segmentados por área e especialidade
Corpus orais representando sotaques, variantes e expressões regionais
Conteúdos culturais — literatura, história, artes e património documental
Dados multimodais — áudio, vídeo e imagem
Colecções temáticas — saúde, educação, desporto, sociedade, entre outras
Objectivo do Corpus
Garantir que a língua portuguesa é tratada com rigor, profundidade e diversidade, fornecendo uma base sólida para o avanço da Inteligência Artificial lusófona e para o desenvolvimento de modelos mais justos, representativos e culturalmente conscientes.