Colecções de dados estruturados para aplicações de Inteligência Artificial.
O que Estamos a Construir
Na Xnewdata AI Portugal, desenvolvemos datasets em língua portuguesa capazes de responder às necessidades reais das aplicações de Inteligência Artificial. O nosso objectivo é oferecer dados de alta qualidade, com curadoria ética, rigor técnico e representatividade cultural.
Domínios Prioritários
Saúde
Dados clínicos e educativos anonimizados para apoiar projectos de IA em saúde pública, literacia em saúde e investigação biomédica.
Educação
Textos académicos, exercícios, resumos e conteúdos estruturados para EdTechs, tutores virtuais, avaliação automática e modelos educacionais.
Turismo e Cultura
Conteúdos narrativos, descritivos e históricos, assim como informação estruturada sobre património, eventos, territórios e experiências culturais — um domínio essencial para aplicações de IA dedicadas ao turismo, cultura e valorização da identidade portuguesa.
Jurídico
Jurisprudência, ementas e petições anonimizadas e organizadas por áreas do Direito, com estruturação adequada para modelos de análise e interpretação jurídica.
Áudio-Texto
Diálogos e monólogos transcritos em português europeu, brasileiro e variantes lusófonas, incluindo diversidade de sotaques, entoações e contextos culturais.
Futebol
Narrativas, estatísticas e conteúdos desportivos que cruzam cultura, emoção e linguagem — um laboratório criativo onde desporto e IA se encontram.
Como Trabalhamos
Curadoria Profunda — selecção, organização, anotação e validação humana contínua.
Metadados Ricos — cada dataset inclui contexto, origem, formato e critérios de qualidade.
Escalabilidade Modular — conjuntos segmentados, preparados para crescer via API e integráveis em pipelines de IA.
Responsabilidade Legal e Ética — conformidade com LGPD, GDPR, licenças abertas e princípios de Responsible AI.
Nota
Os datasets encontram-se em fase de estudo e prototipagem. Ainda não estão disponíveis para uso comercial.