-
Notifications
You must be signed in to change notification settings - Fork 0
Guia do Usuário: Processamento dos dados
O Objetivo do processamento dos dados é auxiliar os usuários a encontrar resultados mais exatos. Os dados originais do publicador não serão sobrescritos, uma vez que apenas os dados computados para melhorar e facilitar a funcionalidade de busca. O processamento é baseado na biblioteca narwhal-processor, da rede Canadensys.
O nome científico será processado utilizando uma biblioteca do eCat, uma ferramenta desenvolvida pelo GBIF. Quando possível, a autoria será separada do nome científico, e armazenada em um campo separado. O nome da espécie também será processado a partir do nome científico.
O país será processado utilizando a biblioteca gbif-parsers, do GBIF. O processamento irá tentar combinar o país com o nome oficial utilizando uma lista controlada. Esta lista também inclui os erros de digitação mais comuns.
Os eventos de data são processados com uma combinação da biblioteca Canadensys e a biblioteca ThreeTen. O processamento tentará padronizar a data dividindo em ano/mês/dia para dar suporte a datas parciais.
Os campos decimallatitude/decimallongitude do DwC-A serão processados utilizando a biblioteca Canadensys. O processamento garante que as coordenadas sejam números válidos. O processo não irá validar as coordenadas contra outros campos do registro. Isto significa que um registro cujo ponto possui coordenadas que pertencem ao Brasil, mas o campo textual 'country' indique 'Colômbia', o registro permanecerá inalterado.
Sugestões, ideas e comentários são bem vindos.