Guia do Usuário: Processamento dos dados

O Objetivo do processamento dos dados é auxiliar os usuários a encontrar resultados mais exatos. Os dados originais do publicador não serão sobrescritos, uma vez que apenas os dados computados para melhorar e facilitar a funcionalidade de busca. O processamento é baseado na biblioteca narwhal-processor, da rede Canadensys.

Nome científico

O nome científico será processado utilizando uma biblioteca do eCat, uma ferramenta desenvolvida pelo GBIF. Quando possível, a autoria será separada do nome científico, e armazenada em um campo separado. O nome da espécie também será processado a partir do nome científico.

País

O país será processado utilizando a biblioteca gbif-parsers, do GBIF. O processamento irá tentar combinar o país com o nome oficial utilizando uma lista controlada. Esta lista também inclui os erros de digitação mais comuns.

Data

Os eventos de data são processados com uma combinação da biblioteca Canadensys e a biblioteca ThreeTen. O processamento tentará padronizar a data dividindo em ano/mês/dia para dar suporte a datas parciais.

Latitude/Longitude

Os campos decimallatitude/decimallongitude do DwC-A serão processados utilizando a biblioteca Canadensys. O processamento garante que as coordenadas sejam números válidos. O processo não irá validar as coordenadas contra outros campos do registro. Isto significa que um registro cujo ponto possui coordenadas que pertencem ao Brasil, mas o campo textual 'country' indique 'Colômbia', o registro permanecerá inalterado.

Sugestões, ideas e comentários são bem vindos.

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Guia do Usuário: Processamento dos dados

Nome científico

País

Data

Latitude/Longitude

Clone this wiki locally