Brapci Bots
Índice
ROBOTi
Comandos de start
- startHarvesting - Inicia processo de colheita nas publicações
- check - realiza uma série de checagems nas tabelas de dados, concept e literal
- ontology - valida as ontologias dos dados
- clear - modifica todos os status das revistas para coletea
- testdb - testa conexão com o banco de dados
Bots da Brapci
- 000 - Atualiza o campo USE nas tabelas de conceito
- 001 - Realiza o Harvesting das publicacões OAI-PMH
- 002 - Realiza o GetRecord das publicações OAI-PMH
- 003 - Processa registro extraíndo metadados
- 004 - Identifica e process o Issue do trabalho
- 005 - Processa trabalho e incorpora na base
ISSUE
- 011 - ??
- 012 - ??
DATA
- 100 - Dados duplicados (excluí)
- 101 - Checa dados com ontologias invertidas
- 102 - Checa se os valores literais existem
- 103 - Classifica os dados conforme suas classes
ONTOLOGIAS
- 105 - Checa relações orfã (não finalizado)
- 110 - Checa se os classe dos dados estão de acordo com a ontologia
- 111 - Checa se dados não atendem a ontologia (-1) status (ERRO)
- 112- Força troca de classes para classes já conhecidas
- 113- Check idioma do título duplos
- 114- Check idioma do dos resumo e duplos
- 120 - Resumo das situação dos dados
LITERAL
- 140 - Checa dados literais duplicados (testa com de, da, dos, ...)
- 150 - Limpa espaços antes de ponto, virgula ....
- 151 - Checa e limpa caracteres especiais (&., ', ...)
- 152 - Checa se o nome não esta dobrado na entrada (ex: Rene Junior Rene Junior)
- 153 - Padroniza entrada de título dos trabalhos (Primeira maiúscula) - ## Validar regras de nomes próprios
- 154 - Checa dados fora do UTF8 (aperfeiçoar)
- 156 - Limpa valores literais de caracteres especiais e ponto no final em Assuntos
- 157 - Alterar todos os dados com status (-1) para serem revalidados
CITED
- 160 - Extrai dados de citação dos dados e envia para tabela de cited (/*ref*/)
AUTHOR
- 200 - Checa nomes duplicados de autor
- 201 - Checa remissivas infinitas, ou triplas
- 202 - Checa e atualiza remissivas
SUBJECT
- 210 - Checa assuntos repetidos
- 211 - Checa remissivas
DATASET
- 220 - Checa trabalhos duplicados
- 230 - Altera a class de Article para Proceeding em trabalhos de eventos
- 231 - Marca trabalhos da revistas PBCI da seção resumo sem PDF