Brapci Bots

De BrapciWiki
Revisão de 13h18min de 3 de julho de 2024 por Renefgj (discussão | contribs) (→‎ONTOLOGIAS)
(dif) ← Edição anterior | Revisão atual (dif) | Versão posterior → (dif)
Ir para navegação Ir para pesquisar

ROBOTi

Comandos de start

  • startHarvesting - Inicia processo de colheita nas publicações
  • check - realiza uma série de checagems nas tabelas de dados, concept e literal
  • ontology - valida as ontologias dos dados
  • clear - modifica todos os status das revistas para coletea
  • testdb - testa conexão com o banco de dados

Bots da Brapci

  • 000 - Atualiza o campo USE nas tabelas de conceito
  • 001 - Realiza o Harvesting das publicacões OAI-PMH
  • 002 - Realiza o GetRecord das publicações OAI-PMH
  • 003 - Processa registro extraíndo metadados
  • 004 - Identifica e process o Issue do trabalho
  • 005 - Processa trabalho e incorpora na base

ISSUE

  • 011 - ??
  • 012 - ??

DATA

  • 100 - Dados duplicados (excluí)
  • 101 - Checa dados com ontologias invertidas
  • 102 - Checa se os valores literais existem
  • 103 - Classifica os dados conforme suas classes

ONTOLOGIAS

  • 105 - Checa relações orfã (não finalizado)
  • 110 - Checa se os classe dos dados estão de acordo com a ontologia
  • 111 - Checa se dados não atendem a ontologia (-1) status (ERRO)
  • 112- Força troca de classes para classes já conhecidas
  • 113- Check idioma do título duplos
  • 114- Check idioma do dos resumo e duplos
  • 120 - Resumo das situação dos dados

LITERAL

  • 140 - Checa dados literais duplicados (testa com de, da, dos, ...)
  • 150 - Limpa espaços antes de ponto, virgula ....
  • 151 - Checa e limpa caracteres especiais (&amp., ', ...)
  • 152 - Checa se o nome não esta dobrado na entrada (ex: Rene Junior Rene Junior)
  • 153 - Padroniza entrada de título dos trabalhos (Primeira maiúscula) - ## Validar regras de nomes próprios
  • 154 - Checa dados fora do UTF8 (aperfeiçoar)
  • 156 - Limpa valores literais de caracteres especiais e ponto no final em Assuntos
  • 157 - Alterar todos os dados com status (-1) para serem revalidados

CITED

  • 160 - Extrai dados de citação dos dados e envia para tabela de cited (/*ref*/)

AUTHOR

  • 200 - Checa nomes duplicados de autor
  • 201 - Checa remissivas infinitas, ou triplas
  • 202 - Checa e atualiza remissivas

SUBJECT

  • 210 - Checa assuntos repetidos
  • 211 - Checa remissivas

DATASET

  • 220 - Checa trabalhos duplicados
  • 230 - Altera a class de Article para Proceeding em trabalhos de eventos
  • 231 - Marca trabalhos da revistas PBCI da seção resumo sem PDF