Mudanças entre as edições de "Gestão de Dados de Pesquisa"

De BrapciWiki
Ir para navegação Ir para pesquisar
 
(7 revisões intermediárias pelo mesmo usuário não estão sendo mostradas)
Linha 1: Linha 1:
 
==Tipos de dados de pesquisa==
 
==Tipos de dados de pesquisa==
* Documentos (texto, Word), planilhas, impressões
+
=== Standard office documents (RE3Data) ===
 +
text documents, spreadsheets, presentations
 +
* Documentos (texto, Word), planilhas, impressões  
 +
 
 +
=== Networkbased data (RE3Data) ===
 +
websites, email, chat history, etc.
 +
 
 +
=== Databases (RE3Data) ===
 +
DBASE, MS Access, Oracle, MySQL, etc.
 +
 
 +
=== Images (RE3Data) ===
 +
JPEG, JPEG2000, GIF, TIF, PNG, SVG, etc.
 +
* Fotografias, filmes, raios-x, negativos,
 +
=== Structured graphics (RE3Data) ===
 +
CAD, CAM, 3D, VRML, etc.
 +
=== Audiovisual (RE3Data) ===
 +
data WAVE, MP3, MP4, Flash, etc.
 +
* Áudio vídeo
 +
=== Scientific and statistical data formats (RE3Data) ===
 +
SPSS, FITS, GIS, etc.
 +
[[https://data.research.cornell.edu/content/tabular-data https://data.research.cornell.edu/content/tabular-data]]
 +
 
 +
=== Raw data (RE3Data) ===
 +
device specific output
 +
=== Plain text (RE3Data) ===
 +
TXT in various encodings
 +
=== Structured text (RE3Data) ===
 +
XML, SGML, etc.
 +
=== Archived data (RE3Data) ===
 +
ZIP, RAR, JAR, etc.
 +
=== Software applications (RE3Data) ===
 +
modelling tools, editors, IDE, compilers, etc.
 +
=== Source code (RE3Data) ===
 +
scripting, Java, C, C++, Fortran, etc.
 +
=== Configuration data (RE3Data) ===
 +
parameter settings, logs, library files
 +
=== Other -
 +
 
 
* Cadernos de laboratório, cadernos de campo, diários
 
* Cadernos de laboratório, cadernos de campo, diários
 
* Questionários, transcrições, livros de código
 
* Questionários, transcrições, livros de código
* Áudio vídeo
+
 
* Fotografias, filmes, raios-x, negativos,
+
 
 
* Proteína ou sequências genéticas
 
* Proteína ou sequências genéticas
 
* Espectro, dados do espectroscópio
 
* Espectro, dados do espectroscópio
Linha 30: Linha 67:
 
* Descompactado
 
* Descompactado
  
==Nome dos arquivos==
 
Os nomes dos arquivos devem refletir o conteúdo do arquivo e incluir informações suficientes para identificar exclusivamente o arquivo de dados. Os nomes dos arquivos podem conter informações como acrônimo do projeto, título do estudo, local, investigador, ano (s) do estudo, tipo de dados, número da versão e tipo de arquivo.
 
 
Ao escolher um nome de arquivo, verifique as limitações de gerenciamento de banco de dados sobre o comprimento do nome do arquivo e o uso de caracteres especiais. Além disso, em geral, os nomes em minúsculas dependem menos do software e da plataforma. Evite usar espaços e caracteres especiais em nomes de arquivo, caminhos de diretório e nomes de campo. Processamento automatizado, URLs e outros sistemas costumam usar espaços e caracteres especiais para analisar a sequência de texto. Em vez disso, considere o uso de sublinhado (_) ou travessões (-) para separar partes significativas dos nomes de arquivo. Evite $% ^ & # | : e semelhantes.
 
 
Se o controle de versão for desejado, uma string de data no nome do arquivo é recomendada para indicar a versão.
 
 
Um exemplo de um bom nome de arquivo de dados:
 
 
'''Sevilleta_LTER_NM_2001_NPP.csv'''
 
 
Sevilleta_LTER é o nome do projeto
 
* NM é a abreviatura de estado
 
* 2001 é o ano civil
 
* NPP representa dados de produtividade primária líquida
 
* csv significa o tipo de arquivo — variável separada por vírgula ASCII
 
 
==Melhores Práticas da disponibilização de dados de pesquisa==
 
* Citação de dados
 
* Armazenamento de dados e backup
 
* Formatos de arquivo
 
* Gerenciamento de arquivos
 
* Glossário de termos de gerenciamento de dados
 
* Guia para escrever um plano de gerenciamento de dados (DMP)
 
* Guia para escrever metadados do estilo "leia-me"
 
* Introdução aos direitos de propriedade intelectual na gestão de dados
 
* Metadados e dados descritivos
 
* Preparando dados FAIR para reutilização e reprodutibilidade
 
* Preparando dados tabulares para descrição e arquivamento
 
* Compartilhamento e arquivamento de dados
 
* Lista de verificação de envio para conjuntos de dados em eCommons
 
* Apoio a pesquisadores em Ciências da Vida
 
 
Referências
 
 
[[https://data.research.cornell.edu/content/best-practices https://data.research.cornell.edu/content/best-practices]]
 
  
[[https://www.ukri.org/wp-content/uploads/2020/10/UKRI-020920-GuidanceBestPracticeManagementResearchData.pdf]]
 
  
[https://old.dataone.org/best-practices/assign-descriptive-file-names DataCite]
+
Veja: [[Boas práticas de disponibilização de dados de pesquisa]]

Edição atual tal como às 13h41min de 20 de janeiro de 2022

Tipos de dados de pesquisa

Standard office documents (RE3Data)

text documents, spreadsheets, presentations

  • Documentos (texto, Word), planilhas, impressões

Networkbased data (RE3Data)

websites, email, chat history, etc.

Databases (RE3Data)

DBASE, MS Access, Oracle, MySQL, etc.

Images (RE3Data)

JPEG, JPEG2000, GIF, TIF, PNG, SVG, etc.

  • Fotografias, filmes, raios-x, negativos,

Structured graphics (RE3Data)

CAD, CAM, 3D, VRML, etc.

Audiovisual (RE3Data)

data WAVE, MP3, MP4, Flash, etc.

  • Áudio vídeo

Scientific and statistical data formats (RE3Data)

SPSS, FITS, GIS, etc.

[https://data.research.cornell.edu/content/tabular-data]

Raw data (RE3Data)

device specific output

Plain text (RE3Data)

TXT in various encodings

Structured text (RE3Data)

XML, SGML, etc.

Archived data (RE3Data)

ZIP, RAR, JAR, etc.

Software applications (RE3Data)

modelling tools, editors, IDE, compilers, etc.

Source code (RE3Data)

scripting, Java, C, C++, Fortran, etc.

Configuration data (RE3Data)

parameter settings, logs, library files

=== Other -

  • Cadernos de laboratório, cadernos de campo, diários
  • Questionários, transcrições, livros de código


  • Proteína ou sequências genéticas
  • Espectro, dados do espectroscópio
  • Respostas de teste
  • Slides, artefatos, espécimes, amostras
  • Coleção de objetos digitais adquiridos e gerados durante o processo de pesquisa
  • Conteúdo do banco de dados (vídeo, áudio, texto, imagens)
  • Modelos, algoritmos, scripts, código, software
  • Conteúdo de um aplicativo (entrada, saída, arquivos de log para software de análise, software de simulação, esquemas)
  • Metodologias e fluxos de trabalho
  • Procedimentos e protocolos operacionais padrão
  • Computadores e dispositivos de armazenamento de dados de computador
  • Compostos sintéticos
  • Organismos, linhas celulares, vírus, produtos celulares
  • Coordenadas clonadas, plantas animais

[[1]]

Formatos

Os formatos com maior probabilidade de serem acessíveis no futuro são:

  • Não proprietário
  • Padrão aberto e documentado
  • Uso comum pela comunidade de pesquisa
  • Representação padrão (ASCII, Unicode )
  • Não criptografado
  • Descompactado


Veja: Boas práticas de disponibilização de dados de pesquisa