Otimização dos processos de indexação dos documentos e de recuperação da informação mediante o uso de instrumentos de controle terminológico. | Ciência da Informação, v. 11, n. 1, 1982 | 1982 - Brapci
Ciência da Informação, v. 11, n. 1, 1982

Otimização dos processos de indexação dos documentos e de recuperação da informação mediante o uso de instrumentos de controle terminológico.

Resumo: Em qualquer área do conhecimento, os termos portadores de significado podem ser utilizados como descritores para representar o conteúdo dos documentos escritos, nos processos de indexação e organização da informação, assim como para formular as perguntas no processo de recuperação da informação. Quando ordenados em função de sua freqüência de uso, os descri tores apresentam uma distribuição que obedece à lei de Bradford-Zipf. A aplicação das facilidades do processamento eletrônico de dados ajuda grandemente a estabelecer, para áreas específicas do conhecimento, instrumentos de controle terminológico, que permitem otimizar os processos de indexação e recuperação dos documentos, utilizando os termos e as associações entre estes que se destacam por sua riqueza de significado, para representar conceitos determinados. Foram estudados dois universos de termos significativos correspondentes a duas áreas diferentes do conhecimento (agricultura e política científica e tecnológica), resultantes da análise do conteúdo de conjuntos suficientemente grandes de documentos, indexados segundo princípios não subjetivos: indexação automática no primeiro caso e indexação automática simulada no segundo. Desse estudo resultam, para cada caso, listas de descritores estabelecidas a partir de suas respectivas freqüências de aparecimento e da aplicação de determinados conceitos de sinonímia e quase-sinonímia, que devem contribuir para otimizar os processos de indexação e recuperação da informação, tanto em sistemas manuais como automatizados. As conclusões estabelecidas no que diz respeito à otimização de indexação parecem confirmadas a partir dos conceitos da teoria da informação.DescritoresIndexação. Controle terminológico.Recuperação da informação.AbstractIn any área of knowledge, the meaning-carrier terms may be used as descriptors to represent the content of the written documents in the indexing and Information organizing processes, as well as to formulate the queries in the information retrieval process. When ranged in function of their frequence of use, the descriptors show a distribution which follows the Bradford-Zipfs law. The data processing facilities may be of great support to prepare, in specif ic áreas of knowledge, Instruments for terminology contrai which enable ones the optimization of the document indexing and retrieval processes by using, to represent specific concepts, the terms and their associations which stand out for their richness in meaning. Two groups of significant terms were studied, corresponding to two different áreas of knowledge (agriculture and scientific and technologic policy), resulting from the contents analysis of sufficiently large sets of documents, indexed according to non-subjective principies: automatic indexing in the first case and simulated automatic indexing in the second. In each case, with basis on their respective occurrences and on the application of synonymy and quasi-synonymy concepts, lists of descriptors were established, which must contribute to optimize the indexing and information retrieval processes, both in manual and automatic systems. The established findings concerning indexing optimization seem confirmed by the information theory concepts.
Palavras-chave: Ciência da informação Indexação Controle terminológico Recuperação da informação
Mots clés:


ROBREDO, J. Otimização dos processos de indexação dos documentos e de recuperação da informação mediante o uso de instrumentos de controle terminológico. Ciência da Informação, v. 11, n. 1, 1982.
ROBREDO JR. Otimização dos processos de indexação dos documentos e de recuperação da informação mediante o uso de instrumentos de controle terminológico. Ciência da informação. 1982;11(1).
ROBREDO, J. (1982). Otimização dos processos de indexação dos documentos e de recuperação da informação mediante o uso de instrumentos de controle terminológico. Ciência da informação; 11(1).
Dados complementares
Informações

Conteúdo relacionado às informações.

References

  • INCUBAÇÃO PROSPECÇÃO  none0 
  • PROTECAO-CONTRA-VENTO-FRIO MELHORAMENTO-DE-PROTEINA  none0 
  • MECANIZACAO-DA-CAFEICULTURA HYPOTHENEMUS-HANIPEI  none0 
  • INDICATRIS LATOSSOLO-ROXO  none0 
  • MOLUSCO PRODUTOS-NATURAIS ^^  none0 
  • LAMBARI HYMENEA-SP  none0 
  • MASSONIANA - KHASYA - CARIBEAE LESAO-HEPATICA-AGUDA  none0 
  • ITALICA-PLENCK MAGNIFICA-WALKER  none0 
  • GALACTIASTRIATA MATA-DE-DOIS-IRMAOS  none0 
  • MATA-DE-PERNAMBUCO MATA-SERTAO-CENTRAL  none0 
  • FUSARIOSE DO ABACAXI LAEVIGAIA  none0 
  • HYMENEOPTERA LIMAO-SILICIANO  none0 
  • GAFANHOTO _ _  none0 
  • MATERIA-GORDA MACA-HELIOTHIS- SPP  none0 
  • HUMUS-MU-80  none0 
  • MATERIA-SECA JABUTICABEIRO  none0 
  • MATERIAL-GENETICO FUSARIUMSOLANI  none0 
  • HEMILINS HEMOGLUTINA projetos de pesquisa agrícola, arranjados em ordem sequencial decrescente de ocorrências.  none0 
  • CNPQ CIENCIA-E-TECNOLOGIA  none0 
  • PESQUISA RECURSOS-HUMANOS  none0 
  • PROGRAMA DESENVOLVIMENTO-CIENTIFICO  none0 
  • II-PBDCT DESENVOLVIMENTO-TECNOLOGICO  none0 
  • INSTITUICAO-DE-PESQUISA PROJETO  none0 
  • POS-GRADUACAO TECNOLOGIA  none0 
  • SOCIOLOGIA TECNOLOGIA-MINERAL  none0 
  • ADMINISTRAÇÃO ÁLCOOL  none0 
  • BOLSA-DE-AUXILIO PROJETO-FLORA-SUDESTE  none0 
  • PROJETO-FLORA-SUL PROJETO-RADAM  none0 
  • PROJETO-SERTANEJO PRONAPESA  none0 
  • PROTEC-RH PSICOLOGIA  none0 
  • QUIMICA-ANALITICA QUIMICA-INORGANICA  none0 
  • QUIMICA-ORGANICA RADIOLOGIA  none0 
  • XILOTECA XINGU  none0 
  • —^^^^ ´_ no processo de indexação de documentos referentes a política científica e tcnológica, arranjados em ordem sequencial decrescente de ocorrências. Ci. Inf., Brasília, 11(1): 3-18, 1982. Otimização dos processos de indexação dos documentos e de recuperação da informação mediante o uso de instrumentos de controle ter m i no lógico.  none0 
  • APARECEM COM __ _i^__0065^—^0002^^—^ v__. — • • — -^ >2706".  none0 
  • ^.^__0214-^  none0 
  • <.07164 ^  none0 
  • "-descritores identificados no processo de indexação automática de títulos de projetos de pesquisa agrícola, que ocorrem com uma determinada acumulado de ocorrências Ci. Inf., Brasília, 11(1): 3-18, 1982. Otimizaçâo dos processos de indexação dos documentos e de recuperação da informação mediante o uso de instrumentos de controle terminológico.  none0 
  • APARECEM COM ´ j descritores identificados no processo de indexação de tecnológica, que ocorrem com uma determinada acumulado de ocorrências. Ci. Inf., Brasília, 11(1): 3-18, 1982. Otimização dos processos de indexação dos documentos e de recuperação da informação mediante o uso de instrumentos de controle terminológico. Representação da variação do número de ocorrências identificados no processo de indexação de tecnológica. Ci. lnf., Brasília, 11(1): 3-18, 1982.  none0 
  • + total de ocorrências dos termos de facetas - 29000 = 40%(valor médio = 20%). No caso dos documentos sobre política científica e tecnológica: Total de ocorrências de todos os termos 9400(valor médio ~= 50%)Isso confirma a conclusão anterior de que o melhor grau de informação se obteria usando uma combinação de descritores de facetas e de descritores pontuais. Por outro lado, o fato de ser a redundância do vocabulário utilizado para indexar os documentos sobre política científica e tecnológica menor do que a redundância do vocabulário agrícola pode explicar-se perfeitamente considerando que, ao ser no primeiro caso o escopo muito mais abrangente(interdisciplinaridade), a quantidade de descritores pontuais (baixa freqüência de uso) é relativamente muito mais elevada e, conseqüentemente, maior o poder informativo (especificidade) da maior parte dos termos.  none0 
  • LIMA, E. & MAIA, S. Comportamento bibliométrico da língua portuguesa, como veículo de representação da informação. Ci. Inf., 2 (2): 99-138, 1974.2 ZIPF, G.K.. The psycho-biology of language; an introduction to dynamic phylology. Cambridge, Mass., MIT Press, 1965. 336 p. Total de ocorrências de termos pontuais  none0 
  • + total de ocorrências de termos de facetas = 7500 = 73%  none0 
  • BIBLIOGRÁFICAS The psycho-biology of language. Boston, Houghton Mifflin, 1935.  none0 
  • GOFFMAN, W. A general theory of communication. In: SARACEVIC, T. Introduction to information Science. New York, Bowker, 1970. p. 726-47.5 BOOTH, A. D. A "law" of occurrences for words of low frequency. Information and Contrai, 10(4): 386-93, 1967.  book 
  • ROBREDO, J. et alii. Elaboracíón de un thesaurus agrícola basado en critérios de eficiência dei lenguaje en ei proceso de comunicación. Brasília, SNIDA, 1975. 23p. Comunicação apresentada no 5. World Congress l. A. A. L. D., México, 14 a 18 de abril, 1975. Construção de um núcleo de thesaurus em agricultura baseado no uso real dos descritores. Brasília, SNIDA, 1975. 15p. Preprint. Comunicação apresentada na 1. Reunião Brasileira de Ciência da Informação. Rio de Janeiro, 15 a 20 de junho de 1975.  none0 
  • BROOKES, B.C. Bradford´s law and the bibliography of Science. Nature, 224: 453-956, 1969.  book 
  • AGRADECIMENTOS Agradecemos a Luis Antônio Gonçalves da Silva, Chefe do Centro de Informação sobre Política Ci. Inf., Brasília, 11(1): 3-18, 1982. Otimização dos processos de indexação dos documentos e de recuperação da informação mediante o uso de instrumentos de controle terminológico.9 ROBREDO J. Estudo das leis que governam as associações entre descritores, com vistas à utilização de vocabulários simplificados e à otimização dos processos de indexação e recuperação. Brasília, BIB/FUB, 1980. 6p., anexos (BIB/PROJ/PESQ/80/02). Exemplar datilografado (difusão limitada).10 — Estudo das possibilidades de otimização da recuperação da informação a partir da racionalização do processo de indexação dos documentos. Brasília, BIB/FUB, 1980. 5p., anexos (BIB/PROJ/PESQ/80/02 (02)). Exemplar datilografado (difusão limitada). Projeto desenvolvido com auxílio do Conselho Nacional de Desenvolvimento Científico e Tecnológico.11 CONSELHO NACIONAL DE  none0 
  • DESENVOLVIMENTO CIENTIFICO E TECNOLÓGICO. Projeto de Implementação do Programa de Informação sobre Política Científica e Tecnológica. Brasília, CNPq, 1980.(difusão limitada).12 ROBREDO, J.; SILVA, L.A.G. da. Estabelecimento de instrumentos de controle terminológico em áreas específicas do conhecimento. Brasília, BIB/FUB, 1981. 24p. Preprint. Comunicação apresentada na 33. Reunião Anual da Sociedade Brasileira para o Progresso da Ciência. Salvador, Ba. 8-15 de julho de 1981. Publicada também em: CIÊNCIA E CULTURA (Suplemento), 3 (7): 188, 1981 (Resumos da 33. Reunião Anual da  none0 
  • SBPC).13 ROBREDO, J.; FERREIRA, J.A. de P. Conceituação de um programa para indexação automática de textos. R. Bibliotecon, Brasília, 8 (2): 254-63, 1980.14 GUIA BRASILEIRO DE PESQUISA AGRÍCOLA  none0 
  • EM ANDAMENTO. Brasília, BINAGRI, 1978/79. v.1 — Cadastro de instituições e pesquisadores, 262 p; v.2 — índice Geral, Partes l-111, fndice de assuntos, 2712 p.; Parte  none0 
  • IV, Índice de instituições, pesquisadores, projetos novos e terminados, p. 2713-3352; Parte V, Listagem de referência dos projetos, p. 3353-3798.15 ROBREDO, J. A indexação automática como mecanismo básico no processo de transferência de informação. Brasília, BIB/FUB, 1980. 20p. Preprint. Comunicação apresentada no 1º Congresso Latino-Americano de Biblioteconomia e Documentação, Salvador, Ba, 21 - 26 de setembro de 1980.  none0 
  • A indexação automática de textos: o presente já entrou no futuro. In: MACHADO, U. D., ed. Estudos avançados em Biblioteconomia e Ciência da Informação. Brasília, Associação dos Bibliotecários do Distrito Federal, 1982. v.1, p. 236-74.17 MOLES, A. Teoria da informação e percepção estética. 2. ed. Rio de Janeiro, Tempo Brasileiro, Brasíia, Editora Universidade de Brasília, 1978. 308 p. (Biblioteca Tempo Universitário, 14). Tradução de Théorie de1´information et perception esthétique. Paris, Flammarion, 1968. Obra fundamental; a composição tipográfica descuidada altera a inteligibilidade da parte matemática.18 SHANNON, C. E. &WEAWER, W. The mathematical theory of communication. Urbana, 111., University of Illinois Press, 1949. 117 p.19 GUILBAUD, T. La cybernétique. Paris, Presses Universitaires de France, 1954. 136 p. (Que sais-je?, 638).  none0 
  • ABELHA-AFRICANA ABELHA-URUCU  none0 
  • ABELMOCHUS-ESCULENTUS ABELMOCHUS - ESCULENTUS- MOENCH  none0 
  • ABÓBORA ABOBOREIRA-CURBITA-MOSCHATA  none0 
  • ABOBRINHA LYCUPERSIUM-ESCULENTUM-MILL  none0 
  • MABEA MAÇA  none0 
  • MACA-DAMIA-INTEGRAFOLIA MACA-DO-ALGODOEIRO  none0 
  • MACA-HELIOTHIS-SPP MACADEMlA  none0 
  • MACADEMIA-INTEGRIFOLIA MACAPA-OIAPOQUE  none0 
  • MACARRÃO MACASSAR  none0 
  • MACHADO MACHO  none0 
  • MACHO-CASTRADO ABACATE  none0 
  • ABACATEIRO ABACAXI  none0 
  • ABACAXICULTURA ABACAXIZEIRO  none0 
  • ABACAXIZEIRO-CAYENNE ABASTECIMENTO-DE-AGUA  none0 
  • ABATE ABELHA  none0 
  • ABNT ACADEMIA-BRASILEIRA-DE-CIENCIAS 001  none0 
  • AÇAO-GOVERNAMENTAL AÇAO-PROGRAMADA  none0 
  • ACERVO AÇO  none0 
  • ACOMPANHAMENTO ACOMPANHAMENTO-FINANCEtRO  none0 
  • LICOPODIACEA-DO-DEVONIANO LIDERANÇA-PARTIDARIA  none0 
  • LINGÜÍSTICA LINHA-DE-PESQUISA  none0 
  • LINHITO LISTA-DE-PARTICIPANTES  none0 
  • LISTAGEM LISTAGEM-DE-PROJETO  none0 
  • LITERATURA-CIENTIFICA UNIDO  none0 
  • UNITAR UNIVERSIDADE  none0 
  • URBANISMO URBANIZAÇÃO  none0 
  • URUCUIA URUGUAI  none0 
  • USINA-DE-ETANOL ZONA-FRANCA  none0 
  • ZOONOSE ••—-•—  none0 
  • XYLEBORUS YORKSHIRE  none0 
  • ZANGAO ZEBU  none0 
  • ZEBU-BRANCO ZEBUINO  none0 
  • ZERANOL ZIRCONIO  none0 
  • ZONA ZONA-ALGODOEIRA  none0 
  • ZONA-CLIMATICA ZONA-DA-MATA  none0 
  • ZONEAMENTO ZONEAMENTO-AGRICOLA  none0 
  • ZONEAMENTO-AGROCLIMATICO ZONEAMENTO-ECOLOGICO  none0 
  • ZOOGEOGRAFIA ZOOPLANCTON  none0 
  • ZOOSANIDADE ZULIA-ENTRERIANA  none0 
  • ZULIA-ENTRERIANA-BERG projetos de pesquisa agrícola, ordenados aparecimento. no processo de indexação de documentos referentes a política científica e tecnológica, ordenados aparecimento. Ci. Inf., Brasília, 11(1): 3-18, 1982. Otimizaçao dos processos de indexação dos documentos e de recuperação da informação mediante o uso de instrumentos de controle terminológico.  none0 
  • PRODUÇÃO SOLO  none0 
  • MELHORAMENTO CULTURA  none0 
  • BOVINO CULTIVAR  none0 
  • CONTROLE AVALIAÇÃO  none0 
  • FRUTO SOJA  none0 
  • SEMENTE MILHO  none0 
  • ECONOMIA ADUBACAO  none0 
  • PLANTA MICROCLIMA  none0 
  • MICROBIOLOGIA-DO-SOLO LATICÍNIO  none0 
Dados explicitados em RDF do trabalho
CategoryDetails
dateOfAvailability1982-06-30: 17725
hasAuthorJaime Robredo: (5545)
hasFileStorage_repository/00/02/06/07/work_00020607#00000.pdf: (54973)
hasSectionOfEspecial: 153
hasSectionOfArtigo: 3
hasSubjectCiência da informação: 237157
hasSubjectIndexação: 261658
hasSubjectControle terminológico: 177160
hasSubjectRecuperação da informação: 261956
wasPublicationInDate1982-06-30: (270412)
hasLanguageExpressionpt: (232736)
hasLicenseRESERVERD: (234643)
isPartOfSourceCiência da informação: 146
hasIssueOfISSUE:JNL:00010-1982-11-1: 17721
hasAbstractEm qualquer área do conhecimento, os termos portadores de significado podem ser utilizados como descritores para representar o conteúdo dos documentos escritos, nos processos de indexação e organização da informação, assim como para formular as perguntas no processo de recuperação da informação. Quando ordenados em função de sua freqüência de uso, os descri tores apresentam uma distribuição que obedece à lei de Bradford-Zipf. A aplicação das facilidades do processamento eletrônico de dados ajuda grandemente a estabelecer, para áreas específicas do conhecimento, instrumentos de controle terminológico, que permitem otimizar os processos de indexação e recuperação dos documentos, utilizando os termos e as associações entre estes que se destacam por sua riqueza de significado, para representar conceitos determinados. Foram estudados dois universos de termos significativos correspondentes a duas áreas diferentes do conhecimento (agricultura e política científica e tecnológica), resultantes da análise do conteúdo de conjuntos suficientemente grandes de documentos, indexados segundo princípios não subjetivos: indexação automática no primeiro caso e indexação automática simulada no segundo. Desse estudo resultam, para cada caso, listas de descritores estabelecidas a partir de suas respectivas freqüências de aparecimento e da aplicação de determinados conceitos de sinonímia e quase-sinonímia, que devem contribuir para otimizar os processos de indexação e recuperação da informação, tanto em sistemas manuais como automatizados. As conclusões estabelecidas no que diz respeito à otimização de indexação parecem confirmadas a partir dos conceitos da teoria da informação.DescritoresIndexação. Controle terminológico.Recuperação da informação.AbstractIn any área of knowledge, the meaning-carrier terms may be used as descriptors to represent the content of the written documents in the indexing and Information organizing processes, as well as to formulate the queries in the information retrieval process. When ranged in function of their frequence of use, the descriptors show a distribution which follows the Bradford-Zipfs law. The data processing facilities may be of great support to prepare, in specif ic áreas of knowledge, Instruments for terminology contrai which enable ones the optimization of the document indexing and retrieval processes by using, to represent specific concepts, the terms and their associations which stand out for their richness in meaning. Two groups of significant terms were studied, corresponding to two different áreas of knowledge (agriculture and scientific and technologic policy), resulting from the contents analysis of sufficiently large sets of documents, indexed according to non-subjective principies: automatic indexing in the first case and simulated automatic indexing in the second. In each case, with basis on their respective occurrences and on the application of synonymy and quasi-synonymy concepts, lists of descriptors were established, which must contribute to optimize the indexing and information retrieval processes, both in manual and automatic systems. The established findings concerning indexing optimization seem confirmed by the information theory concepts.: 0
hasIDoai:ojs.revista.ibict.br:article/175
hasRegisterIdhttp://revista.ibict.br/ciinf/article/view/175: 0
hasRegisterId10.18225/ci.inf..v11i1.175: 0
hasSource1518-8353
hasTitleOtimização dos processos de indexação dos documentos e de recuperação da informação mediante o uso de instrumentos de controle terminológico.: 0
hasUrlhttps://revista.ibict.br/ciinf/article/view/175
hasUrlhttps://revista.ibict.br/ciinf/article/view/175/175
prefLabelOai:ojs.revista.ibict.br:article/175#00010: 0
hasDOI10.18225/ci.inf.v11i1.175
hasDOI10.18225/ci.inf.v11i1.175.g175
Classe: Article