SciELO - Scientific Electronic Library Online

 
vol.55 issue2 author indexsubject indexarticles search
Home Pagealphabetic serial listing  

Services on Demand

Journal

Article

Indicators

    Related links

    • On index processCited by Google
    • Have no similar articlesSimilars in SciELO

    Share


    Ciência e Cultura

    Print version ISSN 0009-6725On-line version ISSN 2317-6660

    Cienc. Cult. vol.55 no.2 São Paulo Apr./June 2003

     

     

    INFORMÁTICA PARA BIODIVERSIDADE: PADRÕES, PROTOCOLOS E FERRAMENTAS

    Vanderlei Perez Canhos

     

    A situação da biodiversidade neste início de século XXI pode ser caracterizada pela combinação de processos acelerados de destruição de ecossistemas primários associados a esforços mobilizadores para a conservação e uso sustentável da biodiversidade e de grandes avanços em tecnologia de informação e comunicação de dados. Esta combinação de fatores está conduzindo à emergência de uma nova área de desenvolvimento científico e tecnológico, denominada informática para biodiversidade. Além de aspectos relacionados ao desenvolvimento de software para a análise e síntese de dados, avanços significativos estão ocorrendo na definição de padrões e protocolos para integração de dados distribuídos, fundamentais para a construção da infra-estrutura global de informação sobre biodiversidade.

     

    PANORAMA INTERNACIONAL Apesar dos avanços decorrentes da implementação da Convenção sobre a Diversidade Biológica e dos esforços de governos e sociedade civil, a base de conhecimento sobre a diversidade biológica é incipiente e desagregada. As informações existentes estão dispersas e via de regra, inacessíveis. Temos uma enorme quantidade de dados em bibliotecas tradicionais (papel) ou em bases de dados digitais não integradas. Temos um volume enorme de informações associadas a amostras (espécimes) de material biológico depositadas em herbários e coleções zoológicas. Estima-se que as coleções de história natural contenham mais que 2.5 bilhões de espécimes (1). Cada espécime representa a evidência física de ocorrência do organismo no passado, e fornece informação desde a presença histórica e geográfica, a detalhes morfológicos e ecológicos. Quando bem documentados, os registros de observações, como os gerados por levantamentos de fauna e flora e estudos de impacto ambiental, podem também representar uma valiosa fonte de dados. Não existem estimativas de registros de observações em literatura publicada.

    O projeto internacional para o estabelecimento de uma Infra-estrutura Global de Informação sobre Biodiversidade (Global Biodiversity Information Facility - GBIF) iniciado em 2001, conta com a adesão de 34 países e 18 organizações internacionais. Esta iniciativa tem como principal objetivo viabilizar o acesso eletrônico a dados científicos primários, permitindo o seu uso por formuladores de políticas, cientistas e público em geral. Esses dados são registros documentados de ocorrências de espécies que podem estar associados a amostras de espécimes em coleções de história natural, e quando correlacionados com informações climáticas e geográficas, auxiliam na análise de questões científicas importantes e são fundamentais para a formulação de políticas e estratégias de conservação ambiental.

    A implementação do GBIF está conduzindo à consolidação de uma rede interoperável de bases de dados e o aprimoramento de ferramentas computacionais. Desenvolvimentos de curto prazo têm como alvo a consolidação da infra-estrutura de dados sobre espécies e espécimes. Os de médio prazo se concentrarão na expansão do conteúdo e na melhoria dos mecanismos de buscas e ferramentas que permitam combinar dados de fontes diversas. No longo prazo, o GBIF proverá um portal que permitirá a integração de dados moleculares, genéticos e ecológicos, com dados sobre biodiversidade e ecossistemas. Este sistema facilitará o acesso em tempo real à informação de grande valor científico e de utilidade social. Os avanços em biologia comparativa, associados à universalização do uso da Internet pela sociedade em geral, contribuirão para a consolidação de um portal eletrônico sobre a enciclopédia da vida no planeta (2).

     

    PADRÕES E PROTOCOLOS Visando a implantação da infra-estrutura global de dados sobre biodiversidade, o GBIF está desenvolvendo parcerias estratégicas com as principais iniciativas científicas internacionais como o Taxonomic Database Working Group (TDWG) um esforço conjunto da IUBS (International Union of Biological Societies) e CODATA (Committee on Data for Science and Technology), voltado à definição de padrões para a troca de informações biológicas e protocolos para a interoperabilidade de sistemas de informação.

    A estratégia para o intercâmbio de dados de espécimes e observações (3) e a arquitetura de dados do GBIF (4) estão em fase avançada de desenvolvimento. A integração de quase 200 bases taxonômicas que serão utilizadas para gerar o catálogo eletrônico de organismos descritos depende da adoção de padrões e protocolos (5).

    Uma iniciativa que merece destaque pelos resultados preliminares e pela forma como está sendo desenvolvido é o DiGIR (Distributed Generic Information Retrieval). DiGIR é um protocolo para interoperabilidade de sistemas que tem por objetivo permitir a integração de dados entre coleções biológicas. Trata-se de uma iniciativa open source, onde todo colaborador interessado pode ler, redistribuir e modificar o código do software. O desenvolvimento do DiGIR está sendo feito de forma colaborativa, envolvendo diferentes grupos de pesquisa do Brasil, Estados Unidos, Europa e Austrália.

     

    FERRAMENTAS ANALÍTICAS Na última década foram desenvolvidas ferramentas que permitem fazer inferências sobre a diversidade e abundância de espécies em biomas e regiões distintas. Dentre estas ferramentas destacam-se as de modelagem do nicho ecológico de espécies (6). Estas ferramentas estão auxiliando na análise e solução de problemas distintos, que vão desde a agregação de valor a conjuntos de dados (7), às mais variadas aplicações de previsão de distribuição de espécies e impacto de mudanças climáticas (8). Estima-se que com o contínuo desenvolvimento dessas ferramentas, novas aplicações nas áreas de agricultura e saúde, terão um grande impacto no desenvolvimento de estratégias de contenção e erradicação de espécies invasoras (9) e doenças endêmicas (10).

     

    INSTITUTO VIRTUAL DA BIODIVERSIDADE Oficialmente estabelecido no escopo do Programa Biota/Fapesp em março de 1999, é um projeto de longo prazo que tem por objetivo inventariar e caracterizar a biodiversidade do estado de São Paulo, definindo os mecanismos para sua conservação, potencial econômico e uso sustentável.

    O programa integra os resultados de atividades de pesquisa de universidades e institutos de pesquisa do estado de São Paulo e de grupos de pesquisa do país e do exterior. A meta é a consolidação da base de conhecimento da biodiversidade paulista, permitindo o acesso contínuo a dados primários de distribuição de espécies biológicas. O programa traz uma nova abordagem para pesquisa ecológica, associada à construção da infra-estrutura de informação e a aplicação de métodos inovadores para análise, síntese e visualização de dados georeferenciados. Para integrar os resultados de projetos de pesquisa associados ao programa, foi estruturado o Sistema de Informação Biota (SinBiota) que congrega os dados das coletas e listas de espécies associadas à base cartográfica do estado de São Paulo. O SinBiota foi desenvolvido pelo Centro de Referência em Informação Ambiental (Cria) em colaboração com a Unicamp, sempre procurando utilizar software de código aberto. A base cartográfica do estado foi digitalizada pelo Instituto Florestal de São Paulo. Toda a informação é de acesso público e gratuito na Internet. Visando possibilitar a alimentação remota e a integração dos dados foi uma adotada uma ficha padrão de coleta com campos mínimos obrigatórios e campos complementares. O uso obrigatório da ficha de coleta e o emprego de GPS (Global Positioning System) permitem a integração dos dados gerados no escopo do programa.

    Associada ao Instituto Virtual da Biodiversidade, a revista Biota Neotrópica tem por objetivo disseminar resultados de pesquisa sobre a biodiversidade neotropical. Todos os resumos são arquivos XML e atenção especial é dada à marcação dos nomes das espécies, de forma a permitir a integração com diferentes sistemas, em especial com o SciELO (Scientific Electronic Library Online) uma biblioteca eletrônica que abrange uma coleção selecionada de periódicos científicos brasileiros.

    O programa agora está investindo na estruturação de um sistema distribuído de informações para coleções biológicas (projeto denominado speciesLink) e no desenvolvimento de ferramentas de modelagem. O projeto, em sua primeira fase, está envolvendo 12 coleções do estado de São Paulo e está adotando o DiGIR como protocolo para interoperabilidade de sistemas.

    No caso da modelagem do nicho ecológico, a equipe do Cria está participando de um projeto colaborativo com a Universidade de Kansas visando o desenvolvimento e aprimoramento do Garp(Genetic Algorithm for Rule-set Production) para computadores pessoais e estações de trabalho. O Museu de História Natural e Centro de Pesquisa em Biodiversidade da Universidade de Kansas coordena o projeto Species Analyst, pioneiro na integração em tempo real de dados de museus e herbários. Esta rede contém cerca de 60 coleções de vários continentes, servindo mais de 50 milhões de registros de espécimes.

    O projeto financiado pela Fapesp está procurando integrar os diferentes sistemas, SinBiota, speciesLink e Species Analyst de forma a produzir um banco de dados virtual, de acesso público e gratuito, que poderá servir de base para a análise da situação atual e para a criação de cenários futuros a respeito da conservação e uso sustentável da biodiversidade do estado.

     

    DESAFIOS E OPORTUNIDADES Conciliar o desenvolvimento sócio-econômico com preservação ambiental não é uma tarefa trivial e freqüentemente a adoção de estratégias adequadas para o desenvolvimento sustentável requerem a integração de dados de fontes dispersas de informação. É crescente a demanda por respostas rápidas e informadas para a solução de problemas associados à ocorrência de espécies como a liberação de organismos transgênicos, a contenção de espécie invasoras, a ocorrência de doenças endêmicas, etc. São questões que requerem o pronto acesso à infra-estrutura de dados e ferramentas adequadas para a análise de problemas específicos.

    Temos no Brasil uma considerável capacidade institucional (recursos humanos e infra-estrutura) para consolidar liderança e competência na área, aos moldes do que foi feito em países megadiversos como México e Austrália.

    Para explorar nossos recursos genéticos de maneira sustentável, se valendo da capacidade humana e institucional instaladas, o Brasil precisa definir uma estratégia habilitadora e definir os investimentos necessários para um política abrangente de consolidação de competências.

     

    Vanderlei Perez Canhos é diretor do Centro de Referência em Informação Ambiental (Cria) Campinas, São Paulo e membro do Board of Directors do Species 2000 e do Taxonomic Databases Working Group (TDWG).

     

     

    Referências bibliográficas

    1. W.D. Duckworth, H.H. Genoways and C.L. Rose, 1993. Preserving natural science collections: Chronicle of our environmental heritage. Washington DC

    2. E. O. Wilson. Trends in Ecology and Evolution 18, 77. 2003.

    3. D. Hobern. Strategy for Exchange of Specimen and Observation Data. GBIF Secretariat. Version 0.1 (draft). 2002.

    4. D. Hobern. GBIF Biodiversity Data Architecture. GBIF Secretariat. Version 0.4. 2003.

    5. V. Gewin. Nature418, 362. 2002.

    6. A.T. Peterson, J. Soberon and V. Sanches-Cordero. Science285, 1265. 1999.

    7. Chapman, A.D. "Quality control and validation of point-sourced environmental resource data". In Spatial accuracy assessment. Land information uncertainty in natural resources. Ann Arbor Press, Chelsea, Michigan. 1999.

    8. A.T. Peterson, M. A. Ortega-Huerta, J. Bartley, V. Sanchez-Cordero, J. Soberon, R.H. Buddemeier and D.R.B. Stockwell. Nature, 416, 624. 2002.

    9. A.T. Peterson and D.A. Vieglais. Bio Science. 51, 363. 2001

    10. A.T. Peterson, V. Sanchez-Cordero, C.B. Beard and J. M. Ramsey. Emerging Infectious Diseases. 8. 662. 2002.

     

    Sítios na Internet

    Atlas São Paulo - http://sinbiota.cria.org.br/atlas

    BioCISE, Resource Identification for a Biological Collection Information Service in Europe http://www.bgbm.fu-berlin.de/biocise/

    Biota Neotropica - http://www.biotaneotropica.org.br

    CODATA, Committee on Data for Science and Technology - http://www.codata.org

    DiGIR, Distributed Generic Information Retrieval - http://digir.sourceforge.net/

    ENHSIN, European Natural History Specimen Information Network - http://www.nhm.ac.uk/science/rco/enhsin/