Mozilla Science Lab

Meses atrás apareceu uma vaga na Mozilla para Diretor da Mozilla Science Lab, um novo projeto da Mozilla. Na época fiquei muito animado com o anúncio da vaga mas a única informação sobre o laboratório de ciência que era possível encontrar era o anúncio da vaga. Ontem, no blog da Mozilla foi feito a anúncio do novo projeto.

O texto com o anúncio encontra-se nesse post no blog da Mozilla intitulado “Introducing the Mozilla Science Lab”. Nele descobrimos que o projeto será liderado por Kaitlin Thaney uma defensora da ciência aberta de longa data que ajudou a fundar e coordenar o programa da Creative Commons.

Kaitlin será acessorada por Greg Wilson, fundador da Software Carpentry (uma programa que ensina um de computação para pesquisadores para que a tecnologia seja aliada destes).

A seguir apresento os problemas atuais que desejo serem resolvidos pela Mozilla Science Lab.

Colaboração com Wikimedia

Colaboração por meio de wikis é uma ótima forma de colaboração entre pesquisadores que, infelizmente, ainda não é muito utilizada por dois motivos:

  1. muitos pesquisadores não gostam de utilizar linguagem de marcação,
  2. o suporte a equações matemáticas em páginas webs ainda é precário.

Espero que nos próximos anos esses dois problemas sejam resolvidos e possamos colaborar mais.

Melhoria no Etherpad

Para quem não sabe o Etherpad é um software que possibilita edição em tempo real de um arquivo de texto “plano”. Até onde eu sei ele serviu de inspiração para o Google criar sua suite de escritório online.

Embora seja uma fantástica ferramenta, o Etherpad ainda precisa de algumas melhorias, principalmente em relação a suportar linguagens de marcação.

Integração Git + Etherpad + Wiki

Na minha opinião a integração dessas três ferramentas são a chave para a ciência no século 21. A Wiki com seu robusto banco de dados que possa ser editado em tempo real por meio do Etherpad e também offline por meio do Git levará a colaboração ao máximo até onde consigo imaginar.

EPUB(3) substituir PDF

Hoje boa parte dos textos acadêmicos (relatórios técnicos, trabalhos de conclusão de curso, dissertações de mestrado, teses de doutorado, artigos em periódicos, livros, ...) são divulgados no formato PDF que nada mais é que a versão eletrônica do mesmo material impresso. Por esse motivo o PDF não é uma formato adequado para fazer mineração de dados.

Já o EPUB, que é baseado em HTML, é um formato mais proprício para mineração de dados que é uma das áreas mais promissoras hoje em dia. A dificuldade na adoção do EPUB são:

  1. falta de conhecimento por parte da comunidade,
  2. poucos programas para ler EPUBs (principalmente em sua versão 3),
  3. problemas na conversão dos formatos usualmente utilizados para criação de documentos científicos (DOC, ODT, LaTeX, ...) para EPUB.

Maior participação do Brasil

Embora o Brasil possua um publicação científica de respeito, as iniciativas rumo a ciência aberta ainda são bastante recentes. Até onde sei, a comunidade brasileira da Mozilla é grande e poderia ajudar a mudar essa realidade.