Testando o Dicionário Houaiss 3 no GNU/Linux

Não existem dicionários de português para Linux, só verificadores ortográficos. O que sobra são dicionários online ou para Windows (através do Wine). Eu pretendia fazer uma avalição das opções, mas aí veio o Acordo Ortográfico da Língua Portuguesa, tornando obsoletos os dicionários que eu pretendia avaliar. Com o tempo, esse problema está sendo resolvido, como no caso do dicionário online que mencionei recentemente. Dentre os dicionários para Windows, o primeiro que conheci atualizado para o acordo foi o Houaiss 3, que recentemente pude ver rodando no Linux com o Wine.

Ao contrário da versão anterior, o Houaiss 3.0 parece rodar perfeitamente no Linux através do Wine. A única precaução é que, assim como o Houaiss 2.0, a versão mais recente também precisa da instalação das Core Fonts da Microsoft, senão o programa fica ilegível. Não adianta instalar as fontes Liberation, da Red Hat, porque o Wine (ainda) não faz a substituição automática.

A maior novidade do Houaiss 3.0 é o acordo ortográfico, mas também chamam a atenção o visual laranja (dispensável, a meu ver) e o aumento do desempenho, especialmente da pesquisa por palavras semelhantes.

Pessoalmente, eu gostaria muito de ter uma versão nativa para Linux. Numa conversa com a Editora Objetiva, responsável pela versão eletrônica do dicionário, me disseram que para lançar uma versão nativa seria necessária uma previsão de pelo menos mil vendas. Naturalmente o número de brasileiros usuários de GNU/Linux é ordens de grandeza maior, mas não tenho como dizer quantos botariam a mão no bolso para comprar o dicionário.

Como para tudo existe um jeito, eu descobri como decifrar (em parte) os arquivos em que o dicionário armazena seus dados. Seria possível, em teoria, desenvolver um aplicativo para GNU/Linux que lesse os arquivos adquiridos (legalmente!) com o software para Windows. Na prática, alguns aspectos ainda não estão claros para mim, e a implementação do software está além das minhas habilidades e do meu tempo para adquiri-las.

Espero que alguém se proponha a realizar esse projeto, mas até lá fico feliz em saber que graças ao trabalho árduo dos desenvolvedores do Wine nós já podemos usar o dicionário no Linux.

10 respostas em “Testando o Dicionário Houaiss 3 no GNU/Linux

  1. Olá, Leonardo.

    Infelizmente não possuo links para te dar agora, mas eu sei que em algumas versões do Houaiss a base de dados inteira deles é um arquivo texto estruturado que é meramente ofuscado por uma técnica tipo fazer um xor de cada byte com uma certa “senha”. É muito simples de “decifrar”. Se você procurar no Google acho que encontra um blog em que o sujeito explica isso. Uma vez com este arquivo em mãos, é só questão de formatar o texto do jeito que você quiser para a ferramenta que você quiser… Já ouvi falar de pessoas que botaram o Houaiss inteiro no dict, diga-se de passagem!… Será apenas uma lenda urbana?

  2. Mil vendas? Isso é piada?
    Só de escolas públicas e órgãos estatais atualmente rodando Linux no Brasil, absolutamente carentes deste tipo de aplicação, já daria muito mais que isso. Para não falar de situações onde a migração para Linux só não foi feita ainda exatamente pela falta de programas nativos como este.
    E “qualquer criança” programa a parte de consulta de uma aplicação como esta, em qualquer SO, o que interessa na verdade é a base de dados. Poderia até ser feito em Java (como alguns dicionários feitos em outros países por empresas decentes e que respeitam o consumidor, ao contrário desta ridícula Editora Objetiva), e sem a menor complicação já seria multiplataforma.

  3. YesWeCan, conheço o site de que você está falando, e já implementei a descriptografia em Python (que é a única linguagem em que sei programar alguma coisa). A etapa seguinte, que eu não implementei completamente, é interpretar semanticamente o arquivo de texto resultante, além de entender para que serve o código que vem na embalagem. Por fim, seria necessário implementar a interface de usuário.

  4. hneto, concordo que acho mil cópias muito pouco. Mas também apenas cerca de 1% das pessoas usam Linux, e não sabemos se as vendas do Houaiss para Windows passaram de 95, 99 mil. Vou retomar o contato com o pessoal da Objetiva sobre a possibilidade de vender para escolas.

  5. “Como para tudo existe um jeito, eu descobri como decifrar (em parte) os arquivos em que o dicionário armazena seus dados. Seria possível, em teoria, desenvolver um aplicativo para GNU/Linux que lesse os arquivos adquiridos (legalmente!) com o software para Windows.”

    Mas daí eles poderiam processar você e/ou o autor do software por engenharia reversa. Achei que você fosse colocar um tutorial sobre como instalar o dito cujo, fica, aí, a dica.

    Essa história de mil vendas, acredito eu, é apenas uma desculpa para a má-vontade deles para com o sistema livre, no entanto poderíamos ficar enviando e-mails ou algo assim… eles poderiam colocar o instalador para Linux no mesmo CD/DVD da versão Windows ou oferecê-lo como download para os compradores desta versão, como algumas empresas de jogos o fazem.

    • Talvez ele até me processassem mesmo, mas isso não me preocupa, primeiro porque não pretendo levar isso adiante, e segundo porque os termos de uso do software são bem liberais, e, até onde sei, a legislação brasileira não se importa com engenharia reversa.

      Se eles fossem espertos eles pediriam para as pessoas construirem aplicativos nativos para Mac, Linux e dispositivos móveis. Quem consegue copiar os arquivos de dados consegue copiar o software deles, então pelo menos no Windows a ofuscação singela que eles fizeram não tem qualquer efetividade contra pirataria. E, se não fosse pelo Wine, eles não teriam por que se importar com engenharia reversa ou qualquer outra coisa, porque eles não têm produto para a plataforma.

  6. Mudando um pouco a discussão para corretor gramatical e não mais dicionários, eu gostaria que alguém fizesse uma comparação entre o Cogroo (http://www.broffice.org/cogroo_3), o corretor gramatical do Word e mais algum corretor que possa ser rodado no linux.

    Será que vale a pena pagar por um corretor gramatical? Quando que vale?

    • Ricardo, acredito que seja melhor perguntar isso aos desenvolvedores do Cogroo. De qualquer forma, não conheço a possibilidade de usar corretores no MS Office no OpenOffice.org ou vice-versa, então se sua suíte estiver definida, passa a ser uma questão de saber em termos absolutos o quão bom é o Cogroo.

  7. Desculpem um comentário um pouco tardio. O grupo espanhol PRISA, a que pertence a Editora Objetiva, tem acordos de colaboração assinados com a Microsoft. Suponho que isso incluirá também a condição de que os produtos electrónicos publicados por PRISA sejam só para a plataforma Windows.
    Quando assinaram os tais acordos, Bill Gates viajou a Madrid e ali foi recebido como um santo ou um herói… O jornal «El País», do grupo PRISA, fez uma extensa cobertura da notícia e poucos meses depois publicava um «curso de informática» (leia-se «curso de Windows») por entregas, que se dava de graça ao comprar o jornal.

    Com isto quero dizer que o dicionário Houaiss não terá edição electrónica para Linux nem para Mac OS enquanto for publicado pela Objetiva e esta fizer parte da PRISA.

Deixe uma resposta

Preencha os seus dados abaixo ou clique em um ícone para log in:

Logotipo do WordPress.com

Você está comentando utilizando sua conta WordPress.com. Sair / Alterar )

Imagem do Twitter

Você está comentando utilizando sua conta Twitter. Sair / Alterar )

Foto do Facebook

Você está comentando utilizando sua conta Facebook. Sair / Alterar )

Foto do Google+

Você está comentando utilizando sua conta Google+. Sair / Alterar )

Conectando a %s