Atualização do dicionário de português para Vim e para Aspell

Fim-de-semana passado atualizei o dicionário (léxico) de português do Brasil para o GNU Aspell, e o de português (tanto europeu quanto brasileiro) para Vim. A maior novidade desse lançamento é um grande aumento da acurácia na correção ortográfica de palavras com ênclise e mesóclise.

A parte portuguesa do dicionário para Vim é derivada do Projecto Natura (veja também: Entrevista com Rui Vilela, mantenedor do dicionário de português europeu). Já a parte brasileira é derivada do Vero, o projeto de verificação ortográfica do BrOffice.org, que em sua última versão passou a contar com regras de ênclise e mesóclise. O BrOffice.org não consegue entender o hífen como parte da palavra, sendo necessária a inclusão de “meias-palavras” ao dicionário para contornar essa limitação. Mas Raimundo Santos Moura, mantenedor do Vero, providenciou uma versão “ideal” para o Aspell e o Vim, sem essa artimanha, melhorando ainda mais a correção ortográfica. Para saber mais sobre as diferentes versões do Vero, visite a página do projeto.

Daqui para frente, as atualizações dicionário de português para o Vim deverão acontecer mais prontamente, devido a uma melhoria no processo de manutenção. Ao invés de usar um script de shell (como faço no Aspell), passei a usar um script de AAP e dois arquivos diff, como aqueles disponíveis no servidor de FTP do Vim. Isso quer dizer que Bram Molenaar (mantenedor do Vim) não vai mais precisar converter meu script shell em script AAP mais arquivos diff, simplificando o processo. (Veja também: Destaque de sintaxe e verificação ortográfica do Gettext no Vim.)

A novidade do dicionário de português do Brasil para Aspell é a inclusão do arquivo br-abnt2.kbd. Esse arquivo representa a disposição das teclas no teclado ABNT2, de forma que o Aspell saiba que as letras “ç” e “l” podem ser trocadas por acidente. Além disso, o pacote agora inclui o script de shell que uso para gerar o dicionário Aspell a partir daquele publicado pelo BrOffice.org.

Como essa versão do dicionário para Aspell é derivada da versão “ideal” do Vero, os usuários do Enchant não vão conseguir verificar palavras com hífen corretamente. A razão disso é que o Enchant também não sabe trabalhar com hífens. Enquanto esse recurso não é implementado, você pode usar o dicionário do BrOffice.org com o Enchant: basta seguir essas instruções publicadas no Viva o Linux. Vale lembrar que o Enchant é usado por quase todos os aplicativos baseados em GTK+, e que o Sonnet (do KDE 4) terá suporte ao Enchant como backend.

(Enquanto Kevin Atkinson, mantenedor do Aspell, não disponibilizar no site de FTP do Aspell, eu manterei online o pacote aspell6-pt_BR (844KB).)

Atualização: pacote disponível no servidor de FTP do GNU. Daqui para frente eu mesmo poderei “subir” cada nova versão no servidor de FTP, através de um CGI controlado por Kevin Atkinson.

Atualização 2: corrigi a falta do arquivo br-abnt2.kbd. Obrigado, Pedro S.!

8 respostas em “Atualização do dicionário de português para Vim e para Aspell

  1. Pingback: Leonardo via Rec6

  2. Vai haver uma actualização para breve na parte pt_PT, porque há um problema de sobre-geração de palavras inválidas pelo script “munchlist” (para mais compressão dos afixos) do Ispell (Jspell->Ispell->Aspell/Myspell). A pessoa que mantem o Ispell vai ver o problema do script para a semana…

  3. Amigo, boa noite. Na realidade meu comentário não tem muito a ver com o post, mas é somente para parabenizá-lo pelo layout do seu blog. É agradável aos olhos e muito confortável de se ler.

  4. Olá, o arquivo ‘br-abnt2.kbd’ não parece estar sendo fornecido com o ‘aspell6-pt_BR-20080221-0.tar.bz2’. Instalei o dicionário com o ‘./configure’-‘make’-‘make install’, e nada de ‘br-abnt2.kbd’. Como as sugestões de palavras não tem serventia alguma para mim, eu simplesmente criei um link simbólico apontando para o ‘standard.kbd’, e tudo tudo voltou a funcionar. Se não foi esquecimento, talvez valesse a pena informar no README onde o arquivo pode ser obtido.

  5. Pingback: Atualização na parte européia do dicionário de português para Vim | Leonardo Fontenelle

Deixe uma resposta

Preencha os seus dados abaixo ou clique em um ícone para log in:

Logotipo do WordPress.com

Você está comentando utilizando sua conta WordPress.com. Sair / Alterar )

Imagem do Twitter

Você está comentando utilizando sua conta Twitter. Sair / Alterar )

Foto do Facebook

Você está comentando utilizando sua conta Facebook. Sair / Alterar )

Foto do Google+

Você está comentando utilizando sua conta Google+. Sair / Alterar )

Conectando a %s