Atualização do dicionário de português do Brasil para Aspell

Acabei de atualizar o dicionário (“léxico”) de português brasileiro para Aspell 0.6. Essa nova versão traz as atualizações do Vero, o projeto de verificação ortográfica do BrOffice.org, e mais duas novidades.

Primeiro, passei a incluir um arquivo NEWS, para quem baixar o pacote mais recente poder conhecer a história do dicionário sem precisar ler meu blog🙂

Segundo e mais importante, esse último lançamento é baseado na versão “completa” do BrOffice.org, e não na “ideal”. (Para conhecer as diferentes versões dos dicionários do BrOffice.org, consulte a página de downloads. Existem inclusive versões para o Acordo Ortográfico da Língua Portuguesa!) Essa decisão foi uma forma de contornar um erro do Enchant que impede o Aspell de verificar palavras com hífen por inteiro. O resultado é que palavras como “abraçá-la-ão” agora serão marcadas como corretas; o efeito colateral é considerar como corretas “abraçá”, “la” e “ão”.

Em tempo: o pacote pode ser baixado da lista de dicionários para Aspell, mas também deverá estar disponível em breve através de sua distribuição ou sistema operacional livre favorito.

13 respostas em “Atualização do dicionário de português do Brasil para Aspell

  1. Pingback: Leonardo via Rec6

  2. Estou em dia com o dicionário agora. Obrigado!

    Caso alguém queira a sua atualização empacotada para Debian [Ubuntu e cia.], preparei um .deb após a instalação, basta clicar aqui.

    [Link quebrado. O autor do comentário sugeriu que os leitores confiram os repositórios oficiais. — Leonardo Fontenelle]

  3. O Manoel Aleksandre percebeu um erro no meu .deb. O Djavan Fagundes me enviou uma página em que o Carlos Morimoto explica o porquê desse tipo de problema. Na verdade, é apenas um arquivo ou mais que já estão instalados por fazerem parte de algum outro pacote e o gerenciador de pacotes não os sobrescreve para evitar conflito. Se não for nada mais grave, como é o caso deste .deb, basta forçar a instalação.
    Quem passar por isso, só precisa digitar no terminal:
    $ sudo dpkg -i --force-all aspell6-pt-br-20080707_0-1_i386.deb

  4. Pacote aspell-pt-br (20080707) feito com a ajuda de Luiz Armesto, que me ensinou rapidamente como empacotar. A forma de prepará-lo foi de acordo com o guia de empacotamento do Ubuntu e não com o checkinstall (caso anterior).

    Com o tempo vou aprendendo…

    [Link excluído a pedido de Vladimir Melo, que orientou os leitores a conferir os repositórios oficiais. — Leonardo Fontenelle]

  5. Pingback: Leonardo Fontenelle | Notas rápidas

  6. Caro Leonardo
    Sou responsável pela tradução do BrOffice.org. Desejo iniciar a revisão da UI e da Ajuda (HC) para acomodar o novo acordo ortográfico.

    Baixei o aspell mais recente do site oficial e não sei se os arquivos contemplam o Acordo. Parece que não (enjoo, infraestrutura continuam grifados). Assim dei uma olhada no tarball do aspell para pt-BR e descobri que tem um script em doc/make.sh que baixa um zip do site do Raimundo com os .aff e .dic e procede a uma conversão.

    Acontece que 1) não sei qual dos arquivos do VERO ele baixa (1) (com ou sem o acordo ortográfico) e 2) o script quer um arquivo chamado proc que não esta no tarball. Que arquivo é esse?

    Agradeço sua ajuda.

    Olivier
    (1) http://www.deso-se.com.br/downloads/broffice.org/pt_BR-C.zip

  7. Olá, Olivier!

    Para criar um dicionário para o Aspell é necessário baixar o pacote ftp://ftp.gnu.org/gnu/aspell/aspell-lang-20071024.tar.bz2. Descompacte-o, crie um diretório doc/ copie lá o arquivo make.sh. Supondo que você use GNU/Linux, abra um terminal, mude o diretório atual para o do aspell-lang (não o doc), e execute “doc/make.sh”. Se você não usar GNU/Linux, me avise que a gente vê o que pode ser feito.

  8. Grato Leonardo, pela rápida resposta.

    Sou usuário de Mandriva Linux 2009.0

    Baixei o pacote indicado e agora tenho dois diretórios (separados)

    aspell6-pt_BR-20080707-0/
    aspell-lang/

    Ao rodar o make da forma indicada dentro de aspell-lang/ o script dá por falta de arquivos que estão em aspell6-pt_BR-20080707-0/ (info, br-abnt2.kbd, etc..)

    Estes dois diretórios seriam um só? Em caso afirmativo, devo descompactar aspell6-pt_BR-20080707-0/ por cima de aspell-lang/ ? A precedência deve ser crucial, imagino, pois há arquivos de mesmo nome em cada diretório.

    Abraços
    Olivier

  9. Está certo, faltou incluir alguns arquivos. Você pode copiar do aspell6-pt_BR-20080707-0/ todos os arquivos exceto os que já existem em aspell-lang/; ou pode copiar do primeiro para o segundo os arquivos cuja falta o script sinta.

    Comentário colateral: seria bom termos em 2009 um aspell6-pt_br com as duas ortografias. Não sei ainda como fazer isso, então espere essa nova versão para começar a revisar a tradução do OOo.

  10. No caso, prefiro trabalhar com o novo acordo ortográfico somente, ainda em 2008.

    Consegui executar o make.sh, ajustando o arquivo a baixar pelo pt_BR-2008-07-07AOV.zip do site do BrOffice.org . Pelo que verifiquei, o script cria um tarball de nome aspell6-pt_BR-20080707-0.tar.bz2. Trabalhando neste novo arquivo, infelizmente continuo esbarrando em problemas.

    [root@localhost aspell6-pt_BR-20080707-0]# ./configure
    Finding Dictionary file location … /usr/lib/aspell-0.60
    Finding Data file location … /usr/lib/aspell-0.60
    [root@localhost aspell6-pt_BR-20080707-0]# make
    /usr/bin/prezip-bin -d < pt_BR.cwl | /usr/bin/aspell –lang=pt_BR create master ./pt_BR.rws
    Error: .//pt_BR_affix.dat:3898: The condition “iquar” does not guarantee that “equar” can always be stripped.
    make: ** [pt_BR.rws] Erro 1

    a linha que gera este erro é :
    SFX h equar équem equar
    SFX h equar équem iquar <—

    Seria um erro nos arquivos do AOC? essa linha é a mesma no arquivo .aff de origem.

    Abraços
    Olivier

Deixe uma resposta

Preencha os seus dados abaixo ou clique em um ícone para log in:

Logotipo do WordPress.com

Você está comentando utilizando sua conta WordPress.com. Sair / Alterar )

Imagem do Twitter

Você está comentando utilizando sua conta Twitter. Sair / Alterar )

Foto do Facebook

Você está comentando utilizando sua conta Facebook. Sair / Alterar )

Foto do Google+

Você está comentando utilizando sua conta Google+. Sair / Alterar )

Conectando a %s