A gota d’água em aplicativos GTK+

Não, eu não estou com a paciência esgotada! 🙂 Hoje estou comemorando que um antigo erro na verificação ortográfica do gedit foi corrigido, de forma que palavras hifenizadas (“corrigi-la-ia”) ou contendo apóstrofo (“d’água”) poderão ser verificadas por inteiro pelo verificador ortográfico.

Continuar lendo

Testando o Dicionário Houaiss 3 no GNU/Linux

Não existem dicionários de português para Linux, só verificadores ortográficos. O que sobra são dicionários online ou para Windows (através do Wine). Eu pretendia fazer uma avalição das opções, mas aí veio o Acordo Ortográfico da Língua Portuguesa, tornando obsoletos os dicionários que eu pretendia avaliar. Com o tempo, esse problema está sendo resolvido, como no caso do dicionário online que mencionei recentemente. Dentre os dicionários para Windows, o primeiro que conheci atualizado para o acordo foi o Houaiss 3, que recentemente pude ver rodando no Linux com o Wine.

Continuar lendo

Mais um dicionário online de português (incluindo traduções)

O software livre conta com bons verificadores ortográficos, como o do projeto Vero, mas parece que os dicionários estão longe do seu alcance. A iniciativa melhor sucedida é o Wikcionário, mas ele não tem a abrangência e o prestígio de seu projeto-irmã Wikipédia. Eu ainda pretendo avaliar o Houaiss 3.0 (através do Wine), mas por enquanto trago a dica de um dicionário de português online: a Infopédia.

Continuar lendo

Conversores para o Acordo Ortográfico da Língua Portuguesa

Revisitando o projeto de implementar a nova ortografia na Wikipédia, eu encontrei três links possivelmente úteis, para conversores online. São três serviços independentes onde o visitante pode inserir, num formulário, texto de ortografia antiga (brasileira e/ou europeia) e obter o mesmo texto já adequado ao Acordo Ortográfico de 1990. Os sites são Português Exacto e Portal da Língua Portuguesa (português europeu) e FLiP (variedades brasileira e europeia).

Continuar lendo

Ensinando o computador a escrever

O Dasher é uma ferramenta de entrada de texto muito criativa e acessível, que tenta adivinhar as próximas letras que você vai escolher com base no que você acabou de escrever. Para assistir a um GIF animado demonstrando o aplicativo, visite essa página sobre o Dasher. Para que o Dasher funcione direito, ele precisa de um texto de treinamento, e há um tempo me propus a providenciar um texto de aprendizado melhor para o Dasher.

Graças a um outro projeto meu, o Classix, estou cada vez mais familiarizado com o Python. Escrevi então uns scripts para recuperar e processar uma grande quantidade de texto da Agência Brasil, uma agência de notícias do governo federal. Pode-ser dizer que atingi aquilo que queria, mas percebi que o conteúdo é muito especializado para o propósito. Só para vocês terem uma noção, após retirar uma série de stop words, a “governo” é a 11ª palavra mais frequente.

Continuar lendo

Procuram-se textos livres escritos com a nova ortografia

A internet está cheia de coleções de textos (notícias, livros etc.) gratuitos, de domínio livre ou sob uma licença livre como as da Creative Commons. Mas eu preciso de algo escrito em linguagem atual (Machado de Assis que me perdoe) e seguindo o novo Acordo ortográfico da Língua Portuguesa, o que me restringe muito as opções. Quero colecionar esses textos de forma automatizada para compor um texto de treinamento para o Dasher e qualquer outro aplicativo com entrada preditiva de texto (como nos torpedos de celulares) e/ou completamento de palavras.

O Dasher já tem um texto de treinamento, mas na minha experiência o Dasher prevê (as próximas letras e palavras) muito melhor em inglês que em português>. Abrindo o texto de treinamento para português encontrei absurdos como «aspas angulares», e resolvi que o Dasher precisava de um novo texto de treinamento.

Continuar lendo

Dicionários para Aspell e Vim disponíveis para adoção

Além do meu afastamento iminente da equipe brasileira de tradução do GNOME, anuncio também que pretendo abandonar a tradução do vocabulário de português do Brasil para Aspell, e do vocabulário português (brasileiro + europeu) para Vim. Assumir um ou ambos vocabulários/léxicos/dicionários é uma forma simples de contribuir para a comunidade sem gastar muito tempo. É necessário ter alguma intimidade com a linha de comando, e um mínimo de inglês para entrar em contato se necessário com o mantenedor do Aspell (Kevin Atkinson) ou com o do Vim (Bram Moolenaar). O processo de trabalho está bem documentado, mas eu ajudarei no lançamento da primeira versão. Só não continuo a manter pessoalmente os dicionários porque assim espero colaborar para diminuir meu envolvimento com a produção de software livre, e com um pouco de sorte ficar bom da tendinite.

Interessados podem usar o formulário de contato do blog ou enviar um e-mail para leonardof em gnome ponto org.

Como usar dicionários do Aspell através do Enchant

Esse artigo é um complemento à notícia de atualização do vocabulário de português brasileiro para Aspell 0.60.x. Resumindo, para fazer o Enchant usar o Aspell em vez do Myspell, você precisa criar ou modificar o arquivo ~/.enchant/enchant.ordering de forma a conter a seguinte linha:

pt_BR:aspell,myspell,ispell

Continuar lendo

Dicionario para Aspell, agora com o Acordo Ortográfico

Acabei de atualizar o vocabulário (“dicionário”) de português do Brasil para o Aspell 0.60. Essa versão traz a nova ortografia, já com as notas de implementação publicadas pela Academia Brasileira de Letras, além de correções variadas. Sei que a língua alemã tem uma versão para cada tipo de ortografia, mas os comentários que recebi apoiaram tão veementemente a adoção irrestrita da nova ortografia que resolvi simplesmente migrar e pronto. Quem quiser continuar a usar a ortografia anterior deve usar a última versão, de 2008.

Continuar lendo

Spell checking for GTK+ 3?

Finally I got myself a new home and some sort of internet connection for it. I was just reading Friedel’s post about spell checking on Google Chrome, where he states that a “system wide spell service that all programs can use” would be on his “wish list for GNOME 3”. Well, GtkSpell uses Enchant already, and LibSexy was included in GTK+ 2.16… What about including GtkSpell in GTK+?

Continuar lendo