A gota d’água em aplicativos GTK+

Não, eu não estou com a paciência esgotada! 🙂 Hoje estou comemorando que um antigo erro na verificação ortográfica do gedit foi corrigido, de forma que palavras hifenizadas (“corrigi-la-ia”) ou contendo apóstrofo (“d’água”) poderão ser verificadas por inteiro pelo verificador ortográfico.

Continuar lendo

Testando o Dicionário Houaiss 3 no GNU/Linux

Não existem dicionários de português para Linux, só verificadores ortográficos. O que sobra são dicionários online ou para Windows (através do Wine). Eu pretendia fazer uma avalição das opções, mas aí veio o Acordo Ortográfico da Língua Portuguesa, tornando obsoletos os dicionários que eu pretendia avaliar. Com o tempo, esse problema está sendo resolvido, como no caso do dicionário online que mencionei recentemente. Dentre os dicionários para Windows, o primeiro que conheci atualizado para o acordo foi o Houaiss 3, que recentemente pude ver rodando no Linux com o Wine.

Continuar lendo

Mais um dicionário online de português (incluindo traduções)

O software livre conta com bons verificadores ortográficos, como o do projeto Vero, mas parece que os dicionários estão longe do seu alcance. A iniciativa melhor sucedida é o Wikcionário, mas ele não tem a abrangência e o prestígio de seu projeto-irmã Wikipédia. Eu ainda pretendo avaliar o Houaiss 3.0 (através do Wine), mas por enquanto trago a dica de um dicionário de português online: a Infopédia.

Continuar lendo

Conversores para o Acordo Ortográfico da Língua Portuguesa

Revisitando o projeto de implementar a nova ortografia na Wikipédia, eu encontrei três links possivelmente úteis, para conversores online. São três serviços independentes onde o visitante pode inserir, num formulário, texto de ortografia antiga (brasileira e/ou europeia) e obter o mesmo texto já adequado ao Acordo Ortográfico de 1990. Os sites são Português Exacto e Portal da Língua Portuguesa (português europeu) e FLiP (variedades brasileira e europeia).

Continuar lendo

Ensinando o computador a escrever

O Dasher é uma ferramenta de entrada de texto muito criativa e acessível, que tenta adivinhar as próximas letras que você vai escolher com base no que você acabou de escrever. Para assistir a um GIF animado demonstrando o aplicativo, visite essa página sobre o Dasher. Para que o Dasher funcione direito, ele precisa de um texto de treinamento, e há um tempo me propus a providenciar um texto de aprendizado melhor para o Dasher.

Graças a um outro projeto meu, o Classix, estou cada vez mais familiarizado com o Python. Escrevi então uns scripts para recuperar e processar uma grande quantidade de texto da Agência Brasil, uma agência de notícias do governo federal. Pode-ser dizer que atingi aquilo que queria, mas percebi que o conteúdo é muito especializado para o propósito. Só para vocês terem uma noção, após retirar uma série de stop words, a “governo” é a 11ª palavra mais frequente.

Continuar lendo

Procuram-se textos livres escritos com a nova ortografia

A internet está cheia de coleções de textos (notícias, livros etc.) gratuitos, de domínio livre ou sob uma licença livre como as da Creative Commons. Mas eu preciso de algo escrito em linguagem atual (Machado de Assis que me perdoe) e seguindo o novo Acordo ortográfico da Língua Portuguesa, o que me restringe muito as opções. Quero colecionar esses textos de forma automatizada para compor um texto de treinamento para o Dasher e qualquer outro aplicativo com entrada preditiva de texto (como nos torpedos de celulares) e/ou completamento de palavras.

O Dasher já tem um texto de treinamento, mas na minha experiência o Dasher prevê (as próximas letras e palavras) muito melhor em inglês que em português>. Abrindo o texto de treinamento para português encontrei absurdos como «aspas angulares», e resolvi que o Dasher precisava de um novo texto de treinamento.

Continuar lendo

Dicionários para Aspell e Vim disponíveis para adoção

Além do meu afastamento iminente da equipe brasileira de tradução do GNOME, anuncio também que pretendo abandonar a tradução do vocabulário de português do Brasil para Aspell, e do vocabulário português (brasileiro + europeu) para Vim. Assumir um ou ambos vocabulários/léxicos/dicionários é uma forma simples de contribuir para a comunidade sem gastar muito tempo. É necessário ter alguma intimidade com a linha de comando, e um mínimo de inglês para entrar em contato se necessário com o mantenedor do Aspell (Kevin Atkinson) ou com o do Vim (Bram Moolenaar). O processo de trabalho está bem documentado, mas eu ajudarei no lançamento da primeira versão. Só não continuo a manter pessoalmente os dicionários porque assim espero colaborar para diminuir meu envolvimento com a produção de software livre, e com um pouco de sorte ficar bom da tendinite.

Interessados podem usar o formulário de contato do blog ou enviar um e-mail para leonardof em gnome ponto org.