Bastidores: como se fez o Balcão — e como se fez a Amália

← Balcão · o que faz bem e menos bem · 2 de julho de 2026

Como fizemos este site (numa tarde, com o modelo a correr num portátil)

  1. A prova. Escrevemos um exame de 71 perguntas de português de Portugal — provérbios para completar, História (de Zamora ao 25 de Abril), léxico pt-PT vs pt-BR (autocarro/ônibus, Mundial/Copa do Mundo), gramática europeia, literatura, cultura e cinco textos de escrita livre. O prompt de sistema era neutro: não pedimos português europeu a nenhum modelo. Era esse o teste — qual é a variante natural de cada um.
  2. O detetor de brasileirismos. Um verificador automático que procura em cada resposta léxico pt-BR (ônibus, geladeira, metrô…), ortografia pt-BR (gênero, prêmio…), gerúndio progressivo («estou fazendo»), próclise em início de frase («Me passa…») e futebolês («gol», «goleiro», «torcida», «Copa do Mundo»).
  3. Os exames. Corremos a AMALIA-9B (0626-SFT, quantizada a 4 bits, ~5,6 GB) e o Llama 3.1-8B da Meta num Mac com 24 GB de memória, via Ollama — sem nuvem, sem GPU de servidor. Cada modelo respondeu às 71 perguntas; pontuação automática por palavras-chave, com repescagem manual quando o modelo tinha razão e a grelha não («portagens» no plural conta, pois claro).
  4. O Balcão. Em vez de um chat aberto, quatro ferramentas fechadas viradas para o que o modelo faz bem. Os provérbios e os episódios históricos vêm de listas curadas — os factos vão fixados no pedido; o modelo só põe a língua. E não responde a notícias, deliberadamente (vê porquê mais abaixo).
  5. A publicação. Site estático nos Cloudflare Workers. Quando corre localmente, fala com o teu Ollama; na internet, mostra respostas reais gravadas («modo montra») até ligares o teu.

Como se fez a Amália (o que se sabe, e é bastante)

A Amália é invulgarmente transparente para um LLM: o consórcio (NOVA LINCS, Instituto de Telecomunicações e Técnico) publicou relatório técnico, pesos, dados de treino de afinação e até os conjuntos de avaliação, tudo no Hugging Face. Em resumo:

O enquadramento legal (que é, em si, uma novidade)

A Amália foi construída para ser irrepreensível aos olhos da lei europeia — uma escolha rara no mundo dos LLM:

Na nossa prova vimos as duas faces na mesma resposta: léxico pt-PT a 98% e zero brasileirismos, mas provérbios inventados e uma armadilha de atualidade em que caiu de caras — coerente com uma cabeça que parou em junho de 2024 e nunca leu um jornal. A comparação completa, com exemplos e a tabela de distância para o GPT, o Claude e o Gemini, está na página de avaliação.

A conclusão de engenharia é simples: a Amália é uma especialista na língua, não uma enciclopédia nem um oráculo. O Balcão foi desenhado à volta disso — factos fixados por nós, língua posta por ela, e nada de notícias.

Fontes e ligações