[Diários do Tradutor] A CAT Tool e os Dragões, parte 2

E seguimos em frente com o relato sobre a experiência de traduzir literatura infanto-juvenil com uma CAT Tool! Se você ainda não leu a parte 1 desta saga, é só clicar aqui.

Bem, depois de tomar a decisão de deixar o Word de lado e tocar o projeto do livro sobre dragões usando uma CAT Tool (no caso, o Smartcat – www.smartcat.ai), foi hora de encarar os primeiros obstáculos na jornada.

A primeira tarefa, então, seria inserir o texto do original na CAT Tool para iniciar o processo. Antigamente os clientes me enviavam os livros físicos, ou então imprimiam o arquivo PDF e enviavam as resmas impressas para que eu trabalhasse. Com o passar dos anos, devido ao avanço da tecnologia e provavelmente ao aumento dos custos de envio via correio, as editoras passaram a enviar somente o arquivo PDF. E a maneira tradicional de traduzir um livro é usar um monitor relativamente grande e ajustá-lo para exibir duas janelas: o texto original de um lado e a tela de trabalho do Word do outro. No post onde mostrei a minha estação de trabalho, há alguns meses, dá para se ter uma ideia de como essas janelas ficam organizadas.

Arquivos PDF são ótimos para leitura e impressão, mas quem já tentou processar, editar ou alterar um arquivo PDF sabe que a tarefa raramente ocorre sem percalços. Como a CAT Tool precisa abrir o arquivo para extrair somente o texto (desconsiderando muitos códigos de formatação, paginação, entre outras particularidades dos arquivos PDF), seria necessário converter o negócio para um formato mais fácil de digerir, como o DOCX ou o RTF.

A primeira tentativa (só pra ver o que acontecia… vai que a gente dá sorte?) foi tentar importar diretamente o PDF para a CAT Tool. Resultado: Não deu certo. Como o Smartcat é uma ferramenta disponibilizada gratuitamente, a empresa responsável precisa arrumar maneiras de conseguir dinheiro; uma dessas maneiras é cobrar uma taxa módica pela conversão de alguns tipos de arquivo (especialmente os famigerados .PDFs) por meio de um processo conhecido como OCR (a sigla em inglês para reconhecimento óptico de caracteres).

Daria pra pagar? Daria, é claro. Mas como estou tentando fazer esse projeto com o menor custo possível, tive que tentar outra coisa. É possível baixar programas que fazem OCR, e tem alguns sites que fazem isso online também. Infelizmente, os resultados também não foram muito animadores. Cada arquivo PDF tem características próprias, aparentemente; alguns são mais fáceis de converter do que outros.

Uma rápida pesquisa revelou ainda duas possibilidades: Com sorte, seria possível abrir o .PDF no editor de texto do Google Docs (que cuidaria da conversão) ou então pelo Word mesmo. Como eu não tinha mais nada a perder, abri o Word e mandei o .PDF pra dentro. Se não desse certo, bastaria abortar a ideia e traduzir tudo “na unha” mesmo, do jeito tradicional.

E foi então que…

E não é que o Word conseguiu abrir o PDF do livro dos dragões? Manoel por Sílvio! (Repita bem rápido: Mas não é possível!). Bastou verificar o arquivo para ver se tudo estava certo, salvar no formato .DOCX e jogar para o Smartcat. Vamos que vamos!

A etapa seguinte do trabalho foi preparar o glossário do projeto e usá-lo para alimentar a CAT Tool. Como o livro é parte de uma série e os nomes de vários personagens, locais e termos característico da obra já foram definidos em volumes anteriores, o cliente enviou uma planilha do Excel com todos esses termos já listados, juntamente com as respectivas traduções — e vamos lembrar que uma das principais vantagens de usar uma CAT Tool é a sua capacidade de gerenciar esses termos, avisando o tradutor sempre que uma palavra que consta no glossário surge no texto. E só para constar: o glossário que chegou já tinha 147 termos.

O glossário do cliente não estava no formato exato que é utilizado pelo Smartcat, pois trazia algumas informações extras (bastante úteis, ressalte-se) sobre a maioria dos termos utilizados. Precisei salvar uma segunda versão, mais enxuta, (eliminando os campos de observações e cabeçalhos, por exemplo), pois a CAT Tool não utiliza as informações que estão ali.

Com tudo preparado, chegou a hora de entrar em ação. A saga continua na parte 3 de “A CAT Tool e os Dragões”, daqui a alguns dias.

Let’s rock!

Até lá! 🙂

2 Comments:

  1. Boa tarde, Ivar!

    Sou leitora do seu blog já faz algo tempo (se não me engano, conheci-o pelo boletim da Multitude) e gostaria de agradecê-lo por compartilhar suas experiências.

    Não sou tradutora mas tenho um grande crush pela área. Tanto que fiz pós em tradução e me apaixonei ainda mais (especialmente pela literária). É por isso que procuro ler bastante sobre o assunto…

    Enfim.

    Só escrevendo pra agradecer pelo blog mesmo. rsrsrsrs

    Na época da pós, os professores comentavam como a CAT não valia muito na área literária por isso estou bem curiosa pra saber como está sendo a tua experiência. 🙂

    Abraços!

    • Oi Tábata, bom dia!

      Muito obrigado por acessar o blog e pelos comentários. Eu não sabia que o pessoal da Multitude tinha incluído o meu site no boletim deles, olhe só! É sempre gratificante saber que outras pessoas estão curtindo as coisas que eu posto por aqui. Só tenho a agradecer pelas gentilezas 🙂

      Sobre o uso da CAT com literatura: estou com anotações aqui pra escrever pelo menos mais uns 3 posts sobre o assunto. Esse livro dos dragões que estou traduzindo até que está indo bem, mas eu ainda não sei se migraria definitivamente para CAT com outros. Mesmo assim, está sendo uma experiência bem legal para definir, pelo menos, quais são os tipos de livros mais e menos adequados para usar com a ferramenta.

      Mais uma vez, agradeço de coração pela leitura e pelo feedback 🙂 Um abraço!

Deixe uma resposta para Tábata Kotowiski Cancelar resposta