ebook img

A folha: N.º 54 — verão de 2017 PDF

2017·1.7 MB·Portuguese
Save to my drive
Quick download
Download
Most books are stored in the elastic cloud where traffic is expensive. For this reason, we have a limit on daily download.

Preview A folha: N.º 54 — verão de 2017

a folha Boletim da língua portuguesa nas instituições europeias http://ec.europa.eu/translation/portuguese/magazine N.º 54 — verão de 2017 SOFTWARE LIVRE E DE CÓDIGO ABERTO: OMEGAT NA DGT, WIZARD, TAGWIPE E TEAMBASE (PARTE 1) — Maria José Bellino Machado; Hilário Leal Fontes; Thomas Cordonnier; Elio Fedele; Fons De Vuyst .................................................................. 1 TENDÊNCIAS DA LÍNGUA PORTUGUESA: AS INÓCUAS E AS INÍQUAS (VI) — Jorge Madeira Mendes ............................................ 13 SARDINHEIRAS E CRAVOS — Ulrike Hub ................................................................................................................................... 15 DESPORTUGUESMENTE — Philippe Magnan Gariso ................................................................................................................. 18 NOTAS SOBRE POVOS, LÍNGUAS E TOPÓNIMOS BANTOS DE ANGOLA — Paulo Correia; Amarílis Pêgo ....................................... 21 LETÓNIA — FICHA DE PAÍS — Juta Preisa; Paulo Correia ........................................................................................................ 26 Software livre e de código aberto: OmegaT na DGT, Wizard, Tagwipe e TeamBase (parte 1) Maria José Bellino Machado; Hilário Leal Fontes Thomas Cordonnier; Elio Fedele; Fons De Vuyst Direção-Geral da Tradução — Comissão Europeia [versão inglesa deste texto — http://ec.europa.eu/translation/portuguese/magazine/documents/folha54_ot_en.pdf] 1. Introdução Num artigo anterior em «a folha», publicado em 2014(1), a utilização de software livre e de código aberto na Direção-Geral da Tradução (DGT) — nomeadamente da ferramenta de tradução assistida por computador OmegaT(2) — foi apresentada em termos gerais. No presente artigo, que está dividido em duas partes, são apresentadas as seguintes aplicações para a tradução assistida por computador, recentemente disponibilizadas pela DGT da Comissão Europeia como software livre e de código aberto:  OmegaT na DGT (DGT-OmegaT) com adaptações/melhorias/novas funções na implementação na DGT do OmegaT (versão standard 3.6(3)), desenvolvido internamente para satisfazer as suas necessidades (programador: Thomas Cordonnier)  DGT-OmegaT Wizard (programador: Elio Fedele)  Tagwipe (programadores: Elio Fedele e João Rosas)  Teambase (programador: Thomas Cordonnier). O projeto é gerido por Fons De Vuyst, chefe do Setor de Apoio Operacional da Unidade de Informática da DGT. Na primeira parte deste artigo, apresentamos uma breve descrição de: a) fluxo de trabalho da DGT em cujo contexto foram adaptadas/desenvolvidas estas aplicações; b) Tagwipe; e c) 10 funções adaptadas a folha N.º 54 — verão de 2017 ou acrescentadas ao OmegaT. Na segunda parte deste artigo, que será publicada no final de 2017, apresentaremos o DGT-OmegaT Wizard e a TeamBase, duas aplicações que ainda exigem algum trabalho para serem «utilizáveis» fora da DGT. Quanto à publicação do DGT-OmegaT como software livre e de código aberto, gostaríamos de sublinhar que o objetivo não é criar uma nova comunidade «em concorrência» com a equipa que desenvolve e mantém o OmegaT original. A DGT publica o código apenas para permitir a qualquer pessoa ver as funções que criámos para satisfazer as nossas necessidades, deixando ao critério da comunidade OmegaT decidir se algumas delas são de interesse geral e podem ser reutilizadas e integradas. Estas aplicações podem ser descarregadas e facilmente experimentadas/utilizadas por qualquer pessoa em qualquer plataforma compatível com Java8 (Windows, Linux, MacOS), uma vez que são disponibilizados tanto o código-fonte como a versão executável, mas salientamos que são publicados tal como estão, sem garantias expressas nem implícitas, e que não será prestado qualquer apoio. 2. Software livre e de código aberto na Comissão Europeia A Comissão Europeia tem vindo a promover a utilização — e a partilha — de software livre e de código aberto, designadamente no âmbito do 7.º Programa-Quadro de Investigação e Desenvolvimento Tecnológico(4) e, atualmente, do Horizonte 2020(5). Além disso, a Estratégia de Software de Código Aberto da Comissão Europeia(6) salienta que «os serviços da Comissão irão participar cada vez mais nas comunidades de software de código aberto a fim de desenvolver as aplicações de base de código aberto que são utilizadas no software da Comissão». Por conseguinte, é neste contexto que as aplicações de código aberto como o OmegaT estão a ser utilizadas na DGT, paralelamente a aplicações comerciais como o SDL Trados Studio, a principal ferramenta de tradução assistida por computador na DGT. A DGT tem utilizado o OmegaT para fins de prototipagem desde 2012 e, para esse efeito, a versão 2.6.0._3 do OmegaT foi inicialmente adaptada e complementada com algumas melhorias úteis. Alguns tradutores gostaram tanto do OmegaT que este foi incluído no panorama informático da DGT e, por essa razão, foi desenvolvido um assistente — o DGT-OmegaT Wizard — a fim de integrar o DGT-OmegaT no fluxo de trabalho específico da DGT. Panorama Informático da DGT Direção Geral da Tradução, Information Technology Master Plan 2016–2020 2 a folha N.º 54 — verão de 2017 Além disso, foram desenvolvidas duas outras aplicações que podem ser usadas tanto por utilizadores do OmegaT como do SDL Studio:  TagWipe, uma aplicação que elimina etiquetas de formatação redundantes nos ficheiros em formato DOCX (Microsoft Office).  TeamBase, que permite a partilha de memórias de projeto entre tradutores que podem utilizar uma ou outra das ferramentas de tradução assistida por computador disponíveis na DGT. Recentemente, a DGT disponibilizou estas aplicações como software livre e de código aberto e as mesmas podem ser descarregadas aqui: http://185.13.37.79/. 3. Fluxo de trabalho da DGT O ambiente de tradução assistida por computador da DGT é explicado em pormenor na publicação da DGT Translation tools and workflow(7). De salientar, para este artigo, que na DGT:  As memórias de tradução relevantes para o(s) documento(s) a traduzir são extraídas automaticamente do Euramis, o repositório interno onde são guardados todos os alinhamentos das traduções da DGT — bem como de outras instituições da UE — nas últimas duas décadas e a maior parte da legislação da UE em vigor, em todas as línguas oficiais. Os segmentos relevantes e os documentos de referência são extraídos em formato TMX e utilizados como memórias externas numa das ferramentas. No DGT-OmegaT, estas memórias são automaticamente copiadas para a subpasta \tm de cada projeto pelo DGT-OmegaT Wizard.  A tradução automática é gerada automaticamente para todos os documentos editáveis a traduzir. A tradução é feita pelo serviço MT@EC(8), o sistema de tradução automática interno da DGT baseado no sistema livre e de código aberto Moses(9), que está treinado com os corpora da UE e adaptado às necessidades da DGT. Os ficheiros TMX gerados pelo MT@EC são utilizados como memórias externas em ambas as ferramentas. No DGT-OmegaT, estas memórias são automaticamente copiadas para a subpasta \mt de cada projeto pelo DGT-OmegaT Wizard.  A terminologia encontra-se guardada na base IATE, a base de dados terminológica interinstitucional da UE. Nos projetos DGT-OmegaT, os termos relevantes para o(s) documento(s) a traduzir são extraídos em formato TXT a partir de uma exportação (apenas termos de partida e de chegada) de toda a base IATE e o glossário «filtrado» é automaticamente copiado para a subpasta \glossary de cada projeto pelo DGT-OmegaT Wizard como um glossário só de leitura. 3 a folha N.º 54 — verão de 2017 4. Tagwipe Com relativa frequência, os documentos em formato DOCX (a esmagadora maioria dos documentos traduzidos na DGT) apresentam (muitas) etiquetas de formatação inúteis. Nesses casos seria obviamente impossível utilizar o OmegaT sem a função Remove tags ativada num número (infelizmente não tão raro quanto isso) de documentos particularmente «maus». No entanto, esta não é a melhor solução por razões óbvias. Por conseguinte, a DGT desenvolveu internamente a aplicação Tagwipe que elimina praticamente todas as etiquetas de formatação redundantes em documentos em formato DOCX. Melhora igualmente a segmentação das frases, algo que é muito importante para assegurar a coerência com a segmentação do Euramis e da MT@EC, melhorando assim a percentagem de correspondência (total ou parcial) com as memórias externas. Na DGT, o Tagwipe é utilizado desde 2012, num ambiente Windows 7, para projetos DGT-OmegaT e, por conseguinte, é atualmente uma aplicação bastante estável. No sítio Web do DGT-OmegaT, é também disponibilizado o Tagwipe para a distribuição Linux Ubuntu. No Tagwipe, o nível de limpeza das etiquetas de formatação pode ser escolhido pelo utilizador entre o nível 0 e o nível 8. Por omissão, na pasta de instalação, o nível de limpeza definido é o segundo nível mais baixo e mais conservador («level.1»). Este é o nível utilizado na DGT uma vez que os documentos traduzidos têm de ser gerados com toda a formatação original. No entanto, quando não é esse o caso, o nível de limpeza pode ser aumentado, eliminando assim formatação não essencial como, por exemplo, cores de fundo de palavras/expressões, espaços protegidos... ou até mesmo (quase) toda a formatação quando é selecionado o nível 8. O Tagwipe é automaticamente utilizado na criação de projetos de tradução em ambas as ferramentas de tradução assistida por computador. Nos projetos SDL Studio, a limpeza de etiquetas de formatação é feita antes da conversão dos ficheiros originais em formato SDLXLIFF. Nos projetos DGT-OmegaT, o Tagwipe foi integrado no DGT-OmegaT Wizard, sendo desse modo limpos todos os documentos originais em formato DOCX quando os projetos são criados ou atualizados. 4 a folha N.º 54 — verão de 2017 No exemplo infra, o Tagwipe eliminou cerca de 90 % das etiquetas de formatação (de 121 para 14) e a segmentação foi melhorada. As etiquetas de formatação que ficaram são legítimas. Visualização no Editor OmegaT sem Tagwipe com Tagwipe 5. OmegaT na DGT O OmegaT(10) é uma ferramenta gratuita de tradução assistida por computador desenvolvida, por iniciativa própria, inicialmente por Keith Godfrey em 2000 e que foi entretanto largamente melhorada com muitos contributos. Didier Briel é o atual gestor do projeto. Atualmente, o OmegaT é a ferramenta de tradução assistida por computador de código aberto mais utilizada. O OmegaT na DGT é uma bifurcação da versão 3.1.2 do OmegaT com a retroinclusão de algumas funções de versões posteriores. Está também disponível uma nova versão com base no «OmegaT standard» 3.6.0, mas numa versão de desenvolvimento beta. Ambas as versões podem ser descarregadas aqui:  http://185.13.37.79/ para descarregar a versão binária (fácil de instalar) e/ou o código-fonte e respetiva documentação.  http://185.13.37.79:8003/ para programadores e comunicação de erros. Apesar das diferenças existentes entre o DGT-OmegaT e o OmegaT, tanto quanto podemos ver, os projetos criados no DGT-OmegaT podem ser utilizados no OmegaT e vice-versa — o DGT-OmegaT mantém a interoperabilidade —, limitando-se ambos a ignorar pastas/ficheiros/informação que não «reconhecem», embora algumas funções não estejam disponíveis, como é evidente. 5 a folha N.º 54 — verão de 2017 No sítio Web do DGT-OmegaT são apresentadas informações técnicas pormenorizadas sobre cada função nova ou adaptada. Neste artigo, limitamo-nos a resumir/destacar 10 funções principais, do ponto de vista do tradutor, que poderão ser de interesse para tradutores fora da DGT. 5.1 Barra de ferramentas da DGT Foi internamente desenvolvido um módulo de extensão para o DGT-OmegaT que produz uma barra de ícones — equivalente a menus — que dá acesso rápido às funções mais frequentemente utilizadas, incluindo algumas que são específicas do DGT-OmegaT, nomeadamente: aplicações/bases de dados da DGT (DocFinder, Quest, Euramis e IATE), modo de revisão (Revision Mode) e consulta de outras línguas de chegada (View Other Target Languages). Na versão em software livre e de código aberto do DGT-OmegaT, os ícones DocFinder, Euramis e Quest estão a cinzento uma vez que estas bases não podem ser acedidas de fora da DGT. A ligação para a IATE está ativa e dá acesso à versão pública da base(11). Embora a base Euramis não possa ser acedida de fora das instituições da UE, uma grande parte da legislação da UE foi disponibilizada gratuitamente na Internet em formato alinhado(12). 6 a folha N.º 54 — verão de 2017 5.2 Ver ficheiros de partida e de chegada Ao traduzir um documento, o ficheiro original do documento ativo no Editor pode ser aberto diretamente a partir do DGT-OmegaT selecionando View source file no menu Project. Desta forma é aberta a aplicação nativa associada ao tipo de ficheiro do documento original, que abre o documento original. No OmegaT não há pré-visualização (em tempo real) do documento traduzido, mas o ficheiro total ou parcialmente traduzido que está ativo no Editor pode ser aberto a partir do DGT-OmegaT selecionando View target file no menu Project. Desta forma é aberta a aplicação nativa associada ao tipo de ficheiro do documento original, que abre o documento traduzido. Mas não há interação entre o DGT-OmegaT e a aplicação nativa, pelo que não devem ser introduzidas alterações no ficheiro de chegada na aplicação nativa uma vez que essas alterações não serão repercutidas no OmegaT! 5.3 Tradução automática A DGT não utiliza sistemas públicos de tradução automática por diversas razões, nomeadamente por questões de confidencialidade e de direitos de autor. Em consequência, foi desenvolvida uma opção Local no DGT-OmegaT, que acrescenta uma nova implementação da tradução automática. Em vez de chamar um servidor em tempo real, esta implementação Local lê dados a partir de um ou mais ficheiros TMX. Na DGT, só o motor de tradução automática Local está disponível. Na versão em software livre e de código aberto do DGT-OmegaT, estão disponíveis, num módulo de extensão, todos os motores da versão OmegaT 3.6, que são apresentados no menu apenas se esse módulo estiver instalado. Na versão executável publicada, este módulo está instalado. Quando é criada uma nova subpasta \mt no projeto para a qual são copiados os ficheiros de tradução automática — algo que é feito automaticamente pelo DGT-OmegaT Wizard quando da criação/atualização de um projeto —, a proposta de tradução automática é apresentada no painel Machine Translation, em lugar de no painel Fuzzy Matches. Com ou sem o módulo de extensão, a janela Editor Behaviour Options permite agora a inserção automática da proposta da tradução automática se não houver uma correspondência superior ao limiar de semelhança mínima definido para segmentos na memória do projeto ou nas memórias externas. Se estiver disponível mais de um motor (ou seja, se estiver instalado um módulo de extensão tradução automática), a janela dá também a possibilidade de escolher qual o motor que será utilizado para a inserção automática. 7 a folha N.º 54 — verão de 2017 5.4 Cores e identificação do texto sugerido no segmento aberto no Editor Como o OmegaT implementa uma série de mecanismos de inserção automática, quando é aberto um novo segmento é muito importante saber se a tradução proposta na zona de edição já se encontrava na memória do projeto ou se foi automaticamente inserida, mas não está validada. O OmegaT só acrescenta uma cor de fundo se o segmento provier de ficheiros TMX das subpastas tm/auto ou tm/mt. O DGT-OmegaT insere cores em alguns outros casos e também mais informações no delimitador do segmento. Segmento vazio Segmento traduzido Segmento pré-traduzido Correspondência total (100 %) Correspondência parcial Tradução automática 5.5 Janelas de pesquisa As funções de pesquisa do OmegaT já são muito sofisticadas. No entanto, no DGT-OmegaT, a janela de pesquisa única do OmegaT foi substituída por um conjunto de quatro janelas (Pesquisa no Projeto, Pesquisa no Diretório, Pesquisa e Substituição, Pesquisa e Pré-Tradução) e respetivos menus que continuam a ter um aspeto semelhante à do OmegaT, embora o código tenha sido completamente reescrito. Graças a esta divisão, as janelas estão menos saturadas... e puderam ser acrescentadas mais opções. Vale realmente a pena explorar estas funções! 8 a folha N.º 54 — verão de 2017 Algumas das novas opções de pesquisa na janela Search Project são:  Expression mode e Word mode; combinados, estes modos oferecem um leque mais vasto de opções e de resultados.  Word mode: As opções de pesquisa no OmegaT são baseadas em cadeias de carateres: quando se pesquisa «super», se o segmento contém «superficial», será encontrado. O DGT-OmegaT acrescenta duas alternativas:  Whole words: No modo de palavras completas, tal como em muitas outras ferramentas de edição, a amostra anterior será rejeitada a não ser que a pesquisa aceite explicitamente carateres antes e depois utilizando o caráter universal «?» (um caráter) ou «*» (0 ou mais carateres).  Lemmas: No modo lemas, são utilizados toquenizadores exatamente como para o painel de Fuzzy Matches: as flexões gramaticais de uma palavra serão reconhecidas, enquanto as palavras «que contenham» outra palavra não serão reconhecidas. No entanto, continua a ser uma pesquisa parcial (ou seja, uma pesquisa de um segmento que contenha determinadas palavras) sem cálculo de uma percentagem de correspondência, enquanto para o painel Fuzzy Matches é feita uma pesquisa completa e é calculada uma percentagem.  Search in é um modo de pesquisa que foi alargado a fim de permitir uma utilização fácil dos operadores boolianos E, OU e/ou NÃO, uma função muito útil para os tradutores para fins terminológicos. Permite, em especial, verificar facilmente se um termo/expressão foi traduzido de forma coerente no projeto e/ou nas memórias externas.  Search by file or folder name permite limitar a pesquisa a um ficheiro de memória de tradução (TMX) ou a uma subpasta com vários ficheiros TMX na pasta \tm.  Memorize: Ao contrário do que acontece no OmegaT, a memorização de uma pesquisa é feita através de um botão (para permitir uma memorização seletiva apenas de pesquisas relevantes) e há opções para memorizar a pesquisa para todos os projetos, para o projeto que está aberto ou apenas para a sessão em curso. Além disso, encontram-se já memorizadas algumas expressões regulares frequentemente utilizadas.  Match display template: Com o modelo de visualização de correspondências, é possível configurar a forma de visualização (como para as correspondências) utilizando a opção Config format. A janela Search and Replace segue a mesma abordagem da janela Search Project. Foi adaptada de modo a incluir um painel de resultados, permitindo assim verificar os segmentos afetados antes de lançar a operação de substituição propriamente dita. Isto é muito útil uma vez que não existe a opção de anular a operação (Undo)! A janela Search and Pre-translate é específica do DGT-OmegaT. A sua função é preencher rapidamente segmentos cuja tradução é irrelevante (por exemplo, números e outros carateres não traduzíveis) ou mais facilmente executada numa operação que abrange vários segmentos. Funciona de forma semelhante a Search and Replace, mas executa a pesquisa no segmento de partida. Por conseguinte, pode ser usada para segmentos não traduzidos. 9 a folha N.º 54 — verão de 2017 Enquanto a janela Search and Replace apenas permite traduzir com texto fixo, a pré-tradução permite preencher segmentos com tradução proveniente de: Source, copiando o segmento de partida para o segmento de chegada; Match, pré-traduzindo a partir de correspondências de memórias externas (o limiar de semelhança pode ser definido) e Text, tal como para Search and Replace, permite a utilização de uma cadeia de carateres constante com a possibilidade de usar variáveis reconhecidas durante a pesquisa. Este é um exemplo da sua utilização com Regular Expressions para pré-traduzir segmentos sem carateres alfabéticos (principalmente números). A janela Search Directory segue uma abordagem similar, com adaptações aos seus fins específicos. 5.6 Glossário O painel Glossary utiliza cores para diferenciar o termo de partida, o termo de chegada e o terceiro campo (ver captação de ecrã no ponto 4), sendo o último campo apresentado juntamente com o respetivo termo de chegada. Além disso, as entradas após as entradas do glossário de escrita são apresentadas por ordem alfabética, tornando mais fácil a consulta. O submenu Glossary — Glossary Pane and Transtips configuration oferece ao tradutor algumas opções importantes para a visualização da terminologia e sincroniza os algoritmos de pesquisa de palavras a fim de produzir resultados coerentes em ambos os painéis. 5.7 Cálculo de estatísticas de correspondências O cálculo das estatísticas de correspondências — Match Statistics e Match Statistics per File — são efetuadas em operação de fundo, permitindo assim ao tradutor começar a traduzir enquanto as estatísticas estão a ser geradas. Isto é especialmente interessante em grandes projetos de centenas/milhares de páginas com muitas memórias externas, uma vez que o cálculo de estatísticas de correspondências (por ficheiro) nesses projetos pode demorar bastante tempo. 5.8 Modo de revisão Na DGT, os tradutores podem ser também revisores e, de um modo geral, o tradutor tem a última palavra, o que significa que, depois de um documento ser revisto por um colega tradutor na qualidade de revisor, o tradutor verificará as alterações efetuadas e pode aceitar ou rejeitar as mesmas. Tendo isto em conta, foi desenvolvido um fluxo de trabalho de revisão no DGT-OmegaT Wizard e foram desenvolvidas as seguintes funções no DGT-OmegaT. 10

See more

The list of books you might like

Most books are stored in the elastic cloud where traffic is expensive. For this reason, we have a limit on daily download.