No VMix um upgrade de placa de vídeo foi feito, para uma 3090, já que nele os 4 outputs estavam sendo utilizados junto com listas de vídeos customizadas. A ideia era, o sinal original, em inglês, saía via NDI no output 1. No output 2 o sinal para o Teams, que não enviava de volta o áudio do Teams.
No output 3 e 4 temos as legendas nos vídeos, pra fazer isso listas exatamente iguais em tempo e conteúdo dos vídeos são geradas e avançadas ao mesmo tempo e triggers para inserir as listas em overlays específicos quando um vídeo entra na tela ou remover da tela quando o input de video sai da tela.
Para slides traduzidos, 2 notebooks extras com os slides nas respectivas línguas e um programa para sincronizar o avanço dos slides. A mesma lógica dos vídeos foi feita para os inputs de “pip ppt”. Para a economia de recursos os inputs de pip ppt não englobavam cada um dos possíveis sources ndi, fazendo a troca de quem era o apresentador via atalhos e evitando a existência de 3 vezes o número de apresentadores em inputs criados.
Para aliviar o VMix, o encoding era deixado para um OBS inclusive para a língua original.
No encoding temos um OBS para a língua original e esse mesmo notebook está dentro de uma reunião de Zoom que alimenta os tradutores simultâneos. É importante ser um Zoom separado para o envio de PGM nesses casos, já que não é possível ouvir a tradução corretamente se o Zoom do computador está enviando áudio para a reunião.
Nos OBS de espanhol e português temos, novamente, um Zoom aberto, esse Zoom está dentro do canal de tradução relevante e com a opção “mute original audio” habilitada, para que apenas a tradução saia.
No OBS encoder temos a fonte de áudio original e uma captura de áudio do desktop que pega o áudio do zoom e adicionamos um filtro de áudio original chamado de “auto ducking” ou “side chain compressor”, a ideia desse filtro é fazer com que o áudio original fique baixo sempre que vier qualquer som da tradução, isso fazia com que houvesse zero operação de áudio em cima do que é feito pelas tradutoras, se elas sentiram que precisavam falar, a voz delas iria sair por cima de qualquer conteúdo e se elas estivessem mudas o telespectador iria ouvir o áudio original.
Se você me perguntar, esse é um dos projetos que tenho mais orgulho da minha ingenuidade pra utilizar o mínimo de recursos possíveis para uma entrega extremamente complexa.
No comments
Be the first to comment.